中国城市劳动力市场的变迁与分层
上QQ阅读APP看书,第一时间看更新

三 数据、变量和测量

我们使用上海市2005年1%人口抽样调查的一个子数据集来进行经验分析。[3]该数据集中16~59岁的非农就业者,原有26000余人,但在将研究对象限定为在经济部门从事非农工作的16~59岁受雇就业者,并不得不放弃存在缺失值的个案之后,最终分析的样本规模为19098人。我们所说的经济部门,是指除国家机关和事业单位(所谓的公共部门)之外的以经济职能为主的社会活动部门。进行这种限定的原因,一方面是基于经济分割理论强调要将公共部门和经济部门做区别对待的传统(见Wallace & Kalleberg,1981),另一方面是出于在中国这些机构的就业和人事改革一直明显滞后于企业改革因而劳动力很少自由流动的考虑。我们将雇主和自雇人士排除在分析之外,是为了保证研究对象在就业性质上的同质性,因为他们的投资行为会对就业结果(尤其是收入)产生重要影响,而且不少研究都一再表明,自雇和受雇这两种工作性质在吸引就业者尤其是移民就业者时扮演着十分不同的角色(Arum,1997;Meng,2001)。

我们特意使用来自一个代表性城市的大样本数据而非全国性、跨地区的抽样数据来进行经验分析,是为了便于对不同的户籍群体进行理论上所关心的一系列比较。具体来说,是因为通过将研究对象明确限定于一个地方的劳动力市场,不同地区之间的经济结构和发展阶段差异对劳动者就业结果的影响就可以被有效地排除在外,从而避免这种影响被混淆在户籍身份的作用之中。[4]众所周知,中国的经济发展和改革进程在地区之间是不平衡的,同时收入不平等的程度和模式也存在地区差异(Xie & Hannum,1996;Hauser & Xie,2005)。而且理论上也有这样一种观点,即所谓的“全国性”劳动力市场其实并不存在,而是不可避免地按地域被分割为众多的“地方性”劳动力市场(Topel,1986;Baumgardner,1988)。因此,如果我们要比较的户籍群体分布在众多不同的地方劳动力市场上,就很难彻底区分户籍身份的效应与地方劳动力市场本身的结构性效应。[5]而且,判断某人是否持有本地户口在单个城市数据中操作起来更加简便,考察本地户口的“价值”在特定的城市语境下也更加直观。尽管本章分析的只是来自上海市的数据,但我们认为,其发现和结论能够推论至中国的许多大中城市,尤其是北京、天津、杭州、广州等大中城市。

上海市2005年1%人口抽样调查收集了受访者在个体特征、户籍登记及就业方面的许多信息。根据受访者两方面的户籍信息,即户口所在地与户口类别,我们就能将样本按户籍身份划分为四个群体:本地城镇居民(持有上海城镇户口的居民)、本地农村居民(持有上海农村户口的居民)、外地农村移民(持有非上海农村户口的居民)与外地城镇移民(持有非上海城镇户口的居民)。这构成了本研究的关键自变量,并将以三个虚拟变量(本地城镇居民为参照组)的形式进入模型。个体特征变量包括三个:性别(虚拟变量,男性=1)、年龄(连续变量,同时引入年龄的平方项)、受教育程度(定类变量,划分为初中及以下、高中或中专、大专及以上三个类别,第一类为参照组)。它们在模型中是控制变量,主要反映了人力资本的作用。此外,还有一个控制变量是每周工作时间,以受访者在接受调查时所回答的上周工作小时数来测量。

个体在劳动力市场中的就业结果构成了本章研究的一系列因变量。我们首先关心的是部门进入,即个体进入哪一个经济部门内就业。正如前文所介绍的,有两个维度可以用来测量中国城市的分割性经济结构:所有制和行业,而每一个维度都可将城市的经济结构划分为两个部门,分别是“国有部门vs.非国有部门”以及“垄断部门vs.非垄断部门”。遵循分层研究文献中的惯常做法,我们将“国有及国有控股企业”这一类型的工作单位视为国有部门,将“集体企业”“私营企业”和“其他”类型(其中包括外资企业)的工作单位视为非国有部门,这样就生成了一个按所有制标准划分的部门虚拟变量(国有部门=1)。另一个按行业标准划分的部门虚拟变量(垄断部门=1)是以两位行业码为基础如此生成的:首先计算每一个细分行业中劳动者在私有制工作单位(指一般意义上的私有制,包括民营、外资等类型的工作单位)中的就业比重,其次将该比重低于某特定值的细分行业大体区分为垄断部门,再次对该特定值附近的细分行业的垄断性质做进一步核对与调整,最后以调整后的结果为准来划定哪些细分行业属于垄断部门。[6]需要强调的是,虽然在划分国有部门/非国有部门和垄断部门/非垄断部门时都涉及了所有制,但前者按所有制类型对企业或单位进行划分,而后者按所有制比重对行业进行划分,两者在概念上仍然是不同的。

用私有部门的就业比重(或者反过来用国有部门的就业比重)这一指标来反映各行业的垄断与非垄断性质在以往的相关研究中十分常见(例如,金玉国,2001;张展新,2004;聂盛,2004;晋利珍,2008)。[7]虽然在成熟的市场经济中垄断这一概念是按市场的集中性(market concentration)来定义的,即一个行业内的商业活动或市场份额被少数几个寡头公司所控制(见Tolbert et al.,1980),但在中国行业垄断却更多地反映为政府在多大程度上允许私有企业进入并与公有制企业相竞争,因此主要是一种行政垄断(参见戚聿东,2002;余东华,2006;岳希明等,2010)。如果某行业内私有部门的就业比重超过了国有部门,该行业在理论上仍可能具有垄断性质,但这在中国实际上几乎是不可能的。因此,就中国的具体国情而言,垄断实际上指的就是国企垄断,用上述方法来测量中国的行业垄断在很大程度上是合理的、可以接受的。最后识别出来的垄断行业名单请见本章附录。值得注意的是,本章对行业垄断的测量更为准确,因为这里的计算是以分类更细的两位行业码为基础的,而不像以往的大部分研究那样依赖一位码行业分类。[8]

除了部门进入之外,本章还关注个体在劳动力市场中的另外两个就业结果,即职业和收入。上海市1%人口抽样调查根据中国职业分类标准(GB/T 6565—1999)将受访者所从事的职业做了两位编码(CSC00编码),我们对此分别做了两种处理。一是按照国内统计部门惯常使用的职业分类体系,先将其划分为“国家机关、党群组织、企业、事业单位负责人”“专业技术人员”“办事人员和有关人员”“商业/服务业人员”“生产、运输设备操作人员及有关人员”“不便分类的其他从业人员”六个大类,再将其简化为“单位负责人和专业技术人员”(包括前两个大类)、“办事人员和有关人员”、“商业/服务业人员”和“体力工人及其他”(包括最后两个大类)四个类别做分析。二是将CSC00编码先转为ISCO88编码(国际标准职业分类,1988)[9]再转为ISEI(国际社会经济地位指数)做分析(Ganzeboom et al.,1992)。ISEI已经在中国研究中得到了应用(例如,边燕杰等,2006),本章使用它主要是为了充分利用两位职业编码的信息。遵循固有的处理策略,我们对收入变量(具体地讲是月收入)取自然对数。