1、高等教育入学机会城乡差异研究第10组实验经济学及其他分支学科 文章字数:8485高等教育入学机会城乡差异研究 基于二元选择O-B分解的实证蔡超1,许启发2(1. 山东工商学院统计学院,山东烟台 264005;2. 合肥工业大学管理学院,安徽合肥 230009)摘要:以CGSS数据为研究对象,通过二元选择O-B分解可以将二元选择概率分解为特征效应与系数效应的优势,对中国高等教育入学机会城乡差异的影响因素进行了定量分析,揭示中国居民高等教育入学选择行为的内在影响机制。实证结果表明:第一,高等教育入学选择行为同时受到个人能力和家庭背景两个方面因素的影响,二者不可偏废;第二,高等教育入学机会城乡差异显
2、著,并且这一差异随时代发展呈现扩大趋势;第三,高等教育入学机会城乡差异主要由特征差异引起,不过系数效应(歧视)也占据了相当重要的位置,后者更应当受到关注。关键词:高等教育入学机会;Logit回归模型;二元选择O-B分解;城乡差异中图分类号:C812 文献标识码:AResearch on Urban-rural Difference of Higher Education OpportunitiesEmpirical Results through O-B Decomposition of Binary Choice CAI Chao1, XU Qi-fa2(1. School of Stati
3、stics, Shandong Institute of Business and Technology, Yantai 264005, China; 2. School of Management, Hefei University of Technology, Hefei 230009, China)Abstract: In this paper, O-B decomposition of binary choice, which can decompose the binary choice probability into characteristics effect and coef
4、ficients effect, is used to study the urban-rural difference of higher education opportunities. Empirical analysis is based on CGSS data. The results tell us three facts. Firstly, individual ability and family background have positive effects on to higher education opportunities, and each of them sh
5、ould not be overlooked. Secondly, the urban-rural difference of higher education opportunities is notability, and this difference is widening over time. Lastly, the characteristics effects are the dominant factors for the urban-rural difference of higher education opportunities. However, the coeffic
6、ient effects (discrimination) also occupy a very important position, and more attention should be paid for the latter.Key Words: Higher Education Opportunities; Logit Regression Model; O-B Decomposition of Binary Choice; Urban-rural Difference一、引言自20世纪90年代末以来,中国高等教育实施了一系列改革措施,其中最显著的一个特征就是高等教育规模不断扩大。
7、党的十七大报告指出,“教育是民族振兴的基石,教育公平是社会公平的重要基础”。随着高等教育规模不断扩大和收费全面并轨,加上中国独特的城乡二元结构,城乡居民的高等教育入学机会是否公平也成为备受关注的社会问题。钟云华(2008)等1-3认为:在中国独特的城乡二元结构以及城乡教育水平存在较大差距的独特格局下,城乡居民接受高等教育的机会并不平等。影响城乡居民高等教育入学机会的主要因素似乎与个人能力(特别是学习能力,更多的是指高考分数)密切相关,同时Manski(1992)等4-11指出:非能力因素(如家庭背景等)也会对高等教育入学机会产生重要影响。在城镇居民与农村居民由于非能力因素上的特征差异最终导致其
8、高等教育入学机会差异的研究方面,李春玲(2003)等12-17运用描述统计的方法研究表明家庭背景等因素对个人高等教育获得的影响在城乡之间有所不同;雷万鹏等(2005)18和白添泷等(2010)19运用Logit回归模型研究表明家庭背景等因素对城乡个人高等教育获得具有显著的正向影响,前者主要依据城乡背景与其他解释变量的交叉乘积项的回归系数显著性来讨论高等教育入学机会的城乡差异,而后者主要通过比较城镇样本和农村样本之间的回归系数来分析。然而,无论是白添泷等(2010)19的系数比较,还是雷万鹏等(2005)18的交叉乘积项都无法定量刻画样本特征差异和回归系数差异对高等教育入学机会城乡差异的贡献。O
9、axaca(1973)20和Blinder(1973)21给出了经典的Oaxaca-Blinder分解方法(简记为经典O-B分解),经典O-B分解为细致刻画解释变量样本特征差异和回归系数差异对连续被解释变量平均水平产生的影响提供一个基本工具,对于离散被解释变量情形却无能为力;对于离散被解释变量,Fairlie(2005)22在Logit回归模型基础上建立的O-B分解(简记为二元选择O-B分解)可以解决二元选择模型的概率分解问题,解决了经典O-B分解只能应用连续被解释变量的局限。高等教育入学机会属于二元(接受过高等教育和未接受高等教育)选择,经典O-B分解难以奏效,为此这里采用Fairlie(2
10、005)22的二元选择O-B分解模型进行实证研究。本文以2006年CGSS调查数据为对象,着重分析了城镇居民与农村居民在高等教育入学机会方面的差异,首先运用Logit回归模型研究了城镇居民和农村居民高等教育入学选择行为;其次运用二元选择O-B分解探究引致高等教育入学机会城乡差异的主导因素。本文以下部分结构安排如下:第二部分为数据选取及描述,介绍了使用的数据库与变量情况;第三部分为计量模型与方法,首先对使用的计量模型进行了设计,其次给出了高等教育入学机会城乡差异的具体分解步骤;第四部分为实证分析,对取得的实证结果进行了讨论;最后,结论与启示放在了第五部分。二、数据选取及描述(一)数据选取本文采用
11、2006年的全国综合社会调查数据(CGSS2006),该数据采用分层四阶段不等概率抽样方法,以家庭为样本单位进行调查,所抽取的样本包括全国(含22个省、4个自治区、4个直辖市;不含西藏自治区和港、澳、台地区)共10151个家庭样本单位。调查内容包括个人基本情况、家庭背景、教育经历、职业经历等丰富的信息,更为重要的是该数据提供了受访人18岁(在中国大陆,高考年龄大多数为18岁)时,父母的教育程度、职业类型、工作单位等关于家庭特征的相关信息,为我们研究个人的教育选择行为提供了很大的方便。本研究删除了仍在高中及高中以下在读的样本和个人信息不完整的样本,这样有效样本包含了分布在28个省、市、自治区的8
12、624人在2005年的有关信息。本文将问卷中在18岁之后获得城镇户口的被访者设定为农村户口,这样,城镇样本量为3645人,农村样本量为4979人。为研究需要,将问卷中教育程度为大专、本科、成人大专、成人本科和研究生及以上统一归类为接受过高等教育;受教育程度在高中及高中以下的统一归类未接受高等教育。对父母亲具体职业类型也进行合并,其中,国家机关、党群组织、企业、事业单位负责人、专业技术人员、办事人员和有关人员以及警察和军人合并为管理层,商业工作人员、服务性工作人员、农、林、牧、渔、水利业生产人员、生产工人、运输工人和有关人员和不便分类人员合并为其他。(二)统计描述表1给出了被解释变量和解释变量的
13、均值与标准差统计,并且报告了城镇居民与农村居民在各变量的均值差与方差比检验结果。对于被解释变量:是否接受过高等教育,其均值表示高等教育入学机会。易见,城镇居民高等教育入学机会远远高于农村居民高等教育入学机会,前者为后者的4.4倍,这一结果在统计上具有显著性。然而,城镇居民高等教育入学机会比农村居民要分散的多,方差比F检验表明这种分散程度城乡之间差异显著。解释变量中,首先考察个人能力变量:性别、年龄、是否上过重点高中。对于性别变量,均值代表男性比率,城镇居民男性比率略低于农村居民,均值差t检验结果显示这一差别并不显著;同时,城镇居民与农村居民男性比率的散布差异也不显著。就性别变量本身而言,其取值
14、对是否接受高等教育本没有影响,然而中国现实可能并非如此。对于年龄变量,取值越大(超过18岁),越不利于接受高等教育,本研究中城镇居民平均年龄略低于农村居民,这种差异也不显著。然而,是否上过重点高中这一变量,上过(取值为1)显然影响接受高等教育,本研究中城镇居民上过重点高中的比例明显高于农村居民,前者为后者的2.8倍,差异显著。其次,考察家庭背景变量:家庭藏书量、父亲(母亲)受教育程度、父亲(母亲)工作类型。这些变量中,变量取值越大,表明家庭背景越有利于接受高等教育,例如:家庭藏书量取值越大,意味着藏书越多,表明家庭重视学识方面的培养;父亲(母亲)受教育程度取值越大,意味着父辈更有文化,知识份子
15、家庭会为接受高等教育树立榜样;父亲(母亲)工作类型取值为1,表明父辈从事管理岗位,家庭视野开阔,容易引导子女接受高等教育。在家庭背景变量方面,城镇居民各变量均值都高于农村,且均值差显著,例如:城镇居民家庭藏书量为农村居民的1.4倍;城镇居民父母亲受教育程度为农村居民的1.6倍;城镇居民中父母亲工作属于管理层的比例远远高于农村居民,前者为后者的3.6倍和5.5倍。综合上述,中国居民高等教育入学机会存在显著的城乡差异,这一结果可能源于个人能力与家庭背景两个方面。均值差显著性检验告诉我们,除性别和年龄两个变量外,其余各变量城镇居民的均值与农村居民都存在显著差异,而这些差异可能是导致高等教育入学机会城
16、乡差异的关键因素。为此,需要采用计量模型与方法进行定量测度,至少需要回答三个方面的问题:第一,中国居民高等教育入学选择行为如何?第二,高等教育入学机会是否存在城乡差异?第三,城乡差异是否由个人能力、家庭背景引致,抑或来自其他方面(如歧视),且各种影响对高等教育入学机会城乡差异贡献程度如何?在接下来的讨论中,将重点解决这两个方面问题。表1 主要变量的描述统计分析变量变量说明全部样本城镇样本农村样本城镇V.S.农村(n=8624)(n=3645)(n=4979)均值标准差均值标准差均值标准差均值差t检验方差比F检验是否接受过高等教育,分类变量,离散取值:=1接受过高等教育;=0其他0.1380.3
17、450.2490.4320.0570.23124.404*3.499*性别,分类变量,离散取值:=1男性,=0女性0.4840.5000.4730.4990.4920.500-1.7460.997年龄,数值变量,连续取值40.58013.10540.34513.57940.75212.745-1.4131.135*是否上过重点高中,分类变量,离散取值:=1上过重点高中,=0其他0.0490.2170.0790.2700.0280.16410.271*2.728*家庭藏书量,顺序变量,取值依次为:1、2、72.1261.2982.5791.4161.7951.09127.900*1.684*父亲
18、受教育程度,顺序变量,取值依次为:1、2、132.2851.5972.9101.9481.8271.07030.356*3.318*母亲受教育程度,顺序变量,取值同父亲受教育程度1.8341.2612.3301.5911.4710.76830.114*4.295*父亲工作类型,分类变量,离散取值:=1父亲工作管理层,=0其他0.1830.3160.3160.4650.0860.28026.523*0.057*母亲工作类型,分类变量,离散取值:=1母亲工作管理层,=0其他0.2550.3680.4840.5000.0880.28310.271*0.165*注:(1)均值差显著性采用独立样本t检验
19、,标准差显著性采用方差比F检验。(2)*、*、*分别表示t检验和F检验在1%、5%、10%的显著水平下显著。(3)表中,男性比率低于50%,这与全国男性多于女性不一致(2005年全国男性比率为51.53%),这里为抽样数据,整个问卷的男性比率为46.15%。(4)家庭藏书量取值含义:1(没有),2(十本以下),3(十到二十本),4(二十到五十本),5(五十到一百本),6(一百到五百本),7(五百本以上)。(5)父亲(母亲)受教育程度取值含义:1(没有受过任何教育),2(扫盲班),3(小学),4(初中),5(职业高中),6(普通高中),7(中专),8(技校),9(大学专科(成人高等教育),10(
20、大学专科(正规高等教育),11(大学本科(成人高等教育),12(大学本科(正规高等教育),13(研究生及以上)。三、计量模型与方法(一)二元选择Logit回归在本研究中,被解释变量代表是否接受过高等教育,为二元响应变量,其均值恰为一个比率,代表高等教育入学机会。因此,为进一步搞清楚高等教育入学机会城乡差异问题,首先要解决是否接受高等教育受哪些因素影响。为此,可以建立Logit回归模型 (1)式中,为个体接受高等教育的概率;表示数学期望;为Logistic分布的累积分布函数;为由个人特征(性别、年龄、是否上过重点高中)和家庭背景(家庭藏书量、父母亲受教育程度及父母亲工作类型)组成解释变量向量,为
21、相应的系数估计向量。将式(1)稍作整理,可得 (2)模型(2)中,有明确的经济含义,称为机会比,在此表示接受高等教育与不接受高等教育机会之比。由模型(2)可见,回归系数对机会比的自然对数将产生线性影响。(二)二元选择O-B分解为进一步探究引致高等教育入学机会城乡差异的因素,需要使用分解技术。Oaxaca(1973)20和Blinder(1973)21提出的经典O-B分解技术能够细致的刻画样本特征差异或系数差异对被解释变量平均水平产生的影响,然而如果被解释变量为二元响应变量,经典O-B分解则难以奏效。Fairlie(2005)22提出的基于Logit回归模型的二元选择O-B分解方法,可以解决经典
22、O-B分解不能应用于二元响应被解释变量的局限。据此可以将城镇居民和农村居民之间的高等教育入学机会差异分解为两个部分:可解释部分和不可解释部分,前者主要由城镇居民和农村居民在个人特征、家庭背景上的差异引起,也称特征效应;而后者主要由回归系数引起,它无法通过城镇居民和农村居民在特征上的差异得到解释,也称系数效应。这里,利用Fairlie(2005)22的二元选择O-B分解思想,对高等教育入学机会城乡差异进行分解,具体步骤如下:第一步,对城镇样本与农村样本,分别利用式(1)建立Logit回归模型,得到城镇回归系数向量和农村回归系数向量。第二步,运用和计算总效应,公式如下: (3)式中,表示城镇居民上
23、大学的比率,表示农村居民上大学的比率,表示城镇样本解释变量向量,表示农村样本解释变量向量,表示城镇样本量,表示农村样本量。称为“特征效应”,是由样本特征差异所引起,为可解释部分;称为“系数效应”,是由回归系数差异或对农村居民的歧视所引起,为不可解释部分。第三步,由于农村样本量大于城镇样本量,使得各个解释变量的特征效应难以计算,因此对农村样本进行随机抽样,使抽取的农村子样本量等于城镇样本量。第四步,运用和计算各个解释变量的特征效应和系数效应。常数项的特征效应为零,系数效应为 (4)性别的特征效应为 (5)性别的系数效应为 (6)其中,。以此类推,可以按照顺序依次计算其他解释变量的特征效应和系数效
24、应。第五步,由于每次抽样的农村子样本不同会造成计算的各个解释变量的特征效应的不同,所以本文在实证中重复抽样100次,以计算每次抽样结果的均值代替各个解释变量的特征效应。四、实证研究(一)高等教育入学机会影响因素分析表2报告了Logit回归模型估计结果,可以看出,个人能力及家庭背景都对高等教育入学机会产生了重要影响。不过,为利用二元选择O-B分解考察各解释变量对高等教育入学机会城乡差异的影响程度,需要各个解释变量都显著。为此,将父亲工作类型这一解释变量删除再进行Logit回归,回归结果也列于表2中。由表2可知,剩余解释变量对高等教育入学机会的影响都已显著。表2 Logit回归分析结果(被解释变量
25、:代表是否接受过高等教育)变量模型1模型2全部城镇农村全部城镇农村常数项-3.266(0.169)*-1.500(0.213)*-4.761(0.341)*-3.258(0.169)*-1.490(0.213)*-4.757(0.337)*性别0.261(0.075)*0.210(0.090)*0.366(0.142)*0.262(0.075)*0.211(0.090)*0.367(0.142)*年龄-0.034(0.003)*-0.046(0.004)*-0.019(0.006)*-0.034(0.003)*-0.046(0.004)*-0.019(0.006)*是否上过重点高中2.055(
26、0.124)*1.678(0.153)*2.663(0.221)*2.053(0.124)*1.671(0.153)*2.663(0.211)*家庭藏书量0.490(0.026)*0.387(0.032)*0.545(0.049)*0.489(0.026)*0.384(0.032)*0.544(0.048)*父亲受教育程度0.190(0.027)*0.167(0.030)*0.172(0.060)*0.186(0.027)*0.159(0.029)*0.170(0.055)*母亲受教育程度0.241(0.033)*0.137(0.036)*0.319(0.077)*0.241(0.033)*0
27、.138(0.036)*0.319(0.077)*母亲工作类型0.340(0.085)*-0.150(0.095)0.713(0.341)*0.328(0.085)*-0.178(0.092)*0.709(0.183)*父亲工作类型-0.045(0.098)-0.116(0.105)-0.017(0.225)注:(1)括号内为标准误差;(2)*、*、*分别表示估计系数在1%、5%、10%的显著水平下显著。性别这一看似对是否接受高等教育不会产生影响的变量,其回归系数显著为正,表明男性比女性更容易获得接受高等教育的机会,并且这一结果在农村更为严重,其边际贡献为0.367,远远高于城镇居民的0.21
28、1。年龄的回归系数显著为负,意味着年龄越大,接受高等教育的可能性就越小。除母亲工作类型这一变量外,其余各变量回归系数显著为正,与前文“二、数据选取及描述”中的分析相一致。至此,回答了问题一,即个人能力与家庭背景都是影响高等教育入学选择行为的重要因素。从表2中可以初步看出,城镇居民与农村居民Logit模型中回归系数存在一定差异。为进一步揭示高等教育入学机会城乡差异,利用Logit模型,分别对城镇居民与农村居民的高等教育入学机会进行模拟。模拟中,解释变量取值依次为,年龄在17到69之间每隔0.1取一个值;性别分别取0和1,与城乡分组进行配合,得到城镇女性、农村女性、城镇男性、农村男性;其余解释变量
29、都选取其众数:Hsch取0、Book取1、Fedu取1、Medu取1、Mwok取0。在揭示城乡差异的同时,还考虑了年龄与性别对高等教育入学机会的影响,模拟结果见图1。图1中共有四条曲线,其中,粗线表示城镇居民,细线表示农村居民;实线表示女性,虚线表示男性。图1告诉我们三个方面的信息。第一,总体上看,四条曲线都向右下方倾斜,意味着随着年龄增长,接受高等教育的可能性越小,这是对Logit模型中年龄变量具有负的边际影响的细致刻画;由于年龄同时代表了不同年代(年龄越小,参考高等的年代越近,如18岁一般于2005年当年参加高考,而38岁一般于1985年参加高考),因此从右向左看,曲线变化还可以解释为:随着时代的发展,接受高等教育可能性显著提高。第二,男性两条虚线始终在女性两条实线上方,意味着男性接受高等教育的可能性超过女性,这与Logit模型中性别变量具有正的边际贡献是一致的;随着时代发展,高等教育入学机会性别差异稍微有所扩大。第三,城镇居民两条粗线在农村居民两条细线的上方,表明城镇居民接受高等教育的可能性远远高于农村居民;同时,随着时代发展,高等教育入学机会城乡差异逐渐扩大。至此,回答了问题二,即中国高等教育入学机会存在显著的
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1