1、2004200520062007200820092010563238393598011001230127013501450148090209840921097008750935087708320基本模型 为了大致分析y与x1 和x2的关系,先作出y对x1 和x2的散点图(见图1和图2中的圆点)。图1 y对x1的散点图 图2 y对x2的散点图从图1可以看出,随着x1 的增加,y的值有比较明显的线性减少趋势,因此考虑如下线性模型:(1)来拟合,是随机误差,而在图2中,当x2增大时,y有向下弯曲减少的趋势,故考虑如下模型来拟合:(2)综合上述的分析,结合模型(1)和(2)简历如下回归模型(3)(3)
2、式右端的x1和x2称为回归变量,是给定商品价格 x1,人均月收入x2时,手表销售量y的平均值,其中称为回归系数,运用SPSS计算得他们的估计值如表1,影响y的其他因素作用都包含在随机误差中,如果模型选择得合适,应大致服从均值为零的正态分布。表1系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-3687.1202443.293-1.509.159x1-18.48115.181-.183-1.217.249x225.7663.3655.6217.657.000X3-.012.001-5.139-7.881a. 因变量: y表2模型汇总RR 方调整 R 方标准 估计的误差.977
3、a.955.942358.688a. 预测变量: (常量), X3, x1, x2。表3Anovab平方和df均方F回归2.984E739948244.06177.324.000a残差1415227.81811128657.074总计3.126E714b. 因变量:注:表中的x3=。结果分析:表2显示:指因变量y的95.5%可由模型,表3中F值远远超过F检验的临界值,p远远小于,因而从整体来说模型是可用的。销售量的预测 将回归系数的估计值代入模型(3),即可预测未来某个时期手表的销售量,将预测值记作,得到模型(3)的预测方程为(4)只需要知道该年份手表的销售价格x1和人均收入x2,就可以计算预
4、测值例如:若某年手表销售价格x1=50,人均收入x2=1500,则销售量的估计值=7037.83例2初中升入高中的升学率,不仅受个人特征的制约,而且要受家庭特征和学校以及一些外部力量(如国家政策等)通过一定的中介因素对学生的升学产生影响。学校是学生学习的主要场所,老师的期望和学校的一些特征(如毕业生数、招生目标、学校历年升学率等)都可能是影响学生升学率的一些重要因素。总体来看,影响初中升入高中人数的因素有很多方面,假定有人口特征、国家教育投入、教育资源以及教育背景等几类因素。因此选取如下变量作为解释变量,参与回归模型分析。选取的7个主要自变量如下:X1:6岁及6岁以上人口数,X2:国家教育总经
5、费,X3:初中毕业人数,X4:高中学校数,X5:高中师生比,X6:每10万人口高中在校生数,X7:居民受教育程度为大专及以上的人数。其中以6岁及6岁以上人口数代表人口特征,国家教育经费代表政府教育投入,初中毕业人数、高中生师比、高中学校数以及每10外人口高中在校生数作为教育规模代表指标,最后以居民受教育程度为大专及以上的人数作为教育背景代表指标。原始统计数据表升入高中数6岁及6岁以上人口数教育总经费初中毕业人数高中学校数普通高中师生比每10万人口高中在校生数居民受教育程度为大专及以上的人数北 京6598314406469016610181130510.2724754433天 津60871100
6、6820608439687321812.5130401713河 北44723257559558491499074666116.0136983233山 西27788228680332840461537454415.6644442198内蒙古17433820356262552728870030616.6936441619辽 宁24827136994479231147549542616.4929474371吉 林15882023274271419530261926216.9630531913黑龙江20792732556338655143633543015.1628982131上 海558421629
7、648230269988427310.5119823855江 苏45606264329996427296284871014.4236774995浙 江30020843157797283459148758214.1431514335安 徽4247435064943837321E+0676920.4436872360福 建23847529789389854147791160613.7437252918江 西25095335686333317151906547616.2636162447山 东50024878686774914899566463213.9933304728河 南64501577706
8、65615232E+0686819.1941494006湖 北42378647978451959392375962218.1844803662湖 南35652153010506605069329368415.2832053254广 东7179008024711661554102016.2339505512广 西26259439345347622364490547818.1630811613海 南54829700892898115274110817.103611482重 庆22089923672266258040748826719.6740281300四 川5153216837365783387
9、5818.6234423844贵 州21906231262270913861549645118.5126471035云 南22032537602342293262076245715.3925781152西 藏138842375494122424012414.11208240陕 西33488731717380616866322558617.7949012885甘 肃21698222002231020046337246317.3039691053青 海3657145616080346571212614.343763403宁 夏480845083702612932318216.444167425新
10、疆14886917442250166135496941314.19320816581 原始拟合模型 利用SPSS进行回归分析,首先采用变量强制进入模型法,建立模型1、原始模型如下:Y=-152385.188+2.427X1+0.009X2+0.207X3+45.259X4+3157.465X5+ 29.253X6+ 2.375X7。2、拟合优度检验分析:由上表可以看出,R及R方反映了回归方程与样本观测值的拟合优度,相关系数R为0.996,决定系数为0.990,接近于1,表明拟合优度很好。3、自相关性检验 上表中给出了杜宾沃森检验值,DW=1.940表明无自相关性,即每个观测值之间不相关。4、方
11、程显著性检验 模型的方差分析表如下所示:9.718E1171.388E11408.3427.820E9233.400E89.797E1130 (常量), V6岁及6岁以上人口数, 每10万人口高中在校生数, 普通高中师生比, 居民受教育程度为大专及以上的人数, 高中学校数, 教育总经费, 初中毕业人数。 初中升入高中数方差分析表显示F值为408.342,P值为0.000,查表可知=4.17,而408.3424.17, 所以认为这个统计模型是有意义的。5、参数显著性检验根据spss计算结果,可得系数表如下:已知显著性可由p10时该变量会在模型中产生共线性。所以由上表可看出:高中学校数、初中毕业人
12、数、教育总经费、6岁及6岁以上人数几个变量均存在共线性;高中学校数、高中师生比、教育总经费、居民受教育程度为大专及以上的人数几个变量均不显著,然而整体的方程显著性却很高,这说明可能部分解释变量对预测变量的显著性被变量间的共线性隐藏了。下面看一下=变量间的共线性诊断表如下共线性诊断a维数特征值条件索引方差比例V6岁及6岁以上人口数dimension17.3371.000.002.4424.075.01.1546.896.02.094.02517.246.03.18.20.11.105.01721.081.05.04.76.616.01522.161.59.47.00732.096.52.12.2
13、9.178.00346.414.92.08.40.84.06由上表看出,最大的条件索引值为46.41430,说明变量间有中等相关性,条件索引最大值对应的行中,6岁及6岁以上人口数和高中专任教师数的方差比例超过了0.5,因此认为二者构成了一个相关变量集,在修正模型时可删去二者之一。一、 模型检验与修正剔除不显著及共线性高的变量由上面的分析,考虑剔除由上一节的分析,考虑剔除部分显著性不高或共线性高的变量。初步剔除高中学校数和居民受教育程度为大专及以上几个变量,得到模型2:.Y=-140083.79+2.488X1+0.011X2+0.226X3+2416.459X5+31.005X6。模型汇总b更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改.996a.992.9901.81865E4587.390251.761 (常量), V6岁及6岁以上人口数, 每10万人口高中在校生数, 普通高中师生比, 教育总经费, 初中毕业人数。由分析表得出如下检验值:1、拟合优度R方=0.996,拟合良好;2、DW值=1.761,自相关性较低;3、F=587.390,方程显著性高;变量检验及共线性检验如下表:
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1