ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:74.90KB ,
资源ID:10002436      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10002436.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实用回归分析.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

实用回归分析.docx

1、实用回归分析 实用回归分析作业统计一班马方方200840530123一、经济背景汽车产业是国民经济的支柱产业,在国民经济中占重要地位。(1) 促进国民经的持续快速发展 汽车产业是资本、技术密集型,又是劳动密集型产业。具有巨大的前后相关联度和很强的波及效果,对国民经济具有很强的带动作用。因此党中央、国务院对发展汽车产业非常重视,多次提出要把汽车产业建成国民经济的支柱产业,并为此采取了一系列的政策措施。在这一思想的指导下,我国汽车产业取得了快速发展,在国民经济中的地位和作用越来越重要。近些年来,我国经济的快速增长,汽车产业做出了很大的贡献。到2020年要实现国民经济翻两番的奋斗目标,离开了汽车产业

2、的快速发展也是难以实现的。(2) 有利于全面建设小康社会 发展汽车产业对全面建设小康社会有很大的推动作用。一是有利于增加就业。汽车产业的规模生产方式和对上下游产业的巨大带动作用为社会提供了大量的就业机会。二是有利于满足人民的消费需求。随着我国国民经济的快速发展和人民生活水平的提高,人民的消费需求已逐步由吃、穿、用为向住和行为主转变,因此,发展汽车产业有利于满足人民不断增长的消费需求,有利于推动居民消费结构的升级。三是有利于改变人民的生活方式,提高生活质量。随着我国汽车产业的发展和汽车普及率的提高,将极大地提高人们的出行效率,拓展活动时间,提高出行的舒适性。(3) 推动技术进步和产业结构升级 汽

3、车作为一个产品,是高新技术的结晶。作为一个产业,是新技术应用范围最广、数量最多、周期最长、规模最大的产业。它不仅本身的生产制造有很高的技术要求,而且对相关产业如原材料产业、装备制造业、配套产业等也有很高的技术要求。因此,汽车产业的发展不仅要求本身广泛发展和使用新技术,也要求相关产业广泛发展使用新技术。因此汽车产业对推动技术进步和产业结构升级具有重要作用。(4) 推动城市化进程城市化是我国经济社会发展的必然历史过程。汽车产业的发展有助于加快我国城市化进程。一是汽车的发展和普及,改变了城市交通的面貌,推动了城市交通的现代化,促进了城市经济繁荣;二是汽车的发展和普及,推动了城市结构的改变,促进了围绕

4、大城市而建立的卫星城市群落发展;三是汽车的普及和发展,加强了城市之间在物质、文化、信息、人员等方面的交流和联系,有利于推动城乡经济一体化发展,缩小城乡差距。我国正处于全面建设小康社会的重要战略机遇期,大力发展汽车产业,全面推进国民经济各部门持续健康发展,是当前我们面临的重大任务。因此,通过建立经济模型,研究汽车产量和相关因素的关系,是一件有意义的事。二、模型的建立为了研究我国汽车产量的变化趋势与其成因,以汽车总产量为因变量y,以钢铁产量、运输公路长度、制造业职工人数、私人汽车拥有量、石油消费总量为影响汽车总产量的的主要因素。y表示汽车总产量(万辆), x表示钢铁产量 (万吨),x表示运输公路长

5、度(万公里),x表示制造业职工人数(万人),x表示私人汽车拥有量(万辆),x表示石油消费总量(万吨)。 据中国统计年鉴获得19942008共15个年份的统计数据,数据如下:年份yxxxxX1994136.699261111.785434205.4221356.241995145.279535.99115.75439249.9622955.81996147.5210124.06118.585293289.6725010.641997158.2510894.17122.645083358.3628110.79199816311559127.853769423.6528426.011999183.2

6、12426135.173496533.8830187.61200020712850140.273240625.3332053.062001234.1715163.44169.83010770.7832784.12002325.118236.61176.522907968.9835528.812003444.3922233.6180.982898.91219.2338107.382004509.1128291.09187.0729601481.6645319.622005570.4935323.98334.523096.51848.0747183.222006727.8941914.85345.

7、73250.32333.3250239.082007888.8948928.8358.373358.42876.2252319.852008934.5550091.53373.023329.33501.3953295作相关分析相关性YX1X2X3X4X5YPearson 相关性1.995*.957*-.529*.992*.961*显著性(双侧).000.000.043.000.000N151515151515X1Pearson 相关性.995*1.976*-.521*.989*.965*显著性(双侧).000.000.046.000.000N151515151515X2Pearson 相关性.

8、957*.976*1-.511.959*.937*显著性(双侧).000.000.052.000.000N151515151515X3Pearson 相关性-.529*-.521*-.5111-.536*-.695*显著性(双侧).043.046.052.039.004N151515151515X4Pearson 相关性.992*.989*.959*-.536*1.953*显著性(双侧).000.000.000.039.000N151515151515X5Pearson 相关性.961*.965*.937*-.695*.953*1显著性(双侧).000.000.000.004.000N1515

9、15151515*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。从相关矩阵看出,y与x1,x2,x4,x5的相关系数都在0.9以上,说明所选自变量与y高度线性相关的,用y与自变量做多元线性回归是适合的。 y与x3的相关系数为-0.529,p值=0.043,在显著性水平=0.05下y与x3是线性相关的。一般认为制造业职工人数和汽车产量应呈正相关,制造业职工人数多了,汽车产量就会增加。汽车产业属于装备制造业,中国装备制造业无论从管理机制、技术创新能力,还是从企业规模、竞争实力等方面,都存在较大差距。作回归分析模型汇总b模型RR 方调整 R 方标准 估计的误差1

10、.999a.997.99618.80279a. 预测变量: (常量), X5, X3, X2, X4, X1。b. 因变量: YANOVAbModelSum of SquaresdfMean SquareFSig.1Regression1098608.5505219721.710621.482.000aResidual3181.9049353.545Total1101790.45414a. Predictors: (Constant), X5, X3, X2, X4, X1b. Dependent Variable: YCoefficientsaModelUnstandardized Coef

11、ficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)154.097130.4101.182.268X1.022.0051.1824.554.001X2-.832.250-.293-3.328.009X3-.013.013-.045-.981.352X4.057.038.2101.513.165X5-.003.004-.136-.922.381a. Dependent Variable: Y回归诊断:回归方程为=154.097+0.022x1-0.832x2-0.013x3+0.057x4-0.003x5. 复相关系数R

12、=0.999,决定系数R=0.997,由决定系数看回归方程高度显著。方差分析表,F=621.482,p值=0.000,表明回归方程高度显著,说明x1,x2,x3,x4,x5整体上对y有高度显著的线性影响。回归系数的显著性检验。在显著性水平=0.05下,自变量x1、x2对y 均有显著影响,但x3、x4、x5对y无显著影响。下面采用后退法剔除变量先剔除p值最大的变量x5,作回归分析系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)37.53031.4741.192.261X1.019.003.9956.162.000X2-.767.238-.270-3.223.009X3-.00

13、2.006-.008-.357.728X4.071.034.2632.098.062a. 因变量: Y自变量x3对应的p值=0.728最大,进一步剔除,再做回归分析模型汇总b模型RR 方调整 R 方标准 估计的误差1.998a.997.99617.90525a. 预测变量: (常量), X4, X2, X1。b. 因变量: YAnovab模型平方和df均方FSig.1回归1098263.8773366087.9591141.891.000a残差3526.57711320.598总计1101790.45414a. 预测变量: (常量), X4, X2, X1。b. 因变量: Y系数a模型非标准化

14、系数标准系数tSig.B标准 误差试用版1(常量)28.37617.5391.618.134X1.019.003.9906.414.000X2-.763.228-.269-3.345.007X4.074.032.2712.286.043a. 因变量: Y复相关系数R=0.998,决定系数R=0.997,回归方程高度显著。方差分析表中 F=1141.891,p值=0.000,回归方程高度显著。在显著性水平=0.05下,自变量x1,x2,x4均对y有显著影响。回归方程y=28.376+0.019x1-0.763x2+0.074x4.另外,x2的回归系数-0.763是负的,x2是运输公路长度,负的回

15、归系数显然是不合理的,可能是由于自变量之间的共线性.三、异常值的诊断YX1X2X4RES_1SRE_1SDR_1COO_1136.699261111.78205.424.276670.257150.245920.00263145.279535.99115.7249.967.399890.44190.425120.00699147.5210124.06118.58289.67-2.13661-0.12728-0.121450.00056158.2510894.17122.64358.36-7.84839-0.46532-0.44810.0068716311559127.85423.65-16.4

16、314-0.9704-0.967580.02782183.212426135.17533.88-15.062-0.89055-0.881470.0239420712850140.27625.33-2.07081-0.12481-0.119080.00064234.1715163.44169.8770.78-6.58438-0.40602-0.390060.00903325.118236.61176.52968.9817.077481.005441.005980.02812444.3922233.6180.981219.2346.164632.743974.657760.24972509.112

17、8291.09187.071481.66-17.7404-1.5275-1.640790.80311570.4935323.98334.521848.07-3.08261-0.26928-0.25760.02622727.8941914.85345.72333.323.159230.216050.206440.00583888.8948928.8358.372876.221.939080.140550.134130.00338934.5550091.53373.023501.39-9.06036-1.27335-1.314862.1615从上表中看到,绝对值最大的学生化残差SRE=2.7439

18、7,小于3,因而根据学生化残差诊断认为数据不存在异常值。绝对值最大的删除学生化残差为SDR=4.65776,因而根据删除学生化残差诊断认为第10个数据为异常值。其Cook距离为0.249720.5,这样第10个数据为异常值的原因是由因变量引起的。第11和15个数据的Cook距离分别为0.80311和2.1615,其删除化学生残差的绝对值分别为1.64079和1.31486,因而认为第10和15个数据为异常值均是由自变量引起的。四、异方差的诊断残差散点图如下:从残差图看,15个点的分布是随机的,即误差项无明显的异方差性。 等级相关系数的检验相关系数YeSig.(双侧).990N1515e相关系数

19、.0041.000Sig.(双侧).990.N1515其中e为残差绝对由上表得等级相关系数r=0.004,p值=0.990,认为残差绝对值e与因变量y不显著相关,不存在异方差。五、自相关性的诊断由上面的残差散点图可以看出,残差项随因变量y无规律的变化,那么随机扰动项不存在序列相关。Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.998a.997.99617.905251.776a. Predictors: (Constant), X4, X2, X1b. Dependen

20、t Variable: Y下面再利用自相关系数法对其检验由上图可知,D.K=1.776,查D.K表,n=15,k=3,在显著性水平=0.05下,d=0.95,d=1.54.由1.54D.K=1.7764-d=2.46,可知残差序列无自相关性。六、多重共线性的诊断CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)28.37617.5391.618.134X1.019.003.9

21、906.414.000.01281.926X2-.763.228-.269-3.345.007.04522.220X4.074.032.2712.286.043.02148.155a. Dependent Variable: Y从上表中看到,x1的方差扩大因子VIF=81.926最大,且远大于10,说明此模型存在强的多重共线性,再根据自变量的经济意义及前面对回归系数的显著性检验,先将x4剔除,用y与剩余两个自变量建立回归方程,有关计算结果如下表:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.

22、Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)6.40117.060.375.714X1.025.0021.29414.124.000.04721.331X2-.868.260-.306-3.337.006.04721.331a. Dependent Variable: Y从上表中看到,x1和x2的方差扩大因子都为21.331,大于10,且x2的p值=0.006,因而剔除x2,剔除后,建立y与x1之间的回归方程,有关计算结果如下:Model SummaryModelRR SquareAdjusted R SquareS

23、td. Error of the Estimate1.995a.991.99027.77706a. Predictors: (Constant), X1CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-39.66113.376-2.965.011X1.019.001.99537.616.0001.0001.000a. Dependent Variable: Y得到y与x1的

24、线性回归方程为:y=-39.661+0.019x1,由复相关系数R=0.995,决定系数R=0.991,知回归方程高度显著。七、经济解释及存在问题、经济解释: 从以上模型分析可得出:制造业职工人数、石油消费总量对汽车产量没有显著影响。说明汽车生产与上述两个因素没有必然联系。钢铁产量、运输公路长度和私人汽车拥有量有显著影响,但运输公路长度和私人汽车拥有量可以由钢铁产量表示,即钢铁产量决定了运输公路长度和私人汽车拥有量。这说明作为汽车产业的上游产业,钢铁制造业的健康发展对汽车生产具有重大意义。为了保证汽车生产,我们必须全力发展现代化的中国钢铁产业。、存在问题: 在未作数据分析回归之前,我们还考虑了许多可能影响的因素,如国民生产总值,城镇居民消费总额,原油总产量,公路运输业从业人数,自行车总产量,但回归分析后都遭到了淘汰,说明往往主观认知与数据说明的问题有很大差距。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1