ImageVerifierCode 换一换
格式:DOCX , 页数:31 ,大小:182.03KB ,
资源ID:10248325      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10248325.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(完整word版北航数理统计大作业1线性回归分析.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

完整word版北航数理统计大作业1线性回归分析.docx

1、完整word版北航数理统计大作业1线性回归分析应用数理统计作业一学号: 姓名: 电话: 二一四年十二月 国内生产总值的多元线性回归模型摘要:本文首先选取了选取我国自1978至2012年间的国内生产总值为因变量,并选取了7个主要影响因素,进一步利用统计软件SPSS对以上数据进行了多元逐步线性回归。从而找到了能反映国内生产总值与各因素之间关系的“最优”回归方程.然后利用多重线性的诊断找出存在共线性的自变量,剔除缺失值较多的因子.再次进行主成份线性回归分析,找出最优回归方程。所得结论与我国当前形势相印证。关键词:多元线性回归,逐步回归法,多重共线性诊断,主成份分析0符号说明变 量符号国内生产总值Y交

2、通运输增加量X1住宿和餐饮业增加值X2房地产业X3人口X4国民总收入X5工业生产总值X6建筑业生产总值X71 介绍文中主要应用逐步回归的主成份分析方法,对数据进行分析处理,最终得出能够反映各个因素对国内生产总值影响的最“优”模型及线性回归方程.国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标.它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。2012年1月,国家统计局公布2011年重要经济数据,其中GDP增长9.2 ,基本符合预期。2012年10月18日,统计显示,2012年前三季度国内生产

3、总值353480亿元,同比增长7.7%;其中,一季度增长8.1%,二季度增长7。6,三季度增长7.4,三季度增幅创下2009年二季度以来14个季度新低。中国的GDP核算历史不长,上世纪90年代之前通常用“社会总产值”来衡量经济发展情况。上世纪80年代初中国开始研究联合国国民经济核算体系的国内生产总值(GDP)指标。1985年开始,中国建立GDP核算制度,1992年,正式取消国民收入核算,GDP成为国民经济核算的核心指标。2003年国家统计局宣布中国将改进GDP核算与数据发布制度,取消容易引起误解的预计数,建立定期修正和调整GDP数据的机制,在发布GDP数据的同时发布相关的重要数据,必要时还将公

4、布核算方法.这是中国提高GDP数据的准确性和透明度,向国际通行办法迈进的重要一步。2014年将全力推进重点改革创新积极稳妥的推进国家统一核算地区生产总值,深化固定资产投资统计,加快改进能耗统计进一步完善社会消费品零售统计,同时将精心组织实施第三次全国经济普查认真做好普查登记。尽快制定经济核算图,指定全国统一的核算办法,为2015年正式实施全国统一的核算GDP来打下一个基础。此举将有效消除近10年来各省GDP总和与国家统计局核算的全国GDP存在较大出入的情况。2005年12月20日,中国国家统计局根据一项重大的经济统计计划所获得的数据重新发布了中国2004年国内生产总值为15。98万亿元人民币,

5、比预期增加预期16.8。此统计过程世界银行向中国政府提供了咨询。根据这项统计,中国农业的比例占13。1,工业比例占46。2,服务业比例上升到40。7。造成中国2004年经济数据大幅度增长的原因是由于本次第一次全国经济普查(全国经济普查)中发现漏报的第三产业经济总值高达2。4万亿元人民币。国民生产总值是指一个国家(地区)所有常住机构单位在一定时期内(年或季)收入初次分配的最终成果(简称GNP)。一个国家常住机构单位从事生产活动所创造的增加值(国内生产总值)在初次分配过程中主要分配给这个国家的常住机构单位,但也有一部分以劳动者报酬和财产收入等形式分配给该国的非常住机构单位。同时,国外生产单位所创造

6、的增加值也有一部分以劳动者报酬和财产收入等形式分配给该国的常住机构单位。从而产生了国民生产总值概念,它等于国内生产总值加上来自国外的劳动报酬和财产收入减去支付给国外的劳动者报酬和财产收入.国内生产总值是反映一国(地区)全部生产活动最终成果的重要指标,是一个国家(地区)领土范围内,包括本国居民、外国居民在内的常住单位在报告期内所产和提供最终使用的产品和服务的价值.2 统计分析步骤2。1 数据的采集和整理本文在进行统计时,查阅中国统计年鉴中收录的1978年至2012年连续35年的国内生产总值为因变量,考虑一些与国内生产总值关系密切并且直观上有线性关系的因素,经过深思熟虑我初步选取了这35年的交通运

7、输增加量、住宿和餐饮业增加值、房地产业、人口、国民总收入、工业生产总值、建筑业生产总值等因素为自变量,分析它们之间“最优”回归方程.表2-1 1978-2012年国内生产总值及其影响因素统计表年度交通运输增加值住宿和餐饮业增加值房地产业人口国民总收入国内生产总值工业生产总值建筑业生产总值1978100。0100。0100.0962593645.23645.21607.0138.21979108.3111。1104。1975424062。64062。61769。7143.81980112。9115。5112。3987054545。64545.61996.5195。51981115.0135。61

8、08.41000724889。54891.62048.4207.11982128。1178。5118.21016545330。55323。42162.3220。71983140。2213.1124.31030085985。65962.72375.6270.61984161。1230。3158。71043577243.87208。12789。0316。71985183。3244.8198。41058519040.79016.03448。7417。91986208.8283。1249.710750710274。410275.23967.0525.71987228.9310.5322。9109300

9、12050。612058。64585.8665.81988257.5388。5363。811102615036。815042.85777.2810。01989268。3426.9421。811270417000.916992.36484.0794。01990290.7441.8448。211433318718.318667.86858。0859。41991321.4477.9501。711582321826.221781.58087.11015.11992353.7607.0675.911717126937。326923.510284.51415。01993398.1657.0748。6118

10、51735260.035333.914188.02266.51994432。0835。3838.211985048108.548197.919480.72964.71995479。4920。8942。512112159810。560793.724950。63728.81996532。4983.8980.512238970142。571176。629447.64387。41997581。31091.41021.012362678060。978973.032921.44621。61998642。91212。21099.412476183024。384402。334018。44985.8199972

11、1.21305。71164。712578688479。289677。135861.55172.12000783.01427。71247.512674398000。599214。640033.65522.32001852。01536.81384。6127627108068.2109655。243580.65931。72002912.71723。41521。8128453119095.7120332。747431.36465.52003968。61936.41671.0129227134977。0135822.854945。57490。820041108.92175.31769.612998815

12、9453.6159878.365210.08694.320051233.12442.01986.1130756183617。4184937。477230。810367。320061356.02748。92293.5131448215904.4216314.491310。912408.620071516.03013.32852.1132129266422.0265810。3110534.915296。520081627.13302。62879。5132802316030。3314045。4130260。218743。220091695.03483.53204。4133450340320。0340

13、902。8135239。922398.820101861。03832.13428。3134091399759.5401512.8160722.226661。020112044.74084。83658。5134735468562.4473104.0188470。231942.720122187。34410.43799.0135404516282.1518942.1199670。735491。32.2采用多重逐步回归分析解:拟合国民生产总值与这7个因素的线性回归曲线,我们不知道他们对于国明生产总值有无影响,那就使用逐步法由软件来选择判断。运用spss软件中的回归-线性里的一系列功能,输出下列一系列

14、图进行逐步线性回归分析。图1由图一可见,有两观察点学生化残差的绝对值大于2,怀疑其为异常点。不考虑该异常点重新拟合回归模型。将自变量作为待筛选量,使用专业统计分析软件IBM SPSS Statistics 20进行逐步回归计算,.有两个变量没有达到选入标准,最终没有进入。其分析结果如表22至26所示。表2-2输入移去的变量a模型输入的变量移去的变量方法1国民总收入。步进(准则: F-toenter 的概率 = .050,F-to-remove 的概率 = .100).2建筑业生产总值。步进(准则: F-to-enter 的概率 = 。050,Fto-remove 的概率 = .100)。3交通

15、运输增加值.步进(准则: Fto-enter 的概率 = 。100)。4房地产业。步进(准则: Ftoenter 的概率 = 。050,Ftoremove 的概率 = 。100).5工业生产总值。步进(准则: Ftoenter 的概率 = 。100).a。 因变量: 国内生产总值表22模型的筛选过程表23模型汇总f模型RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改11。000a1.0001.000916。75421。000816165.166133。00021.000b1。0001.000829.3019.0008。32

16、7132.00731.000c1。0001。000640.4842。00022。649131。00041.000d1。0001.000583。2619.0007。381130.01151.000e1.0001。000530.7914。0007.224129.0121.585a。 预测变量: (常量), 国民总收入。b. 预测变量: (常量), 国民总收入, 建筑业生产总值。c. 预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值。d。 预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值, 房地产业。e. 预测变量: (常量), 国民总收入, 建筑业生产总

17、值, 交通运输增加值, 房地产业, 工业生产总值。f。 因变量: 国内生产总值表2-3拟合的模型的决定系数的改变情况表24Anovaa模型平方和df均方FSig。1回归685936455784.2771685936455784。277816165。166.000b残差27734463。52733840438。289总计685964190247。804342回归685942182514.7962342971091257.398498691。751。000c残差22007733。00832687741.656总计685964190247.804343回归685951473427。523322865

18、0491142。508557385。028。000d残差12716820.28131410220。009总计685964190247.804344回归685953984413。8964171488496103。474504089。615。000e残差10205833.90830340194.464总计685964190247.804345回归685956019801。8955137191203960。379486943。425。000f残差8170445。90929281739。514总计685964190247.80434a。 因变量: 国内生产总值b。 预测变量: (常量), 国民总收入。

19、c。 预测变量: (常量), 国民总收入, 建筑业生产总值.d。 预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值。e。 预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值, 房地产业.f. 预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值, 房地产业, 工业生产总值。表24对拟合后的模型的方差分析检验结果表25已排除的变量a模型Beta IntSig。偏相关共线性统计量容差VIF最小容差1交通运输增加值.003b-.592。558。104。03925.783.039住宿和餐饮业增加值。006b-1.008.321。175。037

20、27。071。037房地产业-.006b1。050。302-.182。03925.531.039人口。001b。563.577.099。3902。567。390工业生产总值。053b-1。639.111。278.001891.649。001建筑业生产总值。034b2。886。007。454。007137.035。0072交通运输增加值。037c4。759.000。650。010103。072.001住宿和餐饮业增加值。032c3.391。002.520.009116.929.001房地产业。014c1.756。089。301。01663.806.002人口.006c3.290。003。509。

21、2553。926.004工业生产总值.027c.590。559。105。0002032。426.0003住宿和餐饮业增加值。043d1。893.068-。327。001936.554.001房地产业.025d2。717。011-。444.006166.228.001人口-.004d1。114.274.199。05318.805.000工业生产总值.050d1.449.158。256.0002069。675.0004住宿和餐饮业增加值。024e-1。003.324-。183。0011110。820。001人口.001e-.155.878。029。04522.285.000工业生产总值.082e2

22、。688.012。447。0002255.478.0005住宿和餐饮业增加值.037f1.755。090-。315。0011160.669。000人口.001f。163。872。031。04422。641.000a. 因变量: 国内生产总值b。 模型中的预测变量: (常量), 国民总收入。c. 模型中的预测变量: (常量), 国民总收入, 建筑业生产总值。d。 模型中的预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值。e. 模型中的预测变量: (常量), 国民总收入, 建筑业生产总值, 交通运输增加值, 房地产业。f。 模型中的预测变量: (常量), 国民总收入, 建筑业

23、生产总值, 交通运输增加值, 房地产业, 工业生产总值。表2-5多重 线性回归拟合模型过程中未进入模型的变量的检验情况最终的“最优”方程为:表2-6给出了残差、预测值等一些指标。表26残差统计量a极小值极大值均值标准 偏差N预测值3281。013519062。063113583.545142039.350435标准 预测值-。7772.855。0001.00035预测值的标准误差120.372465.069203.68183.74235调整的预测值3234。354519458。531113577。384142023。198935残差905.08021083。4408。0000490。21143

24、5标准 残差-1.7052。041.000.92435Student 化 残差2。3242。976.0051。11235已删除的残差1681.17492303。47176.1611737.433735Student 化 已删除的残差-2.5313.509.0171。18835Mahal。 距离.77725。1304.8575.44135Cook 的距离。0001.662。112.31335居中杠杆值.023。739.143。16035a. 因变量: 国内生产总值图2所示为残差的直方图。可见,残差分布比较均匀,近似正态分布,反应了变量服从正态分布。图2如图3所示为残差的正态PP图,可见残差分布是

25、否正态,可见散点大部分呈直线趋势,可认为应变量服从正态分布。图32.3进行共线性诊断表2-7即为共线性诊断表格表27共线性诊断a模型维数特征值条件索引方差比例(常量)国民总收入建筑业生产总值交通运输增加值房地产业工业生产总值111.6301.000.19.192。3702.098.81。81212.5011.000.05。00.002.4972.244。71.00.003。00233。209.241.001.00313。4831.000.01.00。00。002.4982。645.17.00。00。003。01913.682.30.00.02。144。00098.503.521。00.98.86414.4701.000.00。00.00.00。002.5012。987.16.00。00.00.003。02812。687。24.00。02。01。034。00154。628。04.02。02.43。925.000114.037。55.97。96。55。05515.4371。000。00。00.00。00.00.002。5323。197.16。00

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1