ImageVerifierCode 换一换
格式:DOCX , 页数:41 ,大小:392.37KB ,
资源ID:29231152      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/29231152.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(交大应用回归实验报告.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

交大应用回归实验报告.docx

1、交大应用回归实验报告学 生 实 验 报 告实验课程名称 应 用 回 归 分 析 开课实验室 数 学 实 验 室 学 院 学院 级 11级 专业班 学 生 姓 名 学 号 开 课 时 间 2013 至 2014 学年第 2 学期评分细则评 分报告表述的清晰程度和完整性(30分)程序设计的正确性(40分)实验结果的分析和体会(30分)总 成 绩实验指导教师实验2.15一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的心保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表2.7.表2.7周序号1234567891

2、0X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.0(1)画出散点图:(1) X与y之间是否大致呈线性关系;答:由(1)的散点图可以看出x与y之间大致呈线性关系。(2) 用最小二乘估计求出回归方程;答:由SPSS得:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).118.355.333.748x.004.000.9498.509.000a. 因变量: y由该系数表得出最小二乘估计的回归方程为:(3) 求回归标准误差;答:模型汇总模型RR 方调整 R 方标准 估计的误差1.949a.900.88

3、8.48002a. 预测变量: (常量), x。由上表得回归标准误差为: =0.48002(4) 给出与的置信度为95%的区间估计;答: 系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量).118.355.333.748-.701.937x.004.000.9498.509.000.003.005a. 因变量: y由上表得:得置信区间为:(-0.701,0.0937);得置信区间为:(0.003,0.005);(5) 计算x与y的决定系数;答:由(4)得模型汇总表得:=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差

4、波动。(6) 对回归方程做方差分析;答:由SPSS得方差表:Anovab模型平方和df均方FSig.1回归16.682116.68272.396.000a残差1.8438.230总计18.5259a. 预测变量: (常量), x。b. 因变量: y由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。(7) 做回归系数1显著性的检验;答:从(5)中得系数表中可得:回归系数1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。(8) 做相关系数的显著性检验;答:从(4)的模型汇总表可得:r=0.949,说明y与x有显著的线性关系,与F检验和

5、回归系数检验的结果一致。也说明对于一元线性回归三种检验的结果是完全一致的;(9) 对回归方程作残差图并作相应的分析;答:残差图:从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。(10) 该公司预计下一周签发新保单=1000张,需要的加班时间是多少?答:由SPSS得下表:xyPRELICIUICILMCIUMCI8253.53.075861.913294.238442.720513.4312221510.88893-0.387912.165770.252531.52534107043.954222.755315.153143.493694.4147555022.089950

6、.910863.269051.68382.4961148011.838990.646133.031851.394462.2835392033.416452.245384.587523.034223.7986813504.54.958063.664136.251994.288025.628093251.51.28330.047122.519470.7331.8335967032.520171.355773.684572.158892.88145121554.474063.232465.715673.911695.0364410003.703262.519494.887033.283734.122

7、79从表中得出加班时间: (11) 给出的置信水平为95%的精确预测区间和近似预测区间。答:从(10)表可以得出置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为即(2.74332,3.70326)。(12) 给出E()置信水平为95%的区间估计。答:从(11)表中得E()置信水平为95%的区间估计为:(2.51949,4.88703)。实验2.16表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归;(3)用线性

8、回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。(4)通过p-p图或q-q,若有异常点剔出后再分析。表2.8序号yx序号yx序号yx119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382510634295294704669222462445173922482394762661048882327186434940209692509730678571024339905020412722

9、454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122714036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349

10、172197431553418443230551258453766解: 由图知其大致呈线性关系 描述性统计量均值标准 偏差Ny24354.574178.82451x3694.651053.06051相关性yxPearson 相关性y1.000.835x.8351.000Sig. (单侧)y.000x.000.Ny5151x5151输入移去的变量b模型输入的变量移去的变量方法1xa.输入a. 已输入所有请求的变量。b. 因变量: y模型汇总b模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.835a.698.6912321.667.698112

11、.986149.000a. 预测变量: (常量), x。b. 因变量: yAnovab模型平方和df均方FSig.1回归6.090E816.090E8112.986.000a残差2.641E8495390136.691总计8.731E850a. 预测变量: (常量), x。b. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)12109.8791196.94810.117.000x3.314.312.83510.630.000a. 因变量: y残差统计量a极小值极大值均值标准 偏差N预测值19722.5339779.8924354.573490.01951标准

12、预测值-1.3274.420.0001.00051预测值的标准误差325.1141487.149425.285176.41151调整的预测值19570.6038596.9524336.123406.18351残差-3848.0225523.929.0002298.33351标准 残差-1.6572.379.000.99051Student 化 残差-1.6822.403.0031.01051已删除的残差-3963.5895635.19818.4532397.55651Student 化 已删除的残差-1.7152.532.0091.03051Mahal。 距离.00019.535.9802.7

13、6951Cook 的距离.000.316.023.05051居中杠杆值.000.391.020.05551a. 因变量: y标准残差的直方图和正概率图2、回归方程为: 3、从图上可看出,检验误差项服从正态分布。实验3.11描述性统计量均值标准 偏差N货运总量y(万吨)231.5043.40110工业总产值x1亿元70.304.44810农业总产值x1亿元40.403.27310居民非商品之处x3(亿元)2.330.966110相关性货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品之处x3(亿元)Pearson 相关性货运总量y(万吨)1.000.556.731.724工业总产值

14、x1亿元.5561.000.113.398农业总产值x1亿元.731.1131.000.547居民非商品之处x3(亿元).724.398.5471.000Sig. (单侧)货运总量y(万吨).048.008.009工业总产值x1亿元.048.378.127农业总产值x1亿元.008.378.051居民非商品之处x3(亿元).009.127.051.N货运总量y(万吨)10101010工业总产值x1亿元10101010农业总产值x1亿元10101010居民非商品之处x3(亿元)10101010输入移去的变量b模型输入的变量移去的变量方法1居民非商品之处x3(亿元), 工业总产值x1亿元, 农业总

15、产值x1亿元a.输入a. 已输入所有请求的变量。b. 因变量: 货运总量y(万吨)模型汇总b模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.898a.806.70823.442.8068.28336.015a. 预测变量: (常量), 居民非商品之处x3(亿元), 工业总产值x1亿元, 农业总产值x1亿元。b. 因变量: 货运总量y(万吨)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), 居民非商品之

16、处x3(亿元), 工业总产值x1亿元, 农业总产值x1亿元。b. 因变量: 货运总量y(万吨)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-348.280176.459-1.974.096工业总产值x1亿元3.7541.933.3851.942.100农业总产值x1亿元7.1012.880.5352.465.049居民非商品之处x3(亿元)12.44710.569.2771.178.284a. 因变量: 货运总量y(万吨)残差统计量a极小值极大值均值标准 偏差N预测值175.47292.55231.5038.95210标准 预测值-1.4381.567.0001.000

17、10预测值的标准误差10.46620.19114.5263.12710调整的预测值188.35318.11240.1849.83910残差-25.19833.225.00019.14010标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.1231.18810已删除的残差-97.61550.883-8.68343.43210Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。 距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中杠杆值.099.642.30

18、0.17310a. 因变量: 货运总量y(万吨)相关系数矩阵:相关性货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品之处x3(亿元)货运总量y(万吨)Pearson 相关性1.556.731*.724*显著性(双侧).095.016.018N10101010工业总产值x1亿元Pearson 相关性.5561.113.398显著性(双侧).095.756.254N10101010农业总产值x1亿元Pearson 相关性.731*.1131.547显著性(双侧).016.756.101N10101010居民非商品之处x3(亿元)Pearson 相关性.724*.398.5471显著

19、性(双侧).018.254.101N10101010*. 在 0.05 水平(双侧)上显著相关。1、用SPSS算出y,x1,x2,x3相关系数矩阵如上图=2、3、由于决定系数R方=0.999 R=1.0000较大所以认为拟合度较高4、因为F=8.283 P=0.0150.05所以认为回归方程在整体上拟合的好5、可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。去除x3后作F检验,得:Anovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量:

20、(常量), x2, x1。b. 因变量: y由表知通过F检验继续做回归系数检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970.556.697.476.9871.013x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013a. 因变量: y此时,我们发现x1,x2的显著性大大提高。6、x1:(-0

21、.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)7、8、 残差统计量a极小值极大值均值标准 偏差N预测值175.4748292.5545231.500038.9520610标准 预测值-1.4381.567.0001.00010预测值的标准误差10.46620.19114.5263.12710调整的预测值188.3515318.1067240.183549.8391410残差-25.1975933.22549.0000019.1402210标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.12

22、31.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。 距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中杠杆值.099.642.300.17310a. 因变量: y所以置信区间为(175.4748,292.5545)9、由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好实验3.12描述性统计量均值标准 偏差NGDP7.03771266666667E43.

23、596620616470544E415第一产业增加值x112358.0804785.113615第二产业增加值x235077.81319370.023515相关性GDP第一产业增加值x1第二产业增加值x2Pearson 相关性GDP1.000.978.999第一产业增加值x1.9781.000.975第二产业增加值x2.999.9751.000Sig. (单侧)GDP.000.000第一产业增加值x1.000.000第二产业增加值x2.000.000.NGDP151515第一产业增加值x1151515第二产业增加值x2151515输入移去的变量b模型输入的变量移去的变量方法1第二产业增加值x2, 第一产业增加值x1a.输入a. 已输入所有请求的变量。b. 因变量: GDP模型汇总模型RR 方调整 R 方标准 估计的误差11.000a.999.9991.187620634109046E3a. 预测变量: (常量), 第二产业增加值

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1