1、a. 因变量: y由该系数表得出最小二乘估计的回归方程为:(4) 求回归标准误差;模型汇总RR 方调整 R 方标准 估计的误差.949a.900.888.48002a. 预测变量: (常量), x。由上表得回归标准误差为:=0.48002(5) 给出与的置信度为95%的区间估计; B 的 95.0% 置信区间下限上限-.701.937.003.005由上表得:得置信区间为:(-0.701,0.0937);(0.003,0.005);(6) 计算x与y的决定系数;由(4)得模型汇总表得:=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差波动。(7) 对回归方程做方差分析;
2、由SPSS得方差表:Anovab平方和df均方F回归16.68272.396.000a残差1.843.230总计18.525b. 因变量:由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。(8) 做回归系数1显著性的检验;从(5)中得系数表中可得:回归系数1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。(9) 做相关系数的显著性检验;从(4)的模型汇总表可得:r=0.949,说明y与x有显著的线性关系,与F检验和回归系数检验的结果一致。也说明对于一元线性回归三种检验的结果是完全一致的;(10) 对回归方程作残差图并作相应的分析;
3、残差图:从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。(11) 该公司预计下一周签发新保单=1000张,需要的加班时间是多少?由SPSS得下表:yPRELICIUICILMCIUMCI3.075861.913294.238442.720513.431220.88893-0.387912.165770.252531.525343.954222.755315.153143.493694.414752.089950.910863.269051.68382.496111.838990.646133.031851.394462.283533.416452.245384.58752
4、3.034223.798684.958063.664136.251994.288025.628091.28330.047122.519470.7331.833592.520171.355773.684572.158892.881454.474063.232465.715673.911695.0364410003.703262.519494.887033.283734.12279从表中得出加班时间:(12) 给出的置信水平为95%的精确预测区间和近似预测区间。从(10)表可以得出置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为即(2.74332,3.70326)
5、。(13) 给出E()置信水平为95%的区间估计。从(11)表中得E()置信水平为95%的区间估计为:(2.51949,4.88703)。2.16 表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归;(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。(4)通过p-p图或q-q,若有异常点剔出后再分析。表2.8序号19583334618208163059351953826422026331141918095
6、296736204603124203253554202093932853721419275226800454221226443914382510634292947046692224624451739224823947266104888232718643494020969250930678571024339905020412722454402717055362523382359442258924042258534168262062728214334022450035472722795336644246402829112427431592821570292045223412297122714036
7、212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解:(1)由图看出x与y大致呈直线关系;(2):12109.8791196.94810.1173.314.312.83510.630回归方程为:(3)由标准残差的直方图和正态概率图可以看出,误差项通过了正态性假设。(4)D
8、REZRESRE-3696.68-1.55754-1.5748-2224.35-0.93347-0.9457-3636.03-1.53486-1.55042-375.051-0.15628-0.158891958.1840.812460.8278-1780.17-0.73204-0.7492-392.213-0.15325-0.1609-3575.91-1.41585-1.47673-72.0447-0.0303-0.03066647.71380.273410.276181737.7220.729930.739153090.4091.304891.317945635.1982.379292.4
9、0314348.59290.146380.148252097.3420.884320.8938-2290.41-0.96691-0.97667-607.181-0.25503-0.25826-1471.5-0.61677-0.62523-3963.59-1.65744-1.68214-2105.59-0.8864-0.89661-2488.5-1.04991-1.06083-2536.66-1.05785-1.07509681.41740.285480.289475526.4252.258292.31852-651.909-0.27524-0.278-860.884-0.35843-0.364
10、56-480.739-0.2026-0.20482-224.075-0.09358-0.0950396.679740.040440.04104-2269.6-0.95838-0.96793-646.131-0.26929-0.273761354.8680.557930.570611847.0290.766580.78094-1381.23-0.56254-0.57851-1382.66-0.57197-0.58364-2055.73-0.86289-0.8741195.49050.08120.082691666.6310.702870.71033-2766.33-1.1668-1.179156
11、9.4720.234260.23971-3149.78-1.25555-1.30514394.84580.166370.16821-756.692-0.31903-0.322463262.3921.358651.381732770.3961.127841.16013900.3661.629421.654511658.6460.700410.7073814.120310.005940.006015166.62.181452.203312883.0480.732280.95361279.1540.540110.54551由标准化残差可以看出无异常点。3.11 研究货运总量y(万吨)与工业总产值x1
12、(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9.表3.9货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品之处x3(亿元)160701.0 260752.4210652.0 265743.0 240721.222068275784.0 663.2 250(1) 计算出y,x1,x2,x3的相关系数矩阵;由SPSS软件得:相关性x1x2x3Pearson 相关性.556.731*.724*显著性(双侧).095.016.018N.113.398.756.254.547.101*. 在 0.05 水平(双侧)上显著相关。所以y,x1,x2,x3的相
13、关系数矩阵为:(2) 求y关于x1,x2,x3的三元线性回归方程;-348.280176.459-1.974.096-780.06083.5003.7541.933.3851.942.100-.9778.4857.1012.880.5352.465.049.05314.14912.44710.569.2771.178.284-13.41538.310由上表可得: =3.754x1+7.101x2+12.447x3-348.280 对所求得的方程作拟合优度检验;模型汇总b.898a.806.70823.442 (常量), x3, x1, x2。复相关系数R=0.806,决定系数R方=0.898,
14、由决定系数看回归方程显著相关。(4)对回归方程作显著性检验;13655.3704551.7908.283.015a3297.130549.52216952.500方差分析表,F=8.283,P=0.015,表明回归方程显著相关,说明x1,x2,x3整体上对y有显著的线性影响。(5)对每一个回归系数作显著性检验;由上表数据可知:自变量x1,x2,x3对应P值为P1=0.100,P2=0.049,P3=0.284,从定性分析看,x2通过了显著性检验,x3的P值最大,明显未通过显著性检验,说明x3居民非商品支出对货运总量的影响是最小的。(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方
15、程,再作回归方程的显著性检验和回归系数的显著性检验。将x3剔除后,用y与x1,x2作回归,计算结果如图:.872a.761.69224.081 (常量), x2, x1。12893.1996446.60011.117.007a4059.301579.900-459.624153.058-3.003.020-821.547-97.7004.6761.816.4792.575.037.3818.9708.9712.468.6763.634.0083.13414.808剔除x3后的回归方程为: =4.676x1+8.971x2-459.624回归方程的显著性检验:此时的F=11.117,P=0.00
16、7,表明回归方程高度显著,说明x1,x2整体上对y有高度的线性影响。回归系数的显著性检验:剔除x3后,其余自变量的显著性都发生了不同程度的变化,这是由于自变量之间的相关性造成的,此时P1=0.037,P2=0.008,说明自变量都已显著,都通过了显著性检验。求出每一个回归系数的置信水平为95%的置信区间;1置信区间为(0.381,8.970)2的置信区间为(3.134,14.808)求标准化回归方程;求当=75,=42,=3.1时的,给定置信水平为95%,用spss软件计算精确置信区间,用手工计算近似预测区间。居民非商品支出x3(亿元)181.6541114.1804249.1279249.8
17、871186.7191313.0551203.1308139.2701266.9915263.1534200.9208325.3859217.9183155.9556279.8809262.0125195.3407328.6842281.8559213.4631350.2487171.9226105.138238.7071262.3928199.0204325.7651221.0727156.1113286.03413.1267.829204.4355331.2225从上面的数据可知: ,精确置信区间为(204.4355,331.2225),由前面问题6的表得 ;手工计算进似预测区间为 即 (219.667,315.991)结合回归方程对问题做一些基本分析。回归方程:从这个回归方程
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1