1、回归分析练习题及参考答案讲课讲稿1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP/元 人均消费水平/元 北京 辽宁 上海 江西 河南 贵州 陕西 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)
2、检验回归方程线性关系的显著性()。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95的置信区间和预测区间。解:(1)可能存在线性关系。(2)相关系数:系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a. 因变量: 人均消费水平有很强的线性关系。(3)回归方程:系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)734.693139.5405
3、.265.003人均GDP.309.008.99836.492.000.998.998.998a. 因变量: 人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)%(4)模型汇总模型RR 方调整 R 方标准 估计的误差1.998a.996.996247.303a. 预测变量: (常量), 人
4、均GDP。人均GDP对人均消费的影响达到99.6%。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。模型摘要模型RR 方调整的 R 方估计的标准差1.998(a)0.9960.996247.303a. 预测变量:(常量), 人均GDP(元)。%(5)F检验:Anovab模型平方和df均方FSig.1回归81444968.680181444968.6801331.692.000a残差305795.034561159.007总计81750763.7146a. 预测变量: (常量), 人均GDP。b. 因变量: 人均消费水平回归系数的检验:t检验系数a模型非标准化系数标准系数tSig.
5、相关性B标准 误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a. 因变量: 人均消费水平%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.998培养动手能力 学一门手艺 打发时间 兴趣爱好36.4920.000a. 因变量: 人均消费水平(元)300-400元 16 32%大学生对手工艺制作兴趣的调研(6)我们大学生没
6、有固定的经济来源,但我们也不乏缺少潮流时尚的理念,没有哪个女生是不喜欢琳琅满目的小饰品,珠光宝气、穿金戴银便是时尚的时代早已被推出轨道,简洁、个性化的饰品成为现代时尚女性的钟爱。因此饰品这一行总是吸引很多投资者的目光。然而我们女生更注重的是感性消费,我们的消费欲望往往建立在潮流、时尚和产品的新颖性上,所以要想在饰品行业有立足之地,又尚未具备雄厚的资金条件的话,就有必要与传统首饰区别开来,自制饰品就是近一两年来沿海城市最新流行的一种。某地区的人均GDP为5000元,预测其人均消费水平为(元)。(7)人均GDP为5000元时,人均消费水平95的置信区间为1990.74915,2565.46399,
7、预测区间为1580.46315,2975.74999。调研课题:服饰 学习用品 食品 休闲娱乐 小饰品2 从n=20的样本中得到的有关回归结果是:SSR(回归平方和)=60,SSE(误差平方和)=40。要检验x与y之间的线性关系是否显著,即检验假设:。十字绣 编制类 银饰制品类 串珠首饰类 (1)线性关系检验的统计量F值是多少? (2)给定显著性水平,是多少?2 www。cer。net/artide/2003082213089728。shtml。 (3)是拒绝原假设还是不拒绝原假设?(1) 政策优势 (4)假定x与y之间是负相关,计算相关系数r。 (5)检验x与y之间的线性关系是否显著?(二)
8、创业优势分析解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18; 因此:F=27(2)=4.41(3)拒绝原假设,线性关系显著。(4)r=0.7746,由于是负相关,因此r=-0.7746(5)从F检验看线性关系显著。3 随机抽取7家超市,得到其广告费支出和销售额数据如下: 超市 广告费支出/万元 销售额/万元 A B C D E F G l 2 4 6 10 14 20 19 32 44 40 52 53 54求:(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著()。(3)绘制关于x的残差图,你觉得关于误差
9、项的假定被满足了吗? (4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a. 因变量: 销售额(万元)(2)回归直线的F检验:ANOVA(b)模型 平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006a. 预测变量:(常量), 广告费支出(万元)。b. 因变量: 销售额(万元)显著。回归系数的t检验:系数(a)模型 非
10、标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a. 因变量: 销售额(万元)显著。(3)未标准化残差图:_标准化残差图:学生氏标准化残差图:看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)。4 根据下面SPSS输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F,se,R2及调整的的值对模型进行讨论。模型汇总b模型RR 方调整 R 方标准 估计的误差10.8424070.709
11、6500.630463109.429596Anovab模型平方和df均方FSig.1回归321946.80183107315.60068.9617590.002724残差131723.19821111974.84总计45367014系数a模型非标准化系数tSig.B标准 误差1(常量)657.0534167.4595393.9236550.002378VAR00002VAR00003VAR000045.710311-0.416917-3.4714811.7918360.3221931.4429353.186849-1.293998-2.4058470.0086550.2221740.034870解:自变量3个,观察值15个。回归方程:=657.0534+5.710311X1-0.416917X2-3.471481X3拟合优度:判定系数R2=0.70965,调整的=0.630463,说明三个自变量对因变量的影响的比例占到63%。 估计的标准误差=109.429596,说明随即变动程度为109.429596回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系显著。回归系数的检验:的t检验的P=0.008655,在显著性为5%的情况下,y与X1线性关系显著。的t检验的P=0.2221
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1