1、的应用统计spss分析报告报告材料学生姓名: 肖浩鑫 学号:31407371 一、实验项目名称:实验报告(三)二、实验目的和要求(一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验;(二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测;(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归;三、实验内容1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)1401
2、3078416524215081001703501559116167455140101251805651501113017567815412140185(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京224607326辽宁112264490上海3454711546江西48512396河南54442208贵州26621608陕西45492035(1)绘制散点图
3、,并计算相关系数,说明二者之间的关系。(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(3)计算判定系数和估计标准误差,并解释其意义。(4)检验回归方程线性关系的显著性()(5)如果某地区的人均GDP为5000元,预测其人均消费水平。(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:航空公司编号航班正点率(%)投诉次数(次)181.821276.658376.685475.768573.874672.293771.27287
4、0.8122991.4181068.5125(1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。(2)检验回归系数的显著性()。(3)如果航班正点率为80%,估计顾客的投诉次数。4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificance F回归2.17E-09残差40158.07总计111642866.67参数估计表Coefficients标准误差t StatP-valueIntercept363.689162.455295.8231910.000
5、168X Variable 11.4202110.07109119.977492.17E-09(1)完成上面的方差分析表。(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。(5)检验线性关系的显著性(a0.05)。5. 随机抽取7家超市,得到其广告费支出和销售额数据如下超市广告费支出/万元销售额/万元A119B232C444D640E1052F1453G2054(1) 用广告费支出作自变量,销售额为因变量,求出估计的回归方程。(2) 检验广告费支出与销售额之间的线性关系是否显著(a0.05)。
6、(3) 绘制关于的残差图,你觉得关于误差项的假定被满足了吗?(4) 你是选用这个模型,还是另寻找一个该更好的模型?6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据月销售收入y(万元)电视广告费用(万元)报纸广告费用(万元)965.01.5902.02.0954.01.5922.52.5953.03.3943.52.3942.54.2943.02.5(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回
7、归系数的意义。(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。7. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下收获量y (kg)降雨量x1 (mm)温度x2 ()2250256345033845004510675010513720011014750011516825012017建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a0.05),你认为模型中是否存在多重共线性?8. 一家房地产评估公司想对某城市的房地产销售价格(y
8、)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据如下:房地产编号销售价格y(元/)地产估价(万元)房产估价(万元)使用面积()1689059644971873024850900278092803555095031441126046200100039591265051165018007283221406450085027329120738008002986899088300230047751803095900810391212040104750900293517250114050730401210
9、80012400080031681529013970020005851245501445508002345115101540908002089117301680001050562519600175600400208613440183700450226198801950003403595107602022401505789620用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。9. 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下月薪y(元)工龄性别(1=男,0=女)15483.2116293.8110112.7012293.
10、4017463.6115284.1110183.8011903.4015513.319853.2016103.5114322.9112153.309902.8015853.51进行回归并对结果进行分析。四、实验数据记录与分析 (基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。)1、(1)由图可知,产量与生产费用呈正线性相关(2)相关性产量生产费用产量Pearson 相关性1.920*显著性(双侧).000N1212生产费用Pearson 相关性.920*1显著性(双侧).000N1212*. 在 .01 水平(双侧)上显著相关。
11、产量与生产费用之间的线性相关系数为0.0920,显著相关2、(1)相关性人均GDP人均消费水平人均GDPPearson 相关性1.998*显著性(双侧).000N77人均消费水平Pearson 相关性.998*1显著性(双侧).000N77*. 在 .01 水平(双侧)上显著相关。人均GDP与人均消费水平呈正线性相关,相关系数为0.998(2)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000a. 因变量: 人均消费水平回归方程:y=734.693+0.309x含义:人均GDP
12、每增加1元,人均消费就增加0.309元(3)模型汇总模型RR 方调整 R 方标准 估计的误差1.998a.996.996247.30347a. 预测变量: (常量), 人均GDP。人均GDP对人均消费的影响达到99.6%(4)F检验Anovab模型平方和df均方FSig.1回归8.144E718.144E71331.692.000a残差305795.034561159.007总计8.175E76a. 预测变量: (常量), 人均GDP。b. 因变量: 人均消费水平t检验系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)734.693139.5405.265.003人均GDP.
13、309.008.99836.492.000b. 因变量: 人均消费水平(5)y=734.693+0.309*5000=2279.693如果某地区的人均GDP为5000元,预测其人均消费水平为2279.693元(6)人均GDP为5000元时,人均消费水平95%的置信区间为2050.84067,2505.91078,预测区间为1680.94287,2875.80857。3、(1)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)430.18972.1555.962.000航班正点率-4.701.948-.869-4.959.001a. 因变量: 投诉次数回归方程:y=430.18
14、9-4.701x回归系数的含义:投诉次数每增加一次,航班正点率下降4.701%(2) 由于Sig=0.0010.05 显著(3)80=430.189-4.701 x=74如果航班正点率为80%,估计顾客的投诉次数为74次4、(1)3、5、变差来源dfSSMSFSignificance F回归11602708.61602708.6399.10000652.17E-09残差1040158.074015.807总计111642866.67(2)R2=SSR/SST=1602708.6/1642866.67=97.6%汽车销售量的变差中有97.6%是由于广告费用的变动引起的(3)R=根号R2=0.98
15、77销售量与广告费用之间的相关系数是0.9877(4)估计的回归方程:y=363.6891+1.420211x回归系数为1.420211,表示广告费用每增加一个单位,汽车销售量平均增加1.420211个单位(5)回归系数的检验:p=2.17E-09,回归系数不等于0,显著回归直线的检验:p=2.17E-09,回归直线显著5、(1)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)29.3994.8076.116.002广告支出费用1.547.463.8313.339.021a. 因变量: 销售额回归方程估计是:y=29.399+1.547x(2)F检验Anovab模型平方和d
16、f均方FSig.1回归691.7231691.72311.147.021a残差310.277562.055总计1002.0006a. 预测变量: (常量), 广告支出费用。b. 因变量: 销售额Sig=0.0210.05显著t检验系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)29.3994.8076.116.002广告支出费用1.547.463.8313.339.021c. 因变量: 销售额Sig=0.0020.05 显著(3)残差不全相等(4)应考虑其他模型,可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)6、(1)系数a模型非标准化系
17、数标准系数tSig.B标准 误差试用版1(常量)88.6381.58256.016.000电视广告费用1.604.478.8083.357.015a. 因变量: 月销售收入估计的回归方程:y=88.64+1.6x(2)、系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)83.2301.57452.882.000电视广告费用2.290.3041.1537.532.001报纸广告费用1.301.321.6214.057.010a. 因变量: 月销售收入估计的回归方程:y=83.23+2.29x1+1.301x2回归系数的意义:报纸广告费用不变的情况下,电视广告费用每增加1万元,月
18、销售额增加2.29万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加1.301万元。(3)不相同,(1)中表示电视广告费用每增加1万元,月销售额增加1.6万元;(2)中表示电视广告费用每增加1万元,月销售额增加2.29万元(4)(1)中的含义为电视广告费用对月销售额达到的影响程度,(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度7、系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.591505.004-.001.999降雨量22.3869.601.4152.332.080温度327.67298.798.5903.317.029a. 因
19、变量: 收获量Anovab模型平方和df均方FSig.1回归31226615.257215613307.629228.444.000a残差273384.743468346.186总计31500000.0006a. 预测变量: (常量), 温度, 降雨量。b. 因变量: 收获量估计的回归方程:y=-0.591+22.386x1+327.672x2回归线性显著降雨量的回归系数不显著,温度的显著x1与x2的相关系数rx1x2=0.965,存在多重共线性8、系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)895.020535.8331.670.112房产估计1.351.140.91
20、69.673.0002(常量)11.653592.972.020.985房产估计.961.200.6514.794.000使用面积.163.066.3362.470.024a. 因变量: 销售价格估计的回归方程:y=11.653+0.163x1+0.961x2销售价格的预测值及95%的置信区间和预测区间:9、SUMMARY OUTPUT回归统计Multiple R0.943391R Square0.889987Adjusted R Square0.871652标准误差96.79158观测值15方差分析dfSSMSFSignificance F回归分析2909488.4454744.248.53
21、9141.77E-06残差12112423.39368.61总计141021912Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept732.0606235.58443.1074250.009064218.76641245.355218.76641245.355工龄111.220272.083421.5429370.148796-45.8361268.2765-45.8361268.2765性别(1=男,0=女)458.684153.45858.580191.82E-06342.208575.1601342.208575.1601拟合优度良好,方程线性显著,工龄线性不显著,性别线性显著
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1