推荐spss回归分析训练集精选word文档 15页.docx

上传人:b****4 文档编号:26800701 上传时间:2023-06-22 格式:DOCX 页数:15 大小:19.92KB
下载 相关 举报
推荐spss回归分析训练集精选word文档 15页.docx_第1页
第1页 / 共15页
推荐spss回归分析训练集精选word文档 15页.docx_第2页
第2页 / 共15页
推荐spss回归分析训练集精选word文档 15页.docx_第3页
第3页 / 共15页
推荐spss回归分析训练集精选word文档 15页.docx_第4页
第4页 / 共15页
推荐spss回归分析训练集精选word文档 15页.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

推荐spss回归分析训练集精选word文档 15页.docx

《推荐spss回归分析训练集精选word文档 15页.docx》由会员分享,可在线阅读,更多相关《推荐spss回归分析训练集精选word文档 15页.docx(15页珍藏版)》请在冰豆网上搜索。

推荐spss回归分析训练集精选word文档 15页.docx

推荐spss回归分析训练集精选word文档15页

本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!

==本文为word格式,下载后可方便编辑和修改!

==

spss回归分析训练集

篇一:

回归分析练习题

回归分析练习题

求:

(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(?

?

0.05)。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

1.

从图上看,可以知道,点的分布呈现线性分布。

1

2从n=20的样本中得到的有关回归结果是:

SSR(回归平方和)=60,SSE(误差平方和)=40。

要检验x与y之间的线性关系是否显著,即检验假设:

H0:

?

1?

0。

(1)线性关系检验的统计量F值是多少?

(2)给定显著性水平?

?

0.05,F?

是多少?

(3)是拒绝原假设还是不拒绝原假设?

(4)假定x与y之间是负相关,计算相关系数r。

(5)检验x与y之间的线性关系是否显著?

求:

(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。

(2)检验广告费支出与销售额之间的线性关系是否显著(?

?

0.05)。

(3)绘制关于x的残差图,你觉得关于误差项?

的假定被满足了吗?

2

(4)你是选用这个模型,还是另寻找一个更好的模型?

4根据下面SPSS输出的回归结果,说明模型中涉及多少个自变量?

多少个观察值?

写出回

归方程,并根据F,se,R2及调整的R2

a的值对模型进行讨论。

3

(1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?

(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?

(3)求回归方程,并检验模型的线性关系是否显著(?

?

0.05)。

(4)解释判定系数R2,所得结论与问题

(2)中是否一致?

(5)计算x1与x2之间的相关系数,所得结果意味着什么?

(6)模型中是否存在多重共线性?

你对模型有何建议?

6(选做)一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。

下面是近8个月的销售额与广告费用数据:

求:

(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。

(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。

(3)上述

(1)和

(2)所建立的估计方程,电视广告费用的系数是否相同?

对其回归系数分别进行解释。

(4)根据问题

(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释

4

的比例是多少?

(5)根据问题

(2)所建立的估计方程,检验回归系数是否显著(?

?

0.05)。

求:

(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。

(2)解释回归系数的实际意义。

(3)根据你的判断,模型中是否存在多重共线性?

5

篇二:

spss练习作业具体步骤

一、调查问卷

二、用SPSSStatistics软件进行描述统计分析

1、某地区经济增长率的时间序列图形。

解:

第一步:

数据来源,如图1

图1某地区经济增长率xls截图图2Spss软件制作过程截图

第二步:

将数据输入SPSS软件之中,如图2,制作某地区经济增长率的时间序列图形,如图3。

图3某地区1990—201X年经济增长率的时间序列图

第三步,从图中可以看出,某地区随时间的变化经济增长率变化趋势较大。

2、用SPSSStatistics进行描述统计分析

解:

第一步,按照题目中的要求,随机选取了148个数据,如图4部分数据:

图4Spss随机数据截图

第二步,根据要求,对上月工资进行描述统计分析,主要包括描述数据的集中趋势、离散程度(见表1),绘制直方图(见图5)。

表1上月工资描述统计表(单位:

元)

集中趋势

均值中值众数和偏度

数据总计

2925290029004329000.165

极小值极大值全距标准差峰度

148离散趋势

150048003300496.3641.238

图5上月工资直方图

第三步,分析数据的统计分布状况。

首先,从集中趋势来,上个月平均工资2925元,其中众数和中数也都在2900元,这说明大部分工资水平在2900左右。

其次,从离散趋势来看,最高工资4800元,最低工资1500元,最高工资和最低工资相差3300元,标准差为496.364,相差较大。

最后,从直方图来看和评述统计表来看,工资在2900元以上的占多数。

可以的该地区整体工资水平大于平均值的占多数,该地区工资水平相对较高。

峰度为1.238,偏度为0.165符合正态分布。

三、用SPSSStatistics软件进行参数估计和假设检验及回归分析

1、计算总体中上月平均工资95%的置信区间(见表3)。

解:

总体中上月平均工资分布未知,但是样本容量大于30,且已知标准误,所以通过SPSS分析得出总体中上月平均工资95%的置信区间,见表3,假设;

H0:

总体中上月平均工资95%的不在此在此区间

H1:

总体中上月平均工资95%的在此区间

答,总体中上月平均工资095的置信区间为[2844.37,3005.63],p=0.000<0.01,作出这样的推论正确的概率为0.95,错误的概率为0.05。

2、检验能否认为总体中上月平均工资等于201X元。

解:

在本案例中,要检验样本中上月平均工资与总体中上月平均工资(为已知值:

201X元)是否存在差异,即某一样本数据与某一确定均值进行比较。

虽然不知道总体分布是否正态,但样本较大(N>30),可以运用单样本T检验.通过SPSS检验结果见(表4、表5)设;Ho:

?

?

201X

H1:

?

?

201X其中,μ表示总体中上月平均工资

表4单个样本统计量

表5单个样本检验

答:

作出结论,均值差值为925,t=22.671,p=0.000<0.01,所以拒绝原假设,接受备择假设,即否认总体中上月的平均工资等于201X元。

3、检验能否认为男生的平均工资大于女生

解:

两个样本均来自于正态分布的总体且男女上月工资独立,可以进行独立样本T检验,(见表6、表7)

假设1:

H0:

?

1?

?

2

H1:

?

1?

?

2其中,?

1代表男生总体方差,?

2代表女生总体方差

从表7中方差方程的Levene检验可以看出,F=0.101,P=0.751>0.05,所以不能拒绝原假设,可以认为两组数据无显著差异,所以应该选择方差相等下的T检验。

表7独立样本检验

2

2

2

2

22

假设2:

H0:

?

1?

?

2

H1:

?

1?

?

2其中μ1代表男生总体平均数,μ2代表女生总体平均数,下同

作出结论:

从表6、表7中可以看出,男生有73人,平均工资3156.16元,女生75人,平均工资2700.00元。

t=6.277,且p=0.000<0.001所以拒绝原假设,接受备择假设,差异极显著。

根据表6,可以最后得出结论,男生平均工资大于女生的结论。

4、一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。

检验这一假说。

解:

根据题意可知,需要进行相关样本T检验,设:

H0:

μ1≤μ2H1;μ1>μ2同上

表8相关样本T检验

均值

标准差

均值标准误40.801

36.76715.501

T13.531

df147

相关系数0.93

sig0.000

2925496.364上月工资

2721.62447.296去年同月工资

上月工资&去年同月工资203.378183.101

通过表8可知,t=13.531,P=0.000<0.01,所以拒绝原假设,接受备择假设,即学生的平均工资今年和去年相比有显著提高。

5、方差分析。

(1)使用单因素方差分析的方法检验:

能否认为不同学科的上月平均工资相等。

如果不能认为全相等,请做多重比较。

解:

第一步,提出假设,H0:

不同学科上月的平均工资是相同的H1:

至少有两门学科上个月的平局工资是相同的经过SPSS软件计算,见表9,

第二步,决策,F=0.754,P=0.472>0.05,接受H0,拒绝H1,三者之间没有显著性差异。

可以认为不同学科上月工资水平相同。

第三步,多重比较,经过Levene检验(见表10),p=0.724,方差没有显著性差异,方差齐性,经过LSD检验(见表11),P值均大于0.05,所以可以得出同样的结论,三门学科的上月工资水平没有差异。

表10方差齐性检验

(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。

解:

第一步,提出假设,H0:

性别和学科对上月工资水平没有影响H1:

性别和学科同时对上月工资水平有影响第二步,经过SPSS计算,见表12,

表12主体间效应的检验

篇三:

应用回归分析_第2章课后习题参考答案

第二章一元线性回归分析

思考与练习参考答案

2.1一元线性回归有哪些基本假定?

答:

假设1、解释变量X是确定性变量,Y是随机变量;

假设2、随机误差项ε具有零均值、同方差和不序列相关性:

E(εi)=0i=1,2,…,nVar(εi)=?

2i=1,2,…,nCov(εi,εj)=0i≠ji,j=1,2,…,n假设3、随机误差项ε与解释变量X之间不相关:

Cov(Xi,εi)=0i=1,2,…,n

假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0,?

2)i=1,2,…,n2.2考虑过原点的线性回归模型Yi=β1Xi+εii=1,2,…,n

误差εi(i=1,2,…,n)仍满足基本假定。

求β1的最小二乘估计解:

得:

n

n

?

X)2?

)2?

(Y?

?

Qe?

?

(Yi?

Y?

i1ii

i?

1

i?

1

2.3证明(2.27式),?

ei=0,?

eiXi=0。

?

?

?

?

X))2?

)2?

?

(Y?

(?

Q?

?

(Yi?

Yii01i

1

1

n

n

证明:

?

?

?

?

X?

?

?

其中:

Yi01i

即:

?

ei=0,?

eiXi=0

?

ei

?

Yi?

Yi

?

Q

?

0?

?

?

Q

?

0?

?

1

2.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什

么条件下等价?

给出证明。

答:

由于εi~N(0,?

2)i=1,2,…,n

所以Yi=β0+β1Xi+εi~N(β0+β1Xi,?

2)最大似然函数:

?

,?

?

就是β0,β1的最大似然估计值。

使得Ln(L)最大的?

10同时发现使得Ln(L)最大就是使得下式最小,

上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:

最大似然估计是在εi~N(0,?

2)的假设下求得,最小二乘估计则不要求分布假设。

所以在εi~N(0,?

2)的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。

?

?

?

?

X))2?

)2?

?

(Y?

(?

Q?

?

(Yi?

Yii01i

1

1

nn

?

是β0的无偏估计。

2.5证明?

0

nn

Xi?

1?

)?

E(?

?

?

)?

E[证明:

E(?

Y?

Yi)?

?

01i

ni?

1Lxxi?

1

nXi?

X?

11

?

E[?

(?

)Yi]?

E[?

(?

i)(?

0?

?

1Xi?

?

i)]

nLnLi?

1i?

1xxxxn

Xi?

X?

11

?

E[?

0?

?

(?

)?

i]?

?

0?

?

(?

i)E(?

i)?

?

0

LxxLxxi?

1ni?

1n

n

n

2.6证明证明:

?

)?

(1?

Var(?

n

n

2

?

?

X

i?

1

n

i

?

?

12

)?

?

?

(?

nLxx2

2

2

n

X?

Xi?

211i?

)?

Var[(?

Var(?

)Y]?

[(?

)Var(?

0?

?

1Xi?

?

i)]?

?

0iLxxLxxi?

1ni?

1n

Xi?

Xi?

2212122

?

?

[()?

2?

()]?

?

[?

]?

nnLxxLxxnLxxi?

1

n

2.7证明平方和分解公式:

SST=SSE+SSR

nn证明:

2

?

)?

(Y?

?

]2SST?

?

?

Yi?

?

?

?

[Yi?

Yii

i?

1i?

1

?

?

?

?

?

?

Yi

i?

1n

n

?

?

2

?

)(Y?

?

?

?

)?

2?

Yi?

Y?

Yi?

Yiii

i?

1

i?

1

n

n

?

?

n

?

?

2

?

?

i?

1

?

22

?

?

Yi?

?

?

Yi?

Yi)?

SSR?

SSE

i?

1

?

?

?

2.8验证三种检验的关系,即验证:

(1)t?

(n?

2)r?

r2

?

2

Lxx?

SSR/121

(2)F?

?

?

t2

?

SSE/(n?

2)?

证明:

(1)

?

t?

?

?

?

?

?

(2)

?

?

?

?

x?

)?

(?

?

?

i?

)?

?

(?

SSR?

?

(y?

?

1(xi?

)?

)?

?

(?

?

1(xi?

))2?

?

?

12Lxx01i

2

2

2

i?

1

i?

1

i?

1

i?

1

n

n

n

n

?

2L?

SSR/1

?

F?

?

12xx?

t2

?

SSE/(n?

2)?

1(xi?

)22

2.9验证(2.63)式:

Var(ei)?

(1?

?

)?

nLxx证明:

?

i)?

var(yi)?

var(y?

i)?

2cov(yi,y?

i)var(ei)?

var(yi?

y

?

?

?

?

x)?

2cov(y,?

?

?

(x?

))?

var(y)?

var(?

i

1i

i

1

i

(xi?

)21(xi?

)221?

?

?

?

[?

]?

2?

[?

]nLxxnLxx

2

2

1(xi?

)22

?

[1?

?

]?

nLxx

?

(x?

))?

Cov(y,)?

Cov(y,?

?

(x?

))Cov(yi,?

?

1iii1i

n

(x?

)1n

其中:

?

Cov(yi,?

yi)?

(xi?

)Cov(yi,?

iyi)

ni?

1Lxxi?

1

12(xi?

)221(xi?

)22

?

?

?

?

?

(?

)?

nLxxnLxx

?

2?

e?

?

2

i

2.10用第9题证明证明:

n?

2是?

2的无偏估计量

1n1n2

?

)?

?

)?

E(?

E(yi?

yE(ei2)?

?

n?

2i?

1n?

2i?

1

2

1n1n1(xi?

)22?

var(ei)?

[1?

?

]?

?

?

n?

2i?

1n?

2i?

1nLxx?

1

(n?

2)?

2?

?

2

n?

2

2.11验证决定系数与F值之间的关系式

r2?

F

F?

n?

2

证明:

SSRSSR1

?

?

SSTSSR?

SSE1?

SSE/SSR

1

?

n?

2

1?

SSR/(SSE/(n?

2))1F?

?

F?

n?

21?

Fr2?

2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算:

表2.6

(1)画散点图(略)

(2)X与Y是否大致呈线性关系?

答:

从散点图看,X与Y大致呈线性关系。

(3)用最小二乘法估计求出回归方程。

计算表

(4)求回归标准误差

先求SSR(Qe)见计算表。

所以

?

?

?

(5)给出0?

1的置信度为95%的区间估计;

?

的置信区间是(?

?

?

t?

s,?

?

?

t?

s)?

由于(1-?

)的置信度下,i?

?

ii?

?

查表可得t?

/2(n?

2)?

t0.025(3)?

3.182

i

i

S?

?

?

1

?

2?

Lxx

?

36.667

?

1.91510

所以?

1的95%的区间估计为:

(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。

?

S?

?

12125

?

(?

?

)?

36.667(?

)?

6.351nLxx510

2

所以?

?

0的95%的区间估计为:

(-1-3.182*6.351,-1+3.182*6.351),

即(-21.211,19.211)。

?

0的置信区间包含0,表示?

0不显著。

(6)计算x和y的决定系数

^^

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1