应用统计spss分析报告1.docx

上传人:b****6 文档编号:5089927 上传时间:2022-12-13 格式:DOCX 页数:20 大小:55.84KB
下载 相关 举报
应用统计spss分析报告1.docx_第1页
第1页 / 共20页
应用统计spss分析报告1.docx_第2页
第2页 / 共20页
应用统计spss分析报告1.docx_第3页
第3页 / 共20页
应用统计spss分析报告1.docx_第4页
第4页 / 共20页
应用统计spss分析报告1.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

应用统计spss分析报告1.docx

《应用统计spss分析报告1.docx》由会员分享,可在线阅读,更多相关《应用统计spss分析报告1.docx(20页珍藏版)》请在冰豆网上搜索。

应用统计spss分析报告1.docx

应用统计spss分析报告1

学生姓名:

肖浩鑫学号:

31407371

一、实验项目名称:

实验报告(三)

二、实验目的和要求

(一)变量间关系的度量:

包括绘制散点图,相关系数计算及显着性检验;

(二)一元线性回归:

包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测;

(三)多元线性回归:

包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归;

三、实验内容

1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:

企业编号

产量(台)

生产费用(万元)

企业编号

产量(台)

生产费用(万元)

1

40

130

7

84

165

2

42

150

8

100

170

3

50

155

9

116

167

4

55

140

10

125

180

5

65

150

11

130

175

6

78

154

12

140

185

(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(

),并说明二者之间的关系强度。

2.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:

地区

人均GDP(元)

人均消费水平(元)

北京

22460

7326

辽宁

11226

4490

上海

34547

11546

江西

4851

2396

河南

5444

2208

贵州

2662

1608

陕西

4549

2035

(1)绘制散点图,并计算相关系数,说明二者之间的关系。

(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。

(4)检验回归方程线性关系的显着性(

(5)如果某地区的人均GDP为5000元,预测其人均消费水平。

(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

3.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:

航空公司编号

航班正点率(%)

投诉次数(次)

1

81.8

21

2

76.6

58

3

76.6

85

4

75.7

68

5

73.8

74

6

72.2

93

7

71.2

72

8

70.8

122

9

91.4

18

10

68.5

125

(1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。

(2)检验回归系数的显着性(

)。

(3)如果航班正点率为80%,估计顾客的投诉次数。

4.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。

通过计算得到下面的有关结果:

方差分析表

变差来源

df

SS

MS

F

SignificanceF

回归

2.17E-09

残差

40158.07

总计

11

1642866.67

参数估计表

Coefficients

标准误差

tStat

P-value

Intercept

363.6891

62.45529

5.823191

0.000168

XVariable1

1.420211

0.071091

19.97749

2.17E-09

(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

(3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显着性(a=0.05)。

5.随机抽取7家超市,得到其广告费支出和销售额数据如下

超市

广告费支出/万元

销售额/万元

A

1

19

B

2

32

C

4

44

D

6

40

E

10

52

F

14

53

G

20

54

(1)用广告费支出作自变量

,销售额为因变量

,求出估计的回归方程。

(2)检验广告费支出与销售额之间的线性关系是否显着(a=0.05)。

(3)绘制关于

的残差图,你觉得关于误差项

的假定被满足了吗?

(4)你是选用这个模型,还是另寻找一个该更好的模型?

6.一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。

下面是近8个月的销售额与广告费用数据

月销售收入y(万元)

电视广告费用

(万元)

报纸广告费用

(万元)

96

5.0

1.5

90

2.0

2.0

95

4.0

1.5

92

2.5

2.5

95

3.0

3.3

94

3.5

2.3

94

2.5

4.2

94

3.0

2.5

(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。

(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。

(3)上述

(1)和

(2)所建立的估计方程,电视广告费用的系数是否相同?

对回归系数分别解释。

(4)根据

(1)和

(2)所建立的估计方程,说明它们的R2的意义。

7.某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下

收获量y(kg)

降雨量x1(mm)

温度x2(

2250

25

6

3450

33

8

4500

45

10

6750

105

13

7200

110

14

7500

115

16

8250

120

17

建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=0.05),你认为模型中是否存在多重共线性?

8.一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。

为此,收集了20栋住宅的房地产评估数据如下:

房地产编号

销售价格y(元/㎡)

地产估价

(万元)

房产估价

(万元)

使用面积

(㎡)

1

6890

596

4497

18730

2

4850

900

2780

9280

3

5550

950

3144

11260

4

6200

1000

3959

12650

5

11650

1800

7283

22140

6

4500

850

2732

9120

7

3800

800

2986

8990

8

8300

2300

4775

18030

9

5900

810

3912

12040

10

4750

900

2935

17250

11

4050

730

4012

10800

12

4000

800

3168

15290

13

9700

2000

5851

24550

14

4550

800

2345

11510

15

4090

800

2089

11730

16

8000

1050

5625

19600

17

5600

400

2086

13440

18

3700

450

2261

9880

19

5000

340

3595

10760

20

2240

150

578

9620

用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。

9.为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下

月薪y(元)

工龄

性别(1=男,0=女)

1548

3.2

1

1629

3.8

1

1011

2.7

0

1229

3.4

0

1746

3.6

1

1528

4.1

1

1018

3.8

0

1190

3.4

0

1551

3.3

1

985

3.2

0

1610

3.5

1

1432

2.9

1

1215

3.3

0

990

2.8

0

1585

3.5

1

进行回归并对结果进行分析。

四、实验数据记录与分析

(基本要求:

1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。

1、

(1)

由图可知,产量与生产费用呈正线性相关

(2)

相关性

产量

生产费用

产量

Pearson相关性

1

.920**

显着性(双侧)

.000

N

12

12

生产费用

Pearson相关性

.920**

1

显着性(双侧)

.000

N

12

12

**.在.01水平(双侧)上显着相关。

产量与生产费用之间的线性相关系数为0.0920,显着相关

2、

(1)

相关性

人均GDP

人均消费水平

人均GDP

Pearson相关性

1

.998**

显着性(双侧)

.000

N

7

7

人均消费水平

Pearson相关性

.998**

1

显着性(双侧)

.000

N

7

7

**.在.01水平(双侧)上显着相关。

人均GDP与人均消费水平呈正线性相关,相关系数为0.998

(2)

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

734.693

139.540

5.265

.003

人均GDP

.309

.008

.998

36.492

.000

a.因变量:

人均消费水平

回归方程:

y=734.693+0.309x

含义:

人均GDP每增加1元,人均消费就增加0.309元

(3)

模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.998a

.996

.996

247.30347

a.预测变量:

(常量),人均GDP。

人均GDP对人均消费的影响达到99.6%

(4)F检验

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

8.144E7

1

8.144E7

1331.692

.000a

残差

305795.034

5

61159.007

总计

8.175E7

6

a.预测变量:

(常量),人均GDP。

b.因变量:

人均消费水平

t检验

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

734.693

139.540

5.265

.003

人均GDP

.309

.008

.998

36.492

.000

b.因变量:

人均消费水平

(5)

y=734.693+0.309*5000=2279.693

如果某地区的人均GDP为5000元,预测其人均消费水平为2279.693元

(6)

人均GDP为5000元时,人均消费水平95%的置信区间为[2050.84067,2505.91078],预测区间为[1680.94287,2875.80857]。

3、

(1)

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

430.189

72.155

5.962

.000

航班正点率

-4.701

.948

-.869

-4.959

.001

a.因变量:

投诉次数

回归方程:

y=430.189-4.701x

回归系数的含义:

投诉次数每增加一次,航班正点率下降4.701%

(2)由于Sig=0.001<0.05显着

(3)80=430.189-4.701x=74

如果航班正点率为80%,估计顾客的投诉次数为74次

4、

(1)

3、

5、

变差来源

df

SS

MS

F

SignificanceF

回归

1

1602708.6 

1602708.6

399.1000065

2.17E-09

残差

10 

40158.07

4015.807

总计

11

1642866.67

(2)

R^2=SSR/SST=1602708.6/1642866.67=97.6%

汽车销售量的变差中有97.6%是由于广告费用的变动引起的

(3)

R=根号R^2=0.9877

销售量与广告费用之间的相关系数是0.9877

(4)

估计的回归方程:

y=363.6891+1.420211x

回归系数为1.420211,表示广告费用每增加一个单位,汽车销售量平均增加1.420211个单位

(5)

回归系数的检验:

p=2.17E-09<α,回归系数不等于0,显着回归直线的检验:

p=2.17E-09<α,回归直线显着

5、

(1)

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

29.399

4.807

6.116

.002

广告支出费用

1.547

.463

.831

3.339

.021

a.因变量:

销售额

回归方程估计是:

y=29.399+1.547x

(2)F检验

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

691.723

1

691.723

11.147

.021a

残差

310.277

5

62.055

总计

1002.000

6

a.预测变量:

(常量),广告支出费用。

b.因变量:

销售额

Sig=0.021<0.05显着

t检验

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

29.399

4.807

6.116

.002

广告支出费用

1.547

.463

.831

3.339

.021

c.因变量:

销售额

Sig=0.002<0.05显着

(3)

残差不全相等

(4)应考虑其他模型,可考虑对数曲线模型:

y=b0+b1ln(x)=22.471+11.576ln(x)

6、

(1)

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

88.638

1.582

56.016

.000

电视广告费用

1.604

.478

.808

3.357

.015

a.因变量:

月销售收入

估计的回归方程:

y=88.64+1.6x

(2)、

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

83.230

1.574

52.882

.000

电视广告费用

2.290

.304

1.153

7.532

.001

报纸广告费用

1.301

.321

.621

4.057

.010

a.因变量:

月销售收入

估计的回归方程:

y=83.23+2.29x1+1.301x2

回归系数的意义:

报纸广告费用不变的情况下,电视广告费用每增加1万元,月销售额增加2.29万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加1.301万元。

(3)不相同,

(1)中表示电视广告费用每增加1万元,月销售额增加1.6万元;

(2)中表示电视广告费用每增加1万元,月销售额增加2.29万元

(4)

(1)中的含义为电视广告费用对月销售额达到的影响程度,

(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度

7、

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-.591

505.004

-.001

.999

降雨量

22.386

9.601

.415

2.332

.080

温度

327.672

98.798

.590

3.317

.029

a.因变量:

收获量

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

2

228.444

.000a

残差

273384.743

4

68346.186

总计

6

a.预测变量:

(常量),温度,降雨量。

b.因变量:

收获量

估计的回归方程:

y=-0.591+22.386x1+327.672x2

回归线性显着

降雨量的回归系数不显着,温度的显着x1与x2的相关系数rx1x2=0.965,存在多重共线性

8、

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

895.020

535.833

1.670

.112

房产估计

1.351

.140

.916

9.673

.000

2

(常量)

11.653

592.972

.020

.985

房产估计

.961

.200

.651

4.794

.000

使用面积

.163

.066

.336

2.470

.024

a.因变量:

销售价格

估计的回归方程:

y=11.653+0.163x1+0.961x2

销售价格的预测值及95%的置信区间和预测区间:

9、

SUMMARYOUTPUT

回归统计

MultipleR

0.943391

RSquare

0.889987

AdjustedRSquare

0.871652

标准误差

96.79158

观测值

15

方差分析

df

SS

MS

F

SignificanceF

回归分析

2

909488.4

454744.2

48.53914

1.77E-06

残差

12

112423.3

9368.61

总计

14

1021912

Coefficients

标准误差

tStat

P-value

Lower95%

Upper95%

下限95.0%

上限95.0%

Intercept

732.0606

235.5844

3.107425

0.009064

218.7664

1245.355

218.7664

1245.355

工龄

111.2202

72.08342

1.542937

0.148796

-45.8361

268.2765

-45.8361

268.2765

性别(1=男,0=女)

458.6841

53.4585

8.58019

1.82E-06

342.208

575.1601

342.208

575.1601

拟合优度良好,方程线性显着,工龄线性不显着,性别线性显着

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 军事

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1