北科SPSS软件练习试题.docx

上传人:b****6 文档编号:7496064 上传时间:2023-01-24 格式:DOCX 页数:18 大小:153.05KB
下载 相关 举报
北科SPSS软件练习试题.docx_第1页
第1页 / 共18页
北科SPSS软件练习试题.docx_第2页
第2页 / 共18页
北科SPSS软件练习试题.docx_第3页
第3页 / 共18页
北科SPSS软件练习试题.docx_第4页
第4页 / 共18页
北科SPSS软件练习试题.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

北科SPSS软件练习试题.docx

《北科SPSS软件练习试题.docx》由会员分享,可在线阅读,更多相关《北科SPSS软件练习试题.docx(18页珍藏版)》请在冰豆网上搜索。

北科SPSS软件练习试题.docx

北科SPSS软件练习试题

Spss第4次作业

第1题

(1)【实验目的】

学会用spss进行相关分析

(2)【实验内容】

1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表

编号

客户满意度得分

综合竞争力得分

1

90

70

2

100

80

3

150

150

4

130

140

5

120

90

6

110

120

7

40

20

8

140

130

9

10

60

10

20

30

11

80

100

12

70

110

13

30

10

14

50

40

15

60

50

这些数据能否说明企业的客户满意度与综合竞争力存在较强的正相关关系?

为什么?

(3)【操作步骤】

1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“综合竞争得分”导入“Y轴”→将“客户满意度得分”导入“X轴”→确定;

2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用;

3.分析→回归→线性→添加客户满意度得分到因变量,综合竞争力的分到自变量→确定

(4)【输出结果】

输入/除去的变量a

模型

输入的变量

除去的变量

方法

1

综合竞争力得分b

.

输入

a.因变量:

客户满意度得分

b.已输入所请求的所有变量。

模型摘要

模型

R

R方

调整后R方

标准估算的误差

1

.864a

.747

.728

23.344

a.预测变量:

(常量),综合竞争力得分

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

20915.714

1

20915.714

38.381

.000b

残差

7084.286

13

544.945

总计

28000.000

14

a.因变量:

客户满意度得分

b.预测变量:

(常量),综合竞争力得分

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准误差

Beta

1

(常量)

10.857

12.684

.856

.408

综合竞争力得分

.864

.140

.864

6.195

.000

a.因变量:

客户满意度得分

(5)【结果分析】

拟合线性直线的方程为:

y=10.86+0.86x,相关系数r为0.864,当显著性水平α为0.01时拒绝原假设,表明两个变量(企业的客户满意度与综合竞争力)之前具有较强的线性关系,相关性显著。

第2题

(1)【实验目的】

学会用spss进行相关分析

(2)【实验任务】

为研究香烟消耗量与肺癌死亡率的关系,收集到下表数据。

国家

1930年人均香烟消耗量

1950年每百万男子中死于肺癌的人数

澳大利亚

480

180

加拿大

500

150

丹麦

380

170

芬兰

1100

350

英国

1100

460

荷兰

490

240

冰岛

230

60

挪威

250

90

瑞典

300

110

瑞士

510

250

美国

1300

200

绘制散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。

(3)【操作步骤】

1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“1950年每百万男子中死于肺癌的人数”导入“Y轴”→将“1930年人均香烟消耗量”导入“X轴”→确定;

2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用;

3.在数据编辑窗口,分析→相关→双变量→将“1930年人均香烟消耗量”、“1950年每百万男子中死于肺癌的人数”导入变量中→选项→选中“平均值和标准差”、“叉积偏差和协方差”→继续→确定。

(4)【输出结果】

描述统计

平均值

标准差

个案数

客户满意度得分

80.00

44.721

15

综合竞争力得分

80.00

44.721

15

 

相关性

客户满意度得分

综合竞争力得分

客户满意度得分

皮尔逊相关性

1

.864**

显著性(双尾)

.000

平方和与叉积

28000.000

24200.000

协方差

2000.000

1728.571

个案数

15

15

综合竞争力得分

皮尔逊相关性

.864**

1

显著性(双尾)

.000

平方和与叉积

24200.000

28000.000

协方差

1728.571

2000.000

个案数

15

15

**.在0.01级别(双尾),相关性显著。

(5)【结果分析】

回归分析显著性为0.202,皮尔逊相关系数相差较大,可能是有最后几组差异较大的数据点所影响。

线性回归方程:

1950年每百万男子中死于肺癌人数=67.561+1930年人均香烟消耗量*0.228。

第3题

(1)【实验目的】

学会用spss进行相关分析

(2)【实验任务】

收集到某商品在不同地区的销售额,销售价格以及该地区平均家庭收入的数据,如下表所示:

销售额(万元)

销售价格(元)

家庭收入(元)

100

50

10000

75

70

6000

80

60

12000

70

60

5000

50

80

3000

65

70

4000

90

50

13000

100

40

11000

110

30

13000

60

90

3000

(1)绘制销售额,销售价格以及家庭收入两两变量间的散点图,如果所绘制的图形不能比较清晰地展示变量之间的关系,应对数据如何处理后再绘图?

(2)选择恰当的统计方法分析销售额与销售价格之间的相关关系。

(3)【操作步骤】

步骤:

图形>旧对话框>散点图>矩阵散点图>定义>添加销售额(万元),销售价格(元)家庭收入(元)>确定

步骤:

分析>相关>双变量>销售价格,家庭收入,销售额添加到变量中>选择皮尔逊相关系数>选择双尾显著性检验>确定>>

(4)【输出结果】

 

相关性

销售价格(元)

家庭收入(元)

销售额(万元)

销售价格(元)

皮尔逊相关性

1

-.857**

-.933**

显著性(双尾)

.002

.000

个案数

10

10

10

家庭收入(元)

皮尔逊相关性

-.857**

1

.880**

显著性(双尾)

.002

.001

个案数

10

10

10

销售额(万元)

皮尔逊相关性

-.933**

.880**

1

显著性(双尾)

.000

.001

个案数

10

10

10

**.在0.01级别(双尾),相关性显著。

 

(5)【结果分析】

1.从相关性分析表中得出:

销售价格与家庭收入与销售额三者两两相关,并且皮尔逊相关系数绝对值较大成很强的相关性。

2.结论分析:

如图所拟合的直线,销售额与销售价格由较强的负相关。

 

回归分析

第4题

(1)【实验目的】

学会用spss进行回归分析

(2)【实验任务】

1、数据学生成绩一.sav和学生成绩二.sav,任意选择两门成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析,请绘制全部样本以及不同性别下两门成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二条和第三条分别针对男生样本和女生样本,并对各回归直线的拟合效果进行评价。

(3)【操作步骤】

打开“学生成绩一.sav”→图形→散点图/点图→简单散点图→定义→将数据导入“X轴”、“Y轴”→确定;

在查看器中→图形→激活;→选择元素→总计拟合曲线和子组拟合曲线。

分析→回归→线性→将数据导入“因变量”、“自变量”→统计→选中“共线性诊断”→继续→确定。

(4)【输出结果】

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

461.871

1

461.871

7.934

.007b

残差

3376.541

58

58.216

总计

3838.413

59

a.因变量:

chi

b.预测变量:

(常量),math

(5)【结果分析】

上表得出,不论是总体拟合效果还是男女分类拟合效果,都比较差,这说明,这两门成绩的相关性弱。

第5题

(1)【实验目的】

建立多元线性回归方程,分析影响的主要因素。

(2)【实验任务】

请先收集若干年粮食总产量以及播种面积,使用化肥量,农业劳动人数等数据,然后建立多元线性回归方程,分析影响粮食总产量的主要因素,数据文件“粮食总产量.sav”

(3)【操作步骤】

分析—回归—线形

(4)【输出结果】

 

输入/除去的变量a

模型

输入的变量

除去的变量

方法

1

农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)b

.

输入

a.因变量:

粮食总产量(y万吨)

b.已输入所请求的所有变量。

 

模型摘要

模型

R

R方

调整后R方

标准估算的误差

1

.986a

.971

.968

1378.77302

a.预测变量:

(常量),农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)

 

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

1989131592.747

3

663043864.249

348.784

.000b

残差

58931465.939

31

1901015.030

总计

2048063058.686

34

a.因变量:

粮食总产量(y万吨)

b.预测变量:

(常量),农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)

 

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准误差

Beta

1

(常量)

-20715.614

7459.573

-2.777

.009

粮食播种面积(万公顷)

2.136

.513

.154

4.167

.000

施用化肥量(kg/公顷)

128.802

13.679

.690

9.416

.000

农业劳动者人数(百万人)

62.461

9.836

.461

6.350

.000

风灾面积比例(%)

-198.598

54.231

-.112

-3.662

.001

a.因变量:

粮食总产量(y万吨)

(5)【结果分析】

结论分析:

从最后的系数的分析表中得出,其中施用化肥量与粮食总产量的相关性最大。

第6题

(1)【实验目的】

完成下列题目

(2)【实验任务】

一家产品销售公司在30个地区设有销售分公司。

为研究产品销售量(y)与销售价格(x1)各地区的人均收入(x2),广告费用(x3)之间的关系,搜集到30个地区的有关数据。

进行多元回归分析所得的结果如下:

表1

模型

离差平方和

Df

均方离差

F

Sig

回归

12026774.1

3

4008924.7

72.79

8.88341E-13

剩余

1431812.6

26

55069.7154

总计

13458586.7

29

.4154

 

表2

非标准化系数

t

Sig

B

标准误差

常数

7589.1

2448

3.1

0.00457

X1

-117.9

31.95

-3.69

0.00103

X2

80.6

14.76

5.46

0.00001

X3

0.5012

0.126

3.98

0.00049

a)将表1中的数据补齐.

如图一

b)写出销售量与销售价格,年人均收入,广告费用的多元线性回方程,并解释各回归系数的意义。

Y=-117.9X1+80.6X2+0.5012X3+7589.1

c)检验回归方程的线性关系是否显著。

显著

d)检验各回归系数是否显著,

均小于0.05,显著

e)计算判定系数,并解释它的实际意义。

12026774.1/13458586.7=0.91

表明回归方程对样本数据点拟合优度高。

 

第7题

(1)【实验目的】

用spss预测数据,并估计误差

(2)【实验任务】

试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当的模型,对样本期外的粮食总产量进行外推预测,并对平均预测预测误差进行估计。

(3)【操作步骤】

图形,旧对话框,线图,简单,个案组摘要,定义,类别轴选择“年份”,其他统计量变量选择“粮食总产量”。

确定

步骤:

分析,回归,曲线估计,将“粮食总产量”导入因变量。

选择时间,选择二次项和指数分布。

保存,确定。

(4)【输出结果】

二次

模型汇总

R

R方

调整R方

估计值的标准误

.978

.957

.955

1651.679

ANOVA

平方和

df

均方

F

Sig.

回归

1.961E9

2

9.804E8

359.372

.000

残差

8.730E7

32

2728042.572

总计

2.048E9

34

系数

未标准化系数

标准化系数

t

Sig.

B

标准误

Beta

个案顺序

-164.291

113.713

-.217

-1.445

.158

个案序列**2

24.234

3.064

1.187

7.909

.000

(常数)

17269.480

887.803

19.452

.000

指数

模型汇总

R

R方

调整R方

估计值的标准误

.939

.881

.878

.107

ANOVA

平方和

df

均方

F

Sig.

回归

2.828

1

2.828

244.898

.000

残差

.381

33

.012

总计

3.209

34

系数

未标准化系数

标准化系数

t

Sig.

B

标准误

Beta

个案顺序

.028

.002

.939

15.649

.000

(常数)

14169.354

525.997

26.938

.000

因变量为ln(粮食总产量(y万吨))。

(5)【结果分析】

分析1:

由线图可以看出,粮食总产量非线性增加,因此,可以通过曲线估计进行分析。

所以在用二次曲线和指数曲线拟合。

分析2:

指数曲线模型,明显优于二次曲线模型,

所以利用指数模型进行合理预测未来粮食总产量。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1