统计分析与spss的应用第五版课后练习答案第4章.docx

上传人:b****6 文档编号:8537044 上传时间:2023-01-31 格式:DOCX 页数:11 大小:20.01KB
下载 相关 举报
统计分析与spss的应用第五版课后练习答案第4章.docx_第1页
第1页 / 共11页
统计分析与spss的应用第五版课后练习答案第4章.docx_第2页
第2页 / 共11页
统计分析与spss的应用第五版课后练习答案第4章.docx_第3页
第3页 / 共11页
统计分析与spss的应用第五版课后练习答案第4章.docx_第4页
第4页 / 共11页
统计分析与spss的应用第五版课后练习答案第4章.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

统计分析与spss的应用第五版课后练习答案第4章.docx

《统计分析与spss的应用第五版课后练习答案第4章.docx》由会员分享,可在线阅读,更多相关《统计分析与spss的应用第五版课后练习答案第4章.docx(11页珍藏版)》请在冰豆网上搜索。

统计分析与spss的应用第五版课后练习答案第4章.docx

统计分析与spss的应用第五版课后练习答案第4章

 

《统计分析与SPSS的应用(第五版)》(薛薇)

 

课后练习答案

 

第4章SPSS基本统计分析

 

1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——

图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics

户口所在职业年龄

Valid

282

282

282

N

0

0

0

Missing

 

户口所在地

Frequenc

Percent

Valid

Cumulative

y

Percent

Percent

中心城市

200

70.9

70.9

70.9

Valid边远郊区

82

29.1

29.1

100.0

Total

282

100.0

100.0

 

职业

Frequenc

Percent

Valid

Cumulative

y

Percent

Percent

国家机关

24

8.5

8.5

8.5

商业服务业

54

19.1

19.1

27.7

文教卫生

18

6.4

6.4

34.0

公交建筑业

15

5.3

5.3

39.4

Valid经营性公司

18

6.4

6.4

45.7

学校

15

5.3

5.3

51.1

一般农户

35

12.4

12.4

63.5

种粮棉专业

4

1.4

1.4

64.9

 

种果菜专业

10

3.5

3.5

68.4

工商运专业

34

12.1

12.1

80.5

退役人员

17

6.0

6.0

86.5

金融机构

35

12.4

12.4

98.9

现役军人

3

1.1

1.1

100.0

Total

282

100.0

100.0

 

年龄

Frequenc

y

Percent

Valid

Percent

Cumulative

Percent

20岁以

4

1.4

1.4

1.4

20~35

146

51.8

51.8

53.2

Valid35~50

91

32.3

32.3

85.5

50岁以

41

14.5

14.5

100.0

Total

282

100.0

100.0

 

分析:

本次调查的有效样本为282份。

常住地的分布状况是:

在中心城市的人最多,

有200人,而在边远郊区只有82人;职业的分布状况是:

在商业服务业的人最多,其次

是一般农户和金融机构;年龄方面:

在35-50岁的人最多。

由于变量中无缺失数据,因此频数分布表中的百分比相同。

 

2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。

进一步,对不同常住地储户存款金额的基本特征进行

对比分析。

分析——描述统计——描述,选择存款金额到变量中。

点击选项,勾选均值、标准差、方差、最小值、最

大值、范围、偏度、峰度、按变量列表,点击继续——确定。

 

分析:

由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。

与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以

看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

 

分析:

由表中可以看出,中心城市有200人,边远郊区为82人。

两部分样本存取款金额

均呈右偏尖峰分布,且边远郊区更明显。

 

3、利用第

 

2章第

 

7题数据,如果假设存款金额服从正态分布,

 

能否利用本章所讲解的功能,

找到存款金额“与众不同”的样本,并说明理由。

分析——描述统计——描述,选择存款金额到变量中。

对“将标准化得分另存为变量”打上

勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝

对值大于3的都是“与众不同”的样本。

理由:

标准化值反映的是样本值与样本均值的差是几个标准差单位。

如果标准化值等于0,

则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果

标准化值小于0,则表示该样本值小于样本均值。

如果标准化值的绝对值大于3,则可认为

是异常值。

4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。

分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”。

点击单元格——选择观测值、期望、行、列、合计。

点击统计量——选择卡方。

点击继续。

确定

利用列联分析实现。

首先编制列联表,然后进行卡方检验。

以户口和收入的列联分析为例:

 

表中,卡方统计量的观测值等于

32.064,概率-P值等于0.001。

若显著性水平设为

0.05,

由于0.001<0.05,拒绝原假设,表明户口地与收入水平不独立。

 

5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的。

利用多选项分析被调查者本次存款的最主要目的是什么。

答:

第2章第7题资料的多选项问题是按照分类法拆分的。

目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。

多选项分类法;

 

存款的最主要目的是正常生活零用

 

6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表:

1)补充表中第一行和第四行空缺的计算结果。

 

紧张

 

婆媳关系一般

 

和睦

 

Total

 

婆媳关系*住房条件Crosstabulation

 

住房条件

Total

一般

Count

57

78

60

195

ExpectedCount

48.75

68.25

78

195

%within婆媳关系

29.23%

40.00%

30.77%

100.00%

%within住房条件

38.00%

37.14%

25.00%

32.50%

Count

45

87

63

195

ExpectedCount

48.75

68.25

78

195

%within婆媳关系

23.08%

44.62%

32.31%

100.00%

%within住房条件

30.00%

41.43%

26.25%

32.50%

Count

48

45

117

210

ExpectedCount

52.5

73.5

84

210

%within婆媳关系

22.86%

21.43%

55.71%

100.00%

%within住房条件

32.00%

21.43%

48.75%

35.00%

Count

150

210

240

600

ExpectedCount

150

210

240

600

%within婆媳关系

25.00%

35.00%

40.00%

100.00%

%within住房条件

100.00%

100.00%

100.00%

100.00%

2)写出卡方检验的统计量并说明其构造基本原理。

X2

(f0

fe)2

fe

3)婆媳关系与住房条件有无联系?

 

判断婆媳关系与住房条件有无关系:

因为P值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假

设,所以婆媳关系与住房条件有关系。

 

计算结果:

 

卡方统计量:

2

r

c

(fijo

fije)2

,用于测度各个单元格的观测频数与期望频数的差异,

fije

i1

j

1

并依卡方理论分布判断差异是否统计显著。

由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显。

本例中,由于概率P值小于显著性水平,应拒绝原假设,婆媳关系与住房条件有关系。

 

7、利用第2章第4题资料,分析两种减肥产品所产生的效果分布是否一致。

分析——描述统计——交叉表,选择“产品类型”到行,选择“体重变化”到列。

点击统计量——勾选卡

方。

点击单元格——选择观察值、期望值、行、列、总计。

点击继续,确定。

将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验。

 

表中,卡方统计量观测值为4.339,对应的概率P-值为0.037,小于显著性水平0.05,应拒绝原假设,说明减肥效果并不一致。

 

8、根据第2章第8题数据,回答以下问题:

(1)该问卷中的多选项问题是按照哪种方式分解的?

(2)请给出调查问卷数排在前三位的城市编码。

这三个城市的有效问卷共有多少份?

(3)股民中有多大比例的人赚钱了?

有多大比例的人亏钱了?

(4)股民买卖股票主要依据的是哪种办法?

股民买卖股票最少依据的是哪种办法?

(5

)要研究专职投资者与业余投资者在股票投资结果上是否有差异,

请给出你的分析思路、

计算结果和分析绪论。

(1

)多选项二分法;

(2

 

102(794份)、101(514份)、401(400份)

(3)

 

赚钱比例:

30.3%,赔钱比例38%

(4)

 

主要依据:

基本因素法;

 

最少依据:

更跟方法

(5)

 

采用列联分析。

卡方检验结果表明:

专职和业余投资者在投资结果上存在显著差异。

 

9、为分析私家车主倾向接受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售

部门对东部地区、中部地区和西部地区的400名消费者作了抽样调查,得到如下结果:

汽车价格

东部地区

中部地区

西部地区

10

万元以下

20

40

40

10

万~20

万元

50

60

50

20

万~30

万元

30

20

20

30

万元以上

40

20

10

(1

)指出表中所涉及的变量,并说明变量的类型。

(2

)可使用哪种分析方法分析上表?

请说明分析的基本思路并利用

SPSS进行分析。

(1

)变量:

汽车价格、居住地区;类型:

定序型变量、定类型变量

(2

)上述是计数数据的组织方式,应首先组织到

SPSS的数据编辑器窗口中,再利用交叉

分组下的频数分析方法。

利用【交差表】来分析上表,步骤如下:

①先将上表中数据录入

SPSS中。

共有400个个案。

②【分析】→【描述统计】→【交叉表】,将“地区”作为

列变量,将“汽车价格”作为行变量,在【统计量】中选择“卡方”,在【单元格】中选择

观察值、期望值、行、列和总计,得到分析结果。

③提出原假设:

认为地区和汽车价格无

关系。

 

列联分析。

原假设:

不同居住区的私家车主接受的汽车价格具有一致性的。

上表可知,

如果显著性水平为0.05,由于卡方检验的概率P-值小于显著性水平,因此应拒绝原假设。

由卡方检验表可知,渐进Sig(双侧)为0.000,如果认为显著性水平为0.05,因为

0.000<0.05,所以拒绝原假设,认为地区和汽车价格有关系,地区分布不同,汽车价格也不同。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教学研究 > 教学计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1