SPSS期末大作业完整版.docx

上传人:b****7 文档编号:8874866 上传时间:2023-02-02 格式:DOCX 页数:74 大小:512.62KB
下载 相关 举报
SPSS期末大作业完整版.docx_第1页
第1页 / 共74页
SPSS期末大作业完整版.docx_第2页
第2页 / 共74页
SPSS期末大作业完整版.docx_第3页
第3页 / 共74页
SPSS期末大作业完整版.docx_第4页
第4页 / 共74页
SPSS期末大作业完整版.docx_第5页
第5页 / 共74页
点击查看更多>>
下载资源
资源描述

SPSS期末大作业完整版.docx

《SPSS期末大作业完整版.docx》由会员分享,可在线阅读,更多相关《SPSS期末大作业完整版.docx(74页珍藏版)》请在冰豆网上搜索。

SPSS期末大作业完整版.docx

SPSS期末大作业完整版

第1题:

基本统计分析1

分析:

本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。

其基本操作步骤如下:

数据-选择个案-随机个案样本-大约(A)80所有个案的%。

1、基本思賂:

(1)由干存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。

此处分为少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上五组。

分组后进行频数分析并绘制带正态曲线的直方图。

(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。

操作步骤:

(1)数据分组:

【转换一重新编码为不同变量】,然后选择存取款金额到【数字变量一输出变量(V)]框中。

在【名称(N)]中输入“存取款金额1”,单击【更改(H)]按钮;单击【旧值和新值】按钮进行分组区间定义。

存取款佥额1

频率

百分比

有效百分比

累积百分比

1.00

82

34.6

34.6

34.6

2.00

76

32.1

32.1

66.7

3.00

10

4.2

4.2

70.9

有效4.00

22

9.3

9.3

80.2

5.00

47

19.8

19.8

100.0

合计

237

100.0

100.0

(2)【分析f描述统计f频率】;选择“存款金额分组”变量到【变量(V)]框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

M方由

(3)【数据->拆分文件】,选择靛年龄”变量到【分组方式】框中,选中【比较组】和

【按分组变量排序文件】,确定;【分析f描述统计T频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】-继续-确定。

统计量

存(取)款金领

N

有效

缺失

1

0

20岁以下

25

50.00

百分位数

50

50.00

75

50.00

N

有效

131

缺失

0

20-35岁

25

500.00

百分位数

50

1000.00

75

5000.00

N

有效

73

缺失

0

35-50岁

25

500.00

百分位数

50

1000.00

75

4500.00

N

有效

32

缺失

0

50岁以上

25

525.00

百分位数

50

1000.00

75

2000.00

结果及结果描述:

频数分布表表明,有一半以上的人的一次存取款金额少于2000X,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多干5000元,下图为相应的带正态曲线的宜方图。

统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)元,年龄在20-35岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在35-50岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。

可见,20-35,35-50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。

2、基本思路:

本问题涉及到两个变量户口和物价趋势,考虑两者之间的朕系,因而需要用到交叉列朕表。

该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剰余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。

操作步猱:

(1)【分析描述统计-交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示負式条形图】

(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框-继续;

(3)单击【统计量】,选中【卡方】框-继续;

结果及其结果分析:

户口"物价越势交叉制表

物价趋舞

合计

上升

稳定

下降

计数

21

131

18

170

期望的计数

20.1

122.7

27.3

170.0

户口中的%

12.4%

77.1%

10.6%

100.0%

城镇户口

物价趋勞中

75.0%

76.6%

47.4%

71.7%

的%

总数的%

8.9%

55.3%

7.6%

71.7%

户口

计数

7

40

20

67

期望的计数

7.9

48.3

10.7

67.0

户口中的%

10.4%

59.7%

29.9%

100.0%

农村户口

物价趋势中

25.0%

23.4%

52.6%

28.3%

的%

总数的%

3.0%

16.9%

8.4%

28.3%

计数

28

171

38

237

合计期塑的计数

28.0

171.0

38.0

237.0

户口中的%

11.8%

72.2%

16.0%

100.0%

物价趋势中

的%

100.0%

100.0

%

100.0

%

100.0%

总数的%

11.8%

72.2%

16.0%

100.0%

卡方检验

df

渐进Sig.(双侧)

Pearson卡方

13.2

2

.001

76”

似然比

12.1

2

.002

59

7.75

线性和线性俎合

0

1

.005

有效案例中的N

237

a.0单元格(0.0%)的期望计数少于5。

最小期望计数为7.92.

上面交叉列联表表明,

I共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;认为物价趋势为上升、稳定、下降的人数分别为2&171、38,各占总数的11.8%,72.2%,16.0%o

II对不同户口的人群进行分析:

城镇户口的人数总共有170A,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%.77.1%.10.6%,认为物价趋势稳定的人数多干总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;

III对物价趋势不同态度的人群分析:

认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例路高干总比例;认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高干总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低干总比例;

总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。

从所得卡方检验结果来看,概率P值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。

3、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和僞

度。

3、基本思賂

本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。

操作步骤:

【数据T拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析-描述统计一频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】-继续-确定。

结果及其分析:

统计量

存(取)款金领

有效N

缺失

均值

41

0

2043.17

300尤以下

中值

300.00

方盖

30740437.195

偏度

4.066

偏度的标准误

.369

有效

137

N

缺失

0

均值

4314.15

300~800元

中值

1000.00

方盖

134185788.508

偏度

6.490

偏度的标准误

.207

7有效

46

N

缺失

0

均值

5687.67

8007500尤

中值

1750.00

方盖

116385836.002

偏度

4.415

偏度的标准误

.350

1500尤以

N有效

13

缺失

0

均值

11026.92

中值

7000.00

方差

197942756.410

偏度

2.193

偏度的标准误

.616

第2题:

基本统计分析2

用随机抽样中的近似抽样方法选取85%的样本,数据-选择个案-随机样本

大约(A)85所有个案的%。

第一问

基本思賂:

①由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。

②进行数据拆分,分别计算“300以下”、“300-800”、“800-1500”、“1500以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异。

操作步骤:

①【转换-重新编码为不同变量(R)】;选择“存款金额”到【数字变量-输出变量(V)】框中;在【名称(N)】中输入“存款金额分组”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。

存款佥報分組

频率

百分比

有效百分比

累积百分比

1.00

85

34.3

34.3

34.3

2.00

77

31.0

31.0

65.3

3.00

16

6.5

6.5

71.8

有效4.00

25

10.1

10.1

81.9

5.00

45

18.1

18.1

100.0

合计

248

100.

0

100.0

②【分析-描述统计―频率】;选择“存款金额分组”变量到【变量(V)]框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中

【显示频率表格】,确定。

③【数据-拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析T描述统计T频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】T继续f确定。

统计■

存(取)款金领

N

有效

缺失

43

0

300元以下

25

200.00

百分位数

50

300.00

75

1000.00

N

有效

148

缺失

0

300-8007C

25

500.00

百分位数

50

1000.00

75

4475.00

N

有效

41

缺失

0

8007500尤

25

710.00

百分位数

50

2000.00

75

6000.00

N

有效

16

缺失

0

1500尤以上

25

3000.00

百分位数

50

4450.00

75

9750.00

第二问

基本思賂:

该问题中设计到两个变量,应采用交叉分组下的频数分析,行变

量为“年龄”,列变量为“未来收入状况的变化趋势”,在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对“未来收入状况的变化趋势”的态度是否一致进行分析。

操作步骤:

①【分析T描述统计一交叉表】,选择“年龄”到【行】框中,选择“未来收入情况”到【列】框中;②单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框-继续;③单击【统计量】,选中【卡方】框-继续;④选中【显示复式条形图】一确定。

毎龄*未未收入情况交叉制表

未来收入情况

合计

增加

基本不

减少

计数

0

2

1

3

期塑的计数

・7

1.8

・5

3.0

20岁以下年龄中的%

0.0%

66.7%

33.3%

100.0%

未来收入情况中的%

0.0%

1.3%

2.4%

1.2%

总数的%

0.0%

0.8%

0.4%

1.2%

计数

35

65

27

127

期望的计数

28.2

77.3

21.5

127.0

20-35岁年龄中的%

27.6%

51.2%

21.3%

100.0%

未来收入情况中的%

63.6%

43.0%

64.3%

51.2%

总数的%

14.1%

26.2%

10.9%

51.2%

年龄

计数

16

55

10

81

期望的计数

18.0

49.3

13.7

81.0

35-50岁年龄中的%

19.8%

67.9%

12.3%

100.0%

未来收入情况中的%

29.1%

36.4%

23.8%

32.7%

总数的%

6.5%

22.2%

4.0%

32.7%

计数

4

29

4

37

期望的计数

8.2

22.5

6.3

37.0

50岁以上年龄中的%

10.8%

78.4%

10.8%

100.0%

未来收入情况中的%

7.3%

19.2%

9.5%

14.9%

总数的%

1.6%

11.7%

1.6%

14.9%

计数

55

151

42

248

期望的计数

55.0

151.0

42.0

248.0

年龄中的%

22.2%

60.9%

16.9%

100.0%

合计

100

100.0

100.0

未来收入情况中的%

100.0%

.0%

%

%

总数的%

22.2%

60.9%

16.9%

100.0%

 

卡方检验

f

渐进Sig.

(双侧)

Pearson卡方

似然比

线性和线性俎合

有效案例中的N

12.895”

13.

905

.01

7

248

.045

.031

.895

a.3单元格(25.0%)的期望计数少于5°

最小期望计数为・51。

 

条形图

耒来散入倘况

第三问

基本思路:

首先按照户口对数据进行拆分,然后计算存款金额的统计量:

均值、四分位数和标准差。

操作步骤:

【数据f拆分文件】,选择“户口”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析-描述统计f频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【四分位数】、【标准差】f继续一确定。

统计量

存(取)款金额

N

均值

有效

缺失

178

0

4476.84

城佟户口

标准差

8813.369

25

500.00

百分位数

50

1000.00

75

5000.00

有效

70

N

缺失

0

均值

2856.47

农村户口

标准差

8317.295

25

300.00

百分位敖

50

775.00

75

2000.00

第3题:

基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行频

数分析,实现以下分析目标:

1.分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村

储户进行比较;

2.分析不同年龄的储户对什么合算的认同是否一致。

3.检验城镇储户的一次存款金额的均值为5000元,是否可信?

利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:

基本思路:

首先通过随机抽样中的近似抽样方式,对居民储蓄调査数据进行抽样。

操作步骤:

选择菜单-数据f选择个案一随机个案样本,样本尺寸填大约所有个案85%

i"巴|

收入fW况021**»WA.W;%l»2]

炊入少平仁⑹

IT知》乂血籟I»sj佇,P7\t^Otiyftr-»«i■

金穴炸⑹fee-]所珂筑

wi巳AAM—-t-JTfcaef>tSRl£>

-t-M

1A朽CSsfciiSaKa卫晟WM冷侦足

Q加伙心:

;,E焰"卜沐

j—1如诂丨…刖助

;d._a._ic:

分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;

基本思路:

(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。

(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。

操作步骤:

转换f重新编码为不同变量"选择存(取)款金额,输出变量名

称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500.501-2000.

2001-3500、3501-5000.5000以上五个组。

最后点击确定。

再分析-描述

统计"频率-变量:

存款金额分组,图表选择直方图,i

収;,f+么各15[31]Ul收入償況[32]未宋收入悄况[83]

』收入水平(34)品存(取)软杵另[£目的一[&r_rdM冃的二["_可dl冃的三(ar_3;

Ji拗价出平(aS)d仞价趋劳(a9)

出他价上桃准备(a10)寂,刊宰干莊准备心“】晁观盡于存的M匡!

〔•

AQ[313)

(可坯町个奈逆押乐件)

!

旧位和祈ta(里J

久初迥):

-百分位佰

?

四分位險

(2)割玄02):

口分位级(E):

-禹紋一

标淮茎①□噩小伯

方芒r:

3is国口均值的傩逞逞>

妄中趙5?

ri中m

□力激©)

□di+

佰为姐的中点(D

住爭利吴他变殳旧信唸KH

 

•§«©◎百分比©

lii恸d^f^:

a9]鸟怖上髓备团D]鸟專库不雯准备□笛]岛卿獺m.易户□团3]鸟寂业M4]/嚮团5]鸟赵M•案的85%(...

N显翩率梆电)

[砸匸粘贴(£)「亜菖[财h帮助I

步骤:

数据f拆分文件f分组方式:

户口f确定。

分析一描述统计f频率T

统计量-四分位数前打勾一确定。

・■戸2—一,厶1

/目的三[a7_3]

JI物价水平|a8)

d物价超劳[a9]

&初上称;隹备:

310:

吧利率不突准益:

an:

良现金不存的務医!

[鸟痕虫[314]

年龄[剖5]

2犬约个空的85%(...員存软全荻为期

匚O分析所有个泉,不创腿組®

◎bb^aa(c)

O浚组组织输出©)

10

J匚)対

分組芳戎9):

户口(8131

◎汝分组殛呈碗序文件(⑤心文件已排序近)

当前磁:

按爼合分祈兵闭”

[炳定H粘贴重査迟)」取^X帮助;

统计童

存款金额分组

频率

百分比

有效百分比

累积百分比

有效

1.00

87

35.4

35.4

35.4

2.00

76

30.9

30.9

66.3

3.00

14

5.7

5.7

72.0

4.00

20

8.1

8.1

80.1

5.00

49

19.9

19.9

100.0

合计

246

100.

0

100.0

存款金额分组

城镇户口

N

有效

177

缺失

0

百分位数

25

2.0000

50

3.0000

75

5.0000

农村户口

N

有效

69

缺失

0

百分位数

25

1.5000

50

3.0000

75

3.0000

存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。

而存款在5000以上的也有19.9%,说明存款数额悬殊较大。

从输出图表中看出城镇储户较农村储户有两倍之多,可能是因为城镇居民比较富裕而且存款意识比较强。

农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。

分析不同年龄的储户对什么合算的认同是否一致。

基本思路:

该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.

操作步骤:

分析一描述统计-交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。

M迪取

「I相艇©

ElPhi?

DCramer^S

□Lambda(L)

[3不定隹条熬包)

按电餚定一

□EK)

曲域耘统计呈1^11

汇相縫迟)

有序

IGamma(G)

3Somers*d(S)JKendall的tau却)

£]Kendallstau-^C)

[KappafK)叵凤雎(!

)匚McMemar(M)

匚cocnransandMantel-Haenszei

卡方检验

df

渐进Sig.(双侧)

Pearson卡方

3.997a

3

.262

似然比

3.986

3

.263

线性和线性组合

3.337

1

.068

有效案例中的N

246

a.2单元格(25.0%)的期望计数少干5。

最小期望计数

为・77。

分析:

因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.

3•检验城镇储户的一次存款金额的均值为5000元,是否可信?

单个样本统计・

户口

N

均值

标准

均值的标准误

_.n存(取)款金城镇户口V额

r,L,>存(取)款金

农村户口y额

177

69

487

1.11

451

7.45

9643・

647

1452

8.340

724.86

1

1749.0

07

 

单个样林验

户口

检验值=5000

t

df

Sig・(双侧)

均值差

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 农学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1