《统计学基础实验》原始数据.docx
《《统计学基础实验》原始数据.docx》由会员分享,可在线阅读,更多相关《《统计学基础实验》原始数据.docx(31页珍藏版)》请在冰豆网上搜索。
《统计学基础实验》原始数据
《统计学基础实验》原始数据
项目1数据文件的建立与管理
1.3实验数据
表1.1中给出的是从某学校统计学专业抽取20个学生的2008年秋季学期的各科学习
成绩。
表1.1学生成绩表
学号
姓名
性别
统计
学
英语
国民
经济
核算
抽样
技术
质量
管理
SPSS
基
础教程
200801
徐庆
女
89
80
87
84
60
87
200802
张小明
女
85
84
45
87
74
78
200803
钟林
女
87
93
65
68
70
85
200804
蔡伟
男
82
85
61
90
80
74
200805
李维
男
78
86
48
83
80
76
200806
孟林
女
69
79
89
73
81
71
200807
王君
女
90
80
54
70
77
81
200808
崔玉新
男
89
80
84
80
79
89
200809
正义峰
男
68
76
54
71
82
70
200810
高峰
男
59
80
91
79
67
82
200811
赵微
女
67
71
56
68
68
76
200812
肖敏
男
56
60
48
62
79
80
200813
李心新
女
83
88
46
85
89
80
200814
唐毅
男
39
82
65
75
80
84
200815
周雪
女
95
93
84
89
88
90
200816
陈俊
男
97
90
89
89
88
95
200817
郑锡
男
69
71
95
85
79
83
200818
马明
男
79
61
51
80
86
78
200819
张伟民
男
61
66
60
70
81
59
200820
赖良勇
男
59
30
62
72
80
52
1.6练习实验
1.表1.3是对某大学统计学专业2007级学生家长情况的调查表。
表1.3某大学统计学专业2007级学生家长情况的调查
问卷
编号
所在省
份
文化
程度
家庭
月收
入
家庭
成员
数
家庭住
房面积
问卷
编号
所在省份
文化
程度
家庭
月收
入
家庭
成员
数
家庭
住房
面积
001
四川
大学
7000
4
150
011
陕西
中学
5000
4
80
002
湖北
大学
8000
4
150
012
重庆
小学
5000
3
90
003
湖南
中学
4000
3
110
013
湖北
中学
4500
4
100
004
北京
大学
7500
5
140
014
湖南
专科
5600
4
100
005
黑龙江
中学
4300
6
100
015
广州
大学
10000
3
150
006
广西
小学
3500
7
100
016
天津
大学
8000
4
140
007
湖南
大学
8100
4
130
017
北京
中学
6000
4
120
008
云南
专科
6700
7
120
018
内蒙古
小学
4500
5
100
009
贵州
中学
6500
5
110
019
江西
小学
3900
3
80
010
海南
专科
7000
6
130
020
福建
小学
4000
5
100
(1)根据表中数据建立三个数据文件,分别命名为“调查1.sav”,“调查2.sav”和“调
查3.sav”。
数据文件“调查1.sav”包括问卷编号从001到010共10个个案的问卷编号、所在省份,文化程度3个变量;“调查2.sav”包括所有个案的问卷编号、家庭月收入、家庭成
员数和家庭住房面积4个变量;“调查3.sav”包括问卷编号从011到020共10个个案的问卷编号、所在省份,文化程度3个变量。
(2)将数据文件“调查1.sav”与“调查3.sav”进行纵向连接,再将横向连接后的新数
据问卷“调查1.sav”与“调查2.sav”进行横向合并,将新的数据文件保存为“调查.sav”。
(3)将数据文件“调查.sav”按照变量“家庭月收入”进行排序。
2•表1.4中的数据为我国2008年第1季度的国内生产总值数据及比去年同期的增长率,
将该表中数据录入到Excel表格中,并将Excel数据表保存为"练习实验2.xls”的电子表格。
将Excel数据表“练习实验2.xls”导入SPSS软件中,保存数据文件为“练习实验2.sav”。
表1.4我国2008年第1季度国内生产总值
绝对额(亿元)
比去年同期增长(%
国内生产总值
61491
10.6
第一产业
4720
2.8
第二产业
30778
11.5
第三产业
25993
10.9
3.表1.5是2006年各国家和地区的国土面积和人口密度数据(国土面积单位为万平方
公里,年中人口单位为万人,人口密度单位为人/平方公里)。
将数据录入到SPSS软件中,
保存数据文件为“国土面积与人口密度.sav”。
表1.5国土面积与人口密度(2006年)
国家和地区
洲别
国土
面积
年中人口
人口
密度
国家和
地区
洲别
国土面
积
年中人口
人口密度
中国
亚洲
960
131180
141
尼日利亚
非洲
92.4
14474.9
159
孟加拉国
亚洲
14.4
14434.5
1109
南非
非洲
121.9
4739.1
39
文莱
亚洲
0.6
38.1
72
捷克
欧洲
7.9
1021.8
132
柬埔寨
亚洲
18.1
1435.1
81
法国
欧洲
55.2
6103.8
111
印度
亚洲
328.7
110981.1
373
德国
欧洲
35.7
8241.1
236
印度尼西亚
亚洲
190.5
22304.2
123
意大禾U
欧洲
30.1
5857.1
199
伊朗
亚洲
164.8
6915.3
42
波兰
欧洲
31.3
3811.2
124
以色列
亚洲
2.2
703.9
325
俄罗斯
欧洲
1709.8
14236.8
9
日本
亚洲
37.8
12756.5
350
西班牙
欧洲
50.5
4354.6
87
朝鲜
亚洲
12.1
2256.9
187
土耳其
欧洲
78.4
7293.5
95
韩国
亚洲
9.9
4841.8
490
乌克兰
欧洲
60.4
4657.1
80
老挝
亚洲
23.7
576.5
25
英国
欧洲
24.4
6036.1
249
马来西亚
亚洲
33
2576.7
78
美国
北美洲
963.2
29898.8
33
蒙古
亚洲
156.7
258.5
2
加拿大
北美洲
998.5
3255.6
4
缅甸
亚洲
67.7
5096.2
78
墨西哥
北美洲
195.8
10422.1
55
巴基斯坦
亚洲
79.6
15900.2
206
巴西
南美洲
851.5
18869.4
22
菲律宾
亚洲
30
8459
284
阿根廷
南美洲
278
3912
14
新加坡
亚洲
0.1
439.3
6376
委内瑞拉
南美洲
91.2
2702.1
31
泰国
亚洲
51.3
6472.4
127
澳大利亚
大洋洲
774.1
2052.1
3
越南
亚洲
32.9
8410.8
271
新西兰
大洋洲
27.1
412.5
15
埃及
非洲
100.1
7539.7
76
要求:
根据变量“人口密度”生成新变量“人口密度等级”,当人口密度大于100人/
平方公里时取值为“人口密集区”,人口密度大于等于25小于100人/平方公里时取值为“人口中等区”,人口密度大于等于1小于25人/平方公里时取值为“人口稀少区”,人口密度
小于1人/平方公里时取值为“人口极稀区”。
4•利用上题中的数据文件“国土面积与人口密度.sav”,根据变量“洲别”进行数据汇总,
计算各组变量国土面积和年中人口的总数,及人口密度的平均数。
项目2描述性统计分析
2.3实验数据
1.表2.1给出了1990年至2006年的GDP和财政收入相关数据资料,原始数据文件为
2-1.sav。
表2.11990-2006年GDF数据单位:
亿元
年份
国内生产总值
第一产业
第二产业
第三产业
国内生产总值指
数(上年=100)
财政收入
1990
18667.82
5062
7717.4
5888.422
103.8
2937.1
1991
21781.5
5342.2
9102.2
7337.099
109.2
3149.48
1992
26923.48
5866.6
11699.5
9357.376
114.2
3483.37
1993
35333.92
6963.763
16454.43
11915.73
114.0
4348.95
1994
48197.86
9572.695
22445.4
16179.76
113.1
5218.1
1995
60793.73
12135.81
28679.46
19978.46
110.9
6242.2
1996
71176.59
14015.39
33834.96
23326.24
110.0
7407.99
1997
78973.03
14441.89
37543
26988.15
109.3
8651.14
1998
84402.28
14817.63
39004.19
30580.47
107.8
9875.95
1999
89677.05
14770.03
41033.58
33873.44
107.6
11444.08
2000
99214.55
14944.72
45555.88
38713.95
108.4
13395.23
2001
109655.2
15781.27
49512.29
44361.61
108.3
16386.04
2002
120332.7
16537.02
53896.77
49898.9
109.1
18903.64
2003
135822.8
17381.72
62436.31
56004.73
110.0
21715.25
2004
159878.3
21412.73
73904.31
64561.29
110.1
26396.47
2005
183867.9
23070.44
87364.58
73432.87
110.4
31649.29
2006
210871
24737
103162
82971.97
111.1
38760.2
2.
表2.2给出了2006年1月至2007年12月份的CPI数据(上年同月=100%),原始
数据文件为2-2.sav。
表2.2
2006.1
-2008.06月CPI数据(%
年月
CPI
年月
CPI
年月
CPI
200601
101.9
200611
101.9
200709
106.2
200602
100.9
200612
102.8
200710
106.5
200603
100.8
200701
102.2
200711
106.9
200604
101.2
200702
102.7
200712
106.5
200605
101.4
200703
103.3
200801
107.1
200606
101.5
200704
103.0
200802
108.7
200607
101.0
200705
103.4
200803
108.3
200608
101.3
200706
104.4
200804
108.5
200609
101.5
200707
105.6
200805
107.7
200610
101.4
200708
106.5
200806
107.1
3.表2.3给出了2002年至2006年长江三角洲地区(上海、江苏、浙江)城乡居民平
表2.3长三角地区收支数据单位:
元
年份
省市
城乡
收入
支出
年份
省市
城乡
收入
支出
2002
上海
城镇
13249.8
10464
2004
上海
农村
7066.33
6328.85
2002
江苏
城镇
8177.64
6042.6
2004
江苏
农村
4753.85
2992.55
2002
浙江
城镇
11715.6
8713.08
2004
浙江
农村
5944.06
4659.11
2002
上海
农村
6223.55
5301.82
2005
上海
城镇
18645.03
13773.41
2002
江苏
农村
3979.79
2620.29
2005
江苏
城镇
12318.57
8621.82
2002
浙江
农村
4940.36
3692.89
2005
浙江
城镇
16293.77
12253.74
2003
上海
城镇
14867.49
11040.34
2005
上海
农村
8247.77
7277.94
2003
江苏
城镇
9262.46
6708.58
2005
江苏
农村
5276.29
3567.11
2003
浙江
城镇
13179.53
9712.89
2005
浙江
农村
6659.95
5432.95
2003
上海
农村
6653.92
5669.57
2006
上海
城镇
20667.91
14761.75
2003
江苏
农村
4239.26
2704.37
2006
江苏
城镇
14084.26
9628.59
2003
浙江
农村
5389.04
4285.13
2006
浙江
城镇
18265.1
13348.51
2004
上海
城镇
16682.82
12631.03
2006
上海
农村
9138.65
8006
2004
江苏
城镇
10481.93
7332.26
2006
江苏
农村
5813.23
4135.21
2004
浙江
城镇
14546.38
10636.14
2006
浙江
农村
7334.81
6057.16
数据来源均为《中国统计年鉴2007》
2.6练习实验
表2.14为2006年1月至2007年12月份的房地产销售价格指数(RESPI)和居民消费价格指数(CPI)。
试绘制RESPI随着时间发展趋势的线图和RESPI与CPI的散点图。
表2.14RESPI与CPI数据
month
RESPI
CPI
month
RESPI
CPI
200601
107.0
102
200701
106.2
101.5
200602
107.9
101
200702
105.6
101.8
200603
108.7
101
200703
105.0
102.7
200604109.3101.3200704105.5102.3
200605109.8101.6200705105.7102.5
200606
109.9
101.8
200706
105.8
103.3
200607
109.9
101.1
200707
106.1
104.4
200608
109.6
101.3
200708
106.7
105.3
200609
109.3
101.5
200709
107.3
105.2
200610
108.9
101.4
200710
108.5
105.6
200611
108.5
101.5
200711
109.1
106.1
200612
108.0
102.2
200712
110.0
105.9
项目3列联分析
3.3实验数据
1.表3.4给出的是对某大学学生信用卡申办情况进行抽样调查得到的数据。
分析大学
生性别与申办信用卡与否是否相关联。
原始数据文件见3-1.sav。
表3.4某大学学生信用卡申办情况数据
信用卡申办
性别
男性
女性
已申办信用卡
94
110
未申办信用卡
148
114
2.某商品生产厂家试分析不同的收入群体对某种商品是否有相同的购买习惯。
表3.5给出的是通过问卷调查所得到的不同收入群体对某种特定商品购买的汇总数据。
原始数据文件见3-2.sav。
表3.5不同收入群体对某种特定商品的购买情况
购买习惯
低收入组
中等收入组
偏咼收入组
高收入组
经常购买
25
40
47
46
不购买
69
51
74
57
有时购买
36
26
19
37
3.6练习实验
1.以少管所、工读学校和普通中学的725名青少年为样本,研究家庭环境与青少年犯
罪之间的关系,相关调查资料如下表3.13所示。
表3.13不同类型青少年父母离异状况的分布
非离异人数
离异人数
合计人数
机构
普通中学
163
7
170
类型
工读学校
197
72
269
少管所
231
55
286
违法
无
227
27
254
犯罪
中等
243
72
315
行为
严重
121
35
156
总体
591
134
725
资料来源:
屈智勇、邹泓《家庭环境、父母监控与青少年犯罪》一文
2.某市调查了520名中老年脑力劳动者,其中有136人有高血压史,其余384人无高血压史,在有高血压史的136人中经诊断为冠心病者有48人,在无高血压史的384人中,经诊断为冠心病者有36人,将这些数据列于表3.14中,要求在0.05的显著性水平下,分析高血压与冠心病是否独立。
表3.14高血压与冠心病关系列联表
患高血压
无高血压
合计
患冠心病
48
36
84
无冠心病
88
348
436
合计
136
384
520
资料来源:
3.江西省九江市于2007年11月9日一11月22日在城区开展了中心城区低收入家庭住房状况抽样调查工作。
调查中有效样本数为1045个,分别从九江市开发区、浔阳区、
庐山区进行抽取,经整理被调查人的购房时间意向资料如下表3.15所示。
试分析不同地区
的低收入家庭购房时间意向是否一致。
表3.15九江市中心城区低收入家庭购房时间意向
地区
一年内购房
二年内购房
三年内购房
合计
开发区
121
53
46
220
浔阳区
314
46
38
398
庐山区
232
118
77
427
合计
667
217
161
1045
资料来源:
4.已知性别与受教育程度存在一定的相关性,现欲测算性别与受教育程度之间的相关程度。
以2007年《中国统计年鉴》中全国人口抽样调查数据为基础,有关资料分别按男、女整理如下表3.16:
表3.162007年全国人口按性别分的受教育程度
受教育程度
未上过小学
小学
初中
高中
大专及以上
合计
性
男
26886
178576
236899
81865
39525
563751
别
女
71449
191438
199374
62787
30056
555104
合计
98335
370014
436273
144652
69581
1118855
资料来源:
2007年《中国统计年鉴》
试问性别与受教育程度之间的相关程度大小。
5•表3.17给出的是某市居民月收入与婚姻状况数据。
分析
(1)该市城市居民收入水平
对婚姻状况的影响;
(2)检验月平均收入与婚姻状况的关系是否受性别的影响(提示:
以“性
72
别”作为控制变量进行分层检验)。
表3.17某市居民月收入与婚姻状况数据
婚姻状况
低收入
中等收入
高等收入
男性
女性
男性
女性
男性
女性
未婚
30
61
80
75
75
53
已婚
86
79
175
165
87
73
离婚
6
9
3
10
2
2
项目4相关与回归分析
4.3实验数据
1.为了研究财政收入受农业增加值、工业增加值、社会总人口数等因素的影响程度,
我们选取了中国1990-2006年财政收入及其影响因素农业增加值、第二产业增加值(包括工
业和建筑业)、社会从业人数,以及其他收入水平4个因素的数据为样本,如表4.1所示。
原始数据文件为4-1.sav。
表4.1中国1990-2006年财政收入及其影响因素数据表
年份
财政收入Y
(亿元)
农业增加值
X1(亿元)
第二产业增加
值X2(亿元)
社会从业人
数X3(万人)
其他收入水
平X4(亿元)