多元统计分析实验指导书实验一均值向量和协方差阵检验.docx
《多元统计分析实验指导书实验一均值向量和协方差阵检验.docx》由会员分享,可在线阅读,更多相关《多元统计分析实验指导书实验一均值向量和协方差阵检验.docx(11页珍藏版)》请在冰豆网上搜索。
多元统计分析实验指导书实验一均值向量和协方差阵检验
实验一SPSS软件的基本操作与均值向量和协方差阵的检验
【实验目的】
通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。
同时能够掌握对均值向量和协方差阵进行检验。
【实验性质】
必修,基础层次
【实验仪器及软件】
计算机及SPSS软件
【实验内容】
1.操作SPSS的基本方法(打开、保存、编辑数据文件)
2.问卷编码
3.录入数据并练习数据相关操作
4.对均值向量和协方差阵进行检验,并给出分析结论。
【实验学时】
4学时
【实验方法与步骤】
1.开机
2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS
3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗
4.对一份给出的问卷进行编码和变量定义
5.按要求录入数据
6.练习基本的数据修改编辑方法
7.检验多元总体的均值向量和协方差阵
8.保存数据文件
9.关闭SPSS,关机。
【实验注意事项】
1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机作业】
1.定义变量:
试录入以下数据文件,并按要求进行变量定义。
表1
学号
姓名
性别
生日
身高(cm)
体重(kg)
英语(总分100分)
数学(总分100分)
生活费($代表人民币)
200201
刘一迪
男
1982.01.12
156.42
47.54
75
79
345.00
200202
许兆辉
男
1982.06.05
155.73
37.83
78
76
435.00
200203
王鸿屿
男
1982.05.17
144.6
38.66
65
88
643.50
200204
江飞
男
1982.08.31
161.5
41.68
79
82
235.50
200205
袁翼鹏
男
1982.09.17
161.3
43.36
82
77
867.00
200206
段燕
女
1982.12.21
158
47.35
81
74
200207
安剑萍
女
1982.10.18
161.5
47.44
77
69
1233.00
200208
赵冬莉
女
1982.07.06
162.76
47.87
67
73
767.80
200209
叶敏
女
1982.06.01
164.3
33.85
64
77
553.90
200210
毛云华
女
1982.09.12
144
33.84
70
80
343.00
200211
孙世伟
男
1981.10.13
157.9
49.23
84
85
453.80
200212
杨维清
男
1981.12.6
176.1
54.54
85
80
843.00
200213
欧阳已祥
男
1981.11.21
168.55
50.67
79
79
657.40
200214
贺以礼
男
1981.09.28
164.5
44.56
75
80
1863.90
200215
张放
男
1981.12.08
153
58.87
76
69
462.20
200216
陆晓蓝
女
1981.10.07
164.7
44.14
80
83
476.80
200217
吴挽君
女
1981.09.09
160.5
53.34
79
82
200218
李利
女
1981.09.14
147
36.46
75
97
452.80
200219
韩琴
女
1981.10.15
153.2
30.17
90
75
244.70
200220
黄捷蕾
女
1981.12.02
157.9
40.45
71
80
253.00
要求:
1)变量名同表格名,以“()”内的内容作为变量标签。
对性别(Sex)设值标签“男=0;女=1”。
2)正确设定变量类型。
其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。
3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。
2.
(1)试录入以下数据文件,保存为“数据1.sav”。
表2
序号
性别
职称
在公司工作的时间
年龄
工资
1
男
2
5
30
2000
2
女
2
4
25
1900
3
女
2
5
28
2000
4
男
1
1
25
1500
5
男
3
8
35
3000
6
男
2
3
29
1850
7
男
3
10
34
3200
8
女
2
8
30
1950
9
女
1
3
27
1600
10
女
4
15
38
4200
11
男
3
8
35
3000
12
男
2
5
32
2000
13
女
1
2
25
1550
14
女
2
9
30
2100
15
女
3
14
34
3500
16
女
1
3
26
1600
17
男
4
10
36
4000
18
女
3
9
34
3150
19
男
2
6
28
1800
20
男
2
2
28
1800
21
女
2
3
28
1850
22
男
2
10
30
1900
23
男
3
20
50
3400
24
男
3
16
45
3300
25
男
4
25
48
4800
26
男
4
10
34
4500
27
女
2
5
29
2000
28
女
3
15
38
3200
29
女
1
1
25
1500
30
男
3
6
35
3100
(2)试录入以下数据文件,保存为“数据2.sav”。
表3
序号
性别
职称
在公司工作的时间
年龄
工资
31
男
3
16
46
3300
32
男
4
30
51
5000
33
男
4
10
33
4500
34
女
2
5
29
2000
35
女
1
5
33
1500
36
女
4
18
48
4700
37
男
3
5
37
3050
38
男
3
15
38
3200
39
男
4
18
48
4700
40
男
3
6
35
3100
(3)试将数据2合并到数据1,合并后的数据文件另存为“数据3.sav”。
(4)将工资进行重编码,2000以下(含2000)为1,2000-3000为2,3000-4000为3,4000以上为4,重编码的结果保存为“工资等级”。
新数据文件保存为“数据4.sav”。
(5)求出各职工刚进入公司时的年龄,保存为“初入年龄”。
新数据文件保存为“数据5.sav”。
(6)试按各职员的工资数进行排秩,排秩要求工资最高的排为第一,相同数额取平均等级。
排秩后的数据文件保存为“数据6.sav”。
(7)试按各职员的工资数分性别进行排序,要求先排男性,后排女性。
同一性别按工资从高到低排列。
排序后的数据文件保存为“数据7.sav”。
3.某航空公司38名职员性别和工资情况的调查数据
表4某航空公司38名职员基本情况调查数据表
Id
Gender
Id
Gender
Id
Gender
1
M
14
F
27
M
2
M
15
M
28
M
3
F
16
M
29
M
4
F
17
M
30
M
5
M
18
M
31
M
6
M
19
M
32
M
7
M
20
F
33
M
8
F
21
F
34
M
9
F
22
M
35
M
10
F
23
F
36
F
11
F
24
F
37
M
12
M
25
F
38
M
13
M
26
M
表5某航空公司38名职员收入情况调查数据表
Id
Salary
Id
Salary
Id
Salary
1
$57,000
14
$35,100
27
$60,375
2
$40,200
15
$27,300
28
$32,550
3
$21,450
16
$40,800
29
$135,000
4
$21,900
17
$46,000
30
$31,200
5
$45,000
18
$103,750
31
$36,150
6
$32,100
19
$42,300
32
$110,625
7
$36,000
20
$26,250
33
$42,000
8
$21,900
21
$38,850
34
$92,000
9
$27,900
22
$21,750
35
$81,250
10
$24,000
23
$24,000
36
$31,350
11
$30,300
24
$16,950
37
$29,100
12
$28,350
25
$21,150
38
$31,350
13
$27,750
26
31050
(1)将表1数据输入到SPSS的数据编辑窗口中,将gender定义为字符型变量,保存数据文件,命名为“gender.sav”。
(2)将表2数据输入到SPSS的数据编辑窗口中,将salary定义为数值型变量,保存数据文件,命名为“salary.sav”。
(3)将两个数据文件合成一个数据文件,命名为“EmployeeData.sav”。
(4)要求将数据文件“EmployeeData.sav”按照变量salary(收入)进行升序排序,并建立一个新数据文件“EmployeeData(sorted).sav”放置排序以后的结果。
(5)要求将数据文件“EmployeeData.sav”按照变量gender(性别)进行分组,对每一组的变量salary计算其算术平均数,并计算其最大观察值,并建立一个新数据文件“EmployeeData(aggregate).sav”放置分类汇总以后的结果。
(6)要求以gender(性别)对数据文件“EmployeeData.sav”进行拆分,并要求在以后的统计分析中可以将各拆分文件的统计分析结果放在同一表格中显示。
(看不出操作结果,熟悉该操作过程即可)。
(7)要求在“EmployeeData.sav”文件中,标识工资在30000元以上的员工。
标识变量名设为s_ed变量标签为工资学历标识。
并把文件保存为“EmployeeData(counted).sav”
4.大学生的素质高低要受各方面因素的影响,其中包括家庭环境与家庭教育(x1)、学校生活环境(x2)、学校周围环境(x3)和个人向上发展的心理动机(x4)等。
从某大学在校学生中抽取了20人对以上因素在自己成长和发展过程中的影响程度给予评分(以9分制),数据如表6所示:
表6
学生
x1
x2
x3
x4
学生
x1
x2
x3
x4
1
5
6
9
8
11
9
3
2
8
2
8
5
3
6
12
9
6
3
4
3
9
6
7
9
13
8
6
7
8
4
9
2
2
8
14
9
3
8
6
5
9
4
3
7
15
9
3
4
6
6
9
5
3
7
16
9
6
2
8
7
6
9
5
5
17
7
4
3
9
8
8
5
4
4
18
6
8
4
9
9
8
4
3
7
19
9
6
8
9
10
9
4
3
6
20
8
7
6
8
假定x=(x1,x2,x3,x4)’服从四元正态分布。
试检验H0:
μ=μ0=(7,5,4,8),H1:
μ≠μ0(α=0.05)。
5.测量30名出生到3周岁婴幼儿的身高和体重数据(见表7),其中男女各15名,
(1)假定这两组都服从正态分布且协方差阵相等,试在显著性水平0.05下检验男女婴幼儿的这两项指标是否有显著差异?
请将下表的数据输入到SPSS文件中,并进行检验。
(2)检验男性婴幼儿与女性婴幼儿的协差阵是否相等(α=0.05)。
表7
编号
男
女
身高
体重
身高
体重
1
54
3
54
3
2
50.5
2.25
53
2.25
3
51
2.5
51.5
2.5
4
56.5
3.5
51
3
5
52
3
51
3
6
76
9.5
77
7.5
7
80
9
77
10
8
74
9.5
77
9.5
9
80
9
74
9
10
76
8
73
7.5
11
96
13.5
91
12
12
97
14
91
13
13
99
16
94
15
14
92
11
92
12
15
94
15
91
12.5
6.1992年美国总统选举的三位候选人为布什、佩罗特和克林顿。
从支持三位候选人的选民中分别抽取了20人,登记他们的年龄段(x1)、受教育程度(x2)和性别(x3)资料如下表所示:
表8
布什
佩罗特
克林顿
投票人
X1
X2
X3
投票人
X1
X2
X3
投票人
X1
X2
X3
1
2
1
1
1
2
1
1
1
4
1
1
2
1
3
2
2
1
2
1
2
4
1
2
3
3
3
1
3
1
0
2
3
2
1
2
4
1
3
2
4
1
3
2
4
4
1
2
5
3
1
2
5
3
1
2
5
2
3
2
6
3
1
2
6
2
4
1
6
4
0
2
7
1
1
2
7
1
1
1
7
3
2
1
8
2
3
1
8
1
3
2
8
4
0
1
9
2
1
2
9
4
1
2
9
2
1
1
10
3
1
1
10
3
3
2
10
3
1
2
11
1
1
2
11
2
1
1
11
3
1
2
12
4
1
2
12
1
3
2
12
2
3
1
13
4
0
2
13
2
1
1
13
4
0
1
14
3
4
2
14
1
1
2
14
2
1
2
15
3
3
2
15
2
1
1
15
4
1
1
16
2
3
1
16
3
1
1
16
2
2
1
17
2
1
1
17
1
1
2
17
3
3
1
18
3
1
1
18
3
1
1
18
3
2
2
19
1
3
2
19
4
3
1
19
3
1
1
20
1
1
2
20
2
1
1
20
4
0
2
(1)假定三组都服从多元正态分布,检验这三组的总体均值是否有显著性差异(α=0.05)。
(2)检验三位候选人的协差阵是否相等(α=0.05)。