应用统计学学课设.docx
《应用统计学学课设.docx》由会员分享,可在线阅读,更多相关《应用统计学学课设.docx(21页珍藏版)》请在冰豆网上搜索。
应用统计学学课设
学号
(应用统计学课程设计)
设计说明书
运用SPSS对大学生上网情况的统计分析
起止日期:
2011年6月6日至2011年6月24日
学生姓名
班级
09级电子商务1班
成绩
指导教师(签字)
管理工程系
2011年6月24日
目录
1选用的分析方法2
2描述性分析2
2.1大学生上网情况的描述性统计输出结果2
2.2数据分析2
2.2.1网龄2
2.2.2每周上网时间3
2.2.3每周计划上网时间3
2.2.4每周玩游戏时间3
3.统计图3
3.1大学生上网情况统计图输出结果3
3.2数据分析4
4统计报表4
5相关分析5
5.1大学生上网情况相关分析输出结果5
5.2数据分析6
6偏相关相关分析7
6.1大学生上网情况偏相关相关分析输出结果7
6.2数据分析8
7一元线性回归分析8
7.1大学生上网情况一元线性回归分析输出结果8
7.2数据分析9
8多元线性回归分析10
8.1大学生上网情况多元线性回归分析输出结果10
8.2数据分析11
总结12
附原始数据12
1选用的分析方法
在本次调查中主要运用的分析方法有:
描述性分析、统计图、统计报表、均值比较、相关分析、偏相关分析、一元线性回归分析、多元线性回归分析。
2描述性分析
2.1大学生上网情况的描述性统计输出结果
统计表
网龄(y)
每周上网时间(h)
每周计划上网时间(h)
每周玩游戏时间(h)
N
有效
40
40
40
40
缺失
0
0
0
0
均值
4.65
28.10
20.70
9.18
均值的标准误
.382
2.306
1.869
1.354
中值
4.50
26.50
15.00
5.00
众数
2
10a
15
4
标准差
2.413
14.585
11.820
8.566
方差
5.823
212.708
139.703
73.379
偏度
.481
.640
2.410
1.957
偏度的标准误
.374
.374
.374
.374
峰度
-.763
-.476
7.379
3.868
峰度的标准误
.733
.733
.733
.733
全距
9
51
60
38
极小值
1
9
10
2
极大值
10
60
70
40
和
186
1124
828
367
a.存在多个众数,显示最小值
b.表示最小值
2.2数据分析
2.2.1网龄
从结果中可以看出,这40位大学生网龄的均值为4.65年,平均标准误差为0.382,中位数为4.50年,众数为2年,标准差为2.413年,方差为5.823年,偏度为0.481年,偏度标准误差0.374年,峰度为-0.763年,峰度标准误差0.733年,全距位9年,极小值1年,极大值10年,合计为186年。
2.2.2每周上网时间
从结果中可以看出,这40位大学生每周上网时间的均值为28.10小时,平均标准误差为2.306,中位数为26.50小时,众数为10小时,标准差为14.585小时,方差为212.708小时,偏度为0.640小时,偏度标准误差0.374小时,峰度为-0.476小时,峰度标准误差0.733小时,全距位51小时,极小值9小时,极大值60小时,合计为1124小时。
2.2.3每周计划上网时间
从结果中可以看出,这40位大学生每周计划上网时间的均值为20.70小时,平均标准误差为1.869,中位数为15.00小时,众数为15小时,标准差为11.820小时,方差为139.703小时,偏度为2.410小时,偏度标准误差0.374小时,峰度为7.379小时,峰度标准误差0.733小时,全距位60小时,极小值10小时,极大值70小时,合计为828小时。
2.2.4每周玩游戏时间
从结果中可以看出,这40位大学生每周玩游戏时间的均值为9.18小时,平均标准误差为1.354,中位数为5.00小时,众数为4小时,标准差为8.566小时,方差为73.379小时,偏度为1.954小时,偏度标准误差0.374小时,峰度为3.868小时,峰度标准误差0.733小时,全距位38小时,极小值2小时,极大值40小时,合计为367小时。
3.统计图
3.1大学生上网情况统计图输出结果
3.2数据分析
该图反映了大一至大四年级学生的网龄、每周上网时间、每周计划上网时间和每周玩游戏时间各项的比较和趋势,且反映了各个年级不同的上网情况。
4统计报表
大学生上网情况统计表a
网龄(y)
每周上网时间(h)
每周计划上网时间(h)
每周玩游戏时间(h)
1
2
10
12
5
2
2
15
13
8
3
4
17
13
3
4
1
9
12
3
5
3
10
15
4
6
5
33
24
5
7
7
37
28
4
8
3
30
20
5
9
2
14
15
3
10
8
16
20
5
11
2
55
20
13
12
2
36
27
13
13
4
16
15
4
14
2
39
50
5
15
5
40
29
14
16
2
33
12
4
17
2
18
15
4
18
4
35
24
3
19
2
17
14
4
20
2
13
10
2
21
9
20
15
4
22
8
55
70
30
23
6
60
35
28
24
5
28
14
16
25
7
32
20
18
26
6
17
13
5
27
3
18
12
8
28
4
25
18
9
29
5
45
28
21
30
3
20
15
7
31
9
21
14
8
32
8
60
40
40
33
4
35
21
20
34
5
10
10
3
35
6
48
30
14
36
8
16
14
4
37
5
36
15
4
38
10
37
25
5
39
5
35
21
10
40
6
13
10
2
总计
N
40
40
40
40
均值
4.65
28.10
20.70
9.18
极小值
1
9
10
2
极大值
10
60
70
40
限于前100个案例。
5相关分析
5.1大学生上网情况相关分析输出结果
描述性统计量
均值
标准差
N
每周上网时间(h)
28.10
14.585
40
网龄(y)
4.65
2.413
40
相关性
每周上网时间(h)
网龄(y)
每周上网时间(h)
Pearson相关性
1
.284
显著性(双侧)
.076
平方与叉积的和
8295.600
389.400
协方差
212.708
9.985
N
40
40
网龄(y)
Pearson相关性
.284
1
显著性(双侧)
.076
平方与叉积的和
389.400
227.100
协方差
9.985
5.823
N
40
40
5.2数据分析
(1)输出结果文件中第一个表格为描述性统计量表。
从图中可知,参与分析的两个变量样本数均为40,每周上网时间均值为28.10小时,标准差为14.585,网龄均值为4.65年,标准差为2.413。
(2)输出结果的文件中第二个表格为相关系数及显著性检验结果。
从图中可知,每周上网时间和网龄的相关系数r=0.284显著水平为0.076,。
因此系数旁边用两个**号进行标识,表示其关系十分显著。
6偏相关相关分析
6.1大学生上网情况偏相关相关分析输出结果
描述性统计量
均值
标准差
N
每周上网时间(h)
28.10
14.585
40
每周玩游戏时间(h)
9.18
8.566
40
每周计划上网时间(h)
20.70
11.820
40
相关性
控制变量
每周上网时间(h)
每周玩游戏时间(h)
每周计划上网时间(h)
-无-a
每周上网时间(h)
相关性
1.000
.755
.749
显著性(双侧)
.
.000
.000
df
0
38
38
每周玩游戏时间(h)
相关性
.755
1.000
.647
显著性(双侧)
.000
.
.000
df
38
0
38
每周计划上网时间(h)
相关性
.749
.647
1.000
显著性(双侧)
.000
.000
.
df
38
38
0
每周计划上网时间(h)
每周上网时间(h)
相关性
1.000
.535
显著性(双侧)
.
.000
df
0
37
每周玩游戏时间(h)
相关性
.535
1.000
显著性(双侧)
.000
.
df
37
0
a.单元格包含零阶(Pearson)相关。
6.2数据分析
(1)输出结果文件中第一个表格为描述性统计量表。
从图中可知,参与分析的三个变量样本数均为40,其中每周上网时间均值为28.10小时,标准差为14.585,每周玩游戏时间均值为9.18小时,标准差为8.566。
每周计划上网时间均值为20.70小时,标准差为11.820。
(2)输出结果的文件中第二个表格为相关系数、偏相关系数及显著性检验结果。
从图中可知,每周上网时间和每周玩游戏时间的相关系数r=0.647,对应的显著水平为0.000,即每周上网时间和每周玩游戏时间是相关性的;以每周计划上网时间为控制变量,即在扣除每周计划上网时间影响情况下,每周上网时间和每周玩游戏时间的相关系数r=0.535,对应的显著水平为0.000,可得出结论,在扣除每周计划上网时间影响情况下,每周上网时间和每周玩游戏时间相关性显著。
7一元线性回归分析
7.1大学生上网情况一元线性回归分析输出结果
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.755a
.570
.558
5.693
a.预测变量:
(常量),每周上网时间(h)。
b.因变量:
每周玩游戏时间(h)
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1630.085
1
1630.085
50.291
.000a
残差
1231.690
38
32.413
总计
2861.775
39
a.预测变量:
(常量),每周上网时间(h)。
b.因变量:
每周玩游戏时间(h)
系数a
模型
非标准化系数
标准系数
t
Sig.
相关性
B
标准误差
试用版
零阶
偏
部分
1
(常量)
-3.281
1.974
-1.662
.105
每周上网时间(h)
.443
.063
.755
7.092
.000
.755
.755
.755
a.因变量:
每周玩游戏时间(h)
7.2数据分析
(1)输出结果文件的第一个表格为常用统计量,反映的是一元线性回归模型的拟合的情况,相关系数R=0.755,决定系数
=0.570,调整决定系数
0.558,回归估计的标准差为S=5.693,模型拟合效果很理想。
(2)输出结果文件的第二个表格为方差分析表。
从表中可知离差平平方和2861.775,残差平方和1231.690,回归平方和1630.085。
回归方程显著性检验中,统计量F=50.291,对应的置信水平为0.000,远比常用置信水平0.05小,因此可以认为方程是极显著的。
(3)第三个标着为回归系数分析表,是回归系数以及回归方程系数的检验结果,系数显著性采用t检验。
从表中可以看出回归方程的常数项为-3.281,回归系数为0.443.回归系数检验统计量为7.092,Sig为相伴概率值小于0.001。
由此可知回归方程为
Y=-3.281+7.092X
回归系数显著水平均为0.000,表明t统计检验量假设回归系数等于0的概率为0.000,远比常用的置信水平0.05要小,因此认为两个变量之间的线性关系是极为显著的,建立的回归方程有效。
(4)输出的图为正态分布图。
该图是用来观察标准化残差的分布是否符合正态分布,如果是,则图中散点应近乎一条直线,体重的纵坐标为因变量(每周玩游戏时间),横坐标为自变量(每周上网时间),散点代表了用建立的回归方程计算的各个每周上网时间下的每周玩游戏时间,图中各点的连线就是建立的回归直线。
8多元线性回归分析
8.1大学生上网情况多元线性回归分析输出结果
描述性统计量
均值
标准偏差
N
每周玩游戏时间(h)
9.18
8.566
40
每周上网时间(h)
28.10
14.585
40
网龄(y)
4.65
2.413
40
相关性
每周玩游戏时间(h)
每周上网时间(h)
网龄(y)
Pearson相关性
每周玩游戏时间(h)
1.000
.755
.309
每周上网时间(h)
.755
1.000
.284
网龄(y)
.309
.284
1.000
Sig.(单侧)
每周玩游戏时间(h)
.
.000
.026
每周上网时间(h)
.000
.
.038
网龄(y)
.026
.038
.
N
每周玩游戏时间(h)
40
40
40
每周上网时间(h)
40
40
40
网龄(y)
40
40
40
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
每周上网时间(h)a
.
输入
2
网龄(y)a
.
输入
a.已输入所有请求的变量。
b.因变量:
每周玩游戏时间(h)
模型汇总c
模型
R
R方
调整R方
标准估计的误差
1
.755a
.570
.558
5.693
2
.761b
.579
.557
5.703
a.预测变量:
(常量),每周上网时间(h)。
b.预测变量:
(常量),每周上网时间(h),网龄(y)。
c.因变量:
每周玩游戏时间(h)
Anovac
模型
平方和
df
均方
F
Sig.
1
回归
1630.085
1
1630.085
50.291
.000a
残差
1231.690
38
32.413
总计
2861.775
39
2
回归
1658.357
2
829.178
25.494
.000b
残差
1203.418
37
32.525
总计
2861.775
39
a.预测变量:
(常量),每周上网时间(h)。
b.预测变量:
(常量),每周上网时间(h),网龄(y)。
c.因变量:
每周玩游戏时间(h)
8.2数据分析
(1)输出的第一个表为参与回归分析的三个变量的描述统计表,从表中可以看出,参与分析的每周上网时间,网龄,每周玩游戏时间样本数均为40。
每周上网时间均值为28.10小时,标准差为14.585,网龄均值为4.65年,标准差为2.413,每周玩游戏时间均值为9.18小时,标准差为8.566。
(2)第二个表格为参与回归分析的三个变量的相关系数及其检验。
表中内用可分为三部分,pearsoncorrelation中给出了三个变量的两两相关系数表,因变量每周玩游戏时间与自变量每周上网时间的相关系数最大,两个变量之间也存在一定程度的相关。
Sig.(单侧)栏是三个变量两两相关的显著性检验结果表。
最底下一栏N,给出了各个变量的样本数。
(3)第三个表依次列出了模型对自变量的筛选过程,即变量进入/退出模型的情况。
第一个进入的是每周上网时间,第二个进入的是网龄。
(4)第四个表位回归方程拟合总结表,模型1每周上网时间的相关系数R=0.755,决定系数
0.570,调整决定系数
0.558,标准误差估计值为5.693;模型2网龄相关系数R=0.761,决定系数
0.579,调整决定系数为
0.557,标准误差估计值5.703。
(5)第五个表中为回归方程的方差分解及检验结果。
回归方程的统计模型1每周上网时间的F=50.291,模型2网龄的F=25.494,P=0.000,可见方程极为显著。
总结
本次课设所研究的问题是:
大学生上网情况。
采用的调查方式是发放调查问卷,在自习室发放了80份问卷,收回80份,其中有效80份,我们抽取其中不同年级、不同性别40份收集数据。
所采集数据基本可以反映我校学生的上网情况。
对于采集回来的数据我们主要分析了年级、性别、网龄、每周上网时间、每周计划上网时间、每周玩游戏时间相互间的差别与联系,可以得出:
大一学生由于宿舍没通网,上网时间偏短;大四学生面临毕业,呈现两级分化,即有的学生上网时间较长,有的几乎不上;大二、大三学生上网时间较长,并且玩游戏时间也较长。
学生普遍的都是实际上网时间超出计划上网时间,这说明比较缺乏自控力。
每周上网时间和每周玩游戏时间之间的线性关系极为显著,说明学生上网主要是玩游戏,不能正确地利用网络。
附原始数据
编号
年级
性别
网龄(y)
每周上网时间(h)
每周计划上网时间(h)
每周玩游戏时间(h)
1
大一
男
2
10
12
5
2
大一
男
2
15
13
8
3
大一
男
4
17
13
3
4
大一
男
1
9
12
3
5
大一
男
3
10
15
4
6
大一
女
5
33
24
5
7
大一
女
7
37
28
4
8
大一
女
3
30
20
5
9
大一
女
2
14
15
3
10
大一
女
8
16
20
5
11
大二
男
2
55
20
13
12
大二
男
2
36
27
13
13
大二
男
4
16
15
4
14
大二
男
2
39
50
5
15
大二
男
5
40
29
14
16
大二
女
2
33
12
4
17
大二
女
2
18
15
4
18
大二
女
4
35
24
3
19
大二
女
2
17
14
4
20
大二
女
2
13
10
2
21
大三
男
9
20
15
4
22
大三
男
8
55
70
30
23
大三
男
6
60
35
28
24
大三
男
5
28
14
16
25
大三
男
7
32
20
18
26
大三
女
6
17
13
5
27
大三
女
3
18
12
8
28
大三
女
4
25
18
9
29
大三
女
5
45
28
21
30
大三
女
3
20
15
7
31
大四
男
9
21
14
8
32
大四
男
8
60
40
40
33
大四
男
4
35
21
20
34
大四
男
5
10
10
3
35
大四
男
6
48
30
14
36
大四
女
8
16
14
4
37
大四
女
5
36
15
4
38
大四
女
10
37
25
5
39
大四
女
5
35
21
10
40
大四
女
6
13
10
2
《应用统计学》课程设计
组内任务分配情况说明
完成人员:
任务分配情况
序号
姓名
学号
承担主要任务
贡献等级
1
调查问卷分发,部分数据分析,报告修改
1
2
调查问卷制作,部分数据分析,报告书写
2
3
调查问卷分发,部分数据分析,数据统计
3
4
调查问卷分发,部分数据分析,数据统计
4
注:
1.“完成人员”排序要与课程设计报告书封面人员排序一致;
2.“承担主要任务”的填写要详细;
3.“贡献等级”一栏显示团队成员在课程设计任务中所作的工作量,贡献由大到小依次为1、2、3、4(贡献最大的为1,贡献最小的为4),要求每一等级为1人。
签字确认:
、、、。
2011年6月24日