统计课设指导书.docx
《统计课设指导书.docx》由会员分享,可在线阅读,更多相关《统计课设指导书.docx(25页珍藏版)》请在冰豆网上搜索。
统计课设指导书
北京信息科技大学
《统计学》课程设计
题目:
关于大学生体育锻炼情况的调查
系别:
xxxxxxxxxxxxx
专业:
xxxxxxxxxxxx
学生姓名:
班级/学号:
指导老师:
起止时间:
目录
1调查方案设计·········································
1.1调查目的……………………………………………………………
1.2调查对象和调查方法…………………………………………………2
1.3调查内容和调查问卷…………………………………………………2
1.4调查问卷的发放………………………………………………………2
1.5调查数据的分析………………………………………………………2
1.6小组分工………………………………………………………………2
2统计分析报告……………………………………………………6
2.1大学生参与体育活动情况的分析………………………………………6
2.2大学生自身健康情况的调查分析……………………………………7
2.3.1男、女生对参与体育活动时间有无显著性差异的显著性检验……10
2.3.2男、女生自身健康情况有无显著性差异的显著性检验…………………
2.4不同专业学生参与体育活动时间有无显著差异的分析………………11
2.5大学生参加体育锻炼时间与自身健康情况的关系……………………11
3调查分析报告的总结………………………………………………………13
4对策与建议…………………………………………………………………14
1调查方案设计
大学校园为了加强大学生的身体素质,提高校园文化建设,在学校开展了不同种类的体育必修、选修课,为了锻炼大学生的体质,提高他们的综合素质。
并且校园里的各个社团,会不断的举办不同种类的体育比赛来丰富大学生校园文化生活。
此外,学校周围也有许多健身房,为大学生参与体育锻炼提供了良好的环境。
1.1调查目的:
随着网络、电子产品及娱乐业的不断发展,大学生业余生活丰富,会参与不同形式的活动,其中体育活动只是一小部分。
近年来,大学生的身体素质不断地被质疑。
通过了解大学生参与体育活动的程度、对校园体育课的看法及自身健康情况的调查,可以为大学生身体素质情况及其影响因素提供依据。
主要内容是:
了解大学生参与体育锻炼情况及其健康情况的总体水平;了解大学生参与锻炼及其健康情况的总体特征;了解影响大学生参与体育锻炼及健康情况的因素;为大学生以后业余生活中参与体育锻炼提供建议。
1.2调查对象和调查方法:
调查对象:
北京信息科技大学在校本科生
调查方法:
用简单抽样的办法把调查问卷发放给每个年级里的各班级随机选中的被调查学生让其填写。
调查后将收回的表格进行统计归类,然后根据统计数据进行分析研究,写出调查报告。
1.3调查内容和调查问卷:
调查内容:
(1)基本情况调查
(2)与体育活动有关的问题的调查
(3)自身健康情况的调查
(4)体育活动积极性调查
调查问卷:
关于大学生体育锻炼情况的调查问卷
同学你好!
我们是来自北京信息科技大学的学生。
因为作业需要,我们想请您为我们填写一份调查问卷。
此问卷绝无其他目的,并会为您保密。
希望您会参与并如实填写。
(请您在合适的选项上打勾或者在横线上填写您正确的信息)
一、基本信息:
1.您的性别?
A男B女
2.您来自于哪个年级?
A大一B大二C大三D大四
3.您来自于哪个专业?
A经济B人文C数学D计算机E财务F外语G会计
H其他
二、与参与体育活动有关的问题的调查
4.您在学校参加(没有参加写0)项体育活动的社团。
5.您喜欢那种体育活动?
(可多选)
A篮球或足球B乒乓球或羽毛球C跑步或游泳D其他E没有
6.您平常每周用于锻炼的时间为小时(最好填写整数)
7.您会选择在什么时候锻炼身体?
A课下业余时间B早上C晚上D随意
8.在大多数业余时间,你都会做些什么?
A上网B睡觉C购物D学习E运动
9.你因为什么原因参加运动?
(可多选)
A自身爱好B减肥C保持健康D其他
10.你参与运动的场所?
A校园B健身房C公园D其他
三、自身健康情况的调查
11.请您为运动的重要性打分______分(满分为10分)
12.如果现在学校要测男子1000米或者女子800米,满分为10分,请为自己打分________。
13.请你为你的健康情况打分_________(满分为10分)
14.请你为你的锻炼时间是否达标而打分___________(满分为10分)
15.请你为你的体育课参与情况打分___________(满分为10分)
四、体育活动积极性调查
16.你会积极参与与体育有关的比赛么?
A会B不会
17.你是否会主动选修体育类选修课?
A会B不会
18.你是否同意学校开展晨跑活动?
A同意B不同意
19.你认为学校应该要求大学生参与项体育课程?
A.0B.1C.2D.3
20.北京的空气污染严重,这会降低你对体育运动的积极性么?
A会B不会
1.4调查问卷的发放
本次调查我们采取分层抽样,对在校本科生各个年级男、女生各发放问卷50份;我们在大一、大二、大三、大四共发放问卷51份:
其中,我们对收回的问卷作了如下统计:
大一:
(男生)2份(女生)0份
大二:
(男生)23份(女生)24份
大三:
(男生)0份(女生)1份
大四:
(男生)0份(女生)1份
总计:
(男生)26份(女生)25份
1.5调查数据的分析
(1)饼图:
分类数据,用来显示百分比。
(2)条形图:
将品质数据进行分组,用来显示不同类别的数量。
(3)直方图:
将数值型数据进行分组,并统计其频数。
(4)频数分布表:
将品质数据进行分组,并统计其频数。
(5)频率分布表:
将品质数据进行分组,并统计其频率。
(6)方差分析:
分析品质数据变量之间均值是否存在显著性差异。
(7)T检验:
将总体按照某一特征分组,检验两个均值是否存在显著性差异。
(8)回归:
将两个相关的变量进行回归,得出两个变量之间的关系。
1.6小组成员和分工:
2.1大学生参与体育活动情况的分析(黄麟、吴桐、李冉、许晋贤)
2.2大学生自身健康情况的调查分析(黄麟、吴桐)
2.3.1男女对参与体育活动时间有无显著性差异的显著性检验(左冬亭)
2.3.2男女自身健康情况有无显著性差异的显著性检验(左冬亭)
2.4不同专业学生参与体育活动时间有无显著差异的分析(左冬亭)
2.5大学生参加体育锻炼时间与自身健康情况的关系(左冬亭)
3.调查分析报告的总结(李冉)
4.对策与建议(许晋贤)
2.统计分析报告
2.1大学生参与体育活动情况的分析
根据调查数据分析我校大学生参与体育活动的基本情况和参与活动的主要类型和所占比例。
1.大学生每周参与体育活动的基本情况调查分析
(1)根据大学生每周参与运动时间的频数分布直方图可以看出,每周运动2~3小时的人数最多,为14人,约占总调查人数的27%;其次,在3~11小时之间的人数比较均衡,总共为27人,占总人数的53%,运动时间超过11小时的人数较少,为8人,约占总人数的15.7%。
所以可以得出,大学生每周参与体育运动的时间基本分布在3~11小时之间。
(2)描述统计
描述统计量
N
极小值
极大值
均值
标准差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
标准误
每周锻炼时间(小时)
51
0
25
6.04
5.004
1.347
.333
2.653
.656
有效的N(列表状态)
51
由以上图标可以得出,大学生平均每周参与运动的时间为6.04小时。
(3)将51名调查对象按照性别进行分类,然后对他们每周参加体育运动的时间为变量绘制茎叶图如下:
由茎叶图可以看出,男生每周参与运动的时间比女生较长,且运动时间分布比较稳定。
(4)将51名调查对象按照性别分组,然后根据业余时间做什么绘制条形统计图如下:
(左边为女生,右边为男生)
由条形统计图可以看出,51名调查对象业余时间主要用来上网,其中,男生上网人数为13人,女生为7人;女生有8人主要去购物。
因此,女生业余时间最喜欢购物,其次上网;男生最喜欢上网。
两者参与运动的人数较少。
(5)将51名调查对象按照参与运动的时间段进行分类,绘制条形统计图如下:
由条形统计图可以看出,大部分调查者喜欢在晚上运动,为16人;其次,在课下业余时间运动、随意时间段均为14人;最后,选择在早上参与运动的人数最少,为7人。
2.大学生参与运动的积极性的调查分析
(1)将51名调查对象按照是否积极参加体育比赛进行分组,绘制饼图如下:
(左边为参加,右边为不参加)由饼图可以看出,调查者积极参加体育比赛的人数占58.82%,较多。
(2)将51名调查对象按照是否积极参加体育选修课进行分组,绘制饼图如下:
(左边为不参加,右边为参加)由饼图可以看出,调查对象中,积极参与体育类选修课的人数占64.71%,大于不积极参加的人数。
(3)将51名调查对象按照是否愿意参加晨跑活动进行分组,绘制饼图如下:
可以看出,大部分调查对象不愿意参加晨跑活动。
(4)将51名调查对象按照“空气污染是否会降低运动积极性”进行分组,绘制饼图如下:
由饼图可以看出,大部分调查者认为空气污染会降低运动积极性。
2.2大学生自身健康情况的调查分析
1.根据调查对象对运动重要性打的分数,绘制频数分布直方图。
根据频数分布直方图可以看出,大部分调查对象认为运动非常重要。
2.根据调查对象对自己长跑能力打分绘制频数分布直方图,如下:
根据直方图可以看出,调查对象长跑的平均分数为6.92分,并且,分布比较稳定。
这说明大学生长跑能力普遍不高。
3.根据大学生对自己健康情况打的分数绘制频数分布直方图,如下:
根据直方图知道,调查对象的平均健康分数为7.67,并且大部分人分数在6~8之间,说明少数大学生健康情况优秀,大部分健康情况良好。
4.根据调查对象对自己的锻炼是否达标打的分数绘制频数分布直方图,如下:
根据直方图可以看出,达标分数的均值为8.06,且大部分人打得分数为10分。
这可以认为,大部分大学生认为自身参与锻炼的时间达标。
2.3.1男、女生对参与体育活动时间有无显著性差异的显著性检验
将51份调查问卷按照性别分组,对其中参与体育锻炼的时间进行显著性检验,如下:
T检验
组统计量
性别
N
均值
标准差
均值的标准误
每周锻炼时间(小时)
女
25
6.28
5.927
1.185
男
26
5.81
4.030
.790
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
差分的95%置信区间
下限
上限
每周锻炼时间(小时)
假设方差相等
1.477
.230
.334
49
.740
.472
1.414
-2.370
3.314
假设方差不相等
.332
42.096
.742
.472
1.425
-2.403
3.347
样本数据中,女生平均每周锻炼时间为6.28小时,男生为5.81小时,提出原假设与备择假设为:
H0:
U1=U2
H1:
U1≠U2
根据独立样本检验统计表中,方差方程的检验中sig值=0.23>0.025,因此接受男女平均每周锻炼时间方差相等的假设。
再根据T检验中,sig值=0.74>0.025,因此接受原假设,认为男、女参与体育活动时间无显著性差异。
2.3.2男、女生自身的健康情况有无显著性差异的显著性检验
将51份调查问卷按照性别分组,对其中健康情况分数进行显著性检验,如下:
组统计量
性别
N
均值
标准差
均值的标准误
为健康情况打分(满分10)
女
25
7.32
1.547
.309
男
26
7.23
1.657
.325
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
差分的95%置信区间
下限
上限
为健康情况打分(满分10)
假设方差相等
.113
.738
.199
49
.843
.089
.449
-.814
.992
假设方差不相等
.199
48.960
.843
.089
.449
-.812
.991
提出原假设与备择假设:
H0:
U1=U2
H1:
U1≠U2
根据独立样本检验统计表中,方差方程的检验中,sig值=0.738>0.025,因此接受男、女生健康情况分数方差相等的假设。
再根据T检验中,sig值=0.843>0.025,因此接受原假设,认为男、女健康情况无显著性差异。
2.4不同专业学生参与体育活动时间有无显著差异的分析
将51份调查问卷按照专业分组,对他们平均每周参加体育锻炼的时间进行显著性检验。
原假设:
H0:
备择假设:
H1:
ANOVA
每周锻炼时间(小时)
平方和
df
均方
F
显著性
组间
106.104
6
17.684
.679
.667
组内
1145.817
44
26.041
总数
1251.922
50
2.5大学生参加体育锻炼时间与自身健康情况的关系
相关性
相关性
每周锻炼时间(小时)
性别
专业
为健康情况打分(满分10)
每周锻炼时间(小时)
Pearson相关性
1
-.048
-.124
-.125
显著性(双侧)
.740
.384
.383
N
51
51
51
51
性别
Pearson相关性
-.048
1
.191
-.028
显著性(双侧)
.740
.180
.843
N
51
51
51
51
专业
Pearson相关性
-.124
.191
1
-.017
显著性(双侧)
.384
.180
.905
N
51
51
51
51
为健康情况打分(满分10)
Pearson相关性
-.125
-.028
-.017
1
显著性(双侧)
.383
.843
.905
N
51
51
51
51
相关性
每周锻炼时间(小时)
为健康情况打分(满分10)
为长跑能力打分(满分10)
每周锻炼时间(小时)
Pearson相关性
1
-.125
.323*
显著性(双侧)
.383
.021
N
51
51
51
为健康情况打分(满分10)
Pearson相关性
-.125
1
.094
显著性(双侧)
.383
.511
N
51
51
51
为长跑能力打分(满分10)
Pearson相关性
.323*
.094
1
显著性(双侧)
.021
.511
N
51
51
51
*.在0.05水平(双侧)上显著相关。
回归
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
每周锻炼时间(小时)
.
输入
a.已输入所有请求的变量。
b.因变量:
为健康情况打分(满分10)
模型汇总
模型
R
R方
调整R方
标准估计的误差
更改统计量
R方更改
F更改
df1
df2
Sig.F更改
1
.125a
.016
-.005
1.592
.016
.774
1
49
.383
a.预测变量:
(常量),每周锻炼时间(小时)。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.961
1
1.961
.774
.383a
残差
124.196
49
2.535
总计
126.157
50
a.预测变量:
(常量),每周锻炼时间(小时)。
b.因变量:
为健康情况打分(满分10)
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
7.514
.351
21.377
.000
6.807
8.220
每周锻炼时间(小时)
-.040
.045
-.125
-.880
.383
-.130
.051
a.因变量:
为健康情况打分(满分10)
回归
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
每周锻炼时间(小时)
.
输入
a.已输入所有请求的变量。
b.因变量:
为长跑能力打分(满分10)
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.323a
.104
.086
1.802
a.预测变量:
(常量),每周锻炼时间(小时)。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
18.493
1
18.493
5.692
.021a
残差
159.193
49
3.249
总计
177.686
50
a.预测变量:
(常量),每周锻炼时间(小时)。
b.因变量:
为长跑能力打分(满分10)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
6.188
.398
15.549
.000
每周锻炼时间(小时)
.122
.051
.323
2.386
.021
a.因变量:
为长跑能力打分(满分10)
单个样本统计量
N
均值
标准差
均值的标准误
每周锻炼时间(小时)
51
6.04
5.004
.701
单个样本检验
检验值=6
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
每周锻炼时间(小时)
.056
50
.956
.039
-1.37
1.45
2.
单个样本统计量
N
均值
标准差
均值的标准误
为长跑能力打分(满分10)
51
6.92
1.885
.264
单个样本检验
检验值=7
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
为长跑能力打分(满分10)
-.297
50
.768
-.078
-.61
.45