某高校在校生体测成绩的统计分析Word下载.docx
《某高校在校生体测成绩的统计分析Word下载.docx》由会员分享,可在线阅读,更多相关《某高校在校生体测成绩的统计分析Word下载.docx(38页珍藏版)》请在冰豆网上搜索。
身体素质通常指的是人体在肌肉活动中所表现出来的各种能力。
一般包括力量、速度、耐力、灵敏和柔韧。
因此,本文通过分析中国农业大学2010年6290名在校生体测成绩数据,利用matlab统计分析理论建立相关模型,研究当前大学生身体素质的真实现状,该研究成果有着非常重要的应用价值。
首先利用描述性统计分析方法对体测数据进行初步研究。
再利用方差分析对13个学院的学生的身高进行单因素一元方差分析和非参数分析,判断不同学院的学生的身高有无显著性差异。
在研究身高和体重的关系时,利用了MATLAN做了回归模型,用一元回归求出身高和体重的函数关系,二元回归求出来身高和体重做自变量,肺活量做因变量的函数关系。
判别分析主要是用5999个学生的身高体重等级去判别291个学生的类别。
关键词:
体测成绩;
统计分析;
MATLAB;
方差分析;
回归分析;
判别分析
ABSTRACT
Inthemodernlife,alongwiththerisingoflivingstandards,collegestudents'
physicalqualityisworseandworsenow,themorehighlyeducatedpeople,physicalqualitygeneraltheworse.Alotofpeopleisnostrangertothewordphysicalquality.Indailylife,peopleoftensay,so-and-soinstrength,whocanrunfast,orwhoisveryflexible,so-and-sostrongendurance.Infacttheseabilitiesarephysicalquality.Physicalqualityusuallyreferstothehumanbodyinmuscleactivityofallkindsofability.Generallyincludespower,speed,stamina,agilityandflexibility.
Therefore,throughtheanalysisofChinaagriculturaluniversityin2010,6290studentscervixresultdata,therelevantmodelisestablishedusingMATLABstatisticanalysistheory,researchtherealstatusofthecurrentcollegestudents'
physicalquality,theresultsofthestudyhasaveryimportantapplicationvalue.First,useofdescriptivestatisticsanalysismethodtoapreliminarystudyonthecervixdata.Second,analysisofvarianceontheheightof13studentsofthecollegeonasinglefactoranalysisofvarianceandnonparametricanalysis,judgetheheightofdifferentcollegestudentshavesignificantdifferences.Inthestudyoftherelationshipbetweenheightandweight,useofMATLANmadearegressionmodel,useAregressionmodeltothefunctionrelationofheightandweight.Bivariateregressionofheightandweightdoseekoutindependentvariables,vitalfunctionofthedependentvariablesdo.Discriminantanalysisismainlyused5999gradestudentheightandweighttodetermine291studentsinclasses.
Keywords:
Thecervixgrades;
StatisticAnalysis;
Analysisofvariance;
AnalysisofRegression;
DiscriminantAnalysis
目录
1前言1
2常用统计分析方法3
2.1描述性统计分析3
2.2方差分析4
2.3回归分析8
2.4判别分析9
3MATLAB主要统计函数简介11
4某高校在校生体测成绩统计分析13
4.1数据来源13
4.2描述性统计量13
4.3方差分析16
4.4回归分析20
4.5判别分析26
5总结与不足28
参考文献29
致谢31
附录32
1前言
随着我国国力的增强,我国逐渐重视大中学生体质健康。
2014年四月二十四日,教育部体卫司司长王登峰在发布会上透露,新版《国家学生体质健康标准》已经基本成形,和旧版相比,取消了所有选测项目,统一为必测项目。
据介绍,新版中要求大、中学生必测长跑。
测试成绩分优秀、良好、及格和不及格4个等级,分别记入学校为每个学生制作的《国家学生体质健康标准登记卡》。
教育部表示,学校没按规定执行的,将在学校体育工作等级评比中“不合格”。
新版标准还要增加体育课学分。
【13】
大学生的健康成长关系到一个国家和整个民族发展的未来,对于我国大学生而言,其身体与智力的发展正处于关键时期。
大学生健康体适能测试,是高校体育工作中的一个重要的组成部分,也是学校教育评价体系中所必不可少。
统计分析这种方法从整体上反映和分析事物数量特征,可以观察并发现事物的本质和发展规律,作出正确的判断。
体测成绩的统计分析从微观上有助于学生自己更好的了解自己的身体健康状态,并作出相应调整。
研究当前大学生身体素质的真实现状,该研究成果有着非常重要的应用价值。
朱慧平,张晓芳在[18]中采用文献资料法、数理统计法、问卷调查等方法,对甘肃省当前大学生的体质健康状况进行了调查研究。
结果发现:
1)男生和女生体质健康状况存在着较大的差距,男生明显好于女生。
2)城市、县城、村镇的学生体质健康状况存在着一定的差异,乡村学生好于城市学生。
3)年级不同,学生的体质状况也不同,研究结果表示大二学生最好,大四学生最差,从大学一年级到四年级学生的体质健康状况有先提高后降低的趋势。
李恺宪在[17]中探讨不同体育生活方式对大学生的体质状况有什么影响以及两者相互关系,研究当中主要采用文献资料、问卷调查、专家访谈等研究方法,进行问卷调查对江苏地区普通高校大学生的体育生活方式,结果发现:
不同年级的体育生活方式存在明显的差异,前三个年级的学生都有很好的体育生活方式,到大四之后学生的体育生活方式明显下降;
在这些学生中调查了不同的体育生活方式并进行比较分析,结果表明,具有良好体育生活方式特征的大学生体质状况明显好于另一部分大学生;
因此,建立良好的体育生活方式,可以提高身体机能素质,促进柔韧、速度和耐力素质的发展,最终促进大学生体质的全面发展。
吴磊在[19]中通过体育课的体能练习提高大学生体质测试的健康水平,结合体测的内容设置相关的体能项目的训练,并有针对性的进行练习。
本文运用访谈法、问卷调查法、统计法试验法等相关研究方法对目前高校存在的问题进行分析和总结提出相关具体方案,为大学生身体素质的提升打好基础。
本文以2010年中国农业大学的在校生体测数据为依据,主要运用统计分析的描述性统计、方差分析、回归分析、判别分析,旨在发现一些规律和问题。
首先从描述性统计量中算出各个年级的体测成绩的几个统计量。
接着用方差分析对不同学院学生的身高分别进行了显著性分析,用多重比较得出哪两种学院学生的身高差异性大。
在回归分析中,先对数据做了相关性分析,查找相关性比较强的,所以拟合了身高和体重的一元回归和身高、体重。
肺活量的二元回归,最后求出回归方程,画出了拟合图。
在判别分析中,对身高体重等级做了分类。
第一类是超重,第二类是肥胖,第三类是较低体重,第四类是营养不良,第五类是正常体重,用5999名学生对291名学生进行分类。
2常用统计分析方法
2.1描述性统计分析
2.1.1常用统计量
通常在得到数据并对数据进行预处理后,需要对数据进行描述性的统计分析。
常用统计量有以下几种:
(1)样本均值(mean),描述了样本数据相对中的中心位置,计算公式:
(2)样本标准差(std),描述了样本数据变异程度的大小,计算公式:
(3)样本极差(range)作为样本数据变异程度大小的一个简单度量,计算公式:
(4)最大值和最小值(Max和min)求样本数据中的最大值和最小值。
公式是。
(5)中位数(Median):
顾名思义就是将样本数据从小到大依次排列,位于中间的那个观测值,样本P分位数定义如下
(6)众数(Mode):
描述了样本观测值数据中出现最多的数。
(7)变异系数是衡量数据变异程度的一个统计量,和标准差不同,当单位和平均值不同时,比较其变异程度就要用变异系数,即标准差和平均数的比值。
(8)样本偏度(skewness)用来计算样本数据的偏度,偏度反映了总体分布密度曲线的对称性信息,偏度越接近0,说明分布越对称。
如偏度大于0说明概率密度的右尾巴长,顶点偏向左边,偏度小于0说明概率密度的左尾巴长,顶点偏向右边,计算公式:
,其中为样本k阶中心矩。
(9)样本k阶中心矩(moment):
(10)样本的峰度(Kurtosis)反映了总体分布密度曲线在其峰值附近的陡峭程度,计算公式:
2.1.2常用统计图
1.直方图(hist/hist3)
在观察数据所服从的分布时,直方图是非常简洁实用的。
做直方图的步骤如下:
(1)将样本观测值从小到大排序得.
(2)适当选取略小于的数与略大于的数,将区间随意分为个不相交的小区间,记第个小区间为,其长度为.
(3)把样本观测值逐个分到各区间内,并计算样本观测值落在各区间内的频数及频率.
(4)在轴上截取各区间,并以各区间为底,以为高作小矩形,就得到频数直方图,若以为高作小矩形,就得到频率直方图。
MATLAB中绘制频数直方图的函数是hist和hist3(二元变量的三维直方图)。
2.箱线图(boxplot)
箱线图的做法如下:
(1)画一个箱子,其左侧线为样本0.25分位数位置,其右侧线为样本0.75分位数位置,在样本中位数