体育统计学资料Word文件下载.docx
《体育统计学资料Word文件下载.docx》由会员分享,可在线阅读,更多相关《体育统计学资料Word文件下载.docx(13页珍藏版)》请在冰豆网上搜索。
在一定的范围里,变量的所有的可能取值不能一一列举出来。
17.离散型变量:
变量所有的可能取值能一一列举出来。
18.总体参数:
反映总体的一些数量特征。
19.样本统计量:
样本所获得的一些数量特征。
20.收集资料的方法:
1日常积累;
2全面普查;
3专题研究。
21.简单随机抽样的方法:
1抽签法;
2随机数表法。
22.整群抽样:
是在总体中先划分群,然后以集体为抽样的单位,在按简单随机抽样取出若干群所组成样本的一种抽样方法。
23.频数整理:
该方法是将数据资料按一定顺序分成若干组,并数出各组中所含有的数据个数,制成频数分布表。
24.集中位置量数:
反映一群性质相同的观察值的平均水平或集中趋势的统计指标。
25.中位数:
将样本的观察值按其数值大小顺序排列起来,处于中间位置的那个数值就是中位数。
26.众数:
是样本观测值在频数分布表中频数最多的那一组的组中值。
27.几何平均数:
是反应集中位置量数的一种方法,它是样本观测值的连乘积,并以样本观测值的总数为次数,开方求得。
28.离中位置量数:
描述一群性质相同的观察值的离散程度的统计指标。
29.标准差:
方差能全面的反映数据的离散程度,可是由于方差的单位与原观察值的单位不一致,为了统一单位起见,将方差开方,便得到了标准差。
30.标准差,它只能在同一项目的情况下,对不能够组的数据进行离散程度的比较。
31.变异系数也是反映变量的离散程度的统计指标,它是一样本标准差与平均数的百分数来表示的,没有单位,记作CV。
32.变异系数兼顾了标准差与平均数两者,故它不受单位是否相同或所比较的两个项目(或指标)是否相同的条件的限制,即能对性质相同的项目(或指标)的数据进行离散程度的比较,又能对那些性质不同的项目(或)的数据离散程度进行比较。
33.在实际审核数据时,遇到在[X-3S,X+3S]区间外的数据,一班作为可疑数据处理。
34.相对数的作用或意义:
1可使原来不能直接相比的数量指标成为可比;
2是进行动态分析的重要依据。
35相对数分为有名数和无名数。
有名数是有两个性质不同但又有联系的绝对数或平均数指标对比计算所等到的相对数;
无名数可以根据不同的情况分别采用倍数、百分数或千分数等来表示。
相对数还可以分为结构相对数、比较相对数、强度相对数、完成程度相对数、动态相对数等种类。
结构相对数:
是在分组基础上,以各个分组合计数值与总数值对比的相对数。
比较相对数:
是指不同地区(部门、单位、事物)的同期、同类指标进行比较的相对数,它可以反映被比较的事物的差异情况及不平衡程度。
强度相对数:
是两个性质不同但有密切联系,又属于同一时期或时点的绝对数或平均数指标的对比
36倍数:
是将对比的基数抽象化为1而计算出来的相对数。
37.百分数(%):
是将对比的基数抽象化为100而计算出来的相对数。
这种形式一般应用于对比的分子数值与分母数值相差不是非常悬殊的场合,若分子过小,如比值为0.06%,则宜用倍数较好。
38.动态:
是指各种现象在不同时间的发展过程。
39.动态数列:
事物的某一统计指标随时间变化而形成的数据序列。
39.动态分析:
用动态数列分析某指标随时间变化而发展的趋势、特征和规律。
40.动态数列的种类:
1绝对数动态数列:
是指某事物在不同时间上的发展规模、水平等的绝对数所形成的数列。
2相对数动态数列:
是由同类事物的相对指标按时间的顺序排列而成的相对数值的动态数组。
3平均数动态数列:
是把不同时间的同类指标的平均数按照时间的先后顺序排列而组成的动态数组。
41.U分法:
是将原始变量转换成标准正态分布的横轴变量的一种统一单位的方法。
42.Z分法:
是根据正态分布理论以差值的方式建立的一种统一变量单位的方法。
43.U分法和z分法的共同特征是等距升分。
35.累进记分法p7646.
36.百分位数法:
是以某变量分布的百分位数记录分数,它要求将观测值从小到大进行排列,并以一定的方式把某变量的值转换成分数。
37.F检验是一种整体性检验,当经方差分析鉴别多个正态总体的平均数有差异显着时,并不能说明各组水平之间都存在显着差异,只是说至少有一对差异显着,究竟哪些差异不显着,则还需进行均数的多种比较。
当然,若F检验不显着时,则表明被检验的所有样本均数没有一对差异是显着的,此时无需进行均数的多种比较。
多种比较的方法有图凯法和S法。
38.试验误差(随机误差):
在方差分析的试验中,即使个水平的试验条件完全相同,但由于随机抽样或试验过程中随机因素的影响,气试验结果仍然会存在偏差。
39.条件误差:
试验条件的不同引起试验结果的不同。
40.方差分析的目的:
要把影响指标的条件误差和随机误差区别开来,从而判断条件误差对指标影响的显着程度。
41.双侧检验:
否定域对称分布于曲线两侧的检验。
42.单侧检验:
否定域仅存在于分布曲线一侧的检验。
体育统计:
运用统计的原理和方法,通过对体育教学,训练,科研和管理中随机现象的描述,推理和分析,揭示其数量规律的一门应用科学。
包括描述统计,假设检验,参数估计,多元统计分析,非参数统计。
定类变量:
是最低层次的变量,它的取值只有类别属性之分,而无大小,程度之分。
定序变量:
它的测度水平高于定类变量,它的取值出了类别属性之外,还有等级,次序的差别
定距变量:
水平高于定类,取值除了类别属性之外,取值之间的距离还可以用标准化的距离去度量它,但定距变量没有自然以以下的零点。
样本特征数:
描述样本数据分布特征的统计指标,主要分为集中量数和差异量数。
分布参数:
描述样本数据分布形状的指标。
集中量数:
是反映一组数据集中趋势的特征数,主要包括算术平均数,中位数,百分位数,众数。
中位数:
将一组数据按大小顺序排列后,处于中间位置的数,用Me表示
差异量数:
是反映一组数据离散趋势的特征数,主要包括极差,四分差,方差,标准差,变异系数
偏度系数:
是反映数据分布的偏斜方向和程度的指标,用sk表示
峰度系数:
是反映数据分布尖峰或平峰程度的指标,用Ku表示
若P(A)《=0.05,则称事件为小概率事件,小小概率事件在一次实验中
可看作是不可能事件,认为不可能发生,这一原则称为小概率事件原则
相关关系:
变量之间存在的不确定的数量关系
线性相关系数:
对于两个连续性变量来说,描述两个变量之间直线关系的密切程度和相关方向的统计指标
完全无关:
当两个变量x与y之间,y的变化不受x的影响时(反之亦然)
相对数:
是两个有关的绝对数之比,也可以是两个统计指标值比
动态分析法:
是以客观现象所显现出来的数量特征为标准,判断被研究现象是否符合正常发展趋势的要求,探求其偏离正常发展趋势的原因并对未来的发展趋势进行预测的一种统计分析方法。
常见的动态分析指标有定基比,环比,增长率,增长速度
率=某现象发生次数!
该现象可能发生次数
定基比=(报告期水平!
基期水平)*100%
环比=(报告期水平!
前一期水平)*100%
组内平方和:
随机误差成为组内差异,反映了随机误差造成的差异大小。
用每个样本数据与其各族平均值利差平方和表示,记作Se又叫组内平方和
组间平方和:
不同的处理造成的差异,称为组间差异,记作Sr表示
小概率事件原则:
若P(A)<
=0.05,则称事件A为小概率事件。
小概率事件在一次试验中可看作不可能事件,认为不可能发生,这一原则称为小概率事件原则。
随机变量:
当用一个变量的取值来表示随机试验的结果时,该变量随着试验的不同结果而取不同的值,也就是说变量的取值是随机的。
抽样误差:
从同一总体中抽取含量相等的若干样本,由于总体中各个体存在差异,而样本只包含总体的一部分个体,因此每次求得的样本统计量与总体参数或样本统计量之间均存在差异,这种由抽样引起的差异,称为抽样误差。
当研究的两个事件或现象之间,既存在着相互影响,相互制约的数量关系,又不像函数关系那样,能由一个变量的数值精确地求出另一个变量的数值来,这类变量间的关系称为相关关系,简称相关。
二.单项选择题
1.体育统计学中最常用的集中量数与差异量数是(x,s)
2.(标准差)是反映同质现象观察值得平局水平与集中趋势的统计指标
3.当分布基本对称时用(平均数)反映集中趋势与平局水平
4.严重偏态的分布用(中位数)能比较好地反映资料的集中趋势
5.样本特征数是来自样本的统计指标,所以又称(统计量)
6.a,b两组身高数据均值一样,单位都是cm,可用(标准差)比较离散程度
7.若几组数据有不同的单位,此时可用(变异系数)比较几组数据的离散程度
8.如1500m跑成绩与100m成绩这两组数据单位相同,均数相差较大,此时可用(变异系数)比较离散程度
9.标准差是最常用的反映数据资料(离散趋势)的统计指标
10.若sk=0,ku=0则数据分布为(正态分布)
11.在体育统计中所谓大样本是指样本量在(30个)以上
12.抽样误差是由(抽样)引起的
13.在抽样研究中,均数的标准误(比标准差小)
14.假设检验的步骤(建立假设,选择和计算统计量,确定p值和判断结果)
15.通常可采用(增大样本含量)方法来减少抽样误差
16.两样本均数比较时,经t检验p,小于等于,说明(越有理由认为两总体均数不同)
17.作两样本均数比较的t检验时(统计量t越大,越有理由说明两总体均数不相等)
18在相关分析中,若变量x的值增加时,y的值随之减少,则两个变量间的关系是(负相关)
19相关系数的取值范围【-1,1】
20直线回归方程中,若回归系数为负,则(表明现象负相关)
21对于回归直线方程y^=100+9x,若x每增加一个单位,则y均增加9个单位
22若两变量完全无关,则估计标准误为(0)
23回归系数和相关系数的符号是一致的,其符号均可以用来判断现象(正相关还是负相关)
24下列属于相对比的是(体重指数)
25甲投篮80次,进球35个,乙投篮65次,进球32个,则两人平均投篮命中率为(0.4620)
26影响总体估计的抽样误差大小的因素是(总体率和样本含量)
27某市随机抽取男女初中生各1000,结果42%男生没任何体育活动,62%女生没任何体育活动,对调查结果进行x方检验,假设h.为()
28t检验和方差分析都可以用于总体平均数的比较(t检验和方差分析不能互相替代)
29对k个组进行多个样本的方差齐性检验,得,p《0.05,按@=检验,可认为
30在方差分析中(组内误差)反映的是由于随机因素而引起的差异
31在单因素方差分析中(组间误差)反映的是由于因素的不同水平而引起的差异
32进行单因素方差分析的数据必须是(连续型数据)
三判断题
1相关系数R》1说明两类变量之间一定存在直线相关关系。
(错)
2当R=0.00时表明两变量不存在相关关系(错)
3当两变量间的相关系数达到显着性水平时,说明两变量之间存在明显的相关关系(对)
4当R不等于0时,说明两变量之间错在线性相关关系(错)
5相关系数为负值时,说明相关关系不密切,反之,相关关系密切(错)
6样本含量越大计算得到的相关系数也会越大(错)
四.填空题
1.统计数据的来源:
积累类数据,文献类数据,报表类数据,专题调查类数据
2.数据收集方法:
观察,实验,问卷调查,访问调查
3.变量分类:
离散型变量,连续性变量:
如果按变量的测度属性分为定类变量,定序变量,
定距变量,定比变量变量。
离散型变量:
只能取有限个或可数个数值,一般为整数值。
连续型变量:
可取任何某一区间内任何数值
4.统计调查方案包括的主要内容:
调查的目的和内容,调查对象和单位,调查项目,调查表
调查时间。
5.抽取样本时,要要遵守(随机抽样)原则,使所有个体被抽中的机会(均等)
6.参数估计的方法有(点估计)和(区间估计)
7.对总体参数提出的假设可分为原假设和备择假设
8,当原假设正确而被拒绝时所犯错误为(第一类);
当备择假设正确而被接收时所犯错误为(第二类)
9.假设检验所依据的基本原理是(小概率原理)
10变量间的关系包括(函数关系)(相关性关系)
11广义上说变量间可能存在的相关关系包括(线性相关关系)(spearman)(复相关关系)(偏相关关系)
12完全相关即是(函数关系),其相关系数为
(1)
13回归直线方程y^=a+bx的参数a是截距,b是回归系数。
在参数估计中待定参数的常用方法是(最小二乘法)
14三组以上总体水平均数的比较使用的方法是(方差分析法)
15总变差,组间平方和,组内平方和之间的关系是总变=组间平方和+组内平方和
16方差分析是通过对组间均值变异的分析研究判断多个(正态总体均值)是否符合相等的一种统计方法
17在实验设计中,把要考虑的那些可以控制的条件称为(因素),把因素变化的各个等级状态称为(水平或处理)
四简答题
1.简述体育统计的主要研究过程。
2.简述统计量与统计参数的区别和联系。
区别:
(1)定义不同。
由样本分析所得反映样本特征统计指标称为统计量。
总体特征的统计指标称为参数。
(2)字母表示不同。
统计量常用英文字母表示,如样本平均数用x^表示,标准差用s表示,样本中指标之间的相关系数用r表示;
参数常用希腊字母表示。
联系:
参数要由统计量来推断估计。
3.怎样更全面地把握数据分布的形状和特征?
一是分布的集中趋势,反应个数据变化趋向中心位;
二是分布的离散程度,反应个数据远离其中心值的趋势;
三是分布的偏度和峰度,反应数据分布的形状。
4.影响抽样误差大小的因素有哪些?
(1)原总体中个体的分散性
(2)样本含量的大小
(3)抽样方法和抽样的组织方式
5.区间估计的两个基本要求
(1)置信度。
希望随机区间(Q^1,Q^2)包括Q的概率P越大越好
(2)精确度。
希望随机区间(Q^1,Q^2)的平均长度(Q^1—Q^2)越短越好
6.假设检验的基本原理
1.假设检验的原理
假设检验:
统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异
?
假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。
(1)两类假设
对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。
一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。
备则假设:
因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示。
虚无假设:
实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。
(2)小概率原理
小概率原理:
小概率事件在一次试验中几乎是不可能发生的
至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显着性水平α。
在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。
之后将其与我们实现界定好的显着性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。
(3)两类错误
(本部分内容请参照实心信号检测论对照来看。
——MJ注)
Ⅰ型错误:
当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误
研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”
Ⅱ型错误:
当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误
假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”
两类检验的关系
①α+β不一定等于1
②在其他条件不变的情况下,α与β不可能同时减小或增大
(4)检验的方向性
单侧检验:
强调某一方向的检验,显着性的百分等级为α
双侧检验:
只强调差异不强调方向性的检验,显着性百分等级为α/2
对于同样的显着性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高。
(5)假设检验的步骤
①根据问题要求,提出虚无假设和备择假设
②选择适当的检验统计量
③确定检验的方向性并规定显着性水平
④计算检验统计量的值
⑤将统计量的值与临界值对比做出决策
7.进行方差分析要满足的条件?
1.)被检验的样本数据来自服从正态分布的总体
2)个总体的方差都相等
3)个样本是从各总体中随机采购去且是相互独立的
8.方差分析的基本原理:
认为不同处理组的均数间的差别基本来源有两个:
随机误差和实验条件
6.用X代表跳高成绩,则X~N(5,0.42)
Z=(X-5)/0.4(则Z~N(0,1)
P(x<
4.5)=(4.5-5)/0.4=-1.25则p(z<
-1.25)=0.1056
不及格学生人数为280*0.1056=30(人)
7.
(1)要求10%学生成绩优秀,就是求A,是P(X<
A)=0.1
用X代表100M成绩,则X~N(14.7,0.72)
查标准正态分布表可得:
P(X<
-1.28)=0.1
由标准化公式可得:
(A-14.7)/0.7=-1.28,则A=13.804S
(2)要求30%学生成绩良好,就是求B,是P(X<
A)=0.1+0.3=0.4
-0.25)=0.4
(A-14.7)/0.7=-0.25,则B=14.525S
(3)要求8%学生成绩不及格,就是求C,是P(X>
C)=0.08,则P(X<
C)=1-0.08=0.92
1.41)=0.92
(A-14.7)/0.7=1.14,则C=15.687S
8、若跳高成绩服从正态分布,其平均数为1.5m,标准差为0.08m。
现规定20%的学生可评为优秀。
问至少跳多高才能获得优秀。
解:
用X代表跳高成绩,则X~N(1.5,0.82)
由20%的学生跳高成绩达到优秀,就是求A,可设成绩达到优秀的概率为P(X>
A),
即P(X>
A)=0.2则P(X<
A)=1-P(X>
A)=1-0.2=0.8
0.84)=0.7995≈0.8
(A-1.5)/0.08=0.84
则A=0.84*0.08+1.5=1.5672m
综上所述,至少要跳1.57m才能获得优秀。
9、测得某年级学生跳远成绩服从正态分布,其平均数为5.0m,标准差为0.2m,
1)若要求90%的学生达到及格,问及格的标准应为多少?
2)若成绩在4.8~5.2m之间有50人,问参加跳远的学生有多少人?
用X代表跳远成绩,则X~N(5,0.22)
1)由90%的学生达到及格,可设成绩达到及格的概率为P(X>
A),即P(X>
A)=0.9
则P(X<
A)=1-0.9=0.1
查标准正态分布表可得:
-1.28)=0.1003≈0.1
由标准化公式可得:
(A-5.0)/0.2=-1.28,则A=-1.28*0.2+5=4.744m
综上所述,及格的标准为4.74m。
2)设成绩在4.8~5.2m之间的概率为P(4.8<
X<
5.2),参加跳远的学生人数为U,那么由标准化公式可得:
u=x-μ/σ
P(4.8<
5.2)=P((4.8-5.0)/0.2<
(5.2-5.0)/0.2)=P(-1<
1)
则P(4.8<
5.2)=P(X<
1)-P(X<
-1)
又查标准正态分布表可得:
1)=0.8413,P(X<
-1)=0.1587
所以P(4.8<
5.2)=0.8413-0.1587=0.6826
则U=50/0.6826≈73(人)
综上所述,参加跳远的学生有73人。
第五章P117
2、解:
本题为:
μ=μ
的假设检验,总体服从正态分布,μ
=145.2,
=144.3,S=5.82,n=100,采用公式进行t检验,为:
1)检验假设
=145.2,即该市12岁男孩身高与全省的平均身高没有差异;
备择假设
μ
,即该市12岁男孩身高与全省的平均身高有差异,
2)计算统计量:
3)确定概率P值,作出统计结论,
通过t值大小进行显着性水平检验:
因为
,所以P>
0.05,按所取
检验水准,接受h0,拒绝h1,差异无统计学意义,则该市12岁男孩身高与全省的平均身高无显着差异。
3、单样本t检验
=7.90,
=8.069,S=0.378,n=28,采用公式进行t检验,为:
1)检验假设
=7.90,即该新教法对铅球成绩没有影响,
,即该新教法对铅球成绩有影响,
2)计算统计量。
3)确定概率P值,作出统计结论。
,所以P<
0.05,拒绝h0,接受h1,差异无统计学意义,因此该新教法对铅球成绩有影响。
4、两独立样本t检验
的假设检验,总体服从正态分布,
1=68,
2=64S1=5,S2=4,n1=n2=16,
,即两地区考生成绩无显着性差异;
备择假设
,即两地区考生成绩有显着性差异;
,所以,p<
0.05,因此两地考生成绩存在显着性差异。
5:
(配对样本均数的t检验)
1)检验假设,ud=0训练前后的100m成绩没有所提高;
ud
0,训练前后100m成绩有提高;
2)计算统计量。
由题目已知条件
,差值标准差
,p<
0.01,拒绝h0,接受h1,所以,有非常显着性差异,因此训练前后的100m成绩有提高。