第一节全距百分位差四分位差平均差Word格式.docx
《第一节全距百分位差四分位差平均差Word格式.docx》由会员分享,可在线阅读,更多相关《第一节全距百分位差四分位差平均差Word格式.docx(9页珍藏版)》请在冰豆网上搜索。
50,8146
45,16138
40,24122
35,3498
30,2164
25,1643
20,1127
15,916
20,77
100—
解:
先计算P和P9010
9010第1步:
确定P百分位数对应的位置,,157,,141.3157,,15.7100100
1
第2步:
确定百分位数所在的分组区间,P在“50,”这组,P在“15,”这9010
组
L,14.5F,138L,49.5F,7第3步:
确定公式中的符号,,,,,,,f,8i,5bbbb
f,9
第4步:
代入公式计算P,P9010
141.3,138P,49.5,,5,51.5690815.7,7P,14.5,,5,19.33109
第5步:
计算P-P9010
P,P,51.56,19.33,32.239010
答:
该分布的百分位差P-P是32.23。
百分等级:
任意分数在整个分数分布中所处的百分位置,百分等级是一种相
对位置量数。
计算公式为:
b100f(XL)P[F]R,,b,Ni
三、四分位差
QPPQ375251四分位差是百分位差的特例,用于分析()与()之差的一半,即
Q,Q31Q,2
四、平均差
(一)概念及计算公式
平均差是一组数内各个数据之间与平均数的绝对离差的平均数。
用A.D.或
者M.D.表示。
iXX,,iX,A.D.,,nn
A.D.---------平均差
Xi-----------离差
fx分组数据计算平均差AD,N
AD:
表示平均差
f表示各组次数
2x:
表示组中值对平均数离差的绝对值
(二)特点
较好反映了数据分布的离散程度。
平均数代表一组数据得集中趋势,把一组数据中的每个数据与平均数比较就可以得到每个数据与平均数偏离的程度。
但是有绝对值,计算起来不方便。
属于低效的差异量数。
第二节方差和标准差
一、定义及公式
方差是离均差平方的算术平均数,表示一列数据平均差距的平方,其样本方
22S,差用符号表示,总体方差用符号表示。
标准差就是方差的算术平方根,表
SSD示一列数据的平均差距。
样本标准差用符号或表示,总体标准差则用符号
表示。
标准差可用于描述变量值的离散程度,与均数结合还可描述资料的分布情
况,此外还可用于求参考值范围和计算标准误。
2XX,,,,2S,N
2,,XX,,S,N
利用原始数据的计算公式:
2222,,XXNXX,,,,,,,2,,S,,,,,NNN,,2222,,XXNXX,,,,,,,,,S,,,,,NNN,,
原始数据公式推导过程如下:
222,,,,X,X,X,2X,X,X,,22,X,2X,X,X,,,
X,22X,X,N,X,N?
,
3
22XXXX,2,,,,,
2,,XX,,2,,,X,2X,,N,,,,NN,,?
222XXX,,,,,,,,,22,X,2,,X,,,NNN222,,,,X,X,X,XN,,,?
例4-2:
计算6、5、7、4、6、8这一组数据的方差和标准差。
(一)计算步骤:
1)求平均数
X6,5,7,4,6,8,X,,,6N6
2)求离均差的平方和
2222222x,(6,6),(5,6),(7,6),(4,6),(6,6),(8,6),10,
3)代入方差和标准差的公式,计算结果:
22x10,2s,s,1.67,1.29,,,1.67sN6
(二)采用原始数据计算
表4-2方差与标准差的原始数据计算表
x2X编号
1416
2525
3749
4416
5636
6864
36226计算步骤:
X,1)求原始数据的和,即,见表4-2的第2栏。
2X,X2)将每一数据()平方,并求其平方和(),见表4-2的第3栏。
3)代入方差的公式,计算结果
4
222,,XX方差:
22636,,,,2,,s,,,,,1.67,,,,NN66,,,,
二、计算分组数据的标准差与方差2,,fm,X,2S,f,2,,fm,X,S,f,
表4-3学生创造性思维成绩分布表第1,40-4435-3930-3425-2920-2415-19行
第2f人数173118232行
第3m组中值423732272217—行
第4fm422599629717634904行
第5,,m,X13.758.753.75-1.25-6.25-11.250行
2第6,,m,X189.062576.562514.06251.562539.0625126.5625—行
2第7,,fm,X189.0625535.937542.187517.1875312.5000253.1251350.0000行
1(基本式
2,,fm,X,2S,f,
2,,fm,X,S,f,
计算过程如下:
fmfm,1)求各组次数与组中值的乘积()及乘积和(),见表4-3的第4行。
2)求平均数
fm904,,,,28.25Xf32,2,,m,Xm,X3)求各组的离均差()及各组的离均差平方,见表4-3的第5行和第
6行。
22,,,,fm,X,,,,fm,X,4)求各组的次数与离差平方的乘积及其连加和,见表4-3
的第7行。
5)代入公式,计算结果
5
2,,fm,X,1350S,,,42.1875,6.50f,32
(简捷式
22,,fd,fdf,,,,,S,,if,
过程如下:
d)确定各组的简化值,见表4-4的第4行。
1
2,d2)求各组简化值的平方,即,见表4-4的第5行。
fd,3)求各组次数与简化值乘积及连加和(),见表4-4的第6行。
2,fd,4)求各组次数与简化值平方的乘积及连加和(),见表4-4的第7行。
5)代入公式,计算结果。
22,,2fd,fdf,,,,,56,832,,S,,i,,5,1.30,5,6.50f,32
表4-4学生创造性思维成绩分布表
第1行40-4435-3930-3425-2920-2415-19
f第2行人数173118232
m第3行组中值423732272217—
第4行d3210-1-2—
2,第5行d941014—
fd,第6行31430-8-482,fd,第7行928308856
三、方差与标准差的合成
22,,nS,d,2S,tn,方差:
22,,nS,d,S,tn,标准差:
例4-4:
在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。
22人数均数标准差,,d,X,Xd,X,Xtt班级nSX()()()
63614210316
1123611012
-4163509817
6
——74——
计算步骤:
1)求总平均数
nX20,80,18,75,16,70,20,705470,X,,,,74tn20,18,16,2074,2dd2)求离差和离差的平方
3)代入公式,计算结果
22,,nS,d,S,tn,
2222222,,,,,,,,,,,,20,8,6,18,7,1,16,8,,4,20,6,,4,
20,18,16,20
5220,,8.4074
四、方差与标准差的性质和意义
(一)性质
可加性、可分解性
1、每一个观测值都加一个相同常数C之后,计算得到的标准差等于原标准差。
2、每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数。
3、每一个观测值都乘以同一个常数C,再加上一个常数d,所得的标准差等于原标准差乘以这个常数C。
(二)意义
1、方差与标准差是表示一组数据离散程度的最好指标。
2、切比雪夫定理指出,随机变量落在平均值附近的概率与标准差有一定的数量关系。
第三节标准差的应用
一、差异系数
(一)概念及公式
差异系数:
又称变异系数、相对标准差等,为标准差对平均数的百分比,用CV表示。
差异系数是一种相对差异量。
用以比较不同单位数据资料的差异,或比较单位相同但平均数相差甚大的数据资料的差异。
7
SCV,,100%X
(二)注意事项
1、测量的数据要保证等距;
2、测量工具应具备绝对零;
3、差异系数只能用于一般的相对差异量的描述,不能进行统计推论。
二、标准分数
标准分数:
又称基分数或Z分数,是以标准差为单位的一种量数。
表示的是
一个原始分数在团体中所处的相对位置。
计算公式:
X,XZ,s
(二)标准分数的性质
1、无实际单位,以平均数为参照点,以标准差为单位的一个相对量2、所有原始分数的Z分数之和等于0
3、一组原始分数中,各个Z分数的标准差为1,平均数为04、若原始分数呈正态分布,则转换得到的所有Z分数的分布为均值为0,
标准差为1的标准正态分布。
(三)标准分数的应用
1、比较观测值在数据分布中的相对位置的高低
例4-5:
某年高考理科数学全国平均成绩65分,标准差是12.5分,考生A、
B、C三人的数学原始分数是50、65、85分,求他们的标准分数是多少,
50,6565,65解:
Z,,,1.2Z,,0AB12.512.5
85,65Z,,1.6C12.5
2、计算不同质的观测值的总和,以表示在团体中的相对位置例4-6:
高考时两名考生的成绩分数,以及全体考生的平均分,标准差如下,
试问根据考试成绩应该优先录取哪名考生,
考试科目甲乙平均分标准差Z(甲)Z(乙)
1.51.910语文858970
政治70626551-0.6
8-0.1250.375外语687269
数学53405060.5-1.67
8
8-0.3751.5理化728775
2.51.505—74——
1)计算每门学科的Z分数;
2)计算甲与乙各学科的Z分数之和;
3)比较Z分数。
3、表示标准测验分数
线性转换,将标准分数转换成正态标准分数,转换公式为:
Z'
aZ,b
三、异常值的取舍
在整理数据时,常采用三个标准差法则取舍数据,即如果数据值落在平均数加减三个标准差之外,则在整理数据时,可将此数据作为异常值舍弃。
第四节差异量数的选用
一、优良差异量数的标准
根据客观数据资料获得的
根据全部观测值计算出来
简单明了
计算方便
稳定
能够采用代数方法进行计算
二、各种差异量数的比较
标准差:
计算严密,考虑了全部数据,测量具有代表性,适合代数运算,稳定,反应灵敏。
但是不好理解
方差:
描述作用不大,但是具有可加性,是对一组数据重造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。
三、各种差异量数之间的关系
样本相当大的时候,标准差大约为全距的六分之一。
s,1.2533AD,1.4826Q
四、如何选用差异量数
(一)需要考虑的因素
9
样本是随机取样的时候,S,Q,R的可靠性依次降低计算的时候,R,Q,S依次繁杂
当需要进一步使用时,S远胜过其他差异量数偏态分布的时候,更多使用Q
(二)应当将集中量数和差异量数联合起来进行考虑前者是典型性,一个点
后者是变异性,一段距离
差异量数越小,集中量数代表性越大,反之亦然。
更多的时候使用平均数和标准差。
中数和四分位差一起使用
10
11