1、全距四分位距百分位距第一节全距、四分位距、百分位距一、全距(Range)1、概念全距是一组数据中最大值与最小值之差,故又称两极差,简称极差。用符号R表示。它是表示一组数据离散程度的最简单、最易理解的一种差异量数。2、计算全距计算比较简单。对于原始数据求全距的方法是:找出最大值、最小值,然后用公式:R最大值最小值对于频数分布表求全距的方法:最大一组与最小一组组中值之差;或者是最大一组上限与最小一组下限之差。注意:如果数据是连续型,必须用精确上下限。 极差(概念要点及计算公式)1. 一组数据的最大值与最小值之差2. 离散程度的最简单测度值3. 易受极端值影响4. 未考虑数据的分布计算公式为未分组数
2、据 R = max(Xi) - min(Xi)组距分组数据 R = 最高组上限 - 最低组下限全距3 应用条件及优缺点全距概念清楚,意义明确,计算简单,是其明显的优点.但因它仅由最大值与最小值求得,易受两极端数值的影响.如果两极端有偶然性或属异常值时,全距不稳定、不可靠。它不考虑中间数值的差异,即其它数据未起作用,反应不灵敏。它明显地受取样变动的影响。由于上述原因,全距只是一种低效的差异量数,只能作为差异量的粗略指标。它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定统计分组。即在编制频数分布表时决定全距范围之用。 二、四分位距(四分差)1、四分位距的概念为了避免全距受两极
3、端数值影响的缺点,则用按一定顺序排列的一组数据中间部位50个频数距离的一半作为差异量指标,即四分位距,又称四分差,用Q表示。若将从小到大排列的一组数据分成频数相等的四段,第一与第二段的分界点称第一个四分位数(Q1)。第三与第四段的分界点称第三个四分位数(Q3)。则四分位距就是第三个四分位数(第75百分位数)与第一个四分位数(第25百分位数)差的一半。用公式表示为:Q(Q3Q1)2四分位差(概念要点)1. 离散程度的测度值之一2. 也称为内距或四分间距3. 第3四分位数与第1四分位数之差 QD = Q3 Q14. 反映了中间50%数据的离散程度5不受极端值的影响6用于衡量中位数的代表性7. 主要
4、用于定序数据,也可用于数值型数据,但不能用于定类数据2、计算方法(1)原始数据计算法先将原始数据从小到大排列好;然后根据求中位数的方法求出第一个四分位数和第三个四分位数;利用公式求四分位距。Q(Q3Q1)2(2)频数分布表计算法先求出第一个四分位数及第三个四分位数;然后将它们代入公式计算四分位距,即可。Q(Q3Q1)22、计算方法 Lb 该分四分点所在组的精确下限fQ1与fQ3该四分点所在组的次数N 数据个数Fb 该分数所在组以下的累加次数i 组距 数值型分组数据的四分位数(计算示例)例例四分位差计算案例2、计算方法注意: 也有人认为:四分位距就是75%百分位数与25%百分位数间的距离. 它代
5、表分布中间50%的距离. 四分位距 (IQR) = Q3 - Q1 semi-interquartile range:四分位距的一半(interquartile range). SIQR = (Q3 - Q1)/23、四分位距的应用及优缺点优点:四位位距简明易懂,计算简便,较少受两极端数值的影响,比全距可靠得多。缺点:但它忽略了左右共50数据的差异,又不适合代数运算,因而限制了它的应用。使用:当一组数据用中位数表示集中量时,就要用四分位距表示差异量。因为它们同属于百分体系。四分位距与中位数一样,适用于有特大或特小两极端数值,有个别数值不确切、不清楚,以及用等级的数据等情况。三、百分位距1、概念
6、:百分位点 位置百分位数数值百分位差段距离百分位距是指两个百分位数之差。常用的百分位距有两种:一种是:第90与第10百分位数之差,用P90P10表示。即按一定顺序排列的一组数据中间部位80个频数的距离。一种是:第93与第7百分位数之差,用P93P7表示。是按一定顺序排列的一组数据中间部位86个频数的距离。2、计算方法:先计算百分位数:百分位数的计算方法我们第二章讲中位数时,涉及到了百分位数的计算方法。然后计算百分位距:百分位距的计算方法很简单,即P90P10或P93P7计算。1)百分位数的计算其中:Pp 表示百分位数p 表示与百分位数相对应的比数N 表示总频数Lp 表示百分位数所在组的下限n
7、表示小于百分位数所在组下限的频数总和fp 表示百分位数所在组的频数i 表示组距 例2)百分位差P90P10P80P20PxPy3、适用条件用几个百分位距能较好地反映一组数据的差异程度。在计算频数分布峰态量时,要用到上述的百分位距。四百分等级(相对地位量数)一)概念在一个团体中,不管人数多少,如果我们要问:某个人在一百个人中胜过多少人;或者问假使把这一团体分为一百等,这一个人占第几等。回答这样的问题,用一个人的原分数或等第都不行。因为在一班学生中的成绩,单独一个原来的分数,最多只能表示分数的高低,不能表示他在全班中的地位。例如某个学生名列第十五名,我们不能知道他的成绩究竟如何,要了解他的成绩在班
8、上的地位,还必须知道他同班同学有多少人。如果全班有60名学生,他名列第十五名,其成绩还是比较好的。如果全班只有30名学生,第十五名就是中等成绩。如果全班只有20名学生,第十五名就是较差的。可见,普通等第是看不出优劣的。平时所用的等第,也只能表示一个学生成绩的高低次序,而不能表示他在全班中的地位。而百分等级则不同,它能表示一个分数在它所属团体中的地位。如一个学生的分数之百分等级为70,就是表示这个学生的分数超过他所在团体的70。所以百分等级是一种相对地位量数,是教育、心理研究中较常用的一种量数。在按分数高低大小顺序排列的情况下,它可以表示任何一个分数在该团体中酌相对地位。什么是百分等级呢?所谓百
9、分等级就是把一班学生的得分依高低次序排列,然后算出一个人在一百人中超过多少人,或算出这个人以下占多少百分比,表示这种关系的量数,在统计学中,就称为百分等级。换言之,百分等级是把全班人数按照一百来计算,从他所得的分数决定他在全班所占的地位。分数的百分等级越大,代表等级越高。百分等级越小,代表等级越低。如某学生的分数之百分等级为90,表示比他差的有90,如果百分等级为20,表示比他差的只有20。百分等级的符号为PR。二)百分等级的计算1未分组数据计算百分等级的方法是:将团体中各个体,按他们所得分数之高低排列成等第。如第一名、第二、以R代表之,第一名,R1;第二名,R2;余类推。以全体人数除100,
10、即100N,表示百分量表上每人应占的分数。第一名占第一个100N,第二个占第二个100N,故求第几名百分等级,即以100RN代表。无论是第几名百分等级,都应以每个分数的占位置的中点来代表它,所以把每段的距离减去半段,即减去50N,而成(100RN)(50N)(100R50)N(100R50)N是每个分数在百分表上的位置,这个位置是按一般等第排列的,其成绩越高,代表等第的数字越小;其成绩越差,其代表的数字越大。故须从100减去(100R50)N,成成为:100(100R50)N未分组数据计算百分等级的公式是:PR100(100R50)N其中: PR表示某个分数的百分等级R表示某个分数所在团体中按
11、大小排列的等第。N个数。例10名学生的作文成绩依次排列为:56、64、68、69、73、75、78、79、83、86分,试求得分为78分的百分等级。作文成绩得78分的学生是第4名,故R4,总人数N10,代入公式得:PR100(100R50)N100(100450)1065即该生的百分等级为65,即在100名学生中,该生的作文成绩胜达65名学生。例试分别计算20名学生、80名学生数学成绩的第1名、第2名和第15名的百分等级。20名学生时:P1100(100150)2098P2100(100250)2092P15100(1001550)202580名学生时:P1100(100150)8099P21
12、00(100250)8098P15100(1001550)8082根据以上计算,我们说在20名学生的数学成绩中,第一名的百分等级为98,第二名的百分等级为92,第十五名的百分等级为26。而在80名学生的数学成绩中,第一名的百分等级为99,第二名的百分等级为98,第十五名的百分等级为82。可见,团体的总人数不同,同一等第的百分等级并不一样。2分组资料(频数分布表)计算百分等级PR 百分等级N 总频数Fb 该分数所在组以下的次数和f 该分数所在组的频数X 给定的原始分数Lb 该分数所在组的精确下限i 组距 例156名学生的语文考试成绩分布如表,求66分的百分等级。解释:在156名学生中有48.7的
13、学生的分数在66分以下。例表中原始分数为52的百分等级百分等级也可以从累加百分曲线图上求得。只要把上面确定百分位数的过程倒转过来即可。如分布中,P10亦即第10百分位之值为19.33分,那么,我们就可以把19.33分或其成绩为19.33分的学生,说成是居于第10百分位的位置; P90 亦即第90百分位之值为51.56分,我们就可以把51.56分说成是居于第90百分位的位置。统计学中习惯上都把这个百分位置称为某某分数的百分等级,如说19.33的百分等级为10.00,51.56分或得51.56分的学生其百分等级为90.00,等等。其它任何一个给定的分数也都可以转化为百分等级。3求一组的百分等级一组
14、的百分等级是以每组的组中值的百分等级来代表,其方法是;先分别求出每组精确上、下限的百分等级,然后将上、下限百分等级相加,以2除之,即为每组组中值的百分等级。求每组精确上、下限的百分等级的方法是:首先将次数分布表由下而上求出各组的累积次数;然后从最低组起计算每组精确上限的百分等级。即以总次数(N)除100,再乘以累积次数。用公式表示为:PR100fcp/N其中:PR表示每组上限的百分等级fcp表示每组的累加次数N表示总数例求各组的百分等级三)百分等级的应用在教育和心理方面运用百分等级主要是运用“百分等级常模。百分等级常模特别适用于教育成就测验,加语文成就测验、算术成就测验,在这类测验里,通常要测量非常多的学生,然后才可以把常模求出来。根据常模就可知道得分多少,百分等级是多少;也可知道占某百分等级时,须得分多少。这样一个换算表上所列数字便是百分等级常模。假如我们知道某学生的语文成就测验成绩为76分,算术成就测验成绩为94分,则我们无法知道他在团体中所占的地位,也就是说无法知道他的成绩比别人好或坏。此时,我们可以查阅百分等级常模。假定查得语文成就测验得分为76分时,PR相当于70,而算术成就测验得分为94分时、PR相当于68,则我们便知道该生的语文成就较70学生为高,但算术成就只较68的学生为高而已。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1