全距四分位距百分位距.docx

上传人:b****5 文档编号:7707869 上传时间:2023-01-25 格式:DOCX 页数:14 大小:183.53KB
下载 相关 举报
全距四分位距百分位距.docx_第1页
第1页 / 共14页
全距四分位距百分位距.docx_第2页
第2页 / 共14页
全距四分位距百分位距.docx_第3页
第3页 / 共14页
全距四分位距百分位距.docx_第4页
第4页 / 共14页
全距四分位距百分位距.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

全距四分位距百分位距.docx

《全距四分位距百分位距.docx》由会员分享,可在线阅读,更多相关《全距四分位距百分位距.docx(14页珍藏版)》请在冰豆网上搜索。

全距四分位距百分位距.docx

全距四分位距百分位距

第一节 全距、四分位距、百分位距

一、全距(Range)

1、概念

全距是一组数据中最大值与最小值之差,故又称两极差,简称极差。

用符号R表示。

它是表示一组数据离散程度的最简单、最易理解的一种差异量数。

2、计算

全距计算比较简单。

对于原始数据求全距的方法是:

找出最大值、最小值,然后用公式:

R=最大值-最小值 

对于频数分布表求全距的方法:

最大一组与最小一组组中值之差;

或者是最大一组上限与最小一组下限之差。

注意:

如果数据是连续型,必须用精确上下限。

极差(概念要点及计算公式)

1. 一组数据的最大值与最小值之差

2. 离散程度的最简单测度值

3. 易受极端值影响

4. 未考虑数据的分布

计算公式为

未分组数据   R=max(Xi)-min(Xi)

组距分组数据 R= 最高组上限-最低组下限

全距

3应用条件及优缺点

全距概念清楚,意义明确,计算简单,是其明显的优点.

但因它仅由最大值与最小值求得,易受两极端数值的影响.如果两极端有偶然性或属异常值时,全距不稳定、不可靠。

它不考虑中间数值的差异,即其它数据未起作用,反应不灵敏。

它明显地受取样变动的影响。

由于上述原因,全距只是一种低效的差异量数,只能作为差异量的粗略指标。

它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定统计分组。

即在编制频数分布表时决定全距范围之用。

二、四分位距(四分差)

1、四分位距的概念

为了避免全距受两极端数值影响的缺点,则用按一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标,即四分位距,又称四分差,用Q表示。

若将从小到大排列的一组数据分成频数相等的四段,第一与第二段的分界点称第一个四分位数(Q1)。

第三与第四段的分界点称第三个四分位数(Q3)。

则四分位距就是第三个四分位数(第75%百分位数)与第一个四分位数(第25%百分位数)差的一半。

用公式表示为:

Q=(Q3-Q1)/2

四分位差(概念要点)

1. 离散程度的测度值之一

2. 也称为内距或四分间距

3. 第3四分位数与第1四分位数之差 QD=Q3–Q1

4. 反映了中间50%数据的离散程度

5.不受极端值的影响

6.用于衡量中位数的代表性

7.主要用于定序数据,也可用于数值型数据,但不能用于定类数据

2、计算方法

(1)原始数据计算法

先将原始数据从小到大排列好;

然后根据求中位数的方法求出第一个四分位数和第三个四分位数;

利用公式求四分位距。

 Q=(Q3-Q1)/2

(2)频数分布表计算法

先求出第一个四分位数及第三个四分位数;

然后将它们代入公式计算四分位距,即可。

Q=(Q3-Q1)/2

2、计算方法

    

    

Lb  该分四分点所在组的精确下限

fQ1与fQ3 该四分点所在组的次数

N  数据个数

Fb  该分数所在组以下的累加次数

i   组距

数值型分组数据的四分位数(计算示例)

四分位差计算案例

2、计算方法

注意:

也有人认为:

四分位距就是75%百分位数与25%百分位数间的距离.它代表分布中间50%的距离.

四分位距(IQR)=Q3-Q1 

semi-interquartilerange:

四分位距的一半(interquartilerange).

SIQR=(Q3-Q1)/2

3、四分位距的应用及优缺点

优点:

四位位距简明易懂,计算简便,较少受两极端数值的影响,比全距可靠得多。

缺点:

但它忽略了左右共50%数据的差异,又不适合代数运算,因而限制了它的应用。

使用:

当一组数据用中位数表示集中量时,就要用四分位距表示差异量。

因为它们同属于百分体系。

四分位距与中位数一样,适用于有特大或特小两极端数值,有个别数值不确切、不清楚,以及用等级的数据等情况。

三、百分位距

1、概念:

百分位点   位置

百分位数  数值

百分位差  段距离

百分位距是指两个百分位数之差。

常用的百分位距有两种:

一种是:

第90与第10百分位数之差,用P90-P10表示。

即按一定顺序排列的一组数据中间部位80%个频数的距离。

一种是:

第93与第7百分位数之差,用P93-P7表示。

是按一定顺序排列的一组数据中间部位86%个频数的距离。

2、计算方法:

先计算百分位数:

百分位数的计算方法我们第二章讲中位数时,涉及到了百分位数的计算方法。

然后计算百分位距:

百分位距的计算方法很简单,即P90-P10或P93-P7计算。

1)百分位数的计算

其中:

Pp表示百分位数

p表示与百分位数相对应的比数

N 表示总频数

Lp 表示百分位数所在组的下限

n 表示小于百分位数所在组下限的频数总和

fp 表示百分位数所在组的频数

i  表示组距

2)百分位差

P90-P10=

P80-P20=

Px-Py=

3、适用条件

用几个百分位距能较好地反映一组数据的差异程度。

在计算频数分布峰态量时,要用到上述的百分位距。

四 百分等级(相对地位量数)

一)概念

在一个团体中,不管人数多少,如果我们要问:

某—个人在一百个人中胜过多少人;或者问假使把这一团体分为一百等,这一个人占第几等。

回答这样的问题,用一个人的原分数或等第都不行。

因为在一班学生中的成绩,单独一个原来的分数,最多只能表示分数的高低,不能表示他在全班中的地位。

例如某个学生名列第十五名,我们不能知道他的成绩究竟如何,要了解他的成绩在班上的地位,还必须知道他同班同学有多少人。

如果全班有60名学生,他名列第十五名,其成绩还是比较好的。

如果全班只有30名学生,第十五名就是中等成绩。

如果全班只有20名学生,第十五名就是较差的。

可见,普通等第是看不出优劣的。

平时所用的等第,也只能表示一个学生成绩的高低次序,而不能表示他在全班中的地位。

而百分等级则不同,它能表示一个分数在它所属团体中的地位。

如一个学生的分数之百分等级为70,就是表示这个学生的分数超过他所在团体的70%。

所以百分等级是一种相对地位量数,是教育、心理研究中较常用的一种量数。

在按分数高低大小顺序排列的情况下,它可以表示任何一个分数在该团体中酌相对地位。

什么是百分等级呢?

所谓百分等级就是把一班学生的得分依高低次序排列,然后算出一个人在一百人中超过多少人,或算出这个人以下占多少百分比,表示这种关系的量数,在统计学中,就称为百分等级。

换言之,百分等级是把全班人数按照一百来计算,从他所得的分数决定他在全班所占的地位。

分数的百分等级越大,代表等级越高。

百分等级越小,代表等级越低。

如某学生的分数之百分等级为90,表示比他差的有90%,如果百分等级为20,表示比他差的只有20%。

百分等级的符号为PR。

二)百分等级的计算

1.未分组数据计算百分等级的方法是:

将团体中各个体,按他们所得分数之高低排列成等第。

如第一名、第二、¡¦以R代表之,第一名,R=1;第二名,R=2;¡¦¡¦余类推。

以全体人数除100,即100/N,表示百分量表上每人应占的分数。

第一名占第一个100/N,第二个占第二个100/N,..

故求第几名百分等级,即以100R/N代表。

无论是第几名百分等级,都应以每个分数的占位置的中点来代表它,所以把每段的距离减去半段,即减去50/N,而成(100R/N)-(50/N)=(100R-50)/N

(100R-50)/N是每个分数在百分表上的位置,这个位置是按一般等第排列的,其成绩越高,代表等第的数字越小;其成绩越差,其代表的数字越大。

故须从100减去(100R-50)/N,成成为:

100-(100R-50)/N

未分组数据计算百分等级的公式是:

PR=100-(100R-50)/N

其中:

   PR表示某个分数的百分等级

R表示某个分数所在团体中按大小排列的等第。

N个数。

例 10名学生的作文成绩依次排列为:

56、64、68、69、73、75、78、79、83、86分,试求得分为78分的百分等级。

作文成绩得78分的学生是第4名,故R=4,总人数N=10,代入公式得:

PR=100-(100R-50)/N=100-(100×4-50)/10=65

即该生的百分等级为65,即在100名学生中,该生的作文成绩胜达65名学生。

例 试分别计算20名学生、80名学生数学成绩的第1名、第2名和第15名的百分等级。

20名学生时:

P1=100-(100×1-50)/20=98

P2=100-(100×2-50)/20=92

P15=100-(100×15-50)/20=25

80名学生时:

P1=100-(100×1-50)/80=99

P2=100-(100×2-50)/80=98

P15=100-(100×15-50)/80=82

根据以上计算,我们说在20名学生的数学成绩中,第一名的百分等级为98,第二名的百分等级为92,第十五名的百分等级为26。

而在80名学生的数学成绩中,第一名的百分等级为99,第二名的百分等级为98,第十五名的百分等级为82。

可见,团体的总人数不同,同一等第的百分等级并不一样。

2.分组资料(频数分布表)计算百分等级

PR 百分等级

N  总频数

Fb  该分数所在组以下的次数和

f   该分数所在组的频数

X   给定的原始分数

Lb  该分数所在组的精确下限

i   组距

例 156名学生的语文考试成绩分布如表,求66分的百分等级。

解释:

在156名学生中有48.7%的学生的分数在66分以下。

例 表中原始分数为52的百分等级

百分等级也可以从累加百分曲线图上求得。

只要把上面确定百分位数的过程倒转过来即可。

如分布中,P10亦即第10百分位之值为19.33分,那么,我们就可以把19.33分或其成绩为19.33分的学生,说成是居于第10百分位的位置;P90亦即第90百分位之值为51.56分,我们就可以把51.56分说成是居于第90百分位的位置。

统计学中习惯上都把这个百分位置称为某某分数的百分等级,如说19.33的百分等级为10.00,51.56分或得51.56分的学生其百分等级为90.00,等等。

其它任何一个给定的分数也都可以转化为百分等级。

3.求一组的百分等级

一组的百分等级是以每组的组中值的百分等级来代表,其方法是;先分别求出每组精确上、下限的百分等级,然后将上、下限百分等级相加,以2除之,即为每组组中值的百分等级。

求每组精确上、下限的百分等级的方法是:

首先将次数分布表由下而上求出各组的累积次数;然后从最低组起计算每组精确上限的百分等级。

即以总次数(N)除100,再乘以累积次数。

用公式表示为:

PR=100fcp/N

其中:

PR表示每组上限的百分等级

fcp表示每组的累加次数

N表示总数

例 求各组的百分等级

三)百分等级的应用

在教育和心理方面运用百分等级主要是运用“百分等级常模。

百分等级常模特别适用于教育成就测验,加语文成就测验、算术成就测验—…,在这类测验里,通常要测量非常多的学生,然后才可以把常模求出来。

根据常模就可知道得分多少,百分等级是多少;也可知道占某百分等级时,须得分多少。

这样一个换算表上所列数字便是百分等级常模。

假如我们知道某—学生的语文成就测验成绩为76分,算术成就测验成绩为94分,则我们无法知道他在团体中所占的地位,也就是说无法知道他的成绩比别人好或坏。

此时,我们可以查阅百分等级常模。

假定查得语文成就测验得分为76分时,PR相当于70,而算术成就测验得分为94分时、PR相当于68,则我们便知道该生的语文成就较70%学生为高,但算术成就只较68%的学生为高而已。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 研究生入学考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1