从统计学角度分析平均数的概念.docx
《从统计学角度分析平均数的概念.docx》由会员分享,可在线阅读,更多相关《从统计学角度分析平均数的概念.docx(9页珍藏版)》请在冰豆网上搜索。
从统计学角度分析平均数的概念
从统计学角度分析平均数的概念
————————————————————————————————作者:
————————————————————————————————日期:
ﻩ
平均数
平均数,在统计上指的的是平均指标,用来反映同类社会经济现象在一定时间、地点条件下,总体内各单位数量差异抽象化的代表性指标,是反映总体单位数量特征的一般水平的综合指标。
如平均工资、平均收入、平均成本、平均价格等。
平均指标能够反映总体内部的一般分布特征,这种特征表现为:
一般距离其平均数远的标志值比较少,而距离其平均值近的或接近其平均值的标志值比较多,所以,平均指标反映了总体分布的集中趋势或一般水平。
或者简单地说,平均数就是用来反映总体现象的集中趋势或者一般水平的一种指标.。
平均数是集中量数的代表,也是最常用的一种描述统计指标,它反映了数据的代表性,也即可以通过平均数对数据的集中性或代表性有一个直观的了解。
其次,平均数也是常用的一种统计量,许多推断统计方法都是基于平均数进行的。
目前大多数统计方法中,平均数都占有最重要的位置,无论是要掌握某个总体的状况,还是要比较不同总体的差异等,都涉及到平均数。
平均数在统计分析及统计研究中应用十分广泛。
具体来讲,表现在几个方面:
(一)运用平均数可以科学地对两个总体的水平进行对比。
比如我国的GDP总量在2010年已经超过日本,跃居全世界第二。
如果单以GDP总量来对比,说我国的经济水平超过日本,是不科学的,因为这样的对比不具有可比性,两个国家的规模是不一样,在进行对比时,用人均GDP来进行对比就消除了规模的大小对水平的影响。
(二)运用平均数可以反映现象总体的发展变化趋势,比如利用历年我国职工年平均工资,可以说明职工年平均工资的变动趋势等。
(三)利用平均数用来分析现象之间的依存关系。
比如将耕地按施肥量分组,计算单位面积产量,可以分析施肥量与单位面积产量之间的依存关系。
(四)平均指标是统计推断的基础。
例如,在农业产品产量的抽样调查中,利用样本的平均亩产量,推断全部播种面积总产量,利用部分居民的年平均收入推断全部居民的总收入等。
’
平均数又称为统计指标,是统计学中的一部分,定义为反映现象总体各单位某一数量标志值的典型水平、一般水平和代表性水平。
平均指标是社会经济现象中最常用的一种综合指标分析。
它描述数据的集中程度,反映一组数据的一般情况;对现象在不同空间、时间上进行比较;分析现象之间的依存关系;作为评价事物的参考依据;进行数量上的估算,特点是直观、简明。
平均指标按其所属总体的时间范围不同分为两种:
静态平均数和动态平均数。
静态平均数是反映同一时间范围内总体各单位某一数量标志一般水平的平均指标;动态平均数是反映不同时间而同一空间范围内总体某一数量标志一般水平的平均指标。
算数平均数
数值平均数 调和平均数
几何平均数
静态平均数
中位数
平均数 位置平均数
众数
动态平均数:
平均发展水平
一、数值平均数
1、算数平均数
算数平均数是总体标志总量与总体单位总量对比的结果。
算数平均数是分析社会经济现象一般水平和典型特征的最基本、最常用的一种平均指标。
它也是平均指标中最重要的一种。
由于依据的资料不同,计算方法有所不同,可分为简单算术平均数和加权算术平均数。
基本公式:
算数平均数= 总体标志总量/总体单位总量
(1)简单算术平均数
计算公式:
⎺X=
适用于总体资料未经分组整理、尚为原始资料的情况。
(2)加权算术平均数
计算公式:
⎺X=
=
适用于总体资料经过分组整理形成变量数列的情况。
权数是指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度。
权数对于算术平均数的影响作用,不是取决于权数本身数值的大小,而是决定于权数比重。
权数比重是指作为权数的各组单位数占总体单位数的比重。
分为绝对权数和相对权数两种,绝对权数表现为次数、频数、单位数;即公式⎺x=
/
中的
;相对权数表现为频率、比重;即公式⎺x =
/
=
中的
/
。
在计算加权算术平均数时,还会遇到权数的选择问题。
选择权数的原则是,务必使各组的标志值与其组数乘积等于各组的标志总量,并且具有实际的经济意义。
如果采用的都是单项式数列,那么可直接运用公式求解,如果是组距式分配数列,则需先计算组中值来代表各组的标志值x,再计算平均数。
但运用这种计算方法需有一个假定条件,即假定各单位标志值在各组内是均匀分布的。
这种用组中值来代替计算的算术平均数,不可避免地会存在一定程度的误差,具有近似值的性质。
2、调和平均数
调和平均数是是指各个变量值倒数的算术平均数的倒数,又称倒数平均数。
分为简单调和平均数和加权调和平均数。
(1)简单调和平均数和平均数是各个标志值倒数的简单算术平均数的倒数。
其计算公式为:
⎺Xh=
调和平均数与算术平均数的原理相同。
(2)加权调和平均数是各个标志值倒数的加权算术平均数的倒数,其计算公式为:
⎺
=
,m为总体各组标志总量。
调和平均数与算术平均数在计算上是相通的,但各自适合不同的资料。
3、几何平均数
几何平均数是n个单位的标志值的连乘积的n次方根.它是一种具有特殊用途的平均数,适用于计算标志值的连乘积等于总比率或总速度的现象的平均比率或平均速度.计算形式有简单几何平均数和加权几何平均数。
适用于资料偏态分布,少数数据过分偏大,(各观察值间呈等比关系),原始数据进行对数变换后为对称分布,如平均潜伏期、平均抗体滴度等资料。
(1)简单几何平均数。
如果资料未分组,直接将n项变量值连乘,然后对其连乘积开n次方,所得的平均数即为简单几何平均数,其公式为:
=
(2)加权几何平均数。
与算术平均数一样,当资料已经经过整理,应以各变量值出现的次数为权数,计算加权几何平均数。
其计算公式为:
二、位置平均数
位置平均数是指按数据的大小顺序或出现频数的多少,确定的集中趋势的代表值。
众数和中位数是根据其在总体中所处的位置或地位确定的,所以不受数列中极端值的影响,一般称为位置平均数,.
1、众数
众数是现象中出现次数最多的标志值,即最普遍、最常出现的数值.利用众数可以简单地说明总体中某个标志值分布的集中趋势,反映现象的一般水平.。
众数的特点是,只考虑总体分布中最频繁出现的变量值,因而不受极端值的影响,因此,若要在相等的变量值出现次数较多的一个数列里来反映其变量值的代表性,使用众数最为适宜。
在某些场合,只有众数才适合作为总体的代表数,例如:
成衣、皮鞋、汗衫、袜子、帽子等,不可能也不必要掌握全部销售资料,只需通过典型调查或抽样调查,即可获得某些商品的价格的众数,即市场上的普遍成交价格,用以代表当天的行情,即简便又富有代表性。
用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。
在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。
当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。
例子:
{鸡、鸭、鱼、鱼、鸡、鱼}的众数是鱼。
众数算出来是销售最常用的,代表最多的,众数是在一组数据中,出现次数最多的数据。
2、中位数
将研究总体中各单位的标志值依其大小顺序排列,位于中间位置的标志值就是中位数.在中位数之上和之下各有50%的单位数。
中位数将全部标志值分成两半,一半小于中位数,一半大于中位数,所以中位数又称为二分位数。
在实际工作中,用中位数来代表居民收入水平比采用算术平均数进行计算更为科学。
在实际工作中,中位数用得较多的是测定人口年龄分配的平均年龄数。
按照国际统计惯例,各国政府统计工作时,均对年龄分组采用中位数,而不用算术平均数,则会由于老人岁数很大的影响,使得算术平均年龄偏大而与实际情况不符。
中位数主要用于测度定序数据的集中趋势,当然也适用于定距数据与定比数据的集中趋势,但不适用于定类数据。
二、动态平均数
1、平均发展水平
平均发展水平又称序时平均数或动态平均数,序时平均数和静态平均数都是反映现象一般水平或代表性水平的平均数。
一般平均数是把同质总体某一数量标志在某一时间上的水平抽象化,从静态上反映现象的一般水平或代表性水平,而序时平均数则把同一现象在不同时间上的差异抽象化,从动态上反映现象的一般水平或代表性水平。
一把平均数是根据变量数列计算的,而序时平均数则根据时间数列来计算。
总量指标时间数列动态平均数的计算:
(1)时期数列平均发展水平的计算⎺
(2)时点数列平均发展水平的计算①连续型时点数列平均发展水平的计算。
如果时点数列中发展水平是按日排列的,或只在发生变动时登记变化后的数据,称为时点数列。
A.间隔相等的连续型时点数列:
⎺a=
B.间隔不相等的连续型时点数列:
⎺a=
②间断型时点数列平均发展水平的计算。
是指不能按日排列或不能转换成按日排列的时点数列。
A.间隔相等的间断型时点数列:
a=
B.间隔不等的间断型时点数列:
⎺a=
。
相对指标时间数列计算平均发展水平:
(1)根据两个时期数列对比所形成的相对指标时间数列来计算平均发展水平:
⎺c=
=
(2)根据两个时点数列进行对比所形成的相对指标时间数列来计算:
⎺c=
=
(3)根据一个时期数列与另一个时点数列进行对比所形成的相对指标时间数列来计算平均发展水平:
⎺c=
=
平均指标时间数列计算平均发展水平:
间隔相等的序时平均数:
⎺c=
B.间隔不等的序时平均数:
⎺c=
ﻩ
平均发展速度反映现象逐期发展速度的平均程度,是各个时期环比发展速度的几何平均数,说明社会经济现象在较长时期内速度变化的平均程度。
仅靠平均值来了解一个群的特征是不够的。
简单的将总体单位进行平均也是不合适的,平均数在日常使用中主要存在以下误区:
(1)将不同质的总体单位硬搅在一起计算平均指标。
总平均数是以同质总体为基础计算,如果将不同质的总体单位搅在一起计算平均指标,就会出现许多“被平均”的现象。
(2)只运用一个平均数来说明现象的一般水平。
总体中的总体单位虽然具有同质性,但总体单位之间还存在很大的差别,只运用一个总平均数来说明总体,则无法反映总体内部的差异,同时也无法反映平均数的代表性。
平均指标作为现象总体的一般指标,在使用时要注意以下原则:
用平均指标作为说明总体内某一数量标志的代表值,必须注意总体各单位的同质性.所谓同质性,就是总体各单位在被平均的标志上具有同类性,即平均数不应是一种混杂现象的平均数,这样的平均数没有代表性,没有实际意义。
比如,不能将钢材价格、卷烟价格、棉布价格等混在一起计算平均价格,如果把不同性质的各个单位混在一起计算平均数,不但不能正确反映现象总体的一般水平,反而会与实际情况相悖。