统计学数据的概括性度量.ppt

上传人:b****2 文档编号:2682532 上传时间:2022-11-07 格式:PPT 页数:75 大小:1.49MB
下载 相关 举报
统计学数据的概括性度量.ppt_第1页
第1页 / 共75页
统计学数据的概括性度量.ppt_第2页
第2页 / 共75页
统计学数据的概括性度量.ppt_第3页
第3页 / 共75页
统计学数据的概括性度量.ppt_第4页
第4页 / 共75页
统计学数据的概括性度量.ppt_第5页
第5页 / 共75页
点击查看更多>>
下载资源
资源描述

统计学数据的概括性度量.ppt

《统计学数据的概括性度量.ppt》由会员分享,可在线阅读,更多相关《统计学数据的概括性度量.ppt(75页珍藏版)》请在冰豆网上搜索。

统计学数据的概括性度量.ppt

第4章数据的概括性度量1集中趋势的度量集中趋势的度量2离散程度的度量离散程度的度量3偏态与峰态的度量偏态与峰态的度量甲、乙两个班的统计学成绩甲、乙两个班的统计学成绩序号成绩序号成绩序号成绩序号成绩序号成绩173108119882880377527711792090298538873781275218230743951461137122953174407457314892376328541966921584248933744277778166925953482439188117862686358244829791876275936824572序号成绩序号成绩序号成绩序号成绩序号成绩1869461792256933752641079189026893496383117719862779357947412732098287436885581385216429853794693148122923067387177115642391318439558691675248732824095请对两个班的成绩进行对比分析,你会从哪几个方面着手?

两班成绩的对比分析指标数值平均79.66667标准误差1.378405中位数80众数82标准差9.246621方差85.5峰度1.31565偏度-0.70131最小值51最大值96求和3585观测数45指标数值平均79标准误差1.923872中位数80众数64标准差12.16763方差148.0513峰度0.037583偏度-0.62146最小值46最大值98求和3160观测数40甲班成绩的描述性指标乙班成绩的描述性指标学习目的和学习目的和重难点提示重难点提示本章学习目的本章学习目的领会领会数据分布的各种特征:

集中趋势、离散趋势、偏斜程度和峰度。

掌握掌握数据分布特征各测定值的计算方法、特点及其应用场合。

本章重难点提示本章重难点提示数据分布特征的描述方法,如何使用一些统计量来对数据进行概括性测定。

数据分布特征各测定值的计算方法、特点及其应用场合。

数据分布的特征和测度数据分布的特征和测度峰峰峰峰峰峰度度度度度度偏偏偏偏偏偏度度度度度度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众数数数数数数中位数中位数中位数中位数中位数中位数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率位置位置位置位置位置位置平均数平均数平均数平均数平均数平均数数值数值数值数值数值数值平均数平均数平均数平均数平均数平均数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数调和平均数调和平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数4.1集中趋势的度量1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定集中趋势集中趋势(位置位置)集中趋势指标的种类集中趋势指标的种类从总体各单位变量值中抽象出具有一般水平的量,这个量是根据各个单位的具体标志值计算出来的,有算术平均数、调和平均数、几何平均数等形式。

数值平均数取得集中趋势代表值方法的不同,可分为数值平均数和位置平均数。

先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平。

位置平均数有众数、中位数、四分位数等形式。

位置平均数4.1.1众数众数1.定义:

出现次数最多的变量值。

是集中趋势的测定义:

出现次数最多的变量值。

是集中趋势的测度值之一,不受极端值的影响。

度值之一,不受极端值的影响。

因而在实际工因而在实际工作中有时有它作中有时有它特殊的用途特殊的用途。

诸如,要说明一个。

诸如,要说明一个企业中工人最普遍的技术等级,说明消费者需企业中工人最普遍的技术等级,说明消费者需要的内衣、鞋袜、帽子等最普遍的号码,说明要的内衣、鞋袜、帽子等最普遍的号码,说明农贸市场上某种农副产品最普遍的成交价格等,农贸市场上某种农副产品最普遍的成交价格等,都需要利用众数都需要利用众数适用:

主要用于定类数据,也可用于定序数据和适用:

主要用于定类数据,也可用于定序数据和数数值型数据值型数据注意注意:

有些数据可能没有众数或有几个众数:

有些数据可能没有众数或有几个众数众数众数(众数的不唯一性)无众数无众数原始数据:

10591268一个众数一个众数原始数据:

659855多于一个众数多于一个众数原始数据:

252828364242众数的计算方法众数的计算方法*品质变量的众数品质变量的众数观察次数,出现次数最多的变量值就是众数。

例如:

企业的所有制结构分布、人口的城乡分布。

*数值变量的众数数值变量的众数未分组资料未分组资料观察次数,出现次数最多的数据就是众数。

分组资料分组资料

(1)单项式数列直接观察,次数最多的组的变量值即为众数。

定类数据的众数定类数据的众数表表4-1某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告服务广告服务广告金融广告金融广告房地产广告房地产广告招生招聘广告招生招聘广告其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100【例例例例】根根根根据据据据表表表表44-1-1中中中中的的的的数数数数据据据据,计计计计算算算算众数众数众数众数解解解解:

这这这这里里里里的的的的变变变变量量量量为为为为“广广广广告告告告类类类类型型型型”,这这这这是是是是个个个个定定定定类类类类变变变变量量量量,不不不不同同同同类类类类型型型型的的的的广广广广告告告告就就就就是是是是变变变变量量量量值值值值。

我我我我们们们们看看看看到到到到,在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注商商商商品品品品广广广广告告告告的的的的人人人人数数数数最最最最多多多多,为为为为112112人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的56%56%,因因因因此此此此众众众众数数数数为为为为“商商商商品品品品广广广广告告告告”这一类别,即这一类别,即这一类别,即这一类别,即MMoo商品广告商品广告商品广告商品广告定序数据的众数定序数据的众数【例例例例】根根根根据据据据表表表表44-2-2中中中中的的的的数数数数据据据据,计计计计算算算算众数众数众数众数解解解解:

这这这这里里里里的的的的数数数数据据据据为为为为定定定定序序序序数数数数据据据据。

变变变变量量量量为为为为“回回回回答答答答类类类类别别别别”。

甲甲甲甲城城城城市市市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这一类别,即这一类别,即这一类别,即这一类别,即MMoo不满意不满意不满意不满意表表4-2甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)非常不满意非常不满意不满意不满意一般一般满意满意非常满意非常满意24108934530836311510合计合计300100.0例例单项式变量数列确定众数实例单项式变量数列确定众数实例表4-3某市居民家庭按家庭人口数分组由上表可以看出,家庭人口数为3人的家庭数最多,因此本例中家庭人口数的众数为3人人。

数值型分组数据的众数数值型分组数据的众数1.众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布2.2.2.相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值即为众数即为众数即为众数即为众数即为众数即为众数MMMooo3.3.相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下列近似公式计算列近似公式计算列近似公式计算列近似公式计算MMMoooMMMooo算例算例某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计504.1.2顺序数据:

中位数和分位数1.中位数me集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即MMee50%50%原始数据原始数据:

2422212620位位置置:

12345中位数的计算中位数的计算排排序序:

2021222426原始数据原始数据:

10591268位位置置:

123456排排序序:

56891012中位数=(8+9)/2=8.5计算公式未分组数据的中位数数值型分组数据的中位数例:

某企业例:

某企业5050名工人加工零件中位数计算表名工人加工零件中位数计算表,计算计算5050名工名工人日加工零件数的中位数人日加工零件数的中位数按零件数分组按零件数分组(个个)频数频数(人人)向上累计向上累计(人人)向下累计向下累计(人人)10510511011033335050110110115115558847471151151201208816164242120120125125141430303434125125130130101040402020130130135135664646101013513514014044505044Sm-1Sm+12.四分位数人们经常会将数据划分为4个部分,每一个部分大约包含有1/4即25的数据项。

QLQMQU25%25%25%25%1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据四分位数四分位数(位置的确定位置的确定)未分组数据:

未分组数据:

组距分组数据:

组距分组数据:

下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N4甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)累计频数累计频数非常不满意非常不满意不满意不满意一般一般满意满意非常满意非常满意2410893453024132225270300合计合计300计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 建筑土木

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1