统计学-数据分布特征.ppt
《统计学-数据分布特征.ppt》由会员分享,可在线阅读,更多相关《统计学-数据分布特征.ppt(68页珍藏版)》请在冰豆网上搜索。
![统计学-数据分布特征.ppt](https://file1.bdocx.com/fileroot1/2022-10/20/cb43ec2e-2abc-46d2-9f05-7dbb3a10bc50/cb43ec2e-2abc-46d2-9f05-7dbb3a10bc501.gif)
第四章数据分布特征的测度1主要内容和学习目标:
主要内容和学习目标:
n集中趋势的测度集中趋势的测度n离散程度的测度离散程度的测度n偏度与峰度的测度偏度与峰度的测度4.1集中趋势的测度n一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度n测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值n不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值n低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据的测量数据n选用哪一个测度值来反映数据的集中趋势,要根据数据的选用哪一个测度值来反映数据的集中趋势,要根据数据的来型来确定来型来确定2描述集中趋势的统计量n平均数平均数n中位数和分位数中位数和分位数n众数众数3一、平均数平均数:
平均数:
n集中趋势的测度值之一集中趋势的测度值之一n最常用的测度值最常用的测度值n一组数据的均衡点所在一组数据的均衡点所在n易受极端值的影响易受极端值的影响n用于数值型数据,不能用于品质型数据用于数值型数据,不能用于品质型数据4一、平均数5平均数的计算公式6二、中位数和分位数
(一)中位数
(一)中位数n集中趋势的测度值之一集中趋势的测度值之一n排序后处于中间位置上的值排序后处于中间位置上的值n不受极端值的影响不受极端值的影响7中位数位置的确定8例:
9个家庭的人均月收入数据9例:
10个家庭的人均月收入数据10
(二)四分位数n集中趋势的测度值之一集中趋势的测度值之一n排序后处于排序后处于25%25%(下四分位)和(下四分位)和75%75%(上四分位)(上四分位)位置上的值位置上的值n不受极端值的影响不受极端值的影响11四分位数位置的确定1213三、众数n一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值n适合于数据量较多时使用适合于数据量较多时使用n不受极端值的影响不受极端值的影响n可能没有众数或有几个众数可能没有众数或有几个众数n主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和数值型数据数值型数据1415例:
某城市居民关注广告类型的频数分布16例:
甲城市家庭对住房状况评价的分布频数17四、各度量值的比较18四、各度量值的比较19四、各度量值的比较20各度量值适用的数据类型214.2离散程度的度量224.2离散程度的度量离散程度离散程度n数据分布的另一个重要特征数据分布的另一个重要特征n离中趋势的各测度值是对数据离散程度所作的描述离中趋势的各测度值是对数据离散程度所作的描述n反映各变量值远离其中心值的程度,因此也称为反映各变量值远离其中心值的程度,因此也称为离离中趋势中趋势n从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度n不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值23描述数据离散程度的测度值n极差和四分位差极差和四分位差n平均差平均差n方差和标准差方差和标准差n离散系数离散系数24作用1:
衡量平均值的代表性离中趋势越大,均值的代表性就越小离中趋势越大,均值的代表性就越小例:
过去三年,某公司的平均销售额为例:
过去三年,某公司的平均销售额为12001200万元,万元,这可能有三种情况:
这可能有三种情况:
25作用2:
反映社会经济活动的均衡性离散程度可以表明生产过程的节奏性和其他经济活离散程度可以表明生产过程的节奏性和其他经济活动的均衡性,因此可以作为企业产品质量控制和评动的均衡性,因此可以作为企业产品质量控制和评价经济管理工作的依据。
价经济管理工作的依据。
例:
某公司下属两个企业销售额计划完成情况例:
某公司下属两个企业销售额计划完成情况26一、极差和四分位差27一、极差和四分位差
(一)极差(全距
(一)极差(全距RangeRange)l离散程度的最简单测度值离散程度的最简单测度值l易受极端值的影响易受极端值的影响l未考虑数据的分布未考虑数据的分布28例:
29
(二)四分位差n也称为内距或四分位数间距也称为内距或四分位数间距n上四分位数与下四分位数之差上四分位数与下四分位数之差n反映了中间反映了中间50%50%数据的离散程度数据的离散程度n不受极端值的影响不受极端值的影响n用于衡量中位数的代表性用于衡量中位数的代表性30
(二)四分位差31二、平均差n离散程度的测度值之一离散程度的测度值之一n各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数n能全面反映一组数据的离散程度能全面反映一组数据的离散程度n数学性质较差,实际应用少数学性质较差,实际应用少n计算公式为:
计算公式为:
32三、方差和标准差33343536373839相对位置的测量:
标准分数n也称标准化值,计算公式为:
也称标准化值,计算公式为:
n对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量n可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点n用于对变量的标准化处理用于对变量的标准化处理40标准分数的性质41例:
4243思考:
n在衡量任何现象尤其是不同类型现象的离在衡量任何现象尤其是不同类型现象的离散情况,是否有标准差这种类型的测度值散情况,是否有标准差这种类型的测度值就够了?
就够了?
44454647四、离散系数:
比较几组数据的离散程度48494.3偏态与峰态的度量5051一、偏态及其测度52二、峰态及其测度53例:
54555657用Excel计算描述统计量58用Excel计算描述统计量72页习题25960616263作业1:
6465作业2:
66答案:
6768