数据模型与决策-教学课件-ppt-作者-李连友-第4章--抽样分布与参数估计.pptx
《数据模型与决策-教学课件-ppt-作者-李连友-第4章--抽样分布与参数估计.pptx》由会员分享,可在线阅读,更多相关《数据模型与决策-教学课件-ppt-作者-李连友-第4章--抽样分布与参数估计.pptx(42页珍藏版)》请在冰豆网上搜索。
第第4章章抽样分布与参数估计抽样分布与参数估计1第一第一节节抽样抽样一、一、抽样抽样及其原因及其原因2抽样抽样就是为了进行抽样推断,根据一就是为了进行抽样推断,根据一定的原则和方法,从总体中抽取一部分个体定的原则和方法,从总体中抽取一部分个体(或单位)组成样本。
(或单位)组成样本。
第一第一节节抽样抽样广泛使用广泛使用抽样抽样的的原因原因:
(11)抽样可以降低成本。
)抽样可以降低成本。
(22)抽样可以节约时间。
)抽样可以节约时间。
(33)对于一些具有破坏性的研究过程,只能)对于一些具有破坏性的研究过程,只能使用抽样方法获取资料。
使用抽样方法获取资料。
3第一第一节节抽样抽样(44)在资源一定的条件下,抽样可以扩展研究)在资源一定的条件下,抽样可以扩展研究内容,增强研究深度。
内容,增强研究深度。
(55)当研究的总体为无限时,抽样是惟一的选)当研究的总体为无限时,抽样是惟一的选择。
择。
(66)当研究的总体很大,需要普查人员多,花)当研究的总体很大,需要普查人员多,花费时间长时,根据抽样资料对总体的推断也许会比费时间长时,根据抽样资料对总体的推断也许会比普查更准确。
普查更准确。
4第一第一节节抽样抽样二、二、抽样框抽样框5抽取样本单位时所抽取样本单位时所依据依据的的目标总体清单目标总体清单、图或目录图或目录等等第一第一节节抽样抽样三、三、有放回抽样有放回抽样与无放回抽样与无放回抽样6第一第一节节抽样抽样四、四、有限总体有限总体抽样和无限总体抽样和无限总体抽样抽样7有限总体有限总体就是总体就是总体容量容量中所包含的个体中所包含的个体数量是有限个,或者数量是有限个,或者说说是可以是可以计计数的数的总总体。
体。
无限无限总体总体就是总体就是总体容量容量中所包含的个体中所包含的个体数量是无限个,或者无法计数的总体。
数量是无限个,或者无法计数的总体。
第一第一节节抽样抽样五、五、随机抽样随机抽样与非随机抽样与非随机抽样8随机抽样随机抽样也称也称概率抽样概率抽样,就是严格按随机原,就是严格按随机原则,即保证总体中每个单位都有同等机会被抽中的则,即保证总体中每个单位都有同等机会被抽中的原则抽取样本单位的抽样组织方式。
原则抽取样本单位的抽样组织方式。
常用常用的随机抽样方法主要有简单随机抽样、的随机抽样方法主要有简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样等。
分层抽样、系统抽样、整群抽样和多阶段抽样等。
第一第一节节抽样抽样非非随机抽样随机抽样也称也称非概率抽样非概率抽样,是指抽样时不是遵,是指抽样时不是遵循随机原则,而是按照研究人员的主观经验或其它条循随机原则,而是按照研究人员的主观经验或其它条件来抽取样本单位,总体中每个单位被选作样本单位件来抽取样本单位,总体中每个单位被选作样本单位的概率不一定相同的一种抽样方式。
的概率不一定相同的一种抽样方式。
9常用常用的非随机抽样有方便抽样、滚雪球抽样、的非随机抽样有方便抽样、滚雪球抽样、判断抽样和定额抽样等。
判断抽样和定额抽样等。
六、抽样误差六、抽样误差
(一)抽样误差的概念
(一)抽样误差的概念抽样抽样误差误差是样本统计量的值与总体被估计参数之是样本统计量的值与总体被估计参数之间的差间的差。
(二)产生误差的原因
(二)产生误差的原因10第二节第二节几种常用的抽样几种常用的抽样方式方式一、一、随机抽样随机抽样
(一)简单随机抽样
(一)简单随机抽样简单随机抽样简单随机抽样也称也称单纯随机抽样单纯随机抽样、纯随机抽样纯随机抽样,是指从总体是指从总体个单位中随机抽取个单位中随机抽取个单位作为样本,使每个单位作为样本,使每个单位被抽中的概率相等的一种抽样方式。
个单位被抽中的概率相等的一种抽样方式。
11第二节第二节几种常用的抽样几种常用的抽样方式方式简单抽样的方法:
简单抽样的方法:
(11)抽签法)抽签法(22)随机数表法)随机数表法12第二节第二节几种常用的抽样几种常用的抽样方式方式
(二)
(二)分层分层随机抽样随机抽样分层分层随机抽样随机抽样的基本原理是,首先,将总体中的的基本原理是,首先,将总体中的所有个体分成若干组(这些组通常称为所有个体分成若干组(这些组通常称为“层层”);其次,);其次,再从每一层中抽取一个简单随机样本;最后,将每一再从每一层中抽取一个简单随机样本;最后,将每一层简单随机样本合成为一个样本的抽样方式层简单随机样本合成为一个样本的抽样方式。
13第二节第二节几种常用的抽样几种常用的抽样方式方式分层分层随机抽样的应用价值取决于层内个体的同随机抽样的应用价值取决于层内个体的同质性质性。
抽样抽样误差的大小主要取决于层内各个体之间的误差的大小主要取决于层内各个体之间的差异性差异性。
抽样方法:
抽样方法:
(11)等比例抽样)等比例抽样(22)不)不等比例抽样等比例抽样14第二节第二节几种常用的抽样几种常用的抽样方式方式(三)整群抽样(三)整群抽样整群抽样整群抽样是指,首先要求将总体分成若干个不同是指,首先要求将总体分成若干个不同的组(这些组通常称为的组(这些组通常称为“群群”);其次,再从这些不同的);其次,再从这些不同的群中抽取一部分群组成一个简单随机样本的抽样方式。
群中抽取一部分群组成一个简单随机样本的抽样方式。
15第二节第二节几种常用的抽样几种常用的抽样方式方式整群抽样整群抽样的应用价值取决于群内个体的差异的应用价值取决于群内个体的差异性性。
抽样抽样误差的大小主要取决于各个群之间的差异性误差的大小主要取决于各个群之间的差异性。
整群抽样整群抽样的两个突出优点是方便和成本低的两个突出优点是方便和成本低。
【思考思考】分层抽样与整群抽样的联系和区别。
分层抽样与整群抽样的联系和区别。
16第二节第二节几种常用的抽样几种常用的抽样方式方式(四)系统抽样(四)系统抽样系统抽样系统抽样也称为也称为等距抽样等距抽样或或机械抽样机械抽样,是将总体,是将总体中所有个体先按某种标志排队,然后再按相同的间隔中所有个体先按某种标志排队,然后再按相同的间隔抽取抽取个个体组成一个样本的抽样个个体组成一个样本的抽样。
排队标志的选择排队标志的选择具体样本单位的抽取方法具体样本单位的抽取方法17第二节第二节几种常用的抽样几种常用的抽样方式方式二、二、非随机抽样非随机抽样
(一)
(一)方便方便抽样抽样方便方便抽样抽样就是研究者依据抽选的方便程度来确定就是研究者依据抽选的方便程度来确定样本单位的一种抽样技术。
样本单位的一种抽样技术。
18第二节第二节几种常用的抽样几种常用的抽样方式方式
(二)
(二)滚雪球抽样滚雪球抽样滚雪球滚雪球抽样抽样的原理是,首先确定一个或一批受访对象,的原理是,首先确定一个或一批受访对象,然后再由这些受访对象推荐另外一些受访对象,这样像滚然后再由这些受访对象推荐另外一些受访对象,这样像滚雪球一样一轮一轮地推荐,样本容量不断增大,直至达到雪球一样一轮一轮地推荐,样本容量不断增大,直至达到要求为止要求为止。
滚雪球抽样的原理是,首先确定一个或一批受滚雪球抽样的原理是,首先确定一个或一批受访对象,然后再由这些受访对象推荐另外一些受访对象,访对象,然后再由这些受访对象推荐另外一些受访对象,这样像滚雪球一样一轮一轮地推荐,样本容量不断增大,这样像滚雪球一样一轮一轮地推荐,样本容量不断增大,直至达到要求为止。
直至达到要求为止。
19第二节第二节几种常用的抽样几种常用的抽样方式方式(三)(三)判断判断抽样抽样判断判断抽样抽样是研究者根据个人的判断,选择他(她)是研究者根据个人的判断,选择他(她)认为所选择的能够代表总体的个体组成样本的一种抽认为所选择的能够代表总体的个体组成样本的一种抽样方法。
样方法。
20第二节第二节几种常用的抽样几种常用的抽样方式方式(四)(四)典型抽样典型抽样典型典型抽样抽样也称为也称为典型调查典型调查,是研究者在对所研究,是研究者在对所研究总体全面分析基础上,有意识地从中抽选一部分具有总体全面分析基础上,有意识地从中抽选一部分具有典型性的个体组成样本,并进行进一步研究的一种抽典型性的个体组成样本,并进行进一步研究的一种抽样方式样方式。
选择典型单位的方法选择典型单位的方法21第二节第二节几种常用的抽样几种常用的抽样方式方式(五)(五)重点抽样重点抽样重点重点抽样抽样也称为也称为重点调查重点调查,是研究者从总体中只,是研究者从总体中只抽选一部分重点个体组成样本的抽样方式抽选一部分重点个体组成样本的抽样方式。
重点单位的含义重点单位的含义重点抽样的目的重点抽样的目的22第三节第三节抽样分布抽样分布样本样本统计量所有可能值构成的概率分布称为统计量所有可能值构成的概率分布称为抽样抽样分布分布。
【注意注意】样本统计量和样本统计量的值的区别样本统计量和样本统计量的值的区别23第三节第三节抽样分布抽样分布一、一、样本均值(样本均值()的抽样分布)的抽样分布
(一)
(一)样本均值抽样分布样本均值抽样分布的的含义含义样本均值(样本均值()抽样分布)抽样分布就是样本均值(就是样本均值()所有可能取值的概率分布)所有可能取值的概率分布。
*样本均值样本均值的分布特征依赖于总体的分布的分布特征依赖于总体的分布类型。
类型。
24第三节第三节抽样分布抽样分布1.1.总体分布总体分布已知且为已知且为正态分布正态分布当当总体是正态概率分布时,无论样本容量为多少,总体是正态概率分布时,无论样本容量为多少,的抽样分布一定是正态概率分布的抽样分布一定是正态概率分布。
2.2.总体分布总体分布未知未知借助于借助于统计学中的中心极限定理来确定统计学中的中心极限定理来确定样本均样本均值的值的抽样分布抽样分布。
25第三节第三节抽样分布抽样分布中心极限定理中心极限定理的基本的基本含义含义:
当当样本容量足够大(样本容量足够大()时,不论总体分布的类型)时,不论总体分布的类型如何,从总体中抽取的简单随机样本的如何,从总体中抽取的简单随机样本的的抽样分布都的抽样分布都可以近似地看成正态概率分布。
可以近似地看成正态概率分布。
26第三节第三节抽样分布抽样分布
(二)样本均值的样本均值的期望值和抽样分布的期望值和抽样分布的标准差标准差27第三节第三节抽样分布抽样分布样本均值有放回抽样的抽样样本均值有放回抽样的抽样标准误差标准误差28样本均值有放回抽样的抽样标准误差样本均值有放回抽样的抽样标准误差第三节第三节抽样分布抽样分布二、二、样本样本比例比例的抽样分布的抽样分布29
(一)样本比例抽样分布的含义
(一)样本比例抽样分布的含义样本比例样本比例所有可能取值的概率分布。
所有可能取值的概率分布。
第三节第三节抽样分布抽样分布
(二)样本比例的期望值和标准差
(二)样本比例的期望值和标准差30两种标准差公式通用的条件:
两种标准差公式通用的条件:
第四节第四节参数参数的点估计的点估计一、点估计的含义一、点估计的含义31用用样本统计量一个特定的值(一个点)作为样本统计量一个特定的值(一个点)作为相应总体参数的估计值。
相应总体参数的估计值。
第四节第四节参数参数的点估计的点估计二、点估计的标准二、点估计的标准
(一)无偏性
(一)无偏性
(二)有效性
(二)有效性(三)一致性(三)一致性32第五节第五节参数的区间估计参数的区间估计一、区间估计的基本问题一、区间估计的基本问题
(一)
(一)区间估计的区间估计的含义含义
(二)几组重要概念
(二)几组重要概念1.1.区间区间置信上限置信上限置信下限置信下限2.2.置信系数置信系数置信水平置信水平3.3.估计风险估计风险4.4.误差边际(边际误差、允许误差、抽样极限误差)误差边际(边际误差、允许误差、抽样极限误差)33第五节第五节参数的区间估计参数的区间估计二、二、总体均值总体均值的的区间估计区间估计
(一)
(一)单个总体均值的单个总体均值的区间估计区间估计1.1.大样本情形下大样本情形下总体均值总体均值的区间估计的区间估计(11)总体标准差已知:
)总体标准差已知:
34第五节第五节参数的区间估计参数的区间估计例如例如,在先在先科计算机公司的例子中,假定根据历史科计算机公司的例子中,假定根据历史资料资料得知得知:
30003000名员工年均收入的标准差为名员工年均收入的标准差为39003900元元。
35在本次抽样中:
在本次抽样中:
30003000名员工年均收入区间估计为:
名员工年均收入区间估计为:
第五节第五节参数的区间估计参数的区间估计计算计算结果表明,在已知总体标准差为结果表明,在已知总体标准差为39003900元,样元,样本容量为本容量为3030个人,置信水平为个人,置信水平为95%95%的情况下,先科计的情况下,先科计算机公司算机公司30003000名员工的年均收入大约在名员工的年均收入大约在55487.7358278.9355487.7358278.93元之间。
元之间。
36第五节第五节参数的区间估计参数的区间估计(22)总体总体标准差未知标准差未知:
37第五节第五节参数的区间估计参数的区间估计2.2.小样本总体标准差未知时总体均值的区间估计小样本总体标准差未知时总体均值的区间估计38:
在自由度为分布右侧尾部面积为时的值。
例题见教材102页。
(二)两个总体均值之差的区间估计
(二)两个总体均值之差的区间估计1.1.大样本情况下大样本情况下,两个两个总体方差总体方差已知时已知时,它们之间,它们之间均值之差均值之差的的区间估计区间估计392.2.大大样本情况下样本情况下,两个两个总体方差总体方差未知未知时时,它们之间均它们之间均值之差值之差的的区间估计区间估计40例如例如,北京一家大型百货公司在市中心经营长达,北京一家大型百货公司在市中心经营长达5555年后,于年后,于20102010年年1212月在北京远郊开了第一家连锁店。
该公司的销售部门经月在北京远郊开了第一家连锁店。
该公司的销售部门经理已经注意到,在某一商店畅销的商品在另一商店不一定总是同理已经注意到,在某一商店畅销的商品在另一商店不一定总是同样地畅销。
这位经理经过分析认为,发生这种情况的原因有可能样地畅销。
这位经理经过分析认为,发生这种情况的原因有可能在于,两个地区的顾客包括在年龄、性别、教育程度、收入等方在于,两个地区的顾客包括在年龄、性别、教育程度、收入等方面存在着差异。
于是,该部门经理邀请一家市场调查咨询机构对面存在着差异。
于是,该部门经理邀请一家市场调查咨询机构对两个地区顾客在上述几方面的差异进行了调查。
两个地区顾客在上述几方面的差异进行了调查。
其中其中,有关两地区顾客年龄差异方面的调查,调查机构设计,有关两地区顾客年龄差异方面的调查,调查机构设计的方案如下:
的方案如下:
41:
代表代表总总体体11,指所有光,指所有光顾顾市中心商店的市中心商店的顾顾客;客;:
代表总体代表总体22,指所有光顾远郊商店的顾客;,指所有光顾远郊商店的顾客;:
代表总体代表总体11的均值,即所有光顾市中心商店顾客的平均年的均值,即所有光顾市中心商店顾客的平均年龄;龄;:
代表总体代表总体22的均值,即所有光顾远郊商店顾客的平均年龄;的均值,即所有光顾远郊商店顾客的平均年龄;():
代表两个总体均值的差异;):
代表两个总体均值的差异;42