统计学课件第七章抽样推断PPT课件下载推荐.ppt

上传人:b****9 文档编号:13389551 上传时间:2022-10-10 格式:PPT 页数:107 大小:1.39MB
下载 相关 举报
统计学课件第七章抽样推断PPT课件下载推荐.ppt_第1页
第1页 / 共107页
统计学课件第七章抽样推断PPT课件下载推荐.ppt_第2页
第2页 / 共107页
统计学课件第七章抽样推断PPT课件下载推荐.ppt_第3页
第3页 / 共107页
统计学课件第七章抽样推断PPT课件下载推荐.ppt_第4页
第4页 / 共107页
统计学课件第七章抽样推断PPT课件下载推荐.ppt_第5页
第5页 / 共107页
点击查看更多>>
下载资源
资源描述

统计学课件第七章抽样推断PPT课件下载推荐.ppt

《统计学课件第七章抽样推断PPT课件下载推荐.ppt》由会员分享,可在线阅读,更多相关《统计学课件第七章抽样推断PPT课件下载推荐.ppt(107页珍藏版)》请在冰豆网上搜索。

统计学课件第七章抽样推断PPT课件下载推荐.ppt

,抽样推断理论基础,大数定律,中心极限定律,表明大量随机观象平均结果具有稳定性的性质。

抽样推断的基本概念,全及总体,抽样总体,又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。

常用N表示全及总体的单位数目。

又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。

抽样总体的单位数称为样本容量,通常用n表示。

1nN。

抽样推断的基本概念,例如:

在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。

n30称为大样本,n30称为小样本.n/N称为抽样比.,设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则,根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体参数。

全及指标,总体平均数(又叫总体均值):

全及指标,总体单位标志值的标准差:

总体单位标志值的方差:

总体成数:

总体是非标志的标准差:

总体是非标志的方差:

设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则,样本平均数(又叫样本均值):

样本单位标志值的标准差:

样本单位标志值的方差:

为的无偏估计,为的无偏估计,样本成数:

样本单位是非标志的标准差:

样本单位是非标志的方差:

为的无偏估计,为的无偏估计,抽样方法的分类,重复抽样,从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。

又称放回抽样,总体单位数N不变,同一单位可能多次被抽中。

根据取样方式不同,可分为:

抽样方法的分类,不重复抽样,每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。

又称不放回抽样.,总体单位数减少n,同一单位只可能被抽中一次。

抽样方法的分类,根据对样本的要求不同,可分为:

考虑顺序抽样,不考虑顺序抽样,考虑各单位的中选顺序。

ABCCBA,不考虑各单位的中选顺序。

ABCCBA,考虑顺序的重复抽样,不考虑顺序的不重复抽样,考虑顺序的不重复抽样,不考虑顺序的重复抽样,综合起来共有四种抽样方法,样本的可能数目,考虑顺序的不重复抽样,不考虑顺序的不重复抽样,考虑顺序的重复抽样,不考虑顺序的重复抽样,把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?

中特等奖的概率是多少?

(09选6呢?

),不考虑顺序的不重复抽样,样本的概率分布,把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。

若将样本指标的取值分别记为其相应的概率记为P1,P2,Pn,将它们按顺序排列起来,可得如下概率分布表。

第二节随机抽样的概率分布,抽样分布,样本统计量所有可能值的概率分布,主要样本统计量,平均数比率(成数)方差,分布的形状及接近总体参数的程度,学生成绩30405060708090,按随机原则抽选出名学生,并计算平均分数。

平均数的抽样分布,二者均值相等,学生成绩30405060708090,离差-30-20-100102030,平均数的抽样分布,全部可能样本平均数的均值等于总体均值,即:

从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。

从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。

样本均值的标准差为总体标准差的,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:

从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。

从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。

样本比率的标准差为总体标准的。

比率的抽样分布,教师是否博士是是否否否是,具有博士学位的比率:

0.5比率的标准差:

0.5,从总体中按重复抽样方法随机抽取人,计算其比率和标准差,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:

从非正态总体中抽取的样本比率当n足够大时其分布接近正态分布。

从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。

样本比率的标准差为总体标准差的。

比率的抽样分布,学生成绩60708090均值75方差125,从中按重复抽样方式抽取人,计算样本的均值及方差S。

方差的抽样分布,样本抽样分布,原总体分布,抽样误差,167CM,169CM,172CM,160CM,162CM,167CM,175CM,180CM,165CM,167CM,170CM,175CM,178CM,180CM,162CM,173CM,155CM,160CM,170CM,165CM,平均身高=169.8CM,平均身高=174.6CM,总平均身高=168.6CM,第三节参数估计,也叫抽样估计,就是根据样本指标数值对总体指标数值作出估计或推断。

参数估计,通常,把用来估计总体特征的样本指标叫估计量或统计量,待估计的总体指标叫总体参数。

特点,1、它在逻辑上运用归纳推理而不是演绎推理。

2、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。

3、抽样估计存在抽样误差。

点估计,从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计。

的抽样分布,点估计的最大好处:

给出确定的值点估计的最大问题;

无法控制误差.,问题:

第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?

估计值的优良标准,第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?

是否一个统计量要优于另一个?

估计值的优良标准:

无偏性、有效性、一致性,抽样估计量的优良标准,设为待估计的总体参数,为样本统计量,则的优良标准为:

若,则称为的无偏估计量,若,则称为比更有效的估计量,若越大越小,则称为的一致估计量,作为优良的估计量,除了满足无偏性的要求外,其方差应比较小,有效性,指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值,一致性,抽样估计量的优良标准,学生成绩30405060708090,有效性,按随机原则抽选出名学生,并计算平均分数和中位分数。

有效性,中位数的抽样分布,平均数的抽样分布,无偏性,有偏,无偏,一致性,学生成绩30405060708090,按随机原则抽选出5名学生,并计算平均分数。

n=4时的抽样分布,n=5时的抽样分布,为的无偏、有效、一致估计量;

为的无偏、有效、一致估计量;

为的无偏、有效、一致估计量。

数理统计证明:

抽样估计量的优良标准,区间估计,给出一个区间(置信区间)并推断真正的参数以一定的概率存在于这个区间的方法。

抽样平均误差,指每一个可能样本的指标值与总体指标值之间平均离差,即一系列样本指标的标准差,式中:

为样本平均数的抽样平均误差;

为可能的样本数目;

为第个可能样本的平均数;

为总体平均数,注意:

不要混淆抽样标准差与样本标准差!

抽样平均误差的计算,样本平均数的抽样平均误差,当N500时,有,重复抽样时:

不重复抽样时:

样本成数的抽样平均误差,重复抽样时:

当N500时,有,抽样平均误差的计算公式,关于总体方差的估计方法,用过去同类问题全面调查或抽样调查的经验数据代替;

用样本标准差代替总体标准差,用代替。

抽样平均误差的计算公式,影响抽样误差的因素,总体各单位标志值的差异程度(即标准差的大小):

越大,抽样误差越大;

样本单位数的多少:

越大,抽样误差越小;

抽样方法:

不重复抽样的抽样误差比重复抽样的抽样误差小;

抽样组织方式:

简单随机抽样的误差最大。

抽样极限误差,指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最能范围,也称作抽样允许误差。

常用大可表示。

上式表明:

样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。

由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差的实际意义是希望总体平均数(成数)落在某个已知的范围内。

抽样极限误差,所以前面的不等式应变换为:

在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。

即抽样极限误差通常表示为抽样平均误差的多少倍。

由于t值与样本估计值落入允许误差范围内的概率有关,因此,t也称为概率度。

抽样估计的置信度,抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保证程度,也叫抽样估计的置信度,一般用F(t)表示。

即:

置信度,t值与相应的概率保证程度存在一一对应关,常用t值及相应的概率保证程度为:

t值概率保证程度1.000.68271.960.95002.000.95453.000.9973,在大样本下,68.27%,95.45%,99.73%,抽样极限误差,以样本统计量为中心,以抽样平均误差为距离单位,可以构造一个区间,并可以一定的概率保证待估计的总体参数落在这个区间之中。

区间越大,则概率保证程度越高。

区间估计原理,区间估计原理,0.6827,落在范围内的概率为68.27%,区间估计原理,0.9545,落在范围内的概率为95.45%,样本抽

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1