抽样与抽样分布教材.pptx
《抽样与抽样分布教材.pptx》由会员分享,可在线阅读,更多相关《抽样与抽样分布教材.pptx(53页珍藏版)》请在冰豆网上搜索。
第3章抽样与抽样分布,-2,本章内容,3.3抽样误差与抽样分布,-3,3.1总体与样本,一、全及总体与抽样总体1、全及总体指调查对象的全部单位构成的整体,即具有某种共同性质的若干单位的集合体。
简称总体、母体。
可分为有限总体和无限总体总体单位数用N来表示2、抽样总体从全及总体中按照随机原则抽取一部分单位构成的集合体。
简称样本、子样。
大样本和小样本样本单位数用n来表示,-4,二、全及指标和抽样指标1、全及指标根据总体各单位标志值计算的反映总体数量特征的综合指标,也称为总体指标或总体参数。
(1)总体平均数,-5,
(2)总体成数成数是用来表示总体中具有某种性质的单位数在总体全部单位数中所占的比重。
定义:
当总体的一个现象有两种表现时,其中具有某一种表现的单位数占总体单位数目的比重,叫总体成数,简称成数。
例:
某灯泡厂生产的10000只灯泡中,有450只不合格,则不合格率:
P=450/10000=4.5%合格率:
Q=1-P=95.5%,-6,(3)总体标准差和总体方差说明总体单位之间标志值变异程度的指标。
-7,2、抽样指标根据抽样总体各单位标志值计算的综合指标,又称为样本指标
(1)抽样平均数,-8,
(2)抽样成数定义:
在抽样总体中,一个现象有两种表现时,其中具有某一种表现的单位数占抽样总体单位数目的比重,叫抽样成数,或样本成数。
例:
某灯泡厂生产的10000只灯泡中,从中抽取1000只进行检验,其中有50只不合格,则样本不合格率:
p=50/1000=5%合格率:
q=1-p=95%,-9,(3)抽样总体标准差和抽样总体方差说明抽样总体单位之间标志值变异程度的指标。
-10,三、抽样方法1、重复抽样2、不重复抽样,-11,四、样本容量和样本个数1、样本容量指一个样本总体所包含的单位数2、样本个数指从一个全及总体中可能抽取的样本个数,-12,例:
在总体中有A、B、C、D四个单位,现确定样本容量为2个,可能的样本个数有多少个?
解:
(1)重复抽样条件下,
(2)不重复抽样条件下,-13,3.2抽样的组织形式,一、简单随机抽样(纯随机抽样)二、类型抽样(分类抽样)三、机械抽样(等距抽样)四、整群抽样,-14,一、简单随机抽样(纯随机抽样),1、概念对全及总体的所有单位不进行任何分类或排队,按照随机原则直接从总体单位N中抽取n个单位作为样本,保证每个单位在抽选中都有相等的中选机会。
2、具体抽样方法将总体各单位编号,然后随机抽取,直到抽够预定数目。
例:
现有10000个总体单位,随机抽取100个样本单位。
-15,二、类型抽样(分类抽样),1、概念先将总体按某个标志分成若干组,再随机从各组中抽取样本单位。
2、具体抽样方法
(1)不等比例类型抽样法
(2)等比例类型抽样法,例:
法政系有在校生420人,分别由公管120人,法学180,社工120三个专业组成,现要从中抽取100调查其就业倾向,如何抽取?
-16,三、机械抽样(等距抽样),1、概念将总体各单位按某一标志进行排序,然后再按固定的顺序和间隔来抽选样本单位。
2、具体抽样方法
(1)无关标志排队法例:
产品质量检验
(2)有关标志排队法例:
居民家庭收支调查,注意:
间隔k=N/n取整第一个样本单位的确定:
如果是按无关标志排队,可以从第一个间隔内的任意一个单位开始抽取;如果是按有关标志排队,考虑到样本单位的代表性,一般从第一间隔内居中的单位开始抽取。
-17,四、整群抽样,1、概念将总体单位划分成若干群,然后以群为单位从中随机抽取一些群,对被抽中群的所有单位进行全面调查的一种抽样组织形式。
例:
现在抽查农村居民生活水平状况,不直接抽取居民户,而是以村为单位,抽选若干村,然后对这些村的全体居民户进行调查。
-18,3.3抽样误差与抽样分布,一、抽样误差1、误差及其种类
(1)误差:
由样本得到的估计值与被估计的总体未知真实特征值之差。
(2)种类,-19,2、抽样误差的概念指根据样本数据计算而得到的样本统计量与被估计的未知的总体参数真值之间的随机误差。
3、影响抽样误差的因素
(1)抽样单位数目的多少
(2)总体被研究标志的变异程度(3)抽样方法和组织形式的不同4、抽样平均误差指抽样平均数(或抽样成数)的标准差。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。
-20,
(1)抽样平均数的平均误差(抽样均值误差)重复抽样,不重复抽样,称为修正系数,注意啦:
当抽样比例小于5%时,不区别抽样方法影响,-21,
(2)抽样成数的平均误差重复抽样,不重复抽样,称为修正系数,-22,二、抽样分布在同一个总体中抽出样本容量相同的所有可能样本后,计算每个样本统计量的值和相应的概率,就组成样本统计量的概率分布,简称抽样分布。
(一)重复抽样分布1、抽样平均数的抽样分布是由所有样本平均数的值与其相应的概率表示。
-23,样本均值的抽样分布,【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
4个个体分别为X1=1、X2=2、X3=3、X4=4。
总体的均值、方差及分布如下,均值和方差,-24,样本均值的抽样分布,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。
所有样本的结果如下表,-25,样本均值的抽样分布,计算出各样本的均值,如下表。
并给出样本均值的抽样分布,-26,所有样本均值的均值和方差,式中:
M为样本数目比较及结论:
1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n,-27,样本均值的分布与总体分布的比较,抽样分布,=2.52=1.25,总体分布,P(x),-28,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为,方差为2/n。
即xN(,2/n),-29,当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布,中心极限定理(图示),中心极限定理:
设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值x的抽样分布近似服从均值为、方差为2/n的正态分布,-30,二、抽样分布
(一)重复抽样分布2、抽样成数的抽样分布例:
对某种产品质量的合格率进行检验,现用重复抽样方法,从总体中抽取100个样本进行检验,其合格率p=95%,其抽样平均误差为:
-31,根据中心极限定理可知,当样本容量足够大时,样本均值的抽样分布逐渐趋于正态分布。
而抽样成数的样本容量足够大的条件是np5和n(1-p)5,而本例中n=100,p=0.95,所以服从正态分布,即pN(p,p(1-p)/n),-32,二、抽样分布
(二)不重复抽样分布1、抽样平均数的抽样分布【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
4个个体分别为X1=1、X2=2、X3=3、X4=4。
总体的均值2.5、方差1.25,-33,样本均值的抽样分布,现从总体中抽取n2的简单随机样本,在不重复抽样条件下,共有43=12个样本。
所有样本的结果如下表,-34,样本均值的抽样分布,计算出各样本的均值,如下表。
并给出样本均值的抽样分布,-35,12个样本的均值(x),样本均值的抽样分布,-36,所有样本均值的均值和方差,式中:
M为样本数目比较及结论:
1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n再乘以调整系数,-37,二、抽样分布
(二)不重复抽样分布2、抽样成数的抽样分布例:
某种产品质量的合格率进行检验,现用不重复抽样方法,从总体中抽取100个样本进行检验,其合格率p=95%,N=10000,其抽样平均误差为:
样本方差的抽样分布,-39,卡方分布定义,设X1,X2,Xn为来自总体N(0,1)的样本,则称统计量,服从自由度为n的卡方分布简记为:
-40,卡方分布定义,对于给定的正数a,0a1,称满足条件,的点,为卡方分布的上a分位点。
a,-41,样本方差的分布,设总体服从正态分布XN(,2),X1,X2,Xn为来自该正态总体的样本,则样本方差s2的分布为,将2(n1)称为自由度为(n-1)的卡方分布,-42,卡方(c2)分布,选择容量为n的简单随机样本计算样本方差S2,计算卡方值2=(n-1)S2/2,计算出所有的2值,-43,样本统计量,样本均值,样本成数,样本方差,正态总体或非正态总体大样本,正态总体小样本,2分布,正态分布,t分布,正态分布,大样本,T统计量的分布,-45,学生氏分布定义,设XN(0,1),Yc2(n),并且X,Y独立,则称随机变量,服从自由度为n的t分布,记为tt(n),-46,t分布定义,对于给定的正数a,0a1,称满足条件,的点,为t(n)分布的上a分位点。
a,-47,T统计量的分布,设X1,X2,Xn是来自正态总体N(1,12)的一个样本,称,为统计量,它服从自由度为(n-1)的t分布,两个样本方差比的抽样分布,-49,F分布定义,设Uc2(n1),Vc2(n2),且U,V独立,则称随机变量,服从自由度为(n1,n2)的F分布,记为FF(n1,n2),-50,F分布定义,对于给定的正数a,0a1,称满足条件,的点,为F分布的上a分位点。
a,-51,两个样本方差比的抽样分布,设X1,X2,Xn1是来自正态总体N(1,12)的一个样本,Y1,Y2,Yn2是来自正态总体N(2,22)的一个样本,且Xi(i=1,2,,n1),Yi(i=1,2,,n2)相互独立,则,将F(n1-1,n2-1)称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布,-52,两个样本方差比的抽样分布,不同样本容量的抽样分布,-53,结束,