第十一章抽样法(统计学原理-南开大学,陆宇建).pptx

上传人:j*** 文档编号:30840970 上传时间:2024-01-31 格式:PPTX 页数:122 大小:464.99KB
下载 相关 举报
第十一章抽样法(统计学原理-南开大学,陆宇建).pptx_第1页
第1页 / 共122页
第十一章抽样法(统计学原理-南开大学,陆宇建).pptx_第2页
第2页 / 共122页
第十一章抽样法(统计学原理-南开大学,陆宇建).pptx_第3页
第3页 / 共122页
第十一章抽样法(统计学原理-南开大学,陆宇建).pptx_第4页
第4页 / 共122页
第十一章抽样法(统计学原理-南开大学,陆宇建).pptx_第5页
第5页 / 共122页
点击查看更多>>
下载资源
资源描述

第十一章抽样法(统计学原理-南开大学,陆宇建).pptx

《第十一章抽样法(统计学原理-南开大学,陆宇建).pptx》由会员分享,可在线阅读,更多相关《第十一章抽样法(统计学原理-南开大学,陆宇建).pptx(122页珍藏版)》请在冰豆网上搜索。

第十一章抽样法(统计学原理-南开大学,陆宇建).pptx

第十一章抽样法,1,第一节抽样法的意义和作用,一、抽样法的特点抽样法在统计调查和统计分析中都有广泛的应用。

抽样法是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计判断,从而达到对全部研究对象的认识的一种统计方法。

2,抽样法的基本特点:

(1)根据部分实际资料对全部总体的数量特征作出估计。

通过抽样调查,取得部分单位的实际材料,据以计算抽样的综合指标,然后对于总体的规模、水平、结构指标作出估计。

3,

(2)按随机的原则从全部总体中抽选样本单位。

(3)抽样推断的抽样误差可以事先计算并反加以控制。

抽样推断是以部分资料推算全体,虽然存在一定的抽样误差,但它可以事先通过一定资料加以计算,并且能够采取一定的组织措施来控制这个误差范围,保证抽样准断的结果达到一定的可靠程度。

4,二、抽样法的作用,第一,对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用抽样法。

如,工业生产中检验某些产品的质量时,常常具有破坏性。

如轮胎的里程检验、灯泡的寿命检验,纱布的强力检验、炮弹的杀伤力检验等。

有些现象的总体过大,单位过于分散,进行全面调查实际上是不可能的,例如要检验水库的鱼苗数,森林的木材积蓄丝等。

5,第二,对某些社会经济现象虽然可以进行全面调查但抽样法仍然有其独到的作用,例如:

抽样调查可以节省人力、费用,提高调查的经济效果。

抽样调查可以节省时间,提高调查的时效性。

抽样调查由于调查单位少,调查队伍经过专门训练,可以增加调查项目,取得比较详细的资料,并且提高资料的准确性。

6,第三,抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。

第四,抽样法可以用于工业生产过程的质量控制。

第五,利用抽样法原理,还可以对于某种总体的假设进行检验,来判断这种假设的真伪,决定行动的取舍。

7,三、抽样法的理论基础,

(一)大数法则就数量关系来说,抽样推断是建立在概率论的大数法则基础上,大数法则的一系列定理为抽样推断提供了数学依据。

8,大数法则即关于大量的随机现象具有稳定性质的法则。

它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对地小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,而显现出它们共同作用的倾向,使总体具有稳定的性质。

9,联系到抽样推断来看,大数法则证明:

如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以几乎趋近于l的概率,来期望抽样平均数与总体平均数的绝对离差为任意小,即对于任意的正数。

有:

10,

(二)中心极限定理,大数法则论证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要的依据。

但是,抽样平均数和总体平均数的离差究竟有多大?

离差不超过一定范围的概率究竞有多少?

这个离差的分市怎样?

大数法则并没有在这方面给出什么信息。

这个问题要利用另一重要的定理,即中心极限定理来研究。

中心极限定理证明:

如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布。

11,INTRODUCTIONTOINFERENTIALSTATISTICS,Statisticalinferenceistheprocessofmakinggeneralizationaboutapopulationfromasample.,Sincemostofthecharacteristicsofapopulationcanbedescribedbyparameters,inferentialstatisticsprimarilydeals,withtheestimationofanunknownpopulationparameterfromthecorrespondingsamplestatistic.,withtheverificationwhetherabelieforhypothesisaboutaparameterissupportedbythesampleevidence.,Estimation,Hypothesistesting,(E.g.:

Weestimateprobabilitymeasuresfromrelativefrequencies.),(E.g.:

Webelievethattheprobabilityofaneventis0.2andusingjustasamplewewanttofindoutwhetherthisisareasonableassumption.),12,Ex1:

Supposeweareinterestedinthefollowingpopulation:

X=1,2,3,4,5).,Sincethisisaverysmallpopulation(Nx=5),itiseasytoobservethewholepopulation,toillustrateitwitharelativefrequencyhistogramandtofindtheparameters,likethepopulationmeanandthepopulationvariance.,and,(Checkthedetails.),Thekeyconceptbehindthesestatisticalproceduresistheprobabilitydistribution,calledsamplingdistribution,ofasamplestatistic.,Asummaryofallpossiblevaluesofastatisticalongwiththecorrespondingprobabilities.,13,Thoughthesecalculationswerereallysimple,assumethat,forsomereason,wedonotobservethewholepopulation,butdrawallpossiblesamplesofsizetwo(n=2)withreplacement.,Thereare25possiblesamples.Theyareshowninthefirstrowandfirstcolumnofthetablebelow.,1stdraw(x1),2nddraw(x2),1.0,Computethesamplemeanfromeachofthesesamples.(E.g.:

Ifx1=1andx2=4,x-baris2.5.),2.5,3.5,2.0,2.5,3.0,1.5,2.0,2.5,3.0,3.5,2.0,2.5,3.0,3.5,4.0,3.0,3.5,4.0,4.5,3.0,1.5,4.0,4.5,5.0,Thesesamplemeanvaluesformasecondpopulation,X-bar1.,(Checkthedetails.),14,Repeatpartbassumingthistimethatsamplingiswithoutreplacement.,1stdraw(x1),2nddraw(x2),Thesesamplemeanvaluesformathirdpopulation,X-bar2.,(Sincesamplesaredrawnwithoutreplacement,thesamenumbercannotturnuptwice.),15,ComparetheX,X-bar1andX-bar2populationstoeachother.,X-bar1andX-bar2arelargerpopulationsthanX.,X,X-bar1andX-bar2havethesamemean.,XhasthebiggestvarianceandX-bar2hasthesmallest.,Theseresultssuggestthat,ItiseasiertoguessX-bar2thanX-bar1orX.,16,Apartfromtheirmeansandvariances,theX-bar1andX-bar2populationscanalsobecharacterizedbytheirshapes.,Notehowever,that,and,(TheserelationshipsbetweenthevariancesofX,X-bar1andX-bar2arevalidingeneral.),TheserelativefrequencyhistogramsaregraphicalrepresentationsoftheX-bar1andX-bar2samplingdistributions.,Apparently,bothsamplingdistributionsaresymmetricalaround=3.Nevertheless,theyaredifferentfromeachother,andbothofthemaredifferentfromthedistributionofX.,17,Howtotakeasample?

Inthisexampletheoriginalpopulation,X,isverysmall,sowecouldeasilycalculatethepopulationmean,x.Therewasnorealneedtodrawsamples.,Inpractice,however,thetargetpopulationisusuallymuchlarger.,Thepopulationaboutwhichwewanttodrawinferences.,Sinceitmightbeimpossibleorimpracticaltoobservethewholepopulation,wedrawasample.,Itisnotnecessarilythesamethanthesampledpopulation,i.e.thepopulationfromwhichweactuallytakethesample.,Thesamplemustberepresentative,i.e.itmusthavesimilarattributesthanthepopulationitself.,InordertoobtainreliableinformationfromasampleThetargetandsampledpopulationsshouldbeverysimilar,orthesameifpossible.,18,Evenasmallsampleislikelytogiveusfairlyaccurateinformationaboutthepopulation.(E.g.thesamplemeancanbeexpectedtobeclosetothepopulationmean.),Ifthesampleitemsareselectedrandomly,thesampleislikeascaled-downversionofthepopulation,unlessweareveryunlucky.,Ifthesampleisnotrandomlyselected,itislikelytoproducemisleading,biasedresults,evenifthesampleisrelativelylarge.,(E.g.Ifwewereattemptingtoestimatemeanearnings,butwefailedtosamplepeopleinmoreaffluentsuburbs,thesamplemeanwouldalmostcertainlyunderestimatethetruepopulationmean.),19,Thisexamplesuggeststhat,Ifweintendtouseasamplestatisticforstatisticalinference,firstwehavetostudyitssamplingdistribution.,(Ex1)Westudiedallpossiblesamplesofsize2drawnwithreplacement.Therewere25differentsamples.Ifweselectonlyoneofthem,butmakesurethatallthesesampleshavethesamechanceofbeingselected,thensamplingisassuredtobesimplerandomsampling.,Ifwedrawjustonesampleandithappenstobex1=1andx2=3,x-baris2.SincethetruemeanofXis3,theerroris1.Thisisasamplingerror.,Samplestatistics,likee.g.X-bar,arerandomvariablessincetheiractualvaluesvarydependingonwhichparticularsampleisselected.,The25possiblesamplesofsize2had9differentsamplemeanvalues:

1.0,1.5,2.0,2.5,3.0,3.5,4.0,4.5and5.0.,SAMPLINGDISTRIBUTIONS,20,TheresultsfromEx1canbegeneralizedasfollows.,Thesamplingdistributionofthesamplemeanscalculatedfromrandomsamplesofthesamesizehavethefollowingcharacteristics:

1),i.e.theexpectedvalueofthesamplemeanisthemeanofthesampledpopulation.,Thesamplemeanfromarandomsampleisourbestguessofthetruepopulationmean.,2),grantedthatsamplingiswithreplacement,orfromarelativelylarge,maybeinfinite,population.(Thepopulationisconsideredtobelargecomparedtothesampleifn/N0.10,i.e.nislessthan10%ofN.),Otherwise,Finitepopulationcorrectionfactor.,Likeprobabilitydistributionsingeneral,asamplingdistributioncanbedescribedbyitsthreeimportantproperties:

mean,standarddeviationandshape.,21,Asfortheshapeofthesamplingdistributionofthesamplemean,itdependsonthedistributionofthesampledpopulationandonthesamplesize.,Thestandarddeviationofthesamplemean(oranyotherstatistic)iscalledstandarderror.,Sincethemeanofthesamplemeanis,thestandarddeviationofthesamplemeanmeasurestheaveragedistancebetweenthesamplemeanandthepopulationmean.,Namely:

3)Ifthepopulation(X)isnormallydistributed,X-barisalsonormallydistributed,regardlessofthesamplesize.,Ifthepopulation(X)isnotnormallydistributed,orwedonotknowwhetheritisnormal,wecanrelyontheCentralLimitTheorem(CLT):

Ifthesamplesizeislarge(sayn30),X-barisapproximatelynormallydistributed,regardlessoftheshapeofthepopulation.,Themorebell-shapedthepopulationor/andthelargerthesamplesize,thebetterthisapproximationis.,22,Ex2:

Anautomaticmachineinamanufacturingprocessisoperatingproperlyifthelengthsofanimportsub-componentarenormallydistributed,withmean=117cmandstandarddeviation=2.1cm.,Findtheprobabilitythatonerandomlyselectedunithasalengthofgreaterthan120cm.,Findtheprobabilitythatifthreeunitsarerandomlyselected,theirmeanlengthexceeds120cm.,X,i.e.X:

N(117,2.1),n,SinceXisnormallydistributed,X-barisalsonormal,and,X-bar:

N(117,1.212),23,Theprobabilityofrandomlyselectingoneunitlongerthan120cmis7.64%,whiletheprobabilityofselectingthreeunitswithanaveragelengthofgreaterthan120cmisonly0.68%.,24,第二节总体和样本,、全及总体和抽样总体、全及指标和抽样指标、样本容量和样本个数,25,、全及总体和抽样总体,全及总体是所要研究的对象,又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。

全及总体单位数(N)一般很大。

26,抽样总体(又称子样),抽样总体则是所要观察的对象。

简称样本、子样,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。

样本的单位数(n)总是有限的。

全及总体和抽样总体两者是既有区别而又有联系的不同范畴。

27,样本容量,抽样总体的单位数,通常用小写英文字母n来表示。

随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。

28,样本的特点,在一次抽样调查中,全及总体是唯一确定的,样本是不确定的,具有随机性。

一个全及总体可能抽出很多个样本,可能样本的个数与样本容量和抽样方法有关。

29,如:

N=4n=2(考虑顺序)重置抽样时:

样本个数=16若改变样本单位数,取n=3,则,样本个数=44464应用数学排列计算公式:

N个元素中任取n个元素组成的可重复排列,30,如:

N=4n=2(考虑顺序)不重置抽样时:

样本个数=12若改变样本单位数,取n=3,则样本个数=43224应用数学排列计算公式:

N个元素中任取n个元素组成的不可重复排列,31,如:

N=4n=2(不考虑顺序)不重置抽样时:

样本个数=6若改变样本单位数,取n=3,则样本个数=(432)/(32)4应用数学组合计算公式:

N个元素中任取n个元素组成的不可重复排列,32,如:

N=4n=2(不考虑顺序)重置抽样时:

样本个数=10若改变样本单位数,取n=3,则样本个数=(654)/(32)20应用数学排列组合计算公式:

N个元素中任取n个元素组成的不可重复排列,33,判断题,从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。

(),答案:

一个全及总体可能抽出很多个样本,34,判断题,在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。

(),答案:

总体唯一,样本不唯一,35,.参数和统计量(全及指标和抽样指标),参数(全及指标)(parameter)根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指标称为全及指标。

全及指标值具有唯一性。

常用的全及指标有总体平均数()(或总体成数P)、总体标准差(或总体方差2)。

36,不同性质的总体,需要计算不同的全及指标。

对于变量总体,由于各单位的标志可以用数量来表示,所以可以计算总体平均数。

37,对于属性总体,由于各单位的标志不可以用数量来表示,只能计算比重结构指标,称为总体成数。

用大写英文字母P来表示,它说明总体中具有某种标志表现的单位数在总体中所占的比重。

设总体N个单位中,有N1个单位具有某种标志表现的,N0个单位不具有某种标志表现,N1+N0N,P为总体中具有某种标志表现的单位数所占的比重,Q为不具有某种标志表现的单位数所占的比重,则总体成数为,38,此外,全及指标还有总体标准差和总体方差,它们都是测度总体标志值离散程度的指标。

39,统计量(抽样指标),由抽样总体各单位标志值计算出来反映样本

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1