统计学之抽样分布.pptx

上传人:j*** 文档编号:30846516 上传时间:2024-02-03 格式:PPTX 页数:88 大小:897.60KB
下载 相关 举报
统计学之抽样分布.pptx_第1页
第1页 / 共88页
统计学之抽样分布.pptx_第2页
第2页 / 共88页
统计学之抽样分布.pptx_第3页
第3页 / 共88页
统计学之抽样分布.pptx_第4页
第4页 / 共88页
统计学之抽样分布.pptx_第5页
第5页 / 共88页
点击查看更多>>
下载资源
资源描述

统计学之抽样分布.pptx

《统计学之抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计学之抽样分布.pptx(88页珍藏版)》请在冰豆网上搜索。

统计学之抽样分布.pptx

第四章抽样分布第四章抽样分布从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。

现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。

如:

选民人数:

每个候选人的支持率是多少?

产品:

不合格率是多少?

环境:

污染程度如何?

市场:

品种、价格、质量状况、购买力等情况的了解。

在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。

24年2月3日24年2月3日1主要内容主要内容4.1抽样的一般问题抽样的一般问题4.2三种不同性质的分布三种不同性质的分布4.3一个总体参数推断时样本一个总体参数推断时样本统计量统计量的抽样分布的抽样分布4.4两个总体参数推断时样本两个总体参数推断时样本统计量统计量的抽样分布的抽样分布4.5其他抽样方法其他抽样方法24年2月3日24.1抽样的一般问题抽样的一般问题w4.1.1一个例子一个例子w4.1.2统计抽样的几个基本概念统计抽样的几个基本概念w4.1.3简单随机抽样简单随机抽样24年2月3日34.1.1一个例子一个例子本例中存栏肉猪10000头组成的集合,则称为总体,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。

一般总体的单位总数用N表示,称作总体容量。

本例中所抽出的100头肉猪组成的集合,则称为样本,它是指在统计抽样中按照“随机原则”从总体N(10000)中抽出的部分单位(每个单位称作样本单位)所组成的整体,又称子样。

一般样本的单位总数用n(100)表示,称作样本容量。

样本不具惟一性,它的可能个数与N、n及抽样方法有关。

通常n30称为小样本,n30称为大样本,在抽样调查中取大或小样本会直接影响到抽样分布的特征。

例例某养猪厂共有存栏肉猪某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平头,现欲了解这批肉猪平均每头毛重均每头毛重(设为设为),如果将每头肉猪过称去获取数据,如果将每头肉猪过称去获取数据将是不合算的。

我们可以按照“随机原则”从中抽出将是不合算的。

我们可以按照“随机原则”从中抽出100头头称重量,计算这称重量,计算这100头的平均每头毛重,以达到我们期望的头的平均每头毛重,以达到我们期望的目的。

目的。

24年2月3日24年2月3日41、总体和样本、总体和样本总体:

研究对象全体,又称母体。

容量用总体:

研究对象全体,又称母体。

容量用N表示。

表示。

具备惟一性。

具备惟一性。

样本:

按随机原则从总体中抽出的部分单位的全体,样本:

按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。

样本容量用被抽出的每个单位称样本单位。

样本容量用n表示。

表示。

样本不具惟一性。

样本不具惟一性。

当当n30时,为小样本。

时,为小样本。

当当n30时,为大样本。

时,为大样本。

4.1.2统计抽样的几个基本概念统计抽样的几个基本概念24年2月3日24年2月3日52、总体参数和样本统计量、总体参数和样本统计量根据全及总体各单位变量值计算的反映全根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,及总体某数量特征的综合指标,由于总体唯一确定,故称总体参数。

故称总体参数。

如上例中的如上例中的根据样本各单位变量值计算的反映样本某根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故方面数量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。

称为样本统计量,它是一个随机变量。

如上例中的抽出如上例中的抽出100头肉猪的平均每头毛头肉猪的平均每头毛重重4.1.2统计抽样的几个基本概念统计抽样的几个基本概念24年2月3日24年2月3日63、重复抽样与不重复抽样、重复抽样与不重复抽样从总体中抽取样本有两种方法:

重复抽样和不重复抽样。

从总体中抽取样本有两种方法:

重复抽样和不重复抽样。

重复抽样,抽样安排重复抽样,抽样安排-对每次被抽到的单位经登记后再放回对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。

在每次的抽取中样总体,重新参与下一次抽选的抽样方法。

在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。

立的试验。

不重复抽样,抽样安排不重复抽样,抽样安排-对被抽到的单位登记后不再放回总对被抽到的单位登记后不再放回总体的抽样方法。

不重复抽样与重复抽样比较,每次抽样的条体的抽样方法。

不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。

统计中称这样的抽样为相互不独立的试验。

4.1.2统计抽样的几个基本概念统计抽样的几个基本概念24年2月3日24年2月3日74.1.3简单随机抽样简单随机抽样也称为纯随机抽样。

它是对总简单随机抽样也称为纯随机抽样。

它是对总体单位不做任何分类或排队,直接从总体中按“随机原体单位不做任何分类或排队,直接从总体中按“随机原则”抽取样本单位的调查方式。

则”抽取样本单位的调查方式。

为了便于抽取样本单位,一般在明确抽样框为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签的条件下,对总体的每个单位都要编号,然后用抽签式或利用随机数字表进行抽取。

式或利用随机数字表进行抽取。

例如:

例如:

N=500n=10编码从编码从1-500号号在随机数表中随意选取二个数字,假如得到在随机数表中随意选取二个数字,假如得到4行行,43列。

则选取的号码从这个被选中的数开始,由于列。

则选取的号码从这个被选中的数开始,由于500是个三位数,则小于是个三位数,则小于500的连续三位数即为中选号的连续三位数即为中选号码,见表中所示。

码,见表中所示。

24年2月3日24年2月3日84.1.3简单随机抽样24年2月3日24年2月3日9随机数字表随机数字表974523894212764659099874763642265930598416765870063489962435986633289080365223647065436387132769087912870877652136217721987876434648908327692164896589707743443114228900120874321123043757596721325779959424252386487990344321776095542148797544753769799703777976849877808423277800686921337687908262130892953544320821489900857065432549065643322324379098546476793243438700534521648784542176590879216760896543657897964358650841934325253443876707694637567488125487698767432198453248906034076543324587078676983286548900808463421243326577907963645324908743432923769876672137860769880052326743797343433874856049325477690732437004352187799990135878700821257497682365879048876598023412688032359323314766236689743176944327679094232155023233793203622123793478794235.4.2三种不同性质的分布三种不同性质的分布4.2.1几种常见分布几种常见分布4.2.2总体分布总体分布4.2.3样本分布样本分布4.2.4抽样分布抽样分布4.2.5样本推断总体的理论依据样本推断总体的理论依据这些内容与前面内这些内容与前面内容有什么关系容有什么关系?

24年2月3日10一、分布的含义一、分布的含义w1、在随机试验中,若、在随机试验中,若X随着试验结果的不随着试验结果的不同而随机地取各种不同的数值,并且对取每同而随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率一个数值或某一范围内的值都有相应的概率,则称,则称X为一个随机变量。

为一个随机变量。

w2、随机变量取一切可能值或范围与其相应随机变量取一切可能值或范围与其相应概率间一一对应的关系,称为概率分布概率间一一对应的关系,称为概率分布(pro(probabilitydistribution,babilitydistribution,简称分布简称分布)。

w33、概率分布是关于总体的概念,有了概率概率分布是关于总体的概念,有了概率分布就等于知道了总体。

分布就等于知道了总体。

w4、概率分布可以用各种图或表来表示,一、概率分布可以用各种图或表来表示,一些可以用公式来表示。

些可以用公式来表示。

4.2.1几种常见分布几种常见分布24年2月3日11二、正态分布二、正态分布4.2.1几种常见分布几种常见分布w定义24年2月3日12w正态分布的密度函数图形是一条以均值为中心正态分布的密度函数图形是一条以均值为中心的对称钟型曲线的对称钟型曲线二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日13w正态分布密度函数的数学性质二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日14()fxw标准正态分布及其重要意义标准正态分布及其重要意义二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日15w标准化法标准化法二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日16w标准化法的几何意义标准化法的几何意义w标准化变换实质上是作了一个坐标轴的平移和标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数尺度变换,使正态分布的平均数,标准差。

,标准差。

二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日170m=1s=w正态分布表及上侧分位数正态分布表及上侧分位数二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日18w准则二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日193s准则示意图准则示意图二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日203sw正态分布的重要意义正态分布的重要意义在随机理论中,正态分布是最重要的一种分在随机理论中,正态分布是最重要的一种分布布,理由如下:

理由如下:

w它是最常见的一种分布,现实中许多随机变它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。

量服从或近似服从正态分布。

w在一定的条件下,正态分布是其他分布的近在一定的条件下,正态分布是其他分布的近似分布。

似分布。

w许多有用的分布,特别是小样本的精确分布许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。

是由正态分布推导出来的。

二、正态分布二、正态分布4.2.1几种常见分布几种常见分布24年2月3日21三、小样本三、小样本(n30)的精确分布的精确分布w1、2分布w2、t分布w3、F分布均由正态分布导出的分布4.2.1几种常见分布几种常见分布24年2月3日221、2分布分布(2distribution)

(1)推导说明)推导说明由阿贝由阿贝(Abbe)于于1863年首先给出,后来由海尔墨年首先给出,后来由海尔墨特特(Hermert)和卡和卡皮尔逊皮尔逊(KPearson)分别于分别于1875年和年和1900年推导出来。

年推导出来。

设,则设,则构造,则构造,则Yi服服从自由度为从自由度为1的的2分布,即分布,即当总体,从中抽取容量为当总体,从中抽取容量为n的的样本,则样本,则4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日23),(2NX)1,0(NXz2(1,2,.,)iiYzin=22

(1),()iiYYncc),(2NX)1

(1)(222212nSnxxnii1、2分布分布

(2)性质和特点)性质和特点由于由于2分布变量为正态变量的平方和,故分布变量为正态变量的平方和,故分布的变量分布的变量值始终为正。

值始终为正。

可加性:

若可加性:

若U和和V为两个独立的服从为两个独立的服从2分布的随机变分布的随机变量,量,U2(n1),V2(n2),则则U+V这一随机变量服从这一随机变量服从自由度为自由度为n1+n2的的2分布。

分布。

n个独立正态变量平方和称为有个独立正态变量平方和称为有n个自由度的个自由度的cc2-分布分布,记为记为cc2(n)。

cc2-分布为一族分布分布为一族分布,成员由自由度区成员由自由度区分。

分。

分布的形状取决于其自由度分布的形状取决于其自由度n的大小,通常为不对称的的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。

正偏分布,但随着自由度的增大逐渐趋于对称。

期望为期望为E

(2)=n,方差为,方差为D

(2)=2n(n为自由度为自由度)4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日2411、cc2分布分布(3)图示)图示选择容量为选择容量为n的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值2=(n-1)s2/2计算出所有的计算出所有的2值值不同容量样本的抽样分布不同容量样本的抽样分布cc22n=1n=4n=10n=20mmss总体总体4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日2511、cc2分布分布(4)cc2分布的分布的上分位点分位点分位点设分位点设X2(n),若对于,若对于:

01,存在存在,满足则称为分布的上分位点。

4.2.1几种常见分布几种常见分布三、三、小样本小样本(n2(),PXnaca2()nac2()nc2()nac由统计学家哥赛特(由统计学家哥赛特(W.S.Gosset)于)于1908年提出,并以其笔名命名。

年提出,并以其笔名命名。

22、t-分布分布(t-distribution)

(1)t分布的构造及性质分布的构造及性质4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布构造:

构造:

若若N(0,1),2(n),与与独立,则独立,则t(n)称为自由度为称为自由度为n的的t分布。

分布。

基本性质:

基本性质:

(1)f(t)关于关于t=0(纵轴纵轴)对称。

对称。

(2)f(t)的极限为的极限为N(0,1)的密度函数,即的密度函数,即24年2月3日27()./Ttnnxh=221lim()(),2tnfttexjp-=-t(n)分布的图形为22、t-分布分布(t-distribution)

(2)t分布的图示分布的图示4.2.1几种常见分布几种常见分布三、三、小样本小样本(nt0.05)=0.05P(tt0.05)=1-=0.95w对于给定的对于给定的:

0taa)=aa的点的点taa为为t(n)分布的上分布的上aa分位分位点点。

22、t-分布分布(t-distribution)(3)t分布的上分布的上aa分位点分位点4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日29)(1nt)(nt由统计学家费希尔由统计学家费希尔(R.A.Fisher)提出的,以其提出的,以其姓氏的第一个字母来命名姓氏的第一个字母来命名构造:

设若构造:

设若U为服从自由度为为服从自由度为n1的的2分布,分布,即即U2(n1),V为服从自由度为为服从自由度为n2的的2分布,分布,即即V2(n2),且,且U和和V相互独立,则相互独立,则称称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为33、F分布分布(Fdistribution)

(1)F分布的构造分布的构造4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日3021nVnUF),(21nnFFF分布(图示)不同自由度的不同自由度的F分布分布F(1,10)(5,10)(10,10)33、F分布分布(Fdistribution)

(2)F分布的图示分布的图示4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日31wF分布的分位点:

分布的分位点:

w对于对于:

01,若满足条件:

若满足条件:

PFF(n1,n2)=,则称,则称F(n1,n2)为为F(n1,n2)的的上上分位点分位点33、F分布分布(Fdistribution)(3)F分布的上分布的上aa分位点分位点4.2.1几种常见分布几种常见分布三、三、小样本小样本(n30)的精确分布的精确分布24年2月3日32),(21nnF12(,)Fnna1)总体中各元素的观察值所形成的相对频数)总体中各元素的观察值所形成的相对频数(频率)分布(频率)分布2)分布通常是未知的(因为几乎得不到总图)分布通常是未知的(因为几乎得不到总图所有观察值)所有观察值)3)可以根据理论分析假定它服从某种分布)可以根据理论分析假定它服从某种分布总体总体4.2.2总体分布总体分布24年2月3日331)一个样本中各观察值形成的相对频数)一个样本中各观察值形成的相对频数(频率)分布(频率)分布2)也称经验分布)也称经验分布3)当样本容量)当样本容量n逐渐增大时,样本分布逐逐渐增大时,样本分布逐渐接近总体的分布渐接近总体的分布样样本本4.2.3样本分布样本分布24年2月3日3411、统计量与参数、统计量与参数11)在抽样推断中,无论是总体还是样本,都可以用平)在抽样推断中,无论是总体还是样本,都可以用平均数、比例均数、比例(或成数或成数)、标准差和方差等指标来描、标准差和方差等指标来描述它们的特征。

当它们用来描述样本的特征时,称述它们的特征。

当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为为样本统计量;当它们用来描述总体特征时,称为总体参数。

总体参数。

22)样本统计量是样本的函数,依据不同的样本计算出)样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量,如样本来的值是不同的,所以统计量是随机变量,如样本均值均值,样本比例,样本方差等样本比例,样本方差等4.2.4抽样分布抽样分布24年2月3日352、抽样分布的含义、抽样分布的含义1)含义:

)含义:

样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布,在重复选取容量为,在重复选取容量为nn的样本时,由该统计量的所有的样本时,由该统计量的所有可能取值形成的相对频数分布。

可能取值形成的相对频数分布。

2)构造抽样分布包括以下几个步骤:

)构造抽样分布包括以下几个步骤:

(1)从容量为)从容量为N的有限总体中随机抽出容量的有限总体中随机抽出容量为为n的所有可能样本;的所有可能样本;

(2)算出每个样本的统计量数值;)算出每个样本的统计量数值;(3)算出与每个样本统计量数值相对应的概)算出与每个样本统计量数值相对应的概率,作频数分布表。

率,作频数分布表。

4.2.4抽样分布抽样分布24年2月3日24年2月3日363、总体分布、样本均值的抽样分布、总体分布、样本均值的抽样分布(例题分例题分析析)【例】设一个总体,【例】设一个总体,含有含有4个元素个元素(个体个体),即总,即总体单位数体单位数N=4。

4个个体分别为个个体分别为x1=1,x2=2,x3=3,x4=4。

总体分布、总体均值、总体方差如。

总体分布、总体均值、总体方差如下。

下。

总体分布总体分布14230.1.2.3均值和方差均值和方差4.2.4抽样分布抽样分布24年2月3日375.21NxNii25.1)(122NxNii现从总体中抽取现从总体中抽取n2的简单随机样本,在重复的简单随机样本,在重复抽样条件下,共有抽样条件下,共有42=16个样本。

所有样本的结果为个样本。

所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2的样本(共的样本(共16个)个)4.2.4抽样分布抽样分布24年2月3日38x样本均值的抽样分布样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5计算出各样本的均值,如下表,并给出样计算出各样本的均值,如下表,并给出样本均值的抽样分布本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值个样本的均值(x)4.2.4抽样分布抽样分布24年2月3日39样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.52=1.25的分布形式与原有总体的分布和样本容的分布形式与原有总体的分布和样本容量量n的大小等因素有关的大小等因素有关总体分布总体分布14230.1.2.3抽样分布抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x4.2.4抽样分布抽样分布24年2月3日405.2x625.02xx4、抽样分布的意义、抽样分布的意义因为样本均值是一个随机变量,因此,因为样本均值是一个随机变量,因此,与其他随机变量一样,具有平均数(期望)、方与其他随机变量一样,具有平均数(期望)、方差和概率分布。

因为的各种可能取值是不同简差和概率分布。

因为的各种可能取值是不同简单随机抽样的结果,所以的概率分布称为的单随机抽样的结果,所以的概率分布称为的抽样分布。

对于这个抽样分布及其特征的了解,可以抽样分布。

对于这个抽样分布及其特征的了解,可以使我们能够对样本均值与总体均值的接近程度进使我们能够对样本均值与总体均值的接近程度进行概率描述。

行概率描述。

4.2.4抽样分布抽样分布意义:

抽样分布一方面描述了样本的随机性意义:

抽样分布一方面描述了样本的随机性,提供了样本统计量长远而稳定的信息即变化规律;,提供了样本统计量长远而稳定的信息即变化规律;另一方面建立了样本与总体的联系,是进行推断的理另一方面建立了样本与总体的联系,是进行推断的理论基础,也是抽样推断科学性的重要依据。

论基础,也是抽样推断科学性的重要依据。

24年2月3日24年2月3日41xxxxxx一、大数定律一、大数定律w1、是关于均值具有稳定性的一类定律。

、是关于均值具有稳定性的一类定律。

w2、以切比雪夫大数定律为例。

、以切比雪夫大数定律为例。

w设随机变量相互独立,且具有相设随机变量相互独立,且具有相同的有限数学期望和方差

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 职业教育 > 职业技术培训

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1