总体和样本.ppt

上传人:b****2 文档编号:2648715 上传时间:2022-11-05 格式:PPT 页数:73 大小:2.24MB
下载 相关 举报
总体和样本.ppt_第1页
第1页 / 共73页
总体和样本.ppt_第2页
第2页 / 共73页
总体和样本.ppt_第3页
第3页 / 共73页
总体和样本.ppt_第4页
第4页 / 共73页
总体和样本.ppt_第5页
第5页 / 共73页
点击查看更多>>
下载资源
资源描述

总体和样本.ppt

《总体和样本.ppt》由会员分享,可在线阅读,更多相关《总体和样本.ppt(73页珍藏版)》请在冰豆网上搜索。

总体和样本.ppt

1.1.总体和样本总体和样本一、总体和样本一、总体和样本例某钢铁厂某天生产某钢铁厂某天生产10000根钢筋,规定强根钢筋,规定强度小于度小于52kg/mm2的算作次品,如何来求这的算作次品,如何来求这批钢筋的次品率?

是否需要测量每根钢筋的批钢筋的次品率?

是否需要测量每根钢筋的强度呢?

强度呢?

一般来说是不需要的一般来说是不需要的.只要从这只要从这10000根根钢筋中抽取一部分,比如钢筋中抽取一部分,比如100根,测量这根,测量这100根钢筋的强度,就可以推断出整批钢筋根钢筋的强度,就可以推断出整批钢筋的次品率了,这就是抽样检验的次品率了,这就是抽样检验.事事实上,全面检验是有困难的实上,全面检验是有困难的

(1)有些检验是有破坏性的,如使用寿命有些检验是有破坏性的,如使用寿命;

(2)产品数量大,或检验成本太高,人力、物力、产品数量大,或检验成本太高,人力、物力、时间不允许等时间不允许等例如:

有一批棉花,需要检查纤维的长度,我们例如:

有一批棉花,需要检查纤维的长度,我们当然不可能去测量每一根棉花纤维的长度。

当然不可能去测量每一根棉花纤维的长度。

数理统计提供了一整套方法,保证可以通数理统计提供了一整套方法,保证可以通抽样检验做出可靠的科学结论。

抽样检验做出可靠的科学结论。

直观地说,直观地说,被观察对象的全体称作总体;总体被观察对象的全体称作总体;总体的每一基本单元称作个体或样品;从总的每一基本单元称作个体或样品;从总体中抽出的一部分个体组成一个样本,体中抽出的一部分个体组成一个样本,样本中所含个体的个数称作样本的容量样本中所含个体的个数称作样本的容量或大小。

或大小。

如前例所说,如前例所说,10000根钢筋的强度是根钢筋的强度是总体,每一根钢筋的强度是一个个体,总体,每一根钢筋的强度是一个个体,抽查的抽查的100根钢筋的强度是一个样本,它根钢筋的强度是一个样本,它的容量是的容量是100。

更确切的说,对这批钢筋,我们关心的更确切的说,对这批钢筋,我们关心的是它的强度的分布,如强度低于是它的强度的分布,如强度低于52kg/mm2的比例是多少的比例是多少.设设X表示表示“任一根钢筋的强度任一根钢筋的强度”,X是是一个随机变量一个随机变量.它的概率分布就反映了这批它的概率分布就反映了这批钢筋的强度的分布,即把总体看做一个随机钢筋的强度的分布,即把总体看做一个随机变量。

变量。

从总体中抽取一个个体就是做一次随从总体中抽取一个个体就是做一次随机试验,而机试验,而“任取任取n根钢筋,测其强度根钢筋,测其强度”就是做就是做n次随机试验,得到容量为次随机试验,得到容量为n的样的样本本.因为抽取是随机的,故可以样本看做因为抽取是随机的,故可以样本看做n个随机变量个随机变量。

当试验是同重复独立试验时,当试验是同重复独立试验时,与总体与总体有相的分布,这样的样本称作有相的分布,这样的样本称作简单随机样本。

简单随机样本。

一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是

(1)与总体与总体X有相同的分布有相同的分布

(2)相互独立相互独立简单随机样本简单随机样本N/n10.总体中个体总数总体中个体总数样本容量样本容量由定义由定义,若总体若总体是离散型随机变量,其分是离散型随机变量,其分布律为布律为则样本则样本的联合分布为的联合分布为若若是连续型随机变量,其分布密度为是连续型随机变量,其分布密度为则样本则样本的联合分布密度是的联合分布密度是二、频率分布表与直方图二、频率分布表与直方图一、频率分布表设总体是离散型随机变量,是一组样本值,取到的值为,并且取到的个数分别为,则样本容量,我们称为出现的频数,而出现的频率为显然,例1对对100块焊接完的电路板进行检查,每块板块焊接完的电路板进行检查,每块板上焊点不光滑的个数的频数分布表和频率分布表如上焊点不光滑的个数的频数分布表和频率分布表如下图所示下图所示(不光(不光滑点的个数)滑点的个数)123456789101112合计合计(频数频数)4451091515149753100(=/100)1从上表可大体知道这批电路板的不光滑情况,可近似地从上表可大体知道这批电路板的不光滑情况,可近似地作为作为“每块板上不光滑点个数每块板上不光滑点个数”X的分布律的分布律.二、直方图当总体是连续型随机变量时,可采用直方图当总体是连续型随机变量时,可采用直方图来处理数据来处理数据(样本值样本值).设设为给定的一为给定的一组样本值,处理步骤如下:

组样本值,处理步骤如下:

1)简化数据,令)简化数据,令由于数据总在某个某个数值由于数据总在某个某个数值上下波动,可以选上下波动,可以选取适当的常数取适当的常数,把样本值化为位数较少的整数,把样本值化为位数较少的整数,为方面起见,化简后的数值为方面起见,化简后的数值仍记为仍记为.2)求求中的最大最小值中的最大最小值.记记3)分组分组.a)确定组数和组距确定组数和组距.选定组数选定组数,取组距,取组距一般情况下,一般情况下,应取数据的最小单位的整数倍应取数据的最小单位的整数倍.b)确定各组的上下界确定各组的上下界.取第一组的下界取第一组的下界应略小于应略小于,使得,使得落入第落入第一组内,即一组内,即然后令然后令为了使每个数据都落入组内,应使分点为了使每个数据都落入组内,应使分点比样本值多一位比样本值多一位小数小数.4)计算频率,记计算频率,记为落入第为落入第个区间的频数,则频个区间的频数,则频率为率为5)画直方图画直方图.以以为底,为底,为高画小长方形为高画小长方形.显然,所有小长方形面积之和等于显然,所有小长方形面积之和等于1:

样本直方图与密度函数样本直方图与密度函数的关系?

的关系?

根据大数定律,根据大数定律,近似等于随机变量近似等于随机变量落入区间落入区间内内的概率,即的概率,即设设的密度函数为的密度函数为,则,则如果如果在区间在区间内连续内连续下面举例说明画直方图的全过程及注意事项下面举例说明画直方图的全过程及注意事项例例2某食品厂为加强质量管理,在某天生产的一大某食品厂为加强质量管理,在某天生产的一大批罐头中抽查了批罐头中抽查了100个,测得内装食品的净重数据个,测得内装食品的净重数据如下(单位:

如下(单位:

g):

):

342341348346343342346341344348346346341344342344345340344344343344342343345339350337345342349336348344345332342341350343347340344353341340353346345346341339342352342350348344350335340338345345349336342338343343341347341347344339347358343347346344345350341338343339343346342339343350341346341345344342解解1)简化数据简化数据.取取c=340,d=1.令令.简化后的数据如下图简化后的数据如下图21863261486614245044342235-110-359-4845-821103704131036561-12122108410-50-2559-42-23317174-171837645101-23-1362-13101615422)求最大值和最小值求最大值和最小值.由上表知,最小值为由上表知,最小值为-8,最大值为,最大值为18.3)分组分组a)确定组数和组距确定组数和组距.考虑到样本容量考虑到样本容量n=100,取组数取组数m=10.由于由于(18+8)/10=2.6,取组距取组距.b)确定各组的上、下界确定各组的上、下界.取取,依次得依次得-5.5,-2.5,0.5,3.5,6.5,9.5,12.5,15.5,18.5.4)计算频率计算频率5)画直方图画直方图.注意注意.序号k组频数频率1(-8.5,-5.510.012(-5.5,-2.540.043(-2.5,0.5120.124(0.5,3.5320.325(3.5,6.5300.306(6.5,9.5120.127(9.5,12.570.078(12.5,15.510.019(15.5,18.510.01三、经验分布函数对给定的一组样本值,将它们按从小到大的顺序排列:

对给定的一组样本值,将它们按从小到大的顺序排列:

对任意实数对任意实数,定义,定义称称为为经验分布函数经验分布函数.例如例如,给定样本值,给定样本值5,3,7,5,4.将它们从小到大将它们从小到大重新排列重新排列:

3,4,5,5,7.经验分布函数为经验分布函数为记记,发生的概率发生的概率.根据贝努利根据贝努利大数定律大数定律,对任意的对任意的,有有事实上,可以证明下述更强的结论:

事实上,可以证明下述更强的结论:

根据经验分布根据经验分布函数的定义,函数的定义,中不大于中不大于x的个数)的个数)定理定理(格列汶科格列汶科)设总体设总体的分布函数为的分布函数为,当当,经验分布函数,经验分布函数以概率以概率1关于关于一致一致地收敛于地收敛于,即即注:

上述定理表明,当样本容量注:

上述定理表明,当样本容量充分大时充分大时,样本取值的分布相当准确的反映总体的分布样本取值的分布相当准确的反映总体的分布.总体(理论分布)总体(理论分布)?

样本样本样本值样本值统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断样本值,去推断总体的情况总体的情况-总体分布总体分布F(x)的性质的性质.总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体.样本是联系二者的桥梁样本是联系二者的桥梁由由样样本本值值去去推推断断总总体体情情况况,需需要要对对样样本本值值进进行行“加加工工”,这这就就要要构构造造一一些些样样本本的的函函数数,它它把把样样本中所含的(某一方面)的信息集中起来本中所含的(某一方面)的信息集中起来.四、统计量和抽样分布四、统计量和抽样分布1.统计量统计量这种这种不含任何未知参数的样本的函数称为统计不含任何未知参数的样本的函数称为统计量量.它是完全由样本决定的量它是完全由样本决定的量.几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩k=1,2,它反映了总体它反映了总体k阶矩阶矩的信息的信息它反映了总体它反映了总体k阶阶中心矩的信息中心矩的信息2.顺序统计量顺序统计量定义定义:

设设为取自总体为取自总体X的样本,的样本,将其按大小顺序排序将其按大小顺序排序则称则称X(k)为第为第k个次序统计量个次序统计量(No.kOrderStatistic)特别地,称特别地,称为最小顺序统计量为最小顺序统计量(MinimumorderStatistic)称称为最大顺序统计量为最大顺序统计量(MaximumorderStatistic)。

称称为偶数为偶数为奇数为奇数为样本中位数为样本中位数.称称为样本极差,反映了样本的离散为样本极差,反映了样本的离散程度,也反映了总体的离散程度程度,也反映了总体的离散程度.3.抽样分布抽样分布统计量既然是依赖于样本的,而统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个机变量,因而就有一定的分布,这个分布叫做分布叫做统计量的统计量的“抽样分布抽样分布”.抽样分布就是通常的随机变量函数的分布抽样分布就是通常的随机变量函数的分布.只是强调这一分布是由一个统计量所产生的只是强调这一分布是由一个统计量所产生的.研研究统计量的性质和评价一个统计推断

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电力水利

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1