统计部分.ppt

上传人:b****3 文档编号:2700884 上传时间:2022-11-08 格式:PPT 页数:82 大小:852.50KB
下载 相关 举报
统计部分.ppt_第1页
第1页 / 共82页
统计部分.ppt_第2页
第2页 / 共82页
统计部分.ppt_第3页
第3页 / 共82页
统计部分.ppt_第4页
第4页 / 共82页
统计部分.ppt_第5页
第5页 / 共82页
点击查看更多>>
下载资源
资源描述

统计部分.ppt

《统计部分.ppt》由会员分享,可在线阅读,更多相关《统计部分.ppt(82页珍藏版)》请在冰豆网上搜索。

统计部分.ppt

第二部分第二部分统计统计Statistics1从本章开始,我们将讲述数理统计的基本内容.数理统计作为一门学科诞生于19世纪末20世纪初,是具有广泛应用的一个数学分支,它以概率论为基础,根据试验或观察得到的数据,来研究随机现象,以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性,故理论上只要对随机现象进行足够多次观察,则研究对象的规律性就一定能清楚地呈现出来,但实际上人们常常无法对所研究的对象的全体(或总体)进行观察,而只能抽取其中的部分(或样本)进行观察或试验以获得有限的数据.2数理统计的任务包括:

怎样有效地收集、整理有限的数据资料;怎样对所得的数据资料进行分析、研究,从而对研究对象的性质、特点,作出合理的推断,此即所谓的统计推断问题,本课程主要讲述统计推断的基本内容.3第第88章章统计与统计学统计与统计学l重点重点:

n了解统计的研究对象、理解统计的基本概念了解统计的研究对象、理解统计的基本概念4基本问题n1、总体和总体分布n2、样本和样本分布n3、统计推断问题简述5n总体和个体总体和个体总总体体是具有一定共性的研究对象的全体,其大小与范围随具体研究与考察的目的而确定.例如,考察某大学一年级新生的体重情况,则该校一年级全体新生就构成了待研究的总体.总体确定后,称总体的每一个可观察值为个体个体.如前述总体(一年级新生)中的每一个个体即为每个新生的体重.总体中所包含的个体的个数称为总体的容量总体的容量.容量为有限的称为有有限限总总体体,容量为无限的称为无无限限总体总体.1、总体和总体分布6总体中的每一个个体是随机试验的一个观察值,故它是某一随机变量的值,于是,一个总体对应于一个随机变量,对总体的研究就相当于对一个随机变量的研究,的分布就称为总体的分布函数.今后将不区分总体与相应的随机变量,并引入如下定义:

7定义统计学中称随机变量(或向量)为总体,并把随机变量(或向量)的分布称为总体分布.v注(i)有时个体的特性很难用数量指标直接描述,但总可以将其数量化,如检验某学校全体学生的血型,试验的结果有O型、A型、B型、AB型4种,若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;v(ii)总体的分布一般来说是未知的,有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如等).v数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.8n由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体的一组数值,其中每一是从总体中抽取的某一个体的数量指标的观察值.n上述抽取过程为抽样抽样,所抽取的部分个体称为样本样本.样本中所含个体数目称为样本容量样本容量.2、样本和样本分布9n为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本样本是一组随机变量是一组随机变量(或向量).容量为n的样本可视为n维随机向量,一旦具体取定一组样本,便得到样本的一次具体的观察值称其为样本值样本值.v样本值即为样本X1,Xn的一组特定的观察值。

10为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法,最常用的一种抽样方法称为简单随机简单随机抽样抽样,它要求抽取的样本满足下面两个条件:

1.代表性代表性:

与所考察的总体具有相同的分布;2.独立性独立性:

是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本简单随机样本,它可用与总体独立同分布与总体独立同分布的n个相互独立的随机变量表示.注:

今后假定所考虑的样本均为简单随机样本,简称为样本.11设总体的分布函数为,则简单随机样本的联合分布函数为并称其为样本分布样本分布.特别地,若总体为连续型随机变量,其概率密度为,则样本的概率密度为分别称与为总体总体密度密度与样本密度样本密度.12分别称与为总体总体分布分布与样本分布样本分布.若总体为离散型随机变量,其概率分布为,取遍所有可能取值,则样本的概率分布为13在两种不同抽样方式下的样本的联合分布如下:

14样本的联合分布也常称为统计模型。

15总体和样本是数理统计中的两个基本概念.样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数).另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言).称通过总体的一个样本对总体的分布进行推断的问题为统计推断问题统计推断问题.3、统计推断问题简述、统计推断问题简述16总体、样本、样本值的关系总体、样本、样本值的关系:

总体推断(个体)样本样本值抽样在实际应用中,总体的分布一般是未知的,或虽然知道总体分布所属的类型,但其中包含着未知参数.统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断,还需借助样本构造一些合适的统计量,即样本的函数,下面将对相关统计量进行深入的讨论.17n掌握常用统计量的计算掌握常用统计量的计算统计量和抽样分布统计量和抽样分布l重点重点:

n了解统计量定义了解统计量定义181、统计量样本常常表现为一大堆数字,很难直接用来解决我们所要研究的具体问题。

人们常常把数据加工成若干个数量指标,以概括这批数据所提供的相关问题的信息。

数据加工后的数量指标就是统计量。

为由样本推断总体,要构造一些合适的统计量,再由这些统计量来推断未知总体。

这里,样本的统计量即为样本的函数。

广义地讲,统计量可以是样本的任一函数,但由于构造统计量的目的是为推断未知总体的分布,故在构造统计量时,就不应包含总体的未知参数,为此引入下列定义.19n定义:

定义:

完全由样本确定的量完全由样本确定的量(可以是向量)为可以是向量)为统计量统计量,从,从数学观点来看,统计量是样本的函数(可以是向量值)。

数学观点来看,统计量是样本的函数(可以是向量值)。

v此处,此处,“完全完全”指它不应该同未知的总体分布有指它不应该同未知的总体分布有关,例如它不应该含有总体分布中的未知参数,即一关,例如它不应该含有总体分布中的未知参数,即一旦有了样本数据就可以得到统计量的值。

旦有了样本数据就可以得到统计量的值。

通常用表示为总体X的一个样本,则可用表示一个统计量,T可取向量值,而函数应该不含任何未知参数。

20v统计量是随机变量(或随机向量)。

通常用表示当时统计量T的值。

n思考思考21l常用统计量以下设为总体的一个样本.1.样本均值,描述数据的中心位置2.样本方差3.样本标准差,描述数据的分散程度224.样本(k阶)原点矩5.样本(k阶)中心矩注:

上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的函数,它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本(k阶)原点矩、样本(k阶)中心矩.23248、样本相关系数:

25例例某厂实行计件工资制,为及时了解情况,随机抽取30名工人,调查各自在一周内加工的零件数,然后按规定算出每名工人的周工资如下:

(单位:

元)156134160141159141161157171155149144169138168147153156125156135156151155146155157198161151这便是一个容量为30的样本观察值,其样本均值为:

它反映了该厂工人周工资的一般水平.试计算其样本方差与样本标准差.26作业P.128习题八227由由样样本本值值去去推推断断总总体体情情况况,需需要要对对样样本本值值进进行行“加加工工”,这这就就要要构构造造一一些些样样本本的的函函数数,它它把把样样本本中中所所含含的的(某某一一方方面面)的的信息集中起来信息集中起来.统计量和抽样分布统计量和抽样分布1.统计量统计量这种这种不含任何未知参数的样本的函数不含任何未知参数的样本的函数称为统计量称为统计量.它是完全由样本决定的量它是完全由样本决定的量.28几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息29样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩k=1,2,它反映了总体它反映了总体k阶矩阶矩的信息的信息它反映了总体它反映了总体k阶阶中心矩的信息中心矩的信息302.抽样分布抽样分布统计量既然是依赖于样本的,而统计量既然是依赖于样本的,而后者又是随机变量,故后者又是随机变量,故统计量也是随统计量也是随机变量机变量,因而就有一定的分布,这个,因而就有一定的分布,这个分布叫做分布叫做统计量的统计量的“抽样分布抽样分布”.31二二.统计三大分布统计三大分布记为记为分布分布1、定义定义:

设设相互独立相互独立,都服从正态都服从正态分布分布N(0,1),则称随机变量:

则称随机变量:

所服从的分布为自由度为所服从的分布为自由度为n的的分布分布.分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布.32由由分布的定义,不难得到:

分布的定义,不难得到:

1.设设相互独立相互独立,都服从正态分布都服从正态分布则则2.设设且且X1,X2相互相互独立,则独立,则这个性质叫这个性质叫分布的可加性分布的可加性.则则可以求得,可以求得,E(X)=n,D(X)=2n3.若若33记为记为Tt(n).定定义义:

设设XN(0,1),Y,且且X与与Y相相互互独立,则称变量独立,则称变量所服从的分布为自由度为所服从的分布为自由度为n的的t分布分布.2、t分布分布具有自由度为具有自由度为n的的t分布的随机变量分布的随机变量T的数的数学期望和方差为学期望和方差为:

E(T)=0;D(T)=n/(n-2),对对n234由由定义可见,定义可见,3、F分布分布定义定义:

设设X与与Y相互相互独立,则称统计量独立,则称统计量服从自由度为服从自由度为n1及及n2的的F分布,分布,n1称为第称为第一自由度,一自由度,n2称为第二自由度,记作称为第二自由度,记作FF(n1,n2).F(n2,n1)35当总体为当总体为正态分布正态分布时,教材上给出了时,教材上给出了几个重要的抽样分布定理几个重要的抽样分布定理.这里我们不加这里我们不加证明地叙述证明地叙述.几个定理的证明都可以在教几个定理的证明都可以在教材上找到材上找到.三、几个重要的抽样分布定理三、几个重要的抽样分布定理36定理定理1(样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有37定理定理2(样本方差的分布样本方差的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有38设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有定理定理3(与样本均值和样本方差有关(与样本均值和样本方差有关的一个分布)的一个分布)39定理定理4(两总体样本均值差的分布两总体样本均值差的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,则有则有Y1,Y2,是是样本样本40定理定理5(两总体样本方差比的分布两总体样本方差比的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,则有则有Y1,Y2,是是样本样本41总体总体样本样本统计量统计量描述描述作出推断作出推断随机抽样随机抽样数理统计的基本概念的关系数理统计的基本概念的关系42n掌握用矩估计法构造参数的估计量掌握用矩估计法构造参数的估计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 建筑土木

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1