华科统计学课件双学位ch06统计推断优质PPT.ppt

上传人:b****3 文档编号:15613712 上传时间:2022-11-08 格式:PPT 页数:136 大小:2.80MB
下载 相关 举报
华科统计学课件双学位ch06统计推断优质PPT.ppt_第1页
第1页 / 共136页
华科统计学课件双学位ch06统计推断优质PPT.ppt_第2页
第2页 / 共136页
华科统计学课件双学位ch06统计推断优质PPT.ppt_第3页
第3页 / 共136页
华科统计学课件双学位ch06统计推断优质PPT.ppt_第4页
第4页 / 共136页
华科统计学课件双学位ch06统计推断优质PPT.ppt_第5页
第5页 / 共136页
点击查看更多>>
下载资源
资源描述

华科统计学课件双学位ch06统计推断优质PPT.ppt

《华科统计学课件双学位ch06统计推断优质PPT.ppt》由会员分享,可在线阅读,更多相关《华科统计学课件双学位ch06统计推断优质PPT.ppt(136页珍藏版)》请在冰豆网上搜索。

华科统计学课件双学位ch06统计推断优质PPT.ppt

n参数估计,通常又可分为点估计和区间估计两种。

n估计置信度估计置信度。

又称估计的概率保证程度,或者说是估计的可信程度。

通常记为1-。

其中,称为风险概率。

n抽样极限误差抽样极限误差。

又称允许误差范围。

是指在某种概率条件下,估计值与参数真值的离差绝对值,记为(6.1.1)愈小,表明估计的准确度愈高,反之,准确度愈低。

如果=0,则表明估计无偏误。

设估计置信度为1-,则与估计置信度的关系为:

(6.1.2)n抽样均方误差抽样均方误差MSE()n所有可能的估计值与待估参数之间离差的平方的平均数(期望值)。

n估计量方差估计量方差D()n估计量分布的方差。

n偏偏误误B()系统性误差系统性误差n按照某一方案反复抽样,估计值的数学期望与估计参数之间的离差。

n抽样平均误差抽样平均误差n就是抽样估计量的标准差。

记为。

n(6.1.3)n由于在无偏条件下,n(6.1.4)n有n(6.1.5)n因此,又是抽样极限误差在各种概率条件下的标准差。

n当然,要计算,必须知道的分布。

估计量重置抽样(简单随机抽样)不重置抽样(简单随机抽样)样本平均数样本成数n若干估计量的抽样平均误差若干估计量的抽样平均误差(p120表表4-5)返回6.1.2点估计点估计Ch6统计推断统计推断6.1总体参数估计总体参数估计(new)n当总体X的分布函数F(X;

)为已知时,但它的参数为未知,若从总体中抽取一个样本X1,X2,X3,Xn,并直接以样本统计量,作为相应总体参数的估计量,则用该样本统计量,对所作的一个数值点的估计,就称为点估计。

点估计记为点估计是样本变量的函数。

比如,用样本平均数估计总体平均数,用样本的方差估计总体方差,等等,都是点估计。

点估计又叫定值估计。

n未知参数与样本统计量Zn=Z(X1,X2,X3,Xn)之间,一般都存在某种变换关系=f(Zn).(6.1.2)6.1.2点估计点估计Ch6统计推断统计推断6.1总体参数估计总体参数估计(new)n【例6-1】设某灯泡的寿命XN

(2),2为未知,今随机取的4只灯泡,测得寿命数据为1502,1453,1367,1650。

试估计和。

n解:

因为是全体灯泡的平均寿命,为样本的平均寿命,因此,可用样本平均数估计总体平均数,用样本的方差S2估计总体方差2。

n于是,和的估计值分别为1493和118.61。

返回6.1.3优良估计量的标准优良估计量的标准Ch6统计推断统计推断6.1总体参数估计总体参数估计(new)n作为优良的估计量,一般至少应该满足以下三个标准:

n一致性一致性。

n如果估计是一致的,那么对于任意小的数0,有n(6.1.3)n无偏性无偏性。

n如果有关系式(6.1.4)n成立,那么是的无偏估计。

n如果有关系式(6.1.5)n成立,那么则称是渐近无偏的。

n有效性有效性。

n如果和都是的无偏估计量,但如果n(6.1.9)n则称相对于是更有效的估计量。

n【例6-2】如果X1,X2,X3,Xn1来自同一总体X,且是相互独立,若总体X的k阶原点矩E(Xk)k存在,且总体X的k阶中心矩D(Xk)2k-k2=mk也存在,按照随机收敛的定义,当n时,有n因此,样本k阶原点矩Ak,是总体k阶原点矩k的一致估计;

样本k阶中心矩Bk,是总体k阶中心矩mk的一致估计。

n于是,样本平均数是总体平均数的一致估计,样本方差是总体方差的一致估计。

n【例6-3】设总体X的k阶矩k=E(Xk)存在,又设X1,X2,X3,Xn是X的样本。

试证明,不论X服从什么分布,k阶样本矩是k阶总体矩k的无偏估计。

n证明:

X1,X2,X3,Xn1与X同分布,故有nE(Xik)=E(Xk)=k,.i=1,2,.,n.n即有n(6.1.6)n特别的,不论X服从什么分布,只要它的数学期望存在,总是总体X的数学期望1=E(X)的无偏估计量。

n【例6-4】对于均值,方差2都存在的总体,若,2均未知,则2的估计量(6.1.7)n是有偏误的(即不是无偏估计)。

n由(6.1.6),有E(A2)=2=2+2,.n又n故n所以是有偏的。

n相反,可证样本方差(p144)(6.1.8)n是2的无偏估计。

因此,一般都取S2作为方差2的估计量。

返回6.1.4总体参数的区间估计总体参数的区间估计n置信区间置信区间n总体X的分布函数F(X;

),含有一个未知参数。

对于给定的030为大样本。

根据中心极限定理,有n取Z为样本统计量,于是总体均值的置信度为1-的置信区间为n由1-=0.95,=0.05,Z/2=1.96,=26,得全体学生平均每天的锻炼时间n即为(24.824,27.176)。

n【例6-7】某大学从该校中随机抽取100人,调查到他们平均每天参加锻炼的时间为26分钟。

假定总体XN

(2),总体方差2未知,但已知样本方差S2=34。

试以95%的置信水平,估计该大学全体学生平均每天参加锻炼的时间。

因为总体XN

(2),不知2,但已知样本方差S2=34。

根据抽样定理,有n取t为样本统计量,于是总体均值的置信度为1-的置信区间为n由1-=0.95,=0.05,t/2(n-1)=1.984,=26,得全体学生平均每天的锻炼时间n即为(24.84,27.16)。

n教材(P140)

【例5-2】麦当劳餐厅在7星期内抽查了49位顾客的消费额(略)。

试以90%的概率保证,估计顾客平均消费的区间。

设顾客平均消费为,并且假设总体2=9.452。

因为是大样本,根据中心极限定理,有与样本平均数有关的n取Z为样本统计量,则有的置信度为1-的置信区间n由1-=0.90,=0.10,Z/2=1.645,=32,得顾客平均消费的区间n即为(29.77925,34.22075)。

设顾客平均消费为。

因为总体2是不知的,但可计算样本方差S2=9.452。

根据抽样定理,有与样本平均数有关的n取t为样本统计量,则有的置信度为1-的置信区间n由1-=0.90,=0.10,t/2(n-1)=1.6776,=32,S=9.45,得顾客平均消费的区间n即为(29.73542,34.26476)。

n教材(P141)

【例5-3】某乡水稻总面积20000亩,以不重置抽样方法从中随机抽取400亩,实割实测求得样本平均亩产645公斤,标准差为72.6公斤。

要求极限误差不超过7.2公斤,试对该乡水稻的亩产和总产量做估计。

设平均亩产为。

虽然总体2是不知的,但可计算样本方差S2=72.62。

根据抽样定理,有与样本平均数有关的n取t为样本统计量,则有的置信度为1-的置信区间n也即n因为=645,=7.2,得平均亩产的区间n645-7.2=637.8645+7.2=652.2n由以下关系式计算区间(637.830是大样本,根据中心极限定理,t/2Z/2,f(t/2)f(Z/2),1-=F(t/2)F(Z/2),查标准正态分布表求得1-=F(Z/2)=F

(2)=0.9545。

即平均亩产n637.850的大样本,它来自(0,1)分布的总体X,X的均值为P,方差为P(1-P),其中P就是总体成数,是一个未知参数。

求P的置信度为1-的置信区间。

已知(0,1)分布均值和方差为n=P,2=P(1-P)。

(6.1.32)n设X1,X2,X3,Xn是来自X的样本,样本成数p是P的无偏估计。

因样本容量较大,由中心极限定理有n(6.1.33)n样本统计量Z是不依赖于任何未知参数的。

于是有n(6.1.34)n而不等式n(6.1.35)n等价于n(6.1.36)n记n(6.1.37)n解不等式(6.1.36)n(6.1.38)即n于是,就得到了P的近似的、置信度为1-的不对称区间(P1,P2)。

n【例6-8】自一大批产品的100个样品中,得一级品60个。

求这批产品的一级品率P的置信度为0.95的置信区间。

一级品率P是(0,1)分布的参数,在大样本条件下,有中心极限定理n也即n于是有置信度为1-的不对称区间(P1,P2)n代入数据n=100,p=60/100=0.6,1-=0.95,/2=0.025,Z/2=1.96,nn求得P1=0.50,P2=0.69。

故P的置信度为0.95的近似不对称区间是(0.50,0.69)。

n有时解不等式比较麻烦。

nn因此教材(P142)对其进行了简化nn再解不等式n也即n得总体成数P的置信度为1-的对称区间n估计允许误差n教材(P142)

【例5-4】。

在一项新广告的跟踪调查中,在被调查的400人中有240人记的广告标语。

求记的广告标语占总体比率95%为置信度的估计区间。

在大样本条件下,有中心极限定理有nn也即n简化式n再解不等式n得总体比率P的置信度为1-的对称区间n代入数据p=240/400=0.6;

n=400;

1-=0.95;

Z/2=1.96,于是有n教材(P143)

【例5-5】。

估计某市居民住户电视机普及率。

随机抽取900户居民,其中有675户有电视机。

要求极限抽样误差不超过2.8%,试对该市居民住户电视机普及率进行区间估计。

在大样本条件下,有中心极限定理有nn也即n简化式n再解不等式n得居民住户电视机普及率P的置信度为1-的对称区间n也即n代入数据p=675/900=0.75;

=0.028;

于是有n另外由n查正态分布表得1-=F(Z/2)=F(2.0)=0.9545;

n即该市居民住户电视机普及率在(0.722,0.778)之间的可靠性概率为95.45%。

返回6.1.7总体方差的估计总体方差的估计Ch6统计推断统计推断6.1总体参数估计总体参数估计(new)n总体方差也是表明总体数量特征的重要指标。

很多情况,需要利用抽样的方法,来估计总体方差。

通常是,以样本方差S2来估计总体方差2,即n但这只是点估计,更多的是求它的区间估计。

n设总体XN

(2),2均为未

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 销售营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1