统计推断.docx

上传人:b****6 文档编号:6627487 上传时间:2023-01-08 格式:DOCX 页数:24 大小:884.49KB
下载 相关 举报
统计推断.docx_第1页
第1页 / 共24页
统计推断.docx_第2页
第2页 / 共24页
统计推断.docx_第3页
第3页 / 共24页
统计推断.docx_第4页
第4页 / 共24页
统计推断.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

统计推断.docx

《统计推断.docx》由会员分享,可在线阅读,更多相关《统计推断.docx(24页珍藏版)》请在冰豆网上搜索。

统计推断.docx

统计推断

第五章统计推断

•总体与样本之间的关系

-从总体到样本的研究。

-由样本推断总体:

样本统计量的分布规律一般是正态分布、t分布、χ2分布和F分布。

•对总体做统计推断的两种途径

–先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statisticaltestofhypothesis)

–通过样本统计量估计总体参数,称为总体参数估计(estimationofpopulationparameter)

•本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。

一、假设检验

假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。

如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。

小概率原理

在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。

在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α”

例5.1根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。

今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法?

小概率原理用于显著性检验

例5.2用实验动物作实验材料,现从一批动物(σ=0.4)中抽取含量n=10的样本并已经计算出平均值为10.23g。

已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?

解:

1样本平均数满足何种分布?

2从正态分布表查出P=0.03438<0.05,这是一个小概率事件,该样本几乎不可能抽自μ=10.00g的总体。

单侧检测(one-sidedtest)

•上尾检验(uppertailedtest):

拒绝H0后,接受μ>μ0,如下左图。

•下尾检验(lowertailedtest):

拒绝H0后,接受μ<μ0,如下右图。

•双侧检验(two-sidedtest):

拒绝H0后,接受μ≠μ0,如下图。

•由于单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力,所以单侧检验比双侧检验的辨别力更强些。

•实际应用时,要尽量选用单侧检验,但要根据实际情况而定。

二、假设检验中的两类错误

1.TypeⅠerror(α错误),如果H0是真实的,却否定了它,又叫弃真错误。

2.TypeⅡerror(β类错误),如果H0是错误的,却接受了它,又叫纳伪错误。

例5.3用实验动物作实验材料,现从一批动物(σ=0.4)中抽取含量n=10的样本并已经计算出平均值为10.20g。

已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?

方法1

方法2

图5-2两种类型的错误

样本抽自HA:

u=10.3g,但却错误的接受

H0:

u=10.0g的概率为0.2327。

关于两种类型错误的三点解释

•当μ1越接近于μ0时,犯Ⅱ型错误的概率愈大;当μ1越远离μ0时,犯Ⅱ型错误的概率愈小。

•在样本含量和样本平均数都固定时,为了降低犯Ⅰ型错误的概率α(就应将图5-2中的竖线右移),必然增加犯Ⅱ型错误的概率。

•为了同时降低α和β就需增加样本含量。

三、假设检验的步骤

●对样本所属总体提出假设,无效假设记作H0,备择假设,记作HA。

●确定显著水平

在进行无效假设和备则假设之后,要确定一个否定H0的概率标准,这个标准叫显著水平或概率水平。

●在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算。

●根据显著水平α的统计数(如u值)的临界值,进行差异是否显著的推断。

四、均值检验

5.1单个样本的统计假设检验

5.1.1σ已知单个平均数显著性检验:

u检验

例5.5母猪的怀孕期为114天,今抽测10头母猪

的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?

根据题意,本例应进行双侧t检验。

1、提出无效假设与备择假设

2、计算u值

3、建立H0的拒绝域:

因HA:

μ>μ0,故为上尾单侧检验,当μ>μ0.05时拒绝H0,α=0.05的上侧分位数μ0.05=1.645。

4、结论:

因为μ>μ0.05所以拒绝H0,接受HA.上述样本很可能不是抽自N(377.2,3.32)的总体,抽出样本的那个总体的平均数是大于377.2的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。

5.1.2σ未知时平均数显著性检验:

t检验

例5.5母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?

根据题意,本例应进行双侧t检验。

1、提出无效假设与备择假设

2、计算t值

3、查临界t值,作出统计推断

由df=9,查t值表(附表3)得t0.05(9)=2.262,因为|t|0.05,故不能否定H0:

μ=114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为114天的总体。

5.1.3变异性的显著性检验:

χ2检验

例5.6一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽取10株,它们的株高为:

90,105,101,95,100,100,101,105,93,97,考察提纯后的群体是否比原群体整齐?

1、小麦株高是服从正态分布的随机变量

2、提出假设

关于备择假设的说明:

小麦经提纯后只能变得更整齐,绝不会更离散,即σ只能小于σ0,因此HA:

σ<σ0。

3、显著性水平规定α=0.05

4、统计量的值:

5、建立的拒绝域:

因HA:

σ<σ0,故为下尾单侧检验,当χ2<χ21-α时拒绝H0,从附表6中可以查出χ29,0.99=2.09

6、结论,因χ2<χ29,0.99,拒绝H0,接受HA,提纯后株高比原株高整齐。

EX5.1

某鱼场按常规方法所育鲢鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差异?

解题过程

EX5.2

某鱼塘水中的含氧量,多年平均为4.5mg·L-1,现在该鱼塘设10个点采集水样,测定水中含氧量分别为:

4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48.4.26mg·L-1,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。

解题过程

小结

5.2两个样本的显著性差异检验

•单个样本的显著性检验需要事先能够提出合理的参数假设值和对参数有某种意义的备择值。

然而,实际工作中很难提出,故限制了实际应用。

•在实际应用时,常常选用两个样本,一个作为处理,一个作为对照,在这两个样本之间作比较,判定它们之间的差异是否用偶然性解释,若不能用偶然性解释时,则认为它们之间存在足够显著的差异,从而判断这两个样本来自两个不同的总体。

5.2.1两个方差的检验(方差齐性分析)—F检验

1假定从两个正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22.总体平均数可以相等也可以不等.

2零假设H0:

σ1=σ2.备择假设

HA:

σ1>σ2若已知σ1不可能小于σ2。

HA:

σ1<σ2若已知σ1不可能大于σ2。

HA:

σ1≠σ2包括σ1>σ2和σ1<σ2。

3显著性水平:

经常用α=0.05和α=0.01两个水平。

4统计检验量:

Fdf1,df2=s12/s22,df1=n1-1df2=n2-1。

5建立H0的拒绝域:

σ1>σ2,上尾单侧检验,F>Fα时拒绝

σ1<σ2,下尾单侧检验,F

σ1≠σ2,,双侧检验,F>Fα/2及F

6作出结论并解释。

例5.7测定了20位青年男子和20位老年男子的血压值(收缩压mmHg)如下表所示。

问老年人血压值个体间的波动是否显著高于青年人?

解:

根据检验的基本程序:

(1)人类血压值是服从正态分布的随机变量,而且上述两样本是独立获得的。

(2)假设:

H0:

σ1=σ2

HA:

σ1<σ2(由于老年人的血压值波动只会大于青年人,单侧)

(3)显著性水平:

根据问题的要求(是否显著),选α=0.05。

(4)统计量的值:

Fdf1,df2=S12/s22,根据表中数据计算可得S12=193.4,s22=937.7,故F=0.206。

(5)建立H0的拒绝域:

由于HA:

σ1<σ2,故为下尾单侧检验,当F

查表可得F19,19,0.95=1/F19,19,0.05=0.459

(6)结论:

F

即老年人的血压值在个体间的波动高于青年人。

5.2.2标准差(σi)已知时,两个平均数间差异显著性的检验—u检验

例5.8调查两个不同渔场的马面鲀体长,每一渔场调查200条。

平均体长分别为19.8cm和18.5cm。

σ1=σ2=7.2cm。

问在α=0.05水平上,第一渔场的马面鲀体长是否显著高于第二渔场的?

解:

(1)假设:

H0:

μ1=μ2,HA:

μ1>μ2

(2)确定显著性水平:

α=0.05。

(3)计算统计量。

(4)建立H0的拒绝域:

因HA:

μ1>μ2,故为上尾单侧检验。

当u>u0.05时拒绝H0,由附表查出u0.05=1.645。

5.2.3标准差(σi)未知,但相等时,两个

平均数间差异显著性的检验—成组数据t检验

检验程序与5.2.2基本相同,只是所使用的统计量不同,当两个总体的标准差相等时,检验统计量t由下式给出:

•在H0:

μ1=μ2下变为

在平均数检验中应用最为广泛。

先做方差齐性检验(F-双侧检验)判断σi是否相等;

按上式计算统计量t,进行t检验以判断两个平均数之间差异是否显著。

例5.9研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:

研究第一种药物的样本数为9,平均数为27.92,样本方差为8.673。

研究第二种药物的样本数为6,平均数为25.11,样本方差为1.843。

问两种药物对肾组织切片氧消耗的影响差异是否显著?

解:

第一步,做方差齐性检验:

H0:

σ1=σ2,HA:

σ1≠σ2,α=0.05

F8,5=8.673/1.843=4.71,F8,5,0.025=6.757

F8,5,0.975=1/4.817=0.208,F8,5,0.975

,结论是接受H0(σ1=σ2)

第二步,做平均数之间差异的显著性检验:

H0:

μ1=μ2,HA:

μ1≠μ2,α=0.05;计算统计量t=2.168。

t0.05(双侧)=2.160,t>t0.05,结论是在α=0.05水平上两种药物对肾组织切片氧消耗的影响刚刚达到显著。

4.2.4标准差(σi)未知且可能不相等时,

两个平均数间差异显著性的检验

•若经F(双尾)检验,发现σ1≠σ2可用Aspin-Welch检验,近似t检验。

例5.10两组类似的大鼠,一组做对照,另一组做药物处理,然后测定血糖。

已知对照组的样本数为12,平均数为109.17,样本方差为97.430。

经过催产素药物处理组的样本数为8,平均数为106.88,样本方差为7.268。

问药物对大鼠血糖含量的影响是否显著?

解:

第一步,做方差齐性检验:

H0:

σ1=σ2,

HA:

σ1≠σ2,α=0.05

F11,7=97.430/7.268=13.41,

F11,7,0.025=4.714(如何查?

F>F0.025,结论是方差不具齐性(σ1≠σ2)

第二步,做平均数之间的差异显著性检验。

H0:

μ1=μ2,HA:

μ1≠μ2,α=0.05;计算df=13.35,统计量t=0.76。

用线性内插法(如何查?

)可以求出t13.35,0.05(双侧)=2.15,t

结论是催产素药物对大鼠的影响是不显著的。

5.2.5配对数据的显著性检验——配对数据的t检验

生物学试验中,为了减少试验误差,在有条件情况下尽可能把试验设计成若干对子,称为配对试验设计,对这种设计做显著性检验的方法称为配对数据t检验。

配对数据的t检验基本步骤

(一)提出无效假设与备择假设

为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数μ1与μ2之差,所设无效假设、备择假设相当于

(二)计算t值,计算公式为

(三)查临界t值,作出统计推断

例5.11用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见下表。

设体温服从正态分布,问注射前后体温有无显著差异?

(一)提出无效假设与备择假设

(二)计算t值,经过计算得

df=n-1=10-1=9

(三)、查临界t值,作出统计推断

•由df=9,查t值表得:

t0.01(9)=3.250,因为|t|>t0.01(9),P<0.01,否定H0,接受HA,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。

4.2.6配对法与成组法的比较

∵平均数及样本含量均相同的条件下,s愈小

则t值愈大

∴配对法比成组法更容易检出两组数据平均数之间的差异。

在条件许可的情况下,尽量把实验安排成配对法做比较。

EX5.4

根据多年的资料,某杂交黑麦从播种到开花的天数的标准差为6.9d.现在相同试验条件下采取两种方法取样调查,A法调查400株,得出从播种到开花的平均天数为69.5d,B法调查200株,得出从播种到开花的平均天数为70.3d,试比较两种调查方法所得黑麦从播种到开花的天数有无显著差别?

解题过程:

EX5.6

解题思路

•首先进行方差齐性检验,用F检验。

•用方差大的作为分子,方差小的作为分母。

•查F检验的临界值Fα表。

•根据方差齐性与否决定用何种公式。

解题过程

方差齐性检验,F检验

方差不齐

这两个品种蛋白质的含量差异显著。

成对数据平均数比较

EX5.7

在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如表4-l,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。

表4-l

小结

一、名词解释

假设检验(显著性检验)无效假设备择假设显著水平Ⅰ型错误Ⅱ型错误双侧检验(双尾检验)单侧检验(单尾检验)成组设计配对设计

二、简答题

1、显著性检验的基本步骤是什么?

根据什么确定显著水平?

2、什么是统计推断?

为什么统计推断的结论有可能发生错误?

有哪两类错误?

如何降低犯两类错误的概率?

3、配对试验设计与成组试验设计有何区别?

三、计算题

1、随机抽测了10只兔的直肠温度,其数据为:

38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4(℃),已知该品种兔直肠温度的总体平均数=39.5(℃),试检验该样本平均温度与总体是否存在显著差异?

2、给幼鼠喂以不同饲料,研究每日钙的留存量(mg)是否有显著不同,以两种方式设计本实验。

第一种方式:

同一鼠先后喂予不同饲料。

第二种方式,甲组12只喂A饲料,乙组9只喂B饲料。

以α=0.05的水平,检验每种方式中,两种不同饲料钙的留存量差异是否显著。

并对结果加以解释。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1