卡平方测验Word格式.docx
《卡平方测验Word格式.docx》由会员分享,可在线阅读,更多相关《卡平方测验Word格式.docx(17页珍藏版)》请在冰豆网上搜索。
性别
观测株数O
理论株数E
O-E
(O-E)2/E
雌
92(O1)
100(E1)
-8
0.64
雄
108(O2)
100(E2)
8
合计
200
1.28
从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。
这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?
要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。
为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。
从表8-1看出:
O1-E1=8,O2-E2=8,由于这两个差数之和为0,显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。
为了避免正、负抵消,可将两个差数O1-E1、O2-E2平方后再相加,即计算
,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。
但利用
表示实际观察次数与理论次数的偏离程度尚有不足。
例如某一组实际观察次数为505,理论次数为500,相差5;
而另一组实际观察次数为26,理论次数为21,相差亦为5。
显然这两组实际观察次数与理论次数的偏离程度是不同的。
因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。
为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为χ2,即
(8-1)
也就是说,χ2是度量实际观察次数与理论次数偏离程度的一个统计量。
χ2越小,表明实际观察次数与理论次数越接近;
χ2=0,表示两者完全吻合;
χ2越大,表示两者相差越大。
对于表8-1的资料,可计算得
χ2=
但是,由于抽样误差的存在,χ2值究竟大到什么程度才算差异显著(不相符合),小到什么程度才算差异不显著(相符合)呢?
这个问题需用χ2的显著性测验来解决,而χ2测验的依据则是χ2的抽样分布(χ2分布)。
二、卡平方(χ2)的分布
理论研究证明,χ2的分布为正偏态分布,其分布特点为:
1.χ2分布没有负值,均在0~+∞之间,即在χ2=0的右边,为正偏态分布。
2.χ2的分布为连续性分布,而不是间断性的。
3.χ2分布曲线是一组曲线。
每一个不同的自由度都有一条相应的χ2分布曲线。
4.χ2分布的偏斜度随自由度ν不同而变化。
当ν=1时偏斜最厉害,ν>30时曲线接近正态分布,当ν→∞时,则为正态分布。
图8-1为几个不同自由度的χ2分布曲线。
附表列出不同自由度时χ2的一尾(右尾)概率表,可供次数资料的χ2测验之用。
三、卡平方(χ2)的连续性矫正
χ2分布是连续性的,而次数资料则是间断性的。
由(8-1)式计算的χ2只是近似地服从连续型随机变量χ2分布。
在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时,常常偏低,特别是当自由度ν=1时偏差较大。
Yates(1934)提出了一个矫正公式,矫正后的χ2值记为:
=
(8-2)
当自由度ν>1时,(8-1)式的χ2分布与连续型随机变量χ2分布相近似,这时,可不作连续性矫正。
第二节适合性测验
一、适合性测验的意义
判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设测验称为适合性测验。
在适合性测验中,无效假设H0:
实际观察的属性类别分配符合已知属性类别分配的理论或学说;
备择假设HA:
实际观察的属性类别分配不符合已知属性类别分配的理论或学说。
并在无效假设H0成立的条件下,按照已知属性类别分配的理论或学说计算各属性类别的理论次数。
因计算所得的各个属性类别理论次数的总和应等于各个属性类别实际观察次数的总和,即独立的理论次数的个数等于属性类别分类数减1。
也就是说,适合性测验的自由度等于属性类别分类数减1。
若属性类别分类数为k,则适合性测验的自由度ν=k-1。
然后根据(8-1)或(8-2)计算出χ2或
。
将计算所得的χ2或
值与根据自由度ν=k-1查χ2值表(附表6)所得的临界χ2值:
、
比较:
若χ2(或
)<
,P>0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;
若
≤χ2(或
,0.01<P≤0.05,表明实际观察次数与理论次数差异显著,可以认为实际观察的属性类别分配不符合已知属性类别分配的理论或学说;
)≥
,P≤0.01,表明实际观察次数与理论次数差异极显著,可以认为实际观察的属性类别分配极显著地不符合已知属性类别分配的理论或学说。
二、适合性测验的方法
下面结合实例说明适合性测验方法。
[例8.1]大豆花色一对等位基因的遗传研究,在F2获得表8-2所列分离株数。
问这一资料的实际观察比例是否符合于孟德尔遗传规律中3:
1的遗传比例?
测验步骤如下:
1.提出无效假设与备择假设
H0:
大豆花色F2分离符合3:
1比例。
HA:
不符合3:
2.选择计算公式由于该资料只有k=2组,自由度ν=k-1=2-1=1,须使用公式(8-2)来计算
3.计算理论株数根据理论比例3:
1求理论株数:
紫花理论株数:
E1=289×
3/4=216.75
白花理论株数:
E2=289×
1/4=72.25
或E2=260-E1=289-216.75=72.25
4.计算
表8-2大豆花色一对等位基因基因遗传的适合性测验
性状
F2代实际株数(O)
理论株数(E)
O-E
紫色
208
216.75
-8.75
0.3140
白色
81
72.25
+8.75
0.9420
总和
289
1.2560
5.查临界χ2值,作出统计推断当自由度ν=1时,查附表6得
=3.84,计算的
<
,故P>0.05,不能否定H0,表明实际观察次数与理论次数差异不显著,可以认为大豆花色这对性状符合孟德尔遗传分离定律3:
1的理论比例。
[例8.2]两对等位基因遗传试验,如基因为独立分配,则F2代的四种表现型在理论上应有9:
3:
1的比率。
有一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交,其F2代得表8-3结果。
试问这两对性状是否符合孟德尔遗传规律中9:
测验步骤:
实际观察次数之比符合9:
1的分离理论比例。
实际观察次数之比不符合9:
2.选择计算公式由于本例共有k=4组,自由度ν=k-1=4-1=3>1,故利用(8-1)式计算χ2。
3.计算理论次数依据理论比例9:
1计算理论次数:
稃尖有色非糯稻的理论次数E1:
743×
9/16=417.94
稃尖有色糯稻的理论次数E2:
3/16=139.31
稃尖无色非糯稻的理论次数E3:
稃尖无色糯稻的理论次数E4:
1/16=46.44
或E4=743-417.94-139.31-139.31=46.44
4.计算χ2
表8-3F2代表现型的观察次数和理论次数
类型
实际观察次数O
理论次数E
稃尖有色非糯
491(O1)
417.94(E1)
73.06
12.772
稃尖有色糯稻
76(O2)
139.31(E2)
-63.31
28.771
稃尖无色非糯
90(O3)
139.31(E3)
-49.31
17.454
稃尖无色糯稻
86(O4)
46.44(E4)
39.56
33.699
总计
743
92.696
χ2=
=12.772+28.771+17.454+33.699=92.696
5.查临界χ2值(附表6),作出统计推断当ν=3时,
=7.815,因χ2>
,P<0.05,所以应否定H0,接受HA,表明实际观察次数与理论次数差异显著,即该水稻稃尖和糯性性状在F2的实际结果不符合9:
1的理论比率。
这一情况表明,该两对等位基因并非独立遗传,而可能为连锁遗传。
实际资料多于两组的χ2值通式则为:
(8-3)
上式的mi为各项理论比率,ai为其对应的观察次数。
如本例,亦可由(8-3)算得
前面的χ2=92.696,与此χ2=92.706略有差异,系前者有较大计算误差之故。
第三节独立性测验
一、独立性测验的意义
对于次数资料,除进行适合性测验外,有时需要分析两个变数是相互独立还是彼此相关,这是次数资料的一种相关研究。
例如,小麦种子灭菌与否和麦穗发病两个变数之间,若相互独立,表示种子灭菌和麦穗发病高低无关,灭菌处理对发病无影响;
若不相互独立,则表示种子灭菌和麦穗发病高低有关,灭菌处理对发病有影响。
应用χ2进行独立性测验的无效假设是:
两个变数相互独立,对HA:
两个变数彼此相关。
在计算χ2时,先将所得次数资料按照两个变数作两向分组,排列成相依表;
然后,根据两个变数相互独立的假设,算出各个组的理论次数;
再由(8-1)算得χ2值。
这个χ2的自由度随两个变数各自分组数不同而不同,设横行分r组,纵行分c组,则ν=(r-1)(c-1)。
当观察的χ2<
时,便接受H0,即两个变数相互独立;
当观察的χ2≥
时,便否定H0,接受HA,即两个变数彼此相关。
独立性测验与适合性测验是两种不同的检验方法,除了研究目的不同外,还有以下区别:
1.独立性测验的次数资料是按两个变数属性类别进行归组。
根据两个变数属性类别数的不同而构成2×
2表、2×
c表、r×
c表(r为行变数的属性类别数,c为列变数的属性类别数)。
而适合性测验只按某一变数的属性类别将次数资料归组。
2.适合性测验按已知的属性分类理论或学说计算理论次数。
独立性测验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两变数相互独立的假设下进行计算的。
3.在适合性测验中确定自由度时,只有一个约束条件:
各理论次数之和等于各实际次数之和,自由度为属性类别数减1。
而在r×
c表的独立性测验中,共有rc个理论次数,但受到以下条件的约束:
(1)rc个理论次数的总和等于rc个实际次数的总和;
(2)r个横行中的每一个横行理论次数总和等于该行实际次数的总和。
但由于r个横行实际次数之和的总和等于rc个实际次数之和,因而独立的行约束条件只有r-1个;
(3)类似地,独立的列约束条件有c-1个。
因而在进行独立性测验时,自由度ν=rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数-1)×
(直列属性类别数-1)。
二、独立性