统计假设测验.docx

上传人:b****1 文档编号:1848579 上传时间:2022-10-24 格式:DOCX 页数:26 大小:409.88KB
下载 相关 举报
统计假设测验.docx_第1页
第1页 / 共26页
统计假设测验.docx_第2页
第2页 / 共26页
统计假设测验.docx_第3页
第3页 / 共26页
统计假设测验.docx_第4页
第4页 / 共26页
统计假设测验.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

统计假设测验.docx

《统计假设测验.docx》由会员分享,可在线阅读,更多相关《统计假设测验.docx(26页珍藏版)》请在冰豆网上搜索。

统计假设测验.docx

统计假设测验

第六章统计假设测验

知识目标:

●了解随机事件、统计概率等基本概念;

●理解小概率实际不可能性原理及其应用;

●了解二项分布、正态分布的概念及概率计算,理解正态分布曲线特点;

●了解统计假设测验的意义;

●理解统计假设测验的基本原理;

●掌握平均数统计假设测验的方法。

技能目标:

●学会二项分布、正态分布概率的计算方法;

●掌握标准正态分布表及几个主要函数的使用方法;

第一节概率及概率分布

一、事件、频率和概率

(一)事件

某一事物的每一个现象,或某项试验的每一结果为事件(event)。

客观事物中,有些现象或试验结果在一定条件下一定发生,这种事件叫必然事件。

例如,在适宜的温度和湿度下正常的种子一定发芽;在标准大气压下,水加热到100℃一定沸腾。

相反,有些现象或结果,如没有生活力的种子播种后一定不发芽等,这种在一定条件下一定不发生的事件叫不可能事件。

必然事件和不可能事件都是事前可预言其结果的。

还有些现象或结果,如调查1000粒玉米种子在适宜条件下的田间出苗情况,则有的出苗,有的不出苗;掷一枚质地均匀的硬币,可能币值一面朝上,也可能币值一面朝下,事前并不能确定。

这种在一定条件下可能发生也可能不发生的事件叫随机事件或偶然事件。

不同事件间存在着一定的关系,了解事件间的相互关系,有助于认识较为复杂的事件。

1.和事件:

事件A与事件B至少有一个发生,这一新事件称为事件A与事件B的和,记作“A+B”。

例如,每穴播2粒玉米种子,一粒出苗称事件A,二粒出苗称事件B,则事件A与事件B的和事件就是出苗(包括一粒出苗或两粒出苗)。

2.积事件:

事件A与事件B同时发生,这一新事件称为事件A与事件B的积,记作“AB”。

例如棉花生产中,高产为事件A,优质为事件B,则二者的积事件就是高产优质。

3.互斥事件:

如果事件A与事件B不能同时发生,则称事件A和事件B为互斥事件或不相容事件。

如一个黑色袋子里装有红、黄二种颜色的球,每次从中摸一个球,所摸的球要么红球,要么黄球,因此红球和黄球事件为互斥事件。

以上三种事件可以推广到n个事件。

4.对立事件:

如果事件A和事件B必发生其一,但又不能同时发生,则事件A和事件B为对立事件。

即“A+B”是必然事件,“AB”是互斥事件。

如一粒种子的出苗与不出苗,还有上例中一个黑色袋子里装有红、黄二种不同颜色的球,每次从中摸一个球,所摸的球要么红球,要么黄球,红球和黄球也是对立事件。

如果在一个口袋里装有两种以上颜色的球,每次从中摸一个球,此时,所有可能的结果构成什么事件?

 

5.独立事件:

若事件A发生与否不影响事件B发生的可能性,事件B发生与否也不影响事件A发生的可能性,则二者为独立事件。

如棉花直播,每穴播5粒,每粒种子出苗与否并不影响其他几粒的出苗情况。

(二)频率与概率

对于随机事件,在一次试验中其发生与否带有很大的偶然性,要研究其发生的规律性,就必须进行大量的重复观察或试验。

若随机事件A在n次试验中发生了m次,则比值m/n叫做n次试验中随机事件A发生的频率。

[例6.1]为了解一批玉米种子的发芽情况,若分别抽取10粒、50粒、200粒、500粒、1000粒种子,在相同的条件下进行发芽试验,统计结果见表6-1。

表6-1玉米种子发芽试验统计结果

发芽试验总粒数(n)

10

50

100

200

500

1000

种子发芽粒数(m)

10

47

89

184

464

931

种子发芽的频率(m/n)

1.000

0.940

0.890

0.920

0.928

0.931

由表6-1可以看出,在不同粒数的发芽试验中,每次发芽的粒数是随机的,但随着试验种子数的不断增加,发芽的频率越来越接近于0.93。

因此,用0.93表示这批玉米种子发芽的可能性是比较适宜的。

这种通过大量试验而得到的度量随机事件出现可能性的量,叫统计概率或概率(probability)。

由此,概率可定义为:

在相似条件下,重复进行同一类试验,事件A发生的频率m/n,随着试验总次数n的逐渐增加,愈来愈稳定于一个定值p,这个定值p称事件A的概率,记为:

P(A)=p≈m/n

概率是描述随机事件发生可能性大小的数量指标,对随机事件A,有0<P(A)<1。

(三)小概率事件实际不可能性原理

概率表示随机事件在一次试验中发生的可能性大小。

若事件A发生的概率很小,如小于0.05或0.01,则称事件A为小概率事件。

小概率事件不是不可能事件,但在一次试验中发生的可能性很小,以至于人们看作是不可能事件,这种把小概率事件在一次试验中人为地看作是不可能事件,称为“小概率事件实际不可能性原理”。

该原理是统计假设测验的基本原理,下一节将详细叙述该原理的具体应用。

多大概率可以认为是小概率呢?

小概率在不同的实际问题中有不同的标准,在农业生产和科学研究中多采用0.05和0.01这两个标准。

二、二项分布

(一)二项分布的含义

在农业科学研究中,经常会遇到种子出苗或不出苗、害虫的死或活、品种抗病或感病等非此即彼、二者必居其一的对立事件,即可以将总体中的全部个体区分为两类,这种由两类事件构成的总体叫二项总体(binarypopulation)。

在二项总体中,若“此事件”的概率记为p,则“彼事件”的概率记为1-p。

从二项总体中随机抽取n个个体,若属于“此事件”的个体为x个,则属于“彼事件”的个体为n-x个。

在每一次抽样中,随机变数x的取值范围为0、1、2、……n,共n+1种,x的这n+1种取值各有其概率,这些概率的分布称为二项分布。

在农业科学试验中,存在着大量的非此即彼的事件,其规律性多数都可以用二项分布来描述,所以二项分布是最常见的离散性随机变量的概率分布。

要描述一个总体,其总体平均数和标准差(或方差)是最重要的参数。

对二项总体,其平均数,方差,标准差。

(二)二项分布的概率函数及计算

在二项总体中,如果在一次试验中事件A发生的概率为p,那么在n次独立重复试验中事件A恰好发生x次的概率为:

这是二项分布的概率密度函数式,式中:

n次试验中事件A发生x次的概率

x=0、1、2、……、n

p:

事件A发生的概率

是系数

[例6.2]一批玉米种子,其田间出苗率为90%,每穴播3粒,试计算:

(1)每种出苗情况的概率。

(2)至少有一粒出苗的概率。

解:

若x表示出苗的事件,则出苗数x有3、2、1、0共4种情况。

(1)每种出苗数的概率分别为:

(2)至少有一粒出苗的概率为:

一批玉米种子,其田间出苗率为90%,为保证田间缺苗率不高于千分之一,则每穴至少播几粒?

(答案:

n≥3)

 

同时掷6枚硬币于地面,计算出现不同正面数的概率,并将其概率绘制成图。

 

三、正态分布

正态分布(normaldistribution)是连续性变数的一种理论分布,许多生物学领域的随机变量都服从正态分布,因此,它是生物统计的重要基础。

与二项分布一样,正态分布也有其概率密度函数:

正态分布概率密度函数的图像称作正态分布曲线或正态概率曲线,如图6-1。

图6-1正态分布曲线图

(一)正态分布曲线的特征

由正态分布曲线图,可以看出它有以下特征:

1.正态分布曲线是中间高、两边低,而且对称的光滑曲线,曲线最高峰在平均数处,越是接近平均数的组变量分布的次数越多、离平均数越远,分布的次数越少。

2.正态分布曲线因总体平均数和标准差的不同呈现为不同的曲线,所以它不是一条曲线,而是一个曲线系统(图6-2、图6-3)。

正态分布可用符号N(μ,σ)表示,不同的μ和σ,则有不同的曲线,因此正态分布曲线是一系列的曲线。

3.正态分布曲线与横轴间的总面积为1(图6-4)

区间µ±1σ面积或概率68.26%

µ±2σ95.45%

µ±3σ99.73%

µ±1.96σ95%

µ±2.58σ99%

图6-2σ相同,μ不同时的三条正态分布曲线图6-3σ不同,μ相同时的三条正态分布曲线

 

(二)正态分布的标准化

正态分布的标准化,是将观测值x的离均差(x-μ)以标准差σ为单位进行度量,所得的随机变数称为u,即:

随机变数u也服从正态分布,且平均数μ=0、标准差σ=1。

统计学上把μ=0、σ=1的正态分布称为标准正态分布,记作N(0,1)。

标准正态分布只有一条曲线,如图6-5。

 

(三)正态分布的概率计算

正态分布在某个区间上的概率在统计上经常用到,如果直接计算需要利用该随机变量的概率密度函数在该区间上的积分(即函数分布曲线下某个区间的面积)来求得。

而正态分布的概率函数较为复杂,积分的计算又较为困难,这里介绍正态分布概率计算的两种简便方法。

1.利用计算机软件来计算

本书实训部分介绍了用Excel所提供的粘贴函数进行计算,参看实训七。

2.利用标准正态分布累积函数值表

附表1列出了标准正态分布函数FN(u)在(-∞,u)区间内取值的概率,要计算标准正态分布某区间的概率,直接查表即可。

[例6.3]随机变数u服从标准正态分布N(0,1),试计算

(1)P(u≤0.35)

(2)P(u≥1.26)(3)P(0.35≤u≤1.26)。

解:

查附表1得:

P(u≤0.35)=0.6368

对于P(u≥1.26)不能直接查表,根据正态分布的对称性,P(u≥1.26)与1-P(u≤1.26)是相等的,而P(u≤1.26)=0.8962,所以有:

P(u≥1.26)=1-P(u≤1.26)=1-0.8962=0.1038

根据图6-6,P(0.35≤u≤1.26)=P(u≤1.26)-P(u≤0.35)=0.8962-0.6368=0.2594

图6-6P(0.35≤u≤1.26)的概率

下面是二个最常用的标准正态分布的概率值,望同学们理解并熟记。

P(-1.96≤u≤1.96)=0.95

P(-2.58≤u≤2.58)=0.99

对于一般正态分布N(μ,σ)的随机变量X,要计算其在某个区间上的概率,需先将它化为标准正态分布N(0,1)的随机变量u,然后利用标准正态分布累积函数表查出结果。

[例6.4]有一玉米果穗长度的正态总体,其平均数μ=20cm,标准差σ=3.4cm,试计算以下区间的概率:

(1)x1≥25cm

(2)x2≤13cm(3)13cm≤x3≤25cm

解:

首先将x值换算成u值:

查附表2,P(u1≤1.47)=0.92922

P(u2≤-2.06)=0.01970

P(x1≥25)=P(u1≥1.47)=1-P(u1≤1.47)=1-0.92922=0.07078

P(x2≤13)=P(u2≤-2.06)=0.01970

P(13≤x3≤25)=P(-2.06≤u≤1.47)=P(u1≤1.47)-P(u2≤-2.06)

=0.92922-0.04970=0.90925

[例6.5]计算标准正态分布中,

(1)中间概率为0.95时的u的临界值;

(2)≥1.96的概率。

解:

(1)如图6-6,当中间概率为0.95时,两侧概率通常又称两尾概率总和为0.05,则左尾概率为0.025,查附表2得,u≤-1.96,则右尾概率为0.025时的临界u值为+1.96,所以,中间概率为0.95时的u值为:

≤1.96

上述结果可写作:

P(≤1.96)=0.95

此题也可以直接利用附表2进行计算,计算过程为:

如图6-7,当中间概率为0.95时,两尾概率总和为0.05,直接查附表2得,=1.959964≈1.96,即中间概率为0.95时u的临界值为:

(2)≥1.96,包括两个部分:

一是从-∞到-1.96的左尾,另一部分是从1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 演讲主持

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1