统计学考试要点整理docWord文档下载推荐.docx
《统计学考试要点整理docWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学考试要点整理docWord文档下载推荐.docx(15页珍藏版)》请在冰豆网上搜索。
对连续性数据进行分析的方法,通常称为变量的方法
10属性的方法:
对离散型数据进行分析的方法
11对于数据的变异程度,经常使用的度量方法有三中,1范围或称为极差2平均离差3标准离差或称为标准差
12概率论:
研究偶然现象本身规律性的科学
13统计学:
基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性的科学
14随机实验:
在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验
随机误差:
试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。
15基本事件:
试验的每一最基本结果用小写拉丁字母表示
16事件:
基本事件的集合,用大写拉丁字母表示
17样本特征数:
数据集中点的度量~~平均数,数据变异程度的度量---标准差和数据分布的对称程度及陡峭程度的度量----偏斜度和峭度,这些数字是描述样本频率分布特征的,称为数据样本特征或简称为样本特征数
18离差平方和:
将所有离均差都平方,然后相加,所得到的和,成为~
19样本方差s*s:
用样本含量n或者n-1除离差平方和而得到一个平均数,称为~
20偏斜度:
度量数据围绕众数陈不对称得程度即所称的~
21三阶中心矩:
m3=[∑(x-x杠)∧3]/n这个m3矩,因为是三次方二称为三阶;
又因为(x-x杠)表示x与平均数的离差,所以称为中心的。
m3的分母是n而不是n-1。
相应地m’3=[∑x∧3]/n称为三阶原点距
二阶见课本16页
22古典概型:
随机试验的全部可能的结果(即本事件数)是有限的,各基本事件间是互不相容且等可能的,这类随机现象的概率类型称为~
23条件概率:
事件B已经发生的条件下,事件A发生的概率,这是的概率称为已知事件B发生的条件下,事件A发生的条件概率
24概率乘法法则:
两事件交的概率,等于其中一事件(概率必须不为0)的概率乘以另一事件在已知前一事件发生条件下的概率
25随机变量:
随机试验中被测定的量
26观测值:
随机变量所取得的值
27离散性随机变量:
如果随机变量可能取得的数值为有限个,或可数无穷个孤立的数值,则称为~
28连续性随机变量:
如果随机变量可取某一(有限或无限)区间内的任何数值,则成为~
29概率函数:
离散型随机变量X,可能取得的数值为有限个或可数无穷个孤立的数值。
因此,对于X的每个值都能得出一个概率值。
可以将随机变量X所取得值x的概率P(X=x)写成x的函数p(x),这样的函数称为随机变量X的概率函数
30密度函数、分布函数字母太麻烦,课本36
31统计量:
x杠和s方、都是从样本数据计算出来的,统称成为~,描述样本特征的数量
32参数:
μ和σ是总体恒定的量,称为参数.,描述总体特征的数量
33总体特征数:
描述概率分布特征的数字称为总体特征数,包括随机变量的数学期望,方差和各阶矩
34数学期望:
所谓X或X的函数的数学期望,即它们的理论平均数
35二项分布课本42
36泊松分布:
在二项分布中,当某事件出现的概率特别小(ᵩ→0),而样本含量又很大(n→∞)且nᵩ=μ时,二项分布就成泊松分布了
37标准正态分布:
μ=0,σ=1的正态分布
38中心极限定理:
58页
39抽样分布:
从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得样本的各种统计量的概率分布,即所谓的~
40样本误差、自由度课本63
41卡方分布64页
42零假设H0:
总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均数μ等于某一给定的值μ0(μ=μ0)。
或者说,μ与μ0的差等于零,这样的假设成为~
43备则假设:
与零假设相对立的假设,它是在拒绝H0的情况下,可供选择的假设
44统计假设检验:
总体参数估计课本69页
45显著性检验、显著性水平、检验统计量、拒绝域、临界值课本70页
46单侧检验、上尾检验、下尾检验、Ⅰ错误课本71
47无偏估计量:
如果一个统计量的理论平均数,即它的数学期望等于总体参数,这个统计量就被称为~
48点估计:
由用样本数据所计算出来的单个数值,对总体参数所作的估计称为~
49有效估计量:
在样本含量相同情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个是更有效的估计量
50相容估计量:
若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而趋于1,则该统计量称为参数的~
51区间估计96页
52置信水平、置信区间97
53拟合优度检验:
用来检验试剂观测数与依照某种假设或模型计算出来的理论书之间的一致性,以便判断该假设或模型是否与观测数相配合。
也包括两种错误,1如果某一模型正确但拒绝了它,就会犯Ⅰ型错误2当某一模型不正确,却错误接受了它,会犯Ⅱ型错误
54列联表:
卡方检验是另一类型的卡方检验,可以用它检验事件间的独立性或者说检验处理之间的差异显著性
55单因素117
56固定效应、随机效应118
57最小显著差数法LSD126页
58方差分析具备的三个条件128页
第二部分简答
1.几种字母的意义
样本各种特征用拉丁字母表示:
¯
x~~平均数s方~~~方差s~~标准差¯
x~~平均数,s方~~~方差称为统计量
总体各种特征用希腊字母表示:
μ~~~平均数σ方~~~~总体方差σ~总体标准差σ,μ称为参数
2.什么叫总体?
什么叫样本?
为什么要抽样?
怎样抽样?
1)总体:
2)样本:
3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的研究,推断其总体。
生物统计学中往往总体数目是无限个,为方便研究总体特征需要抽样。
4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机抽样。
随机抽样的方法很多,例如抽签,拈阄等。
最好方法是使用随机数字表进行抽样。
5)随即数字表抽样步骤:
第一步,闭上眼睛用铅笔在随机数字表上任意点上一点,假若点到奇数,就用第一页表;
假若点到偶数,就用第二页表。
第二步,在选定的那一页上,在点一次,决定从那个字开始。
决定开始以后进行读书(例如,总体有4728个个体,那就四位数字为一节读下去,不考虑数字间隙。
)可以正读,倒读,横向读,纵向读,也可以沿对角线方向读。
直到读取得数字个数与要取得样本个数相同时才结束。
3.从一个有限总体中,采取放回式抽样和非放回式抽样,所得样本有什么不同?
答:
1)放回式抽样是指:
从总体中抽出一个个体,记下他的特征后,放回总体中,再做第二次抽样。
这样抽样方式可能会重复抽到某一个体。
2)非放回式抽样:
从总体中抽出个体后不再放回。
3)不同:
采用放回式抽样,在各种抽样间是相互独立的;
而采用非放回式抽样,在各次抽样间是非独立的。
4)补充:
对无限总体而言,两者无区别。
3.什么是统计假设?
答:
假设总体平均数μ等于某个值μ0(μ=μ0),然后,通过样本数据去推断这个假设是否可以接受。
若果可以接受,样本很可能抽自这个总体,否则,很可能不是抽自这个总体。
这就是统计假设检验。
4.统计假设目的?
有一个样本或一系列样本所得到结果来推断总体的特征。
5.简述统计假设检验中两类错误的定义及其关系。
假设检验中主要有两类错误,I型错误和II型错误。
当零假设H0本来是正确的,但拒绝了H0,这类错误称为I型错误,由于这种错误的概率用α表示,所以又称为α型错误;
当零假设H0本来不正确但却又接受了H0,这类错误称为II型错误,这类错误的概率以β表示,因而又叫做β错误。
两类错误的关系:
(1)统计检验中两类错误即α错误和β错误。
两类错误的定义,α错误是弃真错误,又称为Ι型错误,β错误是Ⅱ型错误,又称为取伪错误;
(2)α错误和β错误相互之间的关系是:
α大时,β小;
α和β不能同时减少。
6.统计假设有哪几种?
它们的含义是什么?
有零假设和备择假设。
零假设:
假设抽出样本的那个总体之某个参数(如平均数)等于某一给定的值。
备择假设:
在拒绝零假设后可供选择的假设。
7.小概率原理的含义是什么?
它在统计假设检验中起什么作用?
小概率的事件,在一次试验中,几乎是不会发生的。
若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。
小概率原理是显著性检验的基础,或者说显著性检验是在小概率原理的基础上建立起来的。
8.什么情况下用双侧检验?
什么情况下可用单侧检验?
两种检验比较,哪一种检验的效率更高?
为什么?
以总体平均数为例,在已知μ不可能小于μ0时,则备择假设为HA:
μ>
μ0,这时为上尾单侧检验。
在已知μ不可能大于μ0时,则备择假设为HA:
μ<
μ0,这时为下尾单侧检验。
在没有关于μ不可能小于μ0或μ不可能大于μ0的任何信息的情况下,其备择假设为HA:
μ≠μ0,这时为双侧检验。
两种检验比较,单侧检验效率更高,因为在单侧检验时,有一侧的信息是已知的,信息量大于双侧检验,因此效率高于双侧检验。
9.显著性水平是一个指数还是一个特定的概率值?
它与小概率原理有什么关系?
常用的显著水平有哪几个?
显著性水平是一个特定的概率值。
在小概率原理的叙述中提到“若根据一定的假设条件,计算出来该事件发生的概率很小”,概率很小要有一个标准,这个标准就是显著水平。
常用的显著水平有两个,5%和1%。
10.配对比较法与成组比较法有何不同?
在什么情况下使用配对法?
如果按成组法设计的实验,能不能把实验材料随机配对,而按配对法计算,为什么?
配对比较法:
将独立获得的若干份实验材料各分成两部分或独立获得的若干对遗传上基本同质的个体,分别接受两种不同的处理;
或者同一个实验对象先后接受两种不同处理,比较不同的处理效应,这种安排称为配对实验设计。
成组比较法:
将独立获得的若干实验材料随机分成两组,分别接受不同的处理,这种安排称为成组比较法。
在生物统计学中,只有遗传背景一致的成对材料才能使用配对比较法。
如果按成组比较法设计的实验,不能把实验材料进行随机配对而按配对法计算。
因为这种配对是无依据的,不同配对方式所得结果不同,其结果不能说明任何问题。
11.为什么会产生I型错误?
为什么会产生II型错误?
两者的关系是什么?
为了同时减少犯两种错误的概率,应采取什么措施?
在H0是真实的情况下,由于随机性,仍有一部分样本落在拒绝域内,这时将拒绝H0,但这样的拒绝是错误的。
即,如果假设是正确的,却错误地据绝了它,这时所犯的错误称为I型错误。
当μ≠μ0,而等于其它的值(μ1)时,样本也有可能落在接受域内。
当事实上μ≠μ0,但错误地接受了μ=μ0的假设,这时所犯的错误称为II型错误。
为了同时减少犯两种错误的概率,应当增加样本含量。
12.统计推断的结论是接受H0,接受零假设是不是表明零假设一定