统计学知识点含计算Word文档下载推荐.docx
《统计学知识点含计算Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学知识点含计算Word文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
![统计学知识点含计算Word文档下载推荐.docx](https://file1.bdocx.com/fileroot1/2022-10/12/ff928c8c-6c73-4ba5-9e3e-6592d9fd33d5/ff928c8c-6c73-4ba5-9e3e-6592d9fd33d51.gif)
方差未分组分组
经验法则表明:
当一组数据对称分布时
约有68%的数据在平均数加减1个标准差的范围之内
约有95%的数据在平均数加减2个标准差的范围之内
约有99%的数据在平均数加减3个标准差的范围之内
切比雪夫不等式
1.如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用
2.切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”
3.对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。
其中k是大于1的任意值,但不一定是整数
对于k=2,3,4,该不等式的含义是
1.至少有75%的数据落在平均数加减2个标准差的范围之内
2.至少有89%的数据落在平均数加减3个标准差的范围之内
3.至少有94%的数据落在平均数加减4个标准差的范围之内
离散系数标准差与其相应的均值之比计算公式为
统计量
设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量
样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数
统计量的分布称为抽样分布。
1.样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
2.随机变量是样本统计量样本均值,样本比例,样本方差等
3.结果来自容量相同的所有可能样本
4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据几种常用的抽样分布:
(正态分布中的几种统计量的分布)把分布(z),分布,分布,
点估计用样本的估计量的某个取值直接作为总体参数的估计值
例如:
用样本均值直接作为总体均值的估计;
区间估计在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到
1.置信水平表示为(1-α)为是总体参数未在区间内的比例
3.常用的置信水平值有99%,95%,90%相应的α为0.01,0.05,0.10
假定条件
总体服从正态分布,且方差(s2)已知
如果不是正态分布,可由正态分布来近似(n³
30)
2.使用正态分布统计量z
3.总体均值m在1-a置信水平下的置信区间为
置信水平
a
a/2
Za/2
90%
0.1
0.05
1.645
95%
0.025
1.96
(小样本)总体服从正态分布,但方差(s2)未知(n<
30)用t分布统计量
总体比例p在1-a置信水平下的置信区间为
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断
假设检验的流程
提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策
几种常见假设检验
考虑下面三种类型的假设检验:
(4.12)
(1)(双边检验)
(2)(右侧单边检验)
(3)(左侧单边检验)
1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。
备择假设与原假设对立的假设
H0:
样本与总体或样本与样本间的差异是由抽样误差引起的;
H1:
样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;
当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。
根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。
若P>
α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;
如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。
P值的大小一般可通过查阅相应的界值表得到。
1.P值是一个概率值
2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积
3.被称为观察到的(或实测的)显著性水平
H0能被拒绝的最小值
方差分析通过检验各总体均值是否相等来判断分类型自变量对数值型因变量的是否有显著影响用于两个及两个以上样本均数差别的显著性检验。
方差分析的基本假定1.每个总体都应服从正态分布
对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本
(1)每个总体都服从正态分布
(2)观察值相互独立
(3)各个总体样本方差必须相同
1、建立检验假设;
多个样本总体均数相等;
多个样本总体均数不相等或不全等。
检验水准为0.05。
2、计算检验统计量F值;
3、确定P值并作出推断结果。
SST=SSA+SSE
SST的自由度为n-1,其中n为全部观察值的个数
SSA的自由度为k-1,其中k为因素水平(总体)的个数
SSE的自由度为n-k
组内方差
组间方差
误差来源
平方和(SS)
自由度(df)
均方(MS)
F值
P值
F临界值
组间(因素影响)
SSA组建平方和
k-1
MSA组间方差
MSA/MSE
组内(误差)
SSE组内平方和
n-k
MSE组内方差
总和
SST总平方和
n-1
双因素方差分析分析两个因素(行因素Row和列因素Column)对试验结果的影响
行平均值列平均值总平均值
计算平方和(SS)
行因素误差平方和SSR
列因素误差平方和SSC
随机误差项平方和SSE总误差平方和SST
SST=SSR+SSC+SSE
计算均方(MS)
§
误差平方和除以相应的自由度
三个平方和的自由度分别是
•总误差平方和SST的自由度为kr-1
•行因素平方和SSR的自由度为k-1
•列因素平方和SSC的自由度为r-1
•误差项平方和SSE的自由度为(k-1)×
(r-1)
行因素的均方MSR
,列因素的均方MSC,误差项的均方MSE,
将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出对原假设H0的决策
根据给定的显著性水平a在F分布表中查找相应的临界值Fa
若FR>
Fa,拒绝原假设H0,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响
若FC>
Fa,拒绝原假设H0,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响
行因素的统计量列因素的统计量
平方和(SS)
自由度(df)
=ss/df
F值临界值
行因素
SSR
MSR
MSR/MSE
于a=0.05比较
查表
列因素
SSC
r-1
MSC
MSC/MSE
小于a拒绝,大于不拒绝
F大于Fa拒绝显著
小于不拒绝不显著
误差
SSE
(k-1)(r-1)
MSE
SSTSST=SSR+SSC+SSE
kr-1
1.一元线性回归模型描述因变量y如何依赖于自变量x和误差项e的方程称为回归模型
2.一元线性回归模型可表示为
y=b0+b1x+e
ny是x的线性函数(部分)加上误差项
n线性部分反映了由于x的变化而引起的y的变化
n误差项e是随机变量
l反映了除x和y之间的线性关系之外的随机因素对y的影响
l是不能由x和y之间的线性关系所解释的变异性
nb0和b1称为模型的参数
误差平方和
1.总平方和(SST—totalsumofsquares)
n反映因变量的n个观察值与其均值的总误差
2.回归平方和(SSR—sumofsquaresofregression)
n反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和
3.残差平方和(SSE—sumofsquaresoferror)
n反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和
判定系数R2回归平方和占总误差平方和的比例
2.反映回归直线的拟合程度
3.取值范围在[0,1]之间
4.R2®
1,说明回归方程拟合的越好;
R2®
0,说明回归方程拟合的越差
5.判定系数等于相关系数的平方,即R2=r2
1.统计量
P156根据样本量构造出来的一个函数
2.抽样分布
P160
3.点估计
P176
4.区间估计
5.假设检验P值的含义
P214
6.利用P值进行检验
单侧检验
P>
α
不拒绝H0
P<
拒绝H0
双侧检验
(α/2)
不拒绝H0
7.方差分析基本假设
P268
简答题:
一.点估计
1.就是用样本统计量的某个取值直接作为总体参数的估计值。
2.无法给出估计值接近总体参数程度的信息。
二.统计量:
设X1,X2,…Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…Xn),不依赖于任何未知参数,则称函数T(X1,X2,…