统计学公式 贾俊平 精华版.docx
《统计学公式 贾俊平 精华版.docx》由会员分享,可在线阅读,更多相关《统计学公式 贾俊平 精华版.docx(16页珍藏版)》请在冰豆网上搜索。
统计学公式贾俊平精华版
统计学公式贾俊平精华版
01.加权平均数X?
?
WiXi
Wi
几何平均G?
x
02.离散程度
分类数据:
异众比率V-f(众数频数)m
r?
1总频数
顺序数据:
四分位差数值型数据:
方差/标准差
离散程度-离散系数(衡量差异大小)
Vs?
s
,越大,离散系数越大
X03.经验法则:
?
1/2/3个标准差68%/95%/99%04.偏态系数
未分组SK?
n?
Xi-X
?
3
n-1n-2*s
3
?
?
M3
分组SK?
i-X?
*组数
n*s3
Mi,该组的中值;SK越大偏斜越大,
正值,右偏分布峰态系数分组K?
?
?
M
-X
4
i
?
*组数
n*s4
?
3,尖峰分布;?
扁平
?
?
PS:
P?
?
?
?
0.3?
P=?
?
双侧:
H0?
A
无显著差异,同?
/2比较
左单侧:
希望数值越大越好H0?
?
A
右单侧:
希望数值越小越好H0?
?
A;同?
比较P值检验方法,求出Z,若>μ,计算P(Z>Z值)值双侧:
P<?
/2拒绝原假设单侧P<?
拒绝原假设运用置信区上下限比较
?
(边际误差)?
Z?
?
(单侧为n
?
)
抽样标准误差?
总体标准差
n
若x-
?
0?
?
,则拒绝H
若?
未知,用s代替,使用t分布
11.一个总体均值的区间估计
(1)大样本且方差已知/未知:
X?
Z?
或S?
2n
即,该样本平均?
置信区间为。
。
(2)总体正态,小样本,方差未知X?
t?
1)S?
2(n12.样本比率P(样本?
总量)的区间估计
P?
ZP(1?
P)
?
n
13.总体方差(n?
1)s2?
2?
?
2
?
(n?
1)s22
?
/2
?
1?
?
/2
?
2自由度n-1
21.一个估计时样本量的确定:
n?
?
Z?
?
22
2
?
?
?
E2?
?
E(边际误差)?
Z?
?
?
2n?
?
?
22.估计比例时样本量的确定
2
n?
?
Z?
2
?
?
P(1?
P)
E
2
(遇小数点向前进一)31.一个参数的假设检验大样本:
Z?
X?
?
?
或S
/n
小样本,?
已知Z?
X?
?
?
/n
小样本,?
未知:
t?
X?
?
S/n
自由度?
n?
1
32总体比例检验统计量:
Z?
P?
?
?
(1?
?
)
n
.总体方差的检验:
?
?
?
n?
1?
S2332
?
?
2
?
2n-1?
?
?
2?
?
21?
?
/2?
/2?
n-1?
,则不拒绝
11.两个总体均值之差(独立样本)的区间估计:
(1)大样本(n1,n2?
30),?
1,?
2已知/未知
?
/S可以互换
X1
?
X2?
?
Zs221
?
2
n?
s2
1
n2
(2)小样本,正态,?
1?
?
2,未知
X
1
?
X?
?
tnp?
11?
2
?
(1?
n2?
2s2?
?
?
?
n?
1n2?
?
?
n
?
1?
s2?
?
n2sp
1
1
2?
1?
s
2
2?
n1?
n2?
2
(3)小样本,正态,?
1?
?
2,未知,n1?
n2
X?
X?
?
s2
s2?
1
2?
t?
(n1?
n2?
2?
?
1
?
2
?
?
n1n2?
?
(4)小样本,正态,?
1?
?
2,未知,n1?
n2
X
?
?
t?
s2
1s22?
1
?
X2
?
(v?
?
?
?
?
n1
n2?
?
?
?
s2
s22
?
1?
2?
?
v?
?
n1n2?
?
?
?
s22
2
?
1?
?
?
?
s22?
?
n1?
?
?
?
?
?
?
n2?
n1?
1n2?
1
(5).两个总体之差(匹配样本)的估计,d为每一组对应样本之差的总平均数
?
1?
大样本d?
Zsd
?
n
?
2?
小样本d?
t?
?
1)
sd(nn
12.两个总体比例之差:
?
p
?
p2?
?
Zp1(1?
p1)p2(1?
p2)
1
?
2
n?
1n2
13.两个总体方差比
s2
1/s22
2s21/s22
F?
?
2
1/?
2
?
?
/2
F1?
?
/2
?
?
?
F1?
?
1?
?
/2?
n1,n2?
?
F?
?
/2n1,n2?
?
21两个估计均值差时样本量的确定:
nZ22
?
2
?
?
1?
?
22
1?
n2?
?
E
2
22.估计比例时样本量的确定
n1?
n2;p1?
p2?
0.5n?
?
Z2?
2
?
p1
(1?
p1)?
p2(1?
p2
)
E
2
边际误差E
31.两个参数的假设检验1)大样本Z?
X
1
?
X2?
?
?
1?
?
2?
?
2?
2,
12
n?
1n2
2)小样本,?
?
1?
?
2
?
X
1
?
X2?
?
?
1?
?
2?
S211?
p?
?
?
?
n?
1
n?
2?
?
(n1?
n2?
2)3)小样本,?
?
1?
?
2
?
X
1
?
X2?
?
?
1?
?
2?
?
s2
s2?
1
2
?
?
n?
?
?
1n2?
?
V值4)匹配样本:
计算?
?
?
sn,
t(n?
1)比较
32两个总体比率之差:
A、?
1?
?
2
Z?
p1?
p2
p(1?
p)?
?
1
1?
?
n?
n?
?
1
2?
?
B、样本比例?
1?
?
2?
d(多设为00)Z?
p1?
p2?
d
?
?
p?
1(1?
p1)p2(1?
p2)?
?
n?
n?
12?
?
p?
n1p1?
n2p2
n1?
n2
33.总体方差的相似性:
F?
S2
1S2
2
若F1?
?
/2?
n1,n2?
?
F?
F?
/2?
n1,n2?
则可判定,?
1?
?
2
((t自由度(t自由度同左(同
连列分析
2.双因素方差分析连列表:
条件频数/行百分数/列百分数/总百分数期望值:
行百分数x条件总值
方差分析:
检验各个总体的均值是否相等,判断分类自变量对数值因变量的影响
(f0观察值频数fe期望值频数)1.两数之间相关程度:
?
2
?
?
?
f
?
fe?
2
fe
自由度?
(行数-1)(列数-1)
同?
2?
?
df?
比较,若?
2?
?
2
?
?
df?
,拒绝原假设2.独立性检验(是否存在依赖关系)
?
2
?
?
?
f
?
f2
e?
行总和RT?
列总和CT
ffe?
)e总数
同?
2
?
?
df?
比较3.?
相关系数?
?
2n
?
ad-bc
a?
bc?
d?
a?
cb?
dab
cd,?
越大,相关程度越大
4.列联相关系数c?
?
2
?
2?
n
5.V相关系数?
?
2
n*minr-1,c-1单因素方差分析
总平方和(总误差)SST,组间误差SSA,组内误差SSE,x一个条件组的平均数;x总平均数
i:
第i个条件;j:
其中第j个值,n总数,k组的个数SSA:
(组内频数*((各组间平均值与x的误差)的平方))总和自由度k-1
SSE:
(每组内频数与组平均值x的误差)的平方)的总和自由度n-k
SST:
(每一个观测值与x的误差)的平方的总和;自由度n-1MSA组间均方?
SSAk-1;MSE_组内均方?
SSE
n-k
1.统计量F?
MSA
MSE
若F?
F?
,拒绝2.关系量强度R2?
SSA
SSE
自变量对因变量的影响占总的R2
3.最小显著差异LSD?
t?
11?
?
2MSE?
?
?
n?
in?
j?
?
自由度为n-kXi-Xj?
LSD,拒绝,有显著差异
LSD是比较每两组数据间的关系A.独立双因素
列数r,因素j,每列平均值xj;行数k,因素i,每行平均xi;x为总平均数
总平方和(总误差)SST,自由度df:
kr-1行因素误差和SSR,df(k-1),列因素误差和SSC,df(r-1)随机误差平方和SSE;df(r?
1)(k?
1)
SST?
SSR?
SSC?
SSE
MSR?
SSR
K?
1
MSC、MSE同理
1.行因素显著性F?
MSR
RMSE~F(k-1,(r?
1)(k?
1))
列因素显著性FMSC
C?
MSE
~F(r-1,(r?
1)(k?
1))
若F?
F?
,拒绝,即差异显著2.
关系量强度R2?
SSR?
SSC
SST
这两个自变量对因变量的影响占总的R2
B.交互作用双因素
K,个行因素;m,行因素数值的行数R,个列因素;n,观察值总数
误差来源平方和自由度均方F值行因素SSRK-1MSRMSR/MSE列因素SSCR-1MSCMSC/MSE交互左右SSRC(K-1)(R-1)MSRC/MSE误差SSEKR(M-1)总和SSTN-1
1.
51.一元线性回归模型
估计的简单线性回归方程:
y?
?
A?
Bx估计的回归方程的斜率和截距:
B?
?
x?
i
iyi?
xyi
?
?
x2?
n
x
2
i
nA?
y?
b1x52.相关系数r,两个关系间的关系强度?
0,正线性相关;?
0,负线性相关;?
0,无关r的显著性检验,
?
1?
总体相关系数?
较大,正值,r左偏
较大,负值,r右偏分布
?
2?
t
?
r
n-2
1-r
2
~t?
n-2)若t?
t?
,拒绝,即存在r强度的线性关系
53.拟合优度R2?
SSR
SST
越大拟合越好估计标准误差:
Se?
MSE
54.线性关系显著性检验
线性关系F?
MSR
MSE
~F?
1,n-2?
SSR自由度K;SSE自由度n-k-1
回归系数t?
B?
A
S,
?
?
S?
?
?
Se
?
X2
1I?
n?
?
XI
?
2
55.y的置信区间估计,取值X0时,得到y0y1
2
0?
t?
(n?
1)*Se*?
x0?
xn
?
x2
i
?
x56.残差e?
y0-y?
0标准化残差Zei?
y0-y?
0
S,y?
预测y
e
回归分析的一些数据P1:
MR:
相关系数;RS判定系数,ARS调整的判定系数;标准误差s,观测值nP2:
df自由度;总平方和SS;均方MS;线性关系F(Ps:
回归R,残差E,总计T)
61.多元线性回归模型:
多元回归方程:
y?
?
0?
?
1x1?
?
2x2?
?
?
?
?
?
pxp?
?
SST,SSR,SSE之间的关系:
SST?
SSR?
SSE
62.拟合优度
多重判定系数:
R2?
SSR
SST
修正的多重判定:
R2a?
1?
?
1?
R2?
?
n?
1n?
k?
1
样本数量n,自变量数量k估计标准误差:
Se?
MSE
63.显著性检验:
线性关系
F?
SSR/K
SSE/(n?
k?
1)
~F(k,n?
k?
1)
回归系数:
t?
i?
iS~t?
2n-k-1)?
i
64.多重共线性判定各个自变量之间相关系数,
若均?
t?
2n-k-1
),拒绝,即存在71.时间序列
平稳序列
非平稳序列(趋势T/季节性S/周期性C/随机性I)
平均增长率=环比增长率的几何平均值-1
72.预测方法评估第i个观测值Yi,预测值Fi
平均误差ME?
所有预测误差的平均数
平均绝对误差MAD?
全部误差取绝对值后总和求平均均方误差MSE?
每一个误差平方后的总和求平均73.平稳序列的预测t
简单平均法Ft?
1
?
1
t
?
Y
i
移动平均:
Ft?
1?
选择K个值作为一期的平均数
指数平滑:
Ft?
1?
Ft?
?
?
Yt-Ft?
74.趋势型预测线性趋势指数曲线修正指数曲线
75.季节性顺序
P3,:
INTER,截距;XV,斜率;t-stat回归系数P值检验,P>?
,不拒绝;<?
,拒绝