统计学原理计算公式.docx
《统计学原理计算公式.docx》由会员分享,可在线阅读,更多相关《统计学原理计算公式.docx(15页珍藏版)》请在冰豆网上搜索。
统计学原理计算公式
位值平均数计算公式
1、众数:
是一组数据中出现次数最多的变量值
组距式分组下限公式:
Mo
A
L1—d
momo
12
Lm0:
代表众数组下限;*1=fmo-fmo—1:
代表众数组频数一众数组前一组频
dmo:
代表组距;
2=fmo-fmo*:
代表众数组频数一众数组后一组频数
2、中位数:
是一组数据按顺序排序后,处于中间位置上的变量值
n1
中位数位置=——
2
分组向上累计公式Me=Lme'
2Sme-1
fme
dmee
Lme代表中位数组下限;Sme-1:
代表中位数所在组之前各组的累计频数;
fme代表中位数组频数;dme代表组距
3、四分位数:
也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含
25%,处在25%和75%分位点上的数值就是四分位数。
n1-n13(n1)
其公式为:
Q1=Q2=(中包数)Q3=
424
实例
数据总量:
7,15,36,39,4。
41
一共6项
Q1的位置=(6+1)/4=1.75Q2的位置=(6+1)/2=3.5Q3的位置=3(6+1)/4=5.25
Q1=7+(15-7)义(1.75-1)=13,
Q2=36+(39-36)义(3.5-3)=37.5,
Q3=40+(41-40)义(5.25-5)=40.25
数值平均数计算公式
1、简单算术平均数:
是将总体单位的某一数量标志值之和除以总体单位。
X
其公式为:
x1x2
Xn三X
2、加权算术平均数:
受各组组中值及各组变量值出现的频数
(即权数f)大小的影响,
X
其公式为:
XiflX2f2Xifi
三xf
3、加权算术平均数的频率:
其公式为:
X=X1
fl
X2
4、调和平均数:
fi
f2……IX
fn
由于只掌握每组某个标志的数值总和(
M)而缺少总体单位数(f)的资料,
不能直接采用加权算术平均数法计算平均数,则应采用加权调和平均数。
其公式为:
5、简单几何平均数:
就是n个变量值(Xn)连乘积的n次方根:
其公式为:
G=
1X2X3Xn
6、加权几何平均数:
如果变量值较多,其出现的次数不同,则应采用加权几何平均数,
其公式为:
G=
fi
Xf
标志变异绝对指标及成数计算公式
、标志变异绝对指标:
1、
异众比率(又称离异比率或变差比,它是指非众数组的频数占总频数的比率)
公式即,Vr
“fm彳fm
=1
三fi
三fi
2、
极差(也称全距,它是一组数据的最大值与最小值这差
公式即:
R=Xmax-Xmin
3、
平均差(总体各单位标志值对算数平均数的绝对离差的算术平均数,平均差是反映各标志
值对平均数的平均距离,平均差越大,说明总体各标志值越分散,平均差越小,说明
各标志值越集中),
4、
公式即为:
(未分组情况)A.D=
方差和标准差:
(分组情况):
A.D=
方差(是各变量值与其均值离差平方的平均数)
公式即为:
(未分组情况)仃
三(x—X)2
2
(分组情况):
仃
工(x-X)2f
标准差(方差的平方根),
公式即为:
(未分组情况)
三(x-x)2
(分组情况):
0
工(x-X)2f
if
方差的数学性质:
变量的方差等于变量平方的平均数减去变量平均数的平方。
方差的简便算法:
方差二平方的平均数-平均数的平方
三X2
-x
、2
平方的平均数表示为:
-
平均数的平方表示为:
in/
22
方差简便算法的公式即为:
22
X-(x)
、是非标志的平均数、方差、标准差:
是非标志:
将总体分成具有某种性质和不具有某种性质的两部分,我们所关心的标志表
现称为“是”,另一标志标现称为“非”0例如:
产品分为合格与不合格品。
成数:
总体中,是非标志只有两种表现,我们把具有某种表现和不具有某种表现的单位
占全部总体单位的比重称为成数。
具有某种性质的成数用(p)表示,不具有某
种性质的用(q)表示。
p+q=1。
[成数的平均数(均值)就是成数本身]
成数方差:
仃2=p(1-p)成数标准差:
仃=Jp(1-P
抽样平均误差、极限误差计算公式
1、抽样平均误差:
反映所有的样本平均数与总体平均数的平均误差,用°X表示。
平均数公式:
重置抽样公式为:
三(x-」)2二二
Mn
其中仃表示总体标准差,n表示样本容量,M为样本个数o
不重抽样公式为:
三(X-」)2二N-n
其中n为总体单位数。
成数公式:
重置抽样公式为:
P(1-P)
n
不重置抽样公式为:
P(1-P)N-n
N-1
2、极限误差:
样本统计量与被估计的总体参数的离差的绝对值所容许的最大值,又称边际误
差,用」
来表示。
x—X-Ax
p-PM,
A
z=—,用文字表述为:
概度率二抽样极限误差+抽样平均误差。
CF-
X
3、计算题步骤:
概率保证程度用F(z)表示,又叫置信度或置信水平,它是Z的函数
第二套:
△求F(z)
1、抽样计算Xn区间估计2、根据:
z=一查表F(z)
第一套:
F(z)求△
1、抽样计算「又二区间估计
2、根据:
F(z)查麋/Z
3、计算:
&=Z心x,写出X:
收一A,又十区)
4、成数计算步骤:
第一套:
5小)求小
1、抽样计算「P=区间估计
2、根据:
F(z)1表Z
3、计算:
Ap=z⑪p写出(P-ip,P+与)
第二套:
△求F(z)
1、抽样计算P=区间估计
2、根据:
z=—|查表F(z)
;-p
3、由P和Ap,写出(P-ip,P+%)
样本容量、相关系数、估计标准误差
1、平均数:
重复抽样下样本容量n
2_2
z二
;不重复抽样下样本容量
A
22
Nz二
n一222
(N-1)2z2:
2
2、成数:
重复抽样下样本容量n
2
zp(1-p)
不重复抽样下样本容量
%2;
2
Nzp(1-p)
22
(N-1)pzp(1-p)
、相关系数:
在线性条件下说明两个变量之间相关关系密切程度的统计分析指标。
公式1:
r
Z(x-x)(y-y)=Z(x-X)(y-y)
..三(x—x)2](y—y)2..三(x—x)2・、:
三(y—y)2
公式2:
r二
nJxy-】x二y
3nMx2一(鼠fVnEy2-(^y2
公式3:
r
CJ
xy
、样本容量的确定
三、一元线性回归分析:
只涉及一个自变量时称为一元回归
1、估计回归方程可表示为:
y=bo+b1x,
其中仇是估计的回归直线在y轴上的截距,是当x=0时的期望值;匕是直线的斜率,称
为回归系数,表示当x每变动一个单位时y的值平均变动
2、最小二乘法(残差平方和最小)
三、回归直线的似合程度
1、判定系数(可决系数):
等于相关系数的平方。
2、估计标准误差:
实际观察值与回归估计值离差平方和的均方根
反映实际观察值在回归直线周围的分散状况
从另一个角度说明了回归直线的拟合程度
计算公式为Sy
三(y一?
)2_-y2-bb^y-biixy
n-2'in-2
四、利用回归方程式进行估计
1、点估计:
对于自变量x的一个给定值X0,根据回归方程得到因变量y的一个估计值
根据回归方程:
y=b0+biX得出y的估计值。
时间序列的分析指标
1、绝对数时间序列的计算:
(用算术平均数计算)
①、时期序列的序时平均数:
N—……yn=三丫/n
②、时点序列的序时平均数:
连续时点:
连续每天资料不同:
y=三y/n
持续天内资料不变:
y=三yt/三t
间断时点:
间隔时间相等序时平均数的计算(首末折半):
间断时点:
间隔不相等序时平均数的计算:
2、绝对数或平均数时间序列的序时平均数:
应先分别求出构成相对数或平均数的分子和分母
的平均数,而后再进行对比(先平均,再对比):
y=a/b
3、增长量:
增长量=报告期水平-基期水平。
逐期增长量:
是报告期水平与前一期水平之差,表示本期比前一期增长的绝对数量累积增长量:
是报告期水平与某一固定时期水平之差,说明报告期与某一固定期增长的绝
逐期增长量与累积增长量之间存在一定的关系:
各逐期增长量的和等于相应时期的累积增长量;两相邻时期累积增长量之差等相应时期的逐期增长量
(yi-yi_i)yn-y。
4、平均增长量:
&y==
(n为逐期增长量个数,它是观察数量的个数减1)
平均增长量=逐期增长量之和/逐期增长量个数=累积增长量/观察期数。
5、发展速度:
发展速度=报告期水平/基期水平
环比发展速度:
是报告期发展水平与前一水平之比,说明现象逐期发展变化的程度
定基发展速度:
是报告期发展水平与某一固定时期水平之比,说明现象整个观察期内总的发展变化程度。
以上两种发展速度之间存在着一定的数量:
各个环比发展速度的连乘积等于最末期的定基发展速度;两个相邻的定基发展速度之比等于相应的各期环比发展速度。
6、增长速度:
增长速度=增长量/基期水平=报告期水平-基期水平/基期水平=发展速度-1
环比增长速度:
Gi=yi—y—/y—=yi/y7—1(i=1,2-n)
定基增长速度:
Gi=yi—yo/yo—yi/yo_1(i=1,2…n)
环比增长速度与定基增长速度之间没有直接关系:
若由环比增长速度推算定基增长速度,可
先将各环比增长速度加1后连乘,再将结果减1,即得定期增长速度。
7、平均发展速度:
用水平法(几何平均法)计算,
公式为:
yn
yn」
yi
y-
(i=1.2-n)o
8、平均增长速度:
又称增长率,是用于描述现象在整个观察期内平均增长变化程度的指标,
通常用平均发展速度减1来求得。
G=R-1
9、长期趋势分析:
移动平均法:
通过扩大时间序列的时间问隔,并按一定的间隔长期逐期
移动,分别计算出一系列平均数,由这些平均数形成的新的时间序列对原时间序列的波
动起到一定人修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现出现象发展的
基本变动趋势。
公式为:
y=yi+yi书+…yK书」/k(式中k为间隔长度,是大于i小于n的正整数)。
最小平方法:
又称最小二乘法
直线趋势模型:
当时间序列的逐期长增长量大致相同,或利用散点图观察现象的变动近似
一条直线时,可采用下列线性模来描述:
父=a.bt
根据最小平方法的基本要求,
n三ty一三t^y
可得:
b二二^一1彳
n-1-(-1)
综合指数、平均指数
1、加权综合指数:
拉氏:
销售指数(数量指数)
qi/o
三Poqi
Vnn(基期变量值加权)-poqo
-Piqi
帕氏:
价格指数(质量指数)
pi/o=(报告期变量值加权)
」Poqi
公式中qi/o表示数量指数,qo和qi表
组项目基期和报告期的物量数值;
Pi/0表小质量指数;Po和Pi表组项目的基期和报告期的质量数值。
2、股票价格指数:
即以报告期发行量为权数(同度量因素)进行加权综合。
「三pi
公式为:
P1/。
:
一poq1
3、加权平均指数:
数量指标平均指数编制的一般原则是:
以基期价值量指标为权数,计算数量指标个体指数的加权算术平均数
「q1
-pOqO
qo三pm_
加权算术平均指数:
qi/o=F=t—(数量指数)
二p°qo,p°qo
质量指标平均指数编制的一般原则是:
以报告期价值量指标为权数,计算质量指标个体指数的加权调和平均数。
三pq三pa
加权调和平均指数:
p1/0—1—T7T(质量指数)
7py-poq1
Pi/po