例:
已知英次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。
现准备录取10%得考生进行面试,录取分数线大致就是多少?
P(X>?
)=0>10,即P(XV?
)=1-0、10=0、9,=NORMINV(O>9,55,12)=70.38,
最低分数线应为70分。
3•测验分数、测评等级得正态化:
根据被试样本原始分或等级得简单次数分布表,计算各个不同分数或等级得正态标准分数
(1)计算每个不同分数X(或等级)以下累计次数Fb;
(2)计算每个不同分数X(或等级)中点以下累积比率CP:
CPx=°、'*厲
xN
(3)利用Excel统计函数NORMSINV,计算CP对应得正态Z分数。
(4)根据需要■正态Z分数转为其她标准分数形式:
T分数、CEEB分数、托福考试分数.离差智商IQ等,
T=10Z+50,CE£B=100Z+500,TOEFL=70Z+500,/Q=15Z+100
4•偏态系数(SK)与峰态系数(Kurt)得计算与应用
偏态系数:
Excel统计函数SKEW;峰态系数:
Excel统计函数KURT。
偏态系数SK=O,对称分布;SK>0,正偏态分布;SKV0,负偏态分布。
峰态系数Kurt=0,正态分布得峰态;Kurt>0,次数分布得峰度比正态分布峰度低阔;
Kurt<0,次数分布峰度比正态分布峰度高狭。
偏态系数与峰态系数都等于0或接近0时,变童得分布为正态分布。
5.二项分布得定乂
二项分布就是二项试验验结果得槪率分布。
进行门次二项试脸,乞次试脸彼此独立,每次试验时某事件出现得槪率都就是Q,该事件不出现得概率为Q(=1~p),则该事件出现X次得概率分布为:
P(x=x)=b(x,“,“,)=C,'pxqn~xo
二项分布得Excel统计函数:
BINOMDIST
6.二项分布函数BINOMDIST得应用
对20道四选一得单项选择题,如果完全凭猜测答題,那么
(1)猜对5道题得概率就是多少?
(2)猜对5题以下概率就是多少?
(3)猜对6题以上得概率就是多少?
n=20,每题猜对得槪率为p=0.25
(1)猜对5道题得概率P(扫5)二BINOMDIST(5,20,0、25,0)=0>20233
(2)猜对5题以下得槪率PUW5)=BIN0MDIST(5,20,0、25,1)=0.61717
(3)猜对6题以上得槪率P(Q6)*Pg5)=1-BINOMDIST(5,20,0.25,1)=0.38283
7•二项分布得形态:
随zk°得变化具有不同得分布形态
(1)当尸g时,二项分布就是对称分布。
(2)当UpM5时,接近正态分布。
(3)当p丰q,np<5或nq<5时,二项分布为偏态分布。
(4)当p主q、npA5且g25时,二项分布接近正态分布。
8.二项分布得平均数与标准差
进行门次二项试验,每次试验时菜事件出现得概率都就是。
則该爭件出现次数得理论平均数(“)、
方差(夕)与标准差cr分别为:
“=w,er2=npq、o=Jnpq。
如果np^5且门qM5,成功事件出现结果得槪率分布接近“=np、o=Jnpq得正态分布。
进行投掷100枚硬币试验,如果进行无数次试验,正面向上得硬币数目会在0〜100个之间变化。
那么,正面向上次数得理论平均数:
“二斫100X0、5=50,标准差为cr=7w=>/100x0.5x05=5o
20道四选一得单项选择题,如果完全凭猜测答题,那么,
猜对题数得平均数为〃二砰20X1/4二5
猜对题数得理论标准差为o=Vw=720x1/4x3/4=1.94。
第七章总体参数估计
1•常用得点估计:
总体均数“得点估计:
用样本平均数X,Excel统计函数为AVERAGE
总体方差/得点估计:
用样本标准差S;),或S?
•—o
71-1
总体标准差CT得点估计:
用样本标准差S-],
2.总体平均数得区间估计
1.若样本均数得抽样分布为正态分布,
总体均数得0.95置信区间为:
X±ZOO5;2SE?
=X±1.96x
y/n-1
总体均数得0.99置信区间为:
X±Z00I(.2S£v=X±2.58x
yjn-1
2.若样本均数得抽样分布为d仁得t分布,那么,
总体均数得0、95置信区间为:
只±仏5/2$£壬=斤±心05/2><月=
J〃一1
总体均数得0、99置信区间为:
X±5w2SEk=X±Gw2X^=
Jn-1自由度d仁甲=2,心身二?
,可用Excel统计函数TINV计算。
也可查教材453页t值表
3.
总体方差与标准差得区间估计
自由度d仁得力2分布右侧概率区间点得计算,也可用Excel统计函数CHIINV。
也可查教材475页X1分布数值表
总体标准差<7得置信区间:
取总体方差er,置信区间上、下限得正平方根。
4.总体积差相关系数得区间估计:
(1)舟样本相关系数r转换为费舍Zr值,转换方法:
Excel统计函数FISHER
⑵计算Zr得标准误SEz「:
SE”=^=
y/n-3⑶计算总体乙值得1-a置信区间:
乙土Za》SE〃
196
0.95置信区间为:
乙土Z^.SE^=Zr±^^
•一Jh-3
ncq
0、99置信区间为:
乙土ZggSEN=Zr±—
Jn-3
(4)计算总体相关系数Q值得置信区间:
将总体乙值区间上、下限进行费舍逆转换,转换方法:
Excel统计函数FISHERINV
5.总体比率(比例)得区间估计
np>5tnq>5时,样本比率p得抽样分布渐近正态分布。
|AA总体比率得0、95置信区间为:
p±1.96SE/?
=p±1.96x
总体比率得0、99置信区间为:
p±2.58SEp=p±2.58x
第八章假设检验
在Z检验中:
双侧检验临界值:
Zoaxh、96Zoo1/2=2.58
单侧检验临界值:
Z005=1.645Z001=2>326
单侧显著性概率P:
=1-NORMSDIST(ABS(Z值))
双侧显著性概率P:
=(1-NORMSDIST(ABS(Z值)))*2在t检验中:
单侧显著性槪率P:
=TDIST(ABS(t值)9df91)
双侧显著性概率P:
=TDIST(ABS(t值),d行2)
1•单个样本Z检验
主要用途:
分析单个样本均数元与已知得总体均值X得有无显著差异,适用条件:
(1)总体呈正态分布,总体方差CT?
已知;
(2)总体就是正态分布,总体方差虽然未知,但样本容#/i>30;
(3)即使总体非正态分布,总体方差/也未知,样本容#/?
>30.
z=—肖或:
CF/y/nS:
y/n-1
2.单个样本t检验
主要用途:
用于分析单个样本均数丘与已知得总体均数U。
得差异,
适用条件:
(1)总体呈正态分布,总体方差CT2未知,样本容董/?
<30得情况下、
⑵总体非正态分布,总体方差/未知,样本容±n>30得情况下、
3•单个样本比率Z检脸
主要用途:
根据一个样本得比率分析样本所代表得总体比率〃与已知比率內有无显苦差异。
适用条件:
/?
/?
()>5,Mu-5
4•两独立样本比率差异Z检验
主要用途:
根据两个独立样本得比率p.-p2,推斷两总体比率6、P2有无显著差异
适用条件:
两个样本相互独立,nxpvn2p29«i<7r心么都$5
AA
7-—一卩'“
Dl+〃2》2)(®N+〃2“2)
Yn}n2(n}+n2)
5•两独立样本方差齐性检验
主要用途:
根据相互独立得两个样本得方差,推斷两个总体得方差就是否相等或就是否有显著差异。
分子方差得自由度df=o-1,分母方差得自由度d仁处T
大的s爲_n、S訂_1)小的S爲一“2$孑/(”2-1)
双侧显箸性概率P值:
二FDIST(F值,分子自由厦,分母自由皮)*2
6•相关样本t检验
主要用途:
(1)根据一纽被试前.后两次测评结果,推断两次测验结果得总体均数有无显苦差异。
⑵根扌居实验组与配对对照组测评结果,推断实验组与对照组得总体均数有无显著差异。
适用条件:
两个样本得数据有一一对应关系,且有可比性;两总体数据呈正态分布。
7•独立样本Z检验
主要用途:
根損两个独立样本得均数差异X,-X2,推斷两总体均数//P//2有无显著差异。
适用条件:
(1)两总体为正态分布,总体方差cr;已知,不管样本大小
(2)两总体非正态分布,总体方差另已知,>30,/?
2>30时
(3)
两总体非正态分布,总体方差<7卷型未知,>30,/?
2>30时总体右、邑已知时:
z=X】儿:
总体O":
、CT;未知时:
Z=
B亠^2
vV石
8•独立样本等方差假设t检验
主要用途:
根据两个独立样本得均数差异X^X2,推斷两总体均数“、从有无显著差异?
适用条件:
⑴两总体为正态分布,总体打、<7子未知,且O■汁另,不管样本大小
(2)两总体非正态分布,总体of、CT;未知,且af=crf,n{>3U«2>30时
两总体方差Of、<7孑就是否相等,需要先做方差齐性检验。
注意:
大多数请况下,两总体方差基本相等。
9•独立样本异方差假设t检验
主要用途:
根据两个独立样本得均数差异X^X2,推斷两总体均数“、仏有无显著差异?
适用条件:
(1)两总体为正态分布,总体erf、er;未知,且er:
工er訂不管样本大小
(2)两总体非正态分布,总体亓、er;未知,且crf^cr;,^>30,n2>30时
10•积差相关显著性t检验
主要用途:
根据一对变童得样本数据及其积差相关系数厂,推斷两变量有无显著关系。
适用条件:
两变量为连续性数值变量,且总上正态分布。
第十四章抽样原理及方法(参见教材)