心理统计难点步骤.docx
《心理统计难点步骤.docx》由会员分享,可在线阅读,更多相关《心理统计难点步骤.docx(15页珍藏版)》请在冰豆网上搜索。
心理统计难点步骤
二.心理统计难点步骤及例题
一.假设检验的步骤
1.两个独立样本的假设检验
2.相关样本的假设检验
二.方差分析的步骤
1.简单方差分析
2.二因素方差分析
三.积差相关与等级相关的步骤
四.χ2检验的步骤
一.
假设检验的步骤
1.陈述H0和H1;确定显著性标准α=?
2.确定考验是单尾还是双尾
3.确定考验的自由度df;
4.查表求临界分数
5.计算样本的实际分数
6.比较样本的实际分数与临界分数
7.对H0作出结论
1.两个独立样本的假设检验
step1.
陈述H0和H1;确定显著性标准:
α=?
两类假设的形式有所不同,因为现在我们要对于两个不同的总体作出假设。
如,假定我们要比较两个不同的处理条件(两种学习方法,两种不同的药物等),或者比较两组不同的人群(如,男人和女人,青年人和老年人等).
假设有两个总体A(男人)和总体B(女人)。
我们想知道身高有无性别差异.
H0:
假设男人和女人的身高没有差异.
H0:
μA=μB或μA-μB=0
H1:
假设男人和女人的身高有差异.
H1:
μA≠μBμA-μB≠0
Step2.确定考验是单尾还是双尾
因为假设并无方向性,是双尾检验.
单尾检验的H0?
Step3.确定考验的自由度df
自由度描述了样本中可以自由变化的分数的数目。
因为样本均值对于样本中的分数值构成了限制,所以样本有n-1个自由度。
我们在用两个样本,每一个样本各代表一个总体.
所以我们需要用总体参数的估计,因此必须考虑自由度
如何计算df?
样本1:
nA-1
样本2:
nB-1
所以对于两个样本df=nA+nB-2
例:
男人身高:
67,73,74,70,70,75,73,68,69
女人身高:
69,63,67,64,61,66,60,63,63
nA?
=9
nB?
=9
df=?
Step4.查表求临界t-分数
双尾,α=0.05,df=16.
tcrit=?
Step5.计算样本的实际t-分数
从概念上,公式应该是一样的.但在操作上,要复杂一点。
因为有两个样本,意味着需要使用两个估计值.
从概念上:
tobs=(XA-XB)-(µA-µB)
σDX
我们感兴趣的是两个总体之间的差异,而计算t统计量的目的是看两个样本之间差异是否与两个总体之间的差异不同.
分子的意义很明确:
(XA-XB)=两个样本之间的均值差异
分母的意义则比较复杂:
σDX是什么?
是两个样本误差的估计值.
每一个样本都有与其相联系的取样误差.这里需要解决的是两个样本的误差合并(pool)
检验两总体是否方差同质
拇指原则:
对于小样本(n<10),如果一个样本方差(s2)比另一个大4倍以上,大概不会满足方差同质性假设。
对于大一些的样本,如果一个样本方差(s2)比另一个大2倍以上,多半会违反方差同质性前提.
-因为每一个样本有其不同的容量(n1,n2)应当把每一个样本方差的估计值用自由度来加权.
合并方差(pooledvariance)=df1sA2+df2sB2
df1+df2
此方程可以简化,因为s2=SS/df
用SS替换df(s2)得到:
合并方差σAB2=SSA+SSB
df1+df2
设法找出σDX
X标准误估计值的公式:
σX=sqrt(S2/n)
σDX的公式也是类似:
σDX=sqrt(SA2/n1+SB2/n2)
用以上公式解决例题:
首先需要计算两个SS和样本均值:
XA-=71.0XB=64.0
SSA=64.0SSB=66.0
sA=2.83sB=2.87
σAB2=SSA+SSB=64.0+66.0
df1+df28+8
=8.125
σDXA-XB=sqrt(σA2/n1+σB2/n2)
==
=1.34
tobs=(XA-XB)-(µA-µB)
σDXA-XB
=
=5.22
step6.比较样本的实际t-分数与临界t-分数
tobs=5.22tcrit=2.12
step7:
对H0作出结论
因为观察到的t统计量大于临界t统计量,所以我们有理由拒绝H0.男人和女人的身高有差异.
2.相关样本的假设检验
例:
一位统计课老师,在开课的第一天,叫他的学生对自己喜欢统计的程度作出评定,量表是1到10(1不喜欢,10非常喜欢).在一学期的课结束时,按同样的程序叫学生评定一次。
他想知道上他的统计课会不会对学生对统计的喜欢程度产生影响。
结果如表中所示:
学生
事前检验(开学第一天)
事后检验(学期末)
D
D2
1
1
4
3
9
2
3
5
2
4
3
4
6
2
4
4
7
8
1
1
5
2
3
1
1
6
2
2
0
0
7
4
6
2
4
8
3
4
1
1
9
6
6
0
0
10
8
6
-2
4
Σ
40
50
10
28
平均差异==10/10=1.0
相关样本假设考验的步骤:
step1:
陈述H0和H1;&确定显著性标准:
α=?
假定a=0.05H0?
与上一章的不同,我们不是有两个由完全不同个体构成的总体,我们只有一个差异总体。
我们要考验的分布是个D分布,D由事前检验分数减去事后检验分数。
因此,H0:
上一学期的统计课对学生对统计的喜好没有影响.
H0:
mD=0H1:
mD≠0
step2:
确定考验是单尾还是双尾:
双尾检验.
step3:
确定考验的自由度df
只有一个样本,既差异的样本。
df=n-1.
step4:
查表求临界t-分数
a=0.05,双尾,df=10-1=9;tcrit=±2.262
step5:
计算样本的实际t-分数
主要问题是差异分布的估计标准误。
首先需要计算方差.
SSD=ΣD2-(ΣD)2=28-102=28-10=18
n10
sD2=SSD/df=18/9=2.0
然后计算估计标准误
sp=sqrt(sD2/n)=sqrt(2/10)=0.447
就可计算tobs
tobs===2.24
step6:
比较样本的实际t-分数与临界t-分数
tcrit=2.262tobs=2.24
step7:
对H0作出结论
t的观测值没有落入拒绝区域,所以不能拒绝H0.
二.方差分析的步骤
1.简单方差分析
K=处理条件(或组)的数目
n=每一个组的数目(如果它们相等)
ni=第i组的数目(如果它们不等)
N=Sni=总的样本容量
Ti=SXij
G=SXij=总的和
G-bar=G/N=总的均值
SSi=每一个组的和方=∑(Xij-i)2
例:
一位研究者研究三种键盘设计。
记录了三组被试的错误次数:
键盘A:
04010
键盘B:
68542
键盘C:
65946
键盘类型对打字错误有无显著的影响?
Step1.陈述H0和H1;确定显著性标准:
α=.05
Step2.查表求临界F值
Df组间=k-1=3-1=2;Df组内=n=k=15-3=12
Fcrit(2,12)=3.88
Step3:
作方差分析,计算F值
1)计算每组的T和SS;G和∑X2
条件A
∑X2
条件B
∑X2
条件C
∑X2
0
0
6
36
6
36
4
16
8
64
5
25
0
0
5
25
9
81
1
1
4
16
4
16
0
0
2
4
6
36
ΣX=5
∑X2=17
ΣX=25
∑X2=145
ΣX=30
∑X2=194
T1=ΣXA=5,SS1=ΣX2-(ΣX)2/N=17-52/5=12
T2=ΣXA=25,SS2=ΣX2-(ΣX)2/N=145-252/5=20
T3=ΣXc=30,SS2=ΣX2-(ΣX)2/N=194-302/5=14
G=ΣT=5+25+30=60
ΣX2=17+145+194=356
SS总和=ΣX2-G2/N=356-602/15=116
SS处理内=ΣSS=12+20+14=46
SS处理间=ΣT2/N-G2/N=52/5+252/5+302/5-602/15=70
2)作方差分析表
来源
SS
df
MS
处理间
70
2
35
处理内
46
12
3.83
F=9.14
总和
116
14
Step4:
对H0作出结论
因为观察到的F统计量9.14大于临界F3.88,所以我们有理由拒绝H0.键盘类型对打字错误有显著的影响
2.二因素方差分析
因素设计ANOVA的符号
•a:
A因素的水平数
•b:
B因素的水平数
•A1B2:
在单位格A1B2中分数的和
•A1:
在所有A1处理中分数的和
例:
根据心理学原理,测验条件与学习条件一致时,学习效果最好。
以下数据是否显示了教室与考场大小对测验成绩有无显著差异
上课条件
大考场
小考场
大教室
15
5
20
8
11
1
18
1
16
5
小教室
1
22
4
15
2
20
5
17
8
16
Step1.陈述H0和H1;确定显著性标准:
(1)教室大小对成绩没有显著影响
Ho:
μa1=μa2;H1:
μa1≠μa2
•
(2)考场大小对成绩没有显著影响
Ho:
μb1=μb2;H1:
μb1≠μb2
(3)考场大小对成绩的影响不因教室大小而不同
三者均以α=.05为标准
Step2.查表求临界F值
自由度
•dfa=a-1=2-1=1
•dfb=b-1=2-1=1
•dfaxb=(a-1)(b-1)=(2-1)(2-1)=1
•Df处理内=N-ab=20-2*2=16
•FcritA=FcritB=FcritAXB=4.49
Step3:
方差分析准备:
计算各组的统计量,G和ΣX2
•A1=A1B1+A1B2=80+20=100
•A2=A2B1+A2B2=20+90=110
•B1=A1B1+A2B1=80+20=100
•B2=A1B2+A2B2=20+90=110
•G=80+20+20+90=210
•ΣX2=1326+116+110+1654=3206
Step4:
作方差分析,计算F值
1)和方分解第一阶段
•SS总和=∑X2-G2/N=3206-2102/20
=3206-2205=1001
•SS处理间=∑AB2/n–G2/N
=802/5+202/5+902/5-2102/5
=1280+80+80+1620-2205=855
•SS处理内=∑SS=46+36+30+34=146
2)
和方分解第二阶段
•SSA=∑A2/bn–G2/N
=1002/10+1102/10-2205
•SSB=∑B2/an–G2/N
=1002/10+1102/10-2205
•SSAxB=SS处理间–SSA–SSB
=855-5-5=845
3)作方差分析表
来源
SS
df
MS
处理间
855
3
A因素
10
1
5
0.55
B因素
10
1
5
0.55
AXB交互作用
845
1
845
92.60
处理内
146
16
9.125
总和
1001
19
4)作交互作用图
Step5:
结论
交互作用:
F(1,16)=92.60,p>.05
A因素:
F(1,16)=.55,p〈.05;A因素主效应不显著
B因素:
F(1,16)=.55,p〈.05;B因素主效应不显著.
考场大小对成绩的影响因教室大小而不同:
当考场大小与教室大小匹配时,考试成绩较高.当考场大小与教室大小不匹配时,考试成绩较低.
三.积差相关与等级相关的步骤
例:
计算以下两列数据的积差相关和等级相关
被试
X
Y
A
0
4
B
2
1
C
8
10
D
6
9
E
4
6
1.积差相关(Pearson相关,皮尔逊相关,一种参数检验)
1)绘制散点图
2)列表求X2,Y2,XY
X
Y
X2
Y2
XY
0
4
0
16
0
2
1
4
1
2
8
10
64
100
80
6
9
36
81
54
4
6
16
36
24
ΣX=20
ΣY=30
ΣX2=120
ΣY2=234
ΣXY=160
2)求SSXSSYSP
SSX=ΣX2-(ΣX)2/n=120-202/5=120-80=40
SSY=ΣY2-(ΣY)2/n=234-302/5=234-180=54
SP=ΣXY-ΣXΣY/n=160-20*30/5=160-120=40
3)求r
r=SP/sqrt(SSX*SSY)=40/sqrt(40*54)=40/46.48=.861
2.等级相关(Spearman相关,斯皮尔曼相关,一种非参数检验)
X
R
Y
R
D
D2
0
1
4
2
1
1
2
2
1
1
-1
1
8
5
10
5
0
0
6
4
9
4
0
0
4
3
6
3
0
0
ΣD2=2
rs=1-6ΣD2/n(n2-1)=1–6*2/(5*24)=1-0.1=0.90
四.χ2检验的步骤
例:
调查了n=200个不同年龄组的被试对手表显示的偏好程度
数字显示
钟面显示
不确定
30岁或以下
90
40
10
30岁以上
10
40
10
1.计算期望次数fe=(fc*fr)/n
2.计算每个单位格的χ2值
χ2=Σ(f0-fe)2/fe
数字显示
钟面显示
不确定
行的和
30岁以下
90(70)
202/70=5.71
40(56)
(-16)2/56=4.57
10(14)
(-4)2/14=1.14
140
30岁以上
10(30)
(-20)2/30=13.33
40(24)
162/24=10.67
10(6)
42/6=2.67
60
列的和
100
80
20
200
χ2=5.71+4.57+1.14+13.33+10.67+2.67=38.09
df=(R-1)(C-1)=(3-1)(2-1)=2,х2的临界值为5.99
拒绝Ho,对手表显示的偏好程度与被试的年龄段有关