心理统计定义汇总上.docx

资源描述

心理统计定义汇总上.docx

《心理统计定义汇总上.docx》由会员分享，可在线阅读，更多相关《心理统计定义汇总上.docx（17页珍藏版）》请在冰豆网上搜索。

心理统计定义汇总上.docx

心理统计定义汇总上

第一章统计学入门

1.1

1.统计：

指整理，总结并解释信息的一系列数学过程。

1.2

1.总体：

是一个特定研究中所有感兴趣个体的集合。

2.样本：

是从一个总体中选择出来的个体的集合，通常在研究中被期望代表总体。

3.参数：

是一个值，通常是一个数字值，它描述了一个总体。

参数可以从单个测量中得到，或从对总体的一组测量值中推导出来。

4.统计量：

是一个值，通常是一个数字值，它描述了一个样本。

统计量可以从单个测量中得到，或从对总体的一组测量值中推导出来。

5.数据：

是测量或观察，它通常被称为一个分数或原始分数。

6.描述性统计：

是用于总结，组织并简化数据的统计过程。

7.推论性统计：

是允许我们研究样本，然后将研究结果推广至样本来自的总体的技术。

8.取样误差：

是存在于样本统计量和总体参数间的差异或误差的数量。

1.3

1.变量：

是一种针对不同个体具有不同值的特性或条件。

2.常量：

是一个特性或条件，它不会变化,并且对每一个个体都是相同的。

3.相关法：

观察两个变量并确定它们之间是否存在关系。

4.实验法：

操纵一个变量并观察或测量另一个变量。

为了建立两个变量间的因果关系，实验需要控制所有其它变量，使其不会影响结论。

5.自变量：

是研究者操纵的变量。

在行为研究中，自变量通常又被是参与的两个（或多个）处理条件组成。

自变量由在观察因变量之前就操纵好的“前条件”组成。

6.因变量：

是被观察的那个变量，用于评估处理效应。

7.控制条件：

其中个体不接受实验处理。

它们或者不接受处理，或者接受一个中立的、安慰剂性质的处理。

控制条件的目的是提供与实验条件相比较的基准。

8.实验条件：

其中个体接受实验处理。

9.准自变量：

很多研究对两个组进行比较，但是，这两组不是通过操纵自变量得到的。

相反，这些组通常有被试变量（如男性和女性）或是时间变量（如处理前和处理后）决定。

在这些非实验研究中，决定了组别的变量成为准自变量。

10.构念：

是内部属性或特征，它不能被直接观察到，但是可以描述并解释行为。

11.操作定义：

是一个测量过程，它测量了外部行为，并使用测量结果作为定义核对假设的构念的测量。

注意，操作定义有两个部分：

首先，它描述了一系列测量构念的操作；其次，它用测量结果定义了构念。

12.离散变量：

由不同的、不可分割的类别组成。

在相邻两个类别之间不存在其它值。

13.连续变量：

在任意两个观察到的值之间都存在无限多的可能值。

一个连续变量可以被分割为无限个小数部分。

14.实限：

可被表示为一条连续数据线上数值组成的区间的界限。

将两个相邻数值分开的实限恰好位于这两个数值的中点。

每个数值都有两个实限。

上实限是区间的顶边，下实限是区间的底边。

15.称名量表：

由一系列具有不同名称的类别组成。

称名量表的测量将观察的对象分类并贴上标签，但不对观察做任何定量的区分。

16.顺序量表：

由一组按顺序排列的类别组成。

顺序量表的测量将观察的对象按大小排序。

17.等距量表：

由排列的类别组成，这些类别都是完全相同大小的区间。

在等距量表中，量表上的数字之间的差异等价于量上的差异。

然而，大小的比例没有意义。

18.等比量表：

是一种等距量表，并且具有一个绝对零值。

使用等比量表，数字的比例可以反映量上的比例。

第二章频数分布

2.1

1.频数分布：

是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。

2.2

1.频数分布表分组规则：

①分组频数分布表应具有大约十个组距；②每个区间的宽度应为相对简单的数字；③每个组距的最小数值应为宽度的倍数；④所有区间应具有相同宽度。

2.3

1.等距、等比数据频数分布图：

①直方图：

a.矩形高度对应每个类别的频数；b.矩形宽度为每个类别的实限。

②折线图：

a.每个坐标中心上方有一点，其垂直位置对应这一类别的频数；b.点和点之间的连续线段将这一系列点连在一起；c.在分数全距的两端各画一条直线与X轴相交。

2.称名、顺序数据频数分布图：

柱形图：

在直方图的基础上，相邻矩形间留有空隙。

2.4

1.对称分布：

可以通过中心画一条垂直线是的分布的一侧为另一侧的镜像。

2.偏态分布：

分数倾向于堆积在量表的一端并向另一端逐渐变细。

3.尾：

分数逐渐向分布的一端变细的部位。

4.正偏态分布：

尾在右侧的偏态分布，其尾指向X轴正方向。

5.负偏态分布：

尾在左侧的偏态分布，其尾指向X轴负方向。

6.百分等级：

分不中分数不高于一个特定分数的个体的百分率。

7.百分位数：

当一个分数被其百分等级确定时，这个分数被称为百分位数。

8.累计频数：

它显示了不高于一个分数的个体个数。

9.茎叶图优势：

①茎叶图容易构建，只要检查数据一次，就可以构建一个完整的图形。

②茎叶图允许确认数据中每个个体分数。

③茎叶图同时提供了数据列表与分布情况，如果从侧面看茎叶图基本与频数分布图相同。

④茎叶图经过调整也适用于需要更加细节的情况。

第三章集中趋势

3.1

1.集中趋势：

是一个统计测量，它确定了能够代表分布中心的一个数值。

集中趋势的目的是找到最典型或最能代表整个组的单个数值。

2.平均数：

一个分布数据的总和除以数据的个数。

总体：

μ=∑X\N；样本：

M=∑X\N

3.中数（Md）：

恰好将一个分布一分为二的数值。

分布中恰好有50%的个体具有不大于中数的数值。

中数也相当于第50%个百分位数。

4.众数（Mo）：

在一个频数分布中具有最大频率的分数或类别。

5.使用中数的情况：

①极端数值和偏态分布；②未确定数值；③尾端开放式分布；④顺序量表

6.使用众数的情况：

①称名量表；②离散变量；③描述形状

7.偏态分布中三数的位置：

①正：

众数中数平均数；②负：

平均数中数众数

第四章变异性

4.1

1.变异性：

提供了对一个分布中的数据分散开或聚集在一起的程度的数量测量。

4.2

1.全距：

是在最大的X值上实限和最小的X值下实限之间的差值。

2.四分位距：

是被分布的中间50%个体覆盖的距离

3.半四分位距：

四分位距的一半。

4.3

1.离差：

是数据到平均数的距离，离差的总和为零。

2.总体方差：

平均离差平方。

标准差为根号下方差。

3.SS或平方和：

离差平方的总和。

4.计算公式：

SS=∑X²-

；计算公式：

SS=∑（X-M）²

5.总体方差=SS\N；样本方差=

4.4

1.自由度（df）：

对于有n个数值的样本，样本平均数限制了样本变异性，只有n-1个数据是可以自由改变的，即df=n-1。

自由度决定了样本中独立的和可以自由改变的数值。

即样本方差=SS\df。

4.5

1.无偏统计量：

如果从很多样本中得到样本统计量的平均数等于相应的总体参数值，则此样本统计量是无偏的；反之则为有偏统计量。

4.6

1.影响变异性的因素：

①极端值；②样本大小；③取样的稳定性；④开放性分布

2.差异系数：

指标准差与其算术平均数的百分比，它是没有单位的相对数：

CV=SD\M*100%。

3.差异系数相关知识：

①比较不同单位资料的差异程度；②比较单位相同而平均数相差较大的两组资料的差异程度；③可判断特殊差异情况；④根据经验，一般CV值常在5％－35％之间。

如果CV大于35％时，可怀疑所求得的平均数是否失去了意义；如果CV小于5％时，可怀疑平均数与标准差是否计算有误。

第五章Z分数：

分数的位置和标准变化分布

5.1

1.Z分数的意义：

①每个Z分数都解释了原始X值在分布内的位置；②Z分数构成了一个标准化分布，使之可以与其它同样已经转换为分数的分布相比较。

5.2

1.Z分数：

指出了每一个X值在分布中的精确位置，Z分数的符号（+或-）表示这个分数比平均数高或比平均数低。

Z分数的数值用从X到μ有几个标准差指出了其到平均数的距离。

2.Z=

3.Z分数特征：

①Z分数分布的形状将同原始分数的分布完全相同；②Z分数的分布平均数为零；③Z分数分布的标准差为1

4.标准化分布：

由经过变换后的分数组成，这些分数经过变换使得μ和

成为预先设定的值。

标准化分布被用来比较不同的分布。

5.Z分数优点：

可比性：

标准分数以团体的平均数为基准，以标准差为单位，因而具有可比性。

☐可加性：

标准分数使不同的原始分数具有相同的参照点，因而具有可加性。

☐明确性：

标准分数较原始分数的意义更为明确。

☐合理性：

标准分数保证了不同性质的分数在总分数中的权重相同，使分数更合理地反映事实。

第六章概率

6.1

1.概率定义：

在可能出现几种不同结果的情况下，对于任一种特定结果的概率被定义为所有可能的结果的分数或比例。

如果将可能的结果表示为A、B、C、D等，那么A的概率=结果为A的个数\可能结果总数。

2.随机样本：

要求在总体中的每个个体都有相等的机会被选择；要求如果选择不止个体，选择这个个体的概率与选择另一个个体的概率必须先同。

6.3

1.二项分布：

其显示了与从x=0到X=n的每个X值相应的概率。

2.二项分布的正态近似：

①平均数：

μ=pn；②标准差：

；③z=

3.近似性：

二项分布只是正态分布的一个近似值。

当pn与qn都大于10时，二项分布将接近于正态分布。

6.4

1.一些数据：

中间90%—z=1.645中间95%—z=1.96中间99%—z=2.58

2.一些数据：

z本体尾端μ到z中间

1.000.84130.15870.34130.6826

2.000.97720.02280.47720.9554

3.000.99870.00160.49840.9974

第七章概率和样本：

样本平均数的分布

7.1

1.样本误差：

是样本数据和它对应着的总体参数之间的差异，或者说误差的数量。

2.抽样分布：

指样本统计量的分布，它是推论统计的重要依据。

在科学研究中，一般是通过一个样本进行分析，而只有知道了样本统计量的分布规律，才能依据样本对总体进行推论，也才能确定推论正确或错误的概率是多少。

常用的抽样分布是平均数和方差的抽样分布。

7.2

1.样本平均数的分布：

是在一个总体中所有可能的固定大小（n）的随机样本平均数的集合。

2.取样分布：

是一组统计数据的分布，这组统计数据是由从一个总体中取出所有可能的固定大小的样本得到的。

3.中心极限定理：

对于任意平均数μ、标准差为

的总体，样本大小为n的样本平均数分布具有平均数μ、标准误

，并且当n趋于无穷时，分布将趋于正态。

当样本大小n=30时，分布就已经几乎是正态的了。

4.正态特征：

①样本所来自的总体本身是正态分布的；②每个样本所含的数据个数比较多，30或以上。

5.M的期望值：

样本平均数的平均数等于μ。

6.M的标准误：

样本平均数分布的标准差。

标准误估计了由于随机性所造成的M和μ之间的标准差量。

其被样本大小、总体的标准差所决定。

7.大数定律：

样本大小越大，样本平均数同总体平均数越接近的可能性越大。

第八章假设检验

8.1

1.假设检验：

假设检验是一种统计方法，它使用样本数据评估关于总体参数的假设。

2.假设检验的步骤：

①陈述假设；②为判定设定标准；③收集数据并计算样本统计量；

④作出判定

3.假设检验评估处理效应的局限性：

①假设检验关注的焦点是数据，而不是假设；②存在显著的处理效应不一定意味着存在本质的处理效应。

③统计上的显著性不能提供任何关于处理效应的真实大小的信息。

④假设检验只是说明了如果处理没有效应，则非常不可能得到这样的结果。

⑤假设检验评估了处理效应的相对大小（处理效应/随机性），而不是绝对大小的概念。

4.虚无假设（H0）：

其陈述了在普通总体中没有改变、没有差异，或没有相关。

在实验中，

H0预测对于总体，自变量对因变量没有效应。

（你不期望得到的结果）

5.备择假设（H1）：

其陈述了普通总体存在改变、差异或相关。

在实验中，H1预测自变量

将对因变量有影响。

（你期望得到的结果）

6.α水平：

是一个概率值，他被用于定义在虚无假设是正确的情况下非常不可能出现的样本

结果。

7.临界区域：

是由在虚无假设正确的情况下非常不可能出现的极端样本值组成的临界区域界线，由α水平决定。

如果样本数据位于临界区域中，则拒绝虚无假设。

8.对z分数的讨论：

z=得到的差异/偶然引起的差异（实际值/理论值）

8.2

1.第一类误差（α）：

发生在研究者拒绝虚无假设，但它实际上是在正确的情况下。

在一个典型的研究中，第一类误差意味着研究者做出结论处理存在效应，但事实上它他没有效应。

其中，假设检验的α水平是这个检验导致第一类误差的概率，即α水平确定了在虚无假设正确的情况下得到样本数据在临界区域上的概率。

2.第二类误差（β）：

发生在研究者不能拒绝一个错误的虚无假设时。

在典型的研究中，第二类误差意味着假设检验不能检测出真正的处理效应。

另外，一、抽样分布的标准误增大，II类错误的概率会增大；二、增加样本量，II类错误减小；三、总体的标准差减小，II类错误减小；四、将通常的双侧检验变成单侧检验时，II类错误减小

3.α水平的变化：

当α水平降低时，临界区域的界限向分布的更远端移动。

并且，当标准误一定时，α水平降低，β水平会相应升高，反之亦然。

8.3

1.统计显著：

如果当虚无假设是正确的情况下，一个结果非常不可能出现，那么，这个结果就被称为是在统计上显著的，即效应充分到足以拒绝虚无假设。

2.影响假设检验的因素：

①平均数差异的大小②数据的变异性③样本的大小

3.z分数假设检验的假设：

①随机样本：

假定得到的样本数据是随机抽取的；②独立观察：

两个观察之间没有一致的、可预测的关系；③处理不会改变

值；④正态样本分布

8.4

1.方向性假设检验（单尾检验）：

统计假设（H0和H1）规定了总体平均数的增加或减少，即他们作出关于效应方向的陈述。

其中：

在假设检验的第一步中，方向性预测被加到了假设的陈述中；在过程的第二步中，临界区域完全位于分布的一个尾端。

8.5

1.测量效应大小（描述总体）：

科恩d值=平均数差/标准差（而非标准误）

0.2

d>0.8效应较大（平均数差异大于0.8个标准差）

*科恩d值只描述了处理效应的大小，并不被样本的个数影响。

8.6

1.统计检验效能：

检验能正确地拒绝错误的虚无假设的概率，即效能是检验能够识别真正存在的处理效应的概率。

2.检验效能的步骤：

①确定临界界限，假设存在处理效应并得到分布2

②求出在分布1中临界界限处的值n

③求出n在分布2中的位置（z分数）

④确定z分数之外的概率值，得出效能

3.影响效能的其他因素：

①样本大小：

样本数量越大，检验效能越大；②α水平：

降低α水平也将降低检验效能；③单尾与双尾检验：

单尾检验可增加假设检验效能。

第九章t分数

9.1

1.估计标准误：

当

值未知时，估计标准误被用作对实际标准误

的估计值。

估计标准误是从样本方差或是样本标准差计算出来的，它提供了一个从样本平均数M到其总体平均数μ之间的标准距离的估计。

2.估计标准误：

SM=

3.t分数：

当

值未知时，t分数是用来检验有关未知总体平均数μ的假设。

除了t分数用估计标准误做分母外，t分数的公式与z分数公式结构相同。

4.t分数：

5.自由度：

是指在样本中有多少个分数是独立的，并可以自由变化的。

因为样本平均数限制了一个样本分数的值，这个样本的自由度是n-1。

6.t分布：

t分布接近正态分布的程度由自由度决定。

大体上来说，样本越大，自由度越大，t分布也就越接近正态分布。

9.2

1.假设检验的步骤：

①陈述假设，确定α水平；②确定临界区域的位置；③收集样本数据，计算统计量；④对虚无假设做出判定

2.有关t检验的假设：

①样本中的数值必须包含互相独立的观察；②样本来自的总体必须是正态分布

9.3

1.估算科恩d值：

估计d值=

2.变异性：

SS的数值

3.r2:

：

由处理引起的方差占总变异性的百分率

4.测量r2：

用效应后SS值与消除效应后SS值差的绝对值比上总的变异性

5.r2:

：

r2=

，其中：

0.01

0.09

r2>0.25大效应

2.样本大小和方差的影响：

①大的方差意味着得到显著处理的效应概率小；②样本越大产生的t分数就越大，因此越容易产生显著效应。

第十章两个独立样本的t检验

10.1

1.独立测量研究设计：

也叫被试间设计。

每个处理条件（或每个总体）都应用独立样本的研究设计。

其目的为评价两个总体（或处理条件）之间的平均数差。

一般为H0：

μ1-μ2=0（总体平均数间没有差异）；H1：

μ1-μ2≠0（总体间存在平均数差）

10.2

1.独立测量t分数：

t=（样本平均数差异-总体平均数差异）/估计标准误

2.估计标准误：

S（M1-M2）=

3.合并方差：

4.独立样本自由度：

df=df1+df2=n1+n2-2

10.3

1.独立样本检验的步骤：

①陈述假设，选择α水平；②确定自由度df与临界区域；③计算合并方差、估计标准误、计算t分数、做出判定

2.独立测量的效应：

估计d=

（与n1、n2无关）

3.总变异：

SST=

组内变异：

SSW=

组外变异：

SSB=

处理方差百分率：

r2=

4.样本方差的影响：

总的来说，大的样本方差能够使数据中的任何平均数差异变得模糊，并且降低在假设检验中得到显著差异的可能性。

10.4

1.独立测量的根本假设：

①每个样本中的观察必须是独立的

②与两个样本相对应的两个总体都必须是正态分布（大样本除外）

③与两个样本相对应的两个总体都必须有相等的方差

2.Hartley检验：

①为每个样本单独计算样本方差，s2=SS\df

②选择这些样本方差中最大值和最小值，计算

Fmax=

（若两组样本量不相等，则同取大样本数）

一个相对较大的Fmax值表明了样本方差之间的较大差异。

在这种情况下，一方面，数据表明总体方差是不等的，违背了齐性假设；另一方面，一个小的Fmax值（约1.00）表明了样本方差是近似的，并且齐性假设是合理的。

③与表中的数据作对比：

1）k（样本个数）2）df值3）α水平

3.替代合并方差的另一种方法：

合并自由度

①计算两个单独方差的标准误s1、s2

②代入公式：

df=

（V1=

；V2=

）

*注意：

调整自由度将使df值变小，从而扩大临界区域的边界线。

4.独立测量t检验的估计标准误测量的是两个样本平均数间差异的期望值。

第十一章两个相关样本的t检验

11.1

1.重复测量：

样本中的个体要在同一个因变量下被测量多于一次，所有的处理条件都使用相同的被试。

2.匹配试验：

一个样本中的每个个体是与另一样本中的被试相匹配的。

这个匹配是的两个个体在一个特定的、研究者想控制的变量是相当的（或近似于相当）。

11.2

1.差值：

D=X2-X1；样本差异平均数（MD）；SSD；SM

2.相关样本检验的假设：

H0：

μD=0；H1：

μD≠0

3.相关样本t检验：

（假设μD=0）

11.4

1.重复测量设计的优点：

①被试的个数：

更少的被试

②随时间变化的研究：

特别适用于随时间变化的研究

③个体差异：

可降低或消除由个体差异引起的问题

2.重复测量设计的缺点：

①时间变化可能是引起因变量变化的原因。

解决方法：

抵消平衡，被试被随意分为两组，一组先接受处理1再接受处理2，另外一组先接受处理2再接受处理1。

3.相关样本t检验的假设：

①每个处理条件内的观察必须是独立的；②差值的总体分布必须是正态的。

第十二章估计

12.1

1.估计：

用样本统计量推断总体参数的推论性统计过程。

2.点估计：

使用统计量的值给出未知的总体参数的估计。

3.良好点估计的条件：

①无偏性：

如果一切可能样本统计量的值与总体参数值偏差的平均值为0，这种统计量就是总体参数的无偏估计量。

②有效性：

当总体参数不止有一种无偏估计量时，某一种估计量的一切可能样本值的方差小者为有效性高，方差大者为有效性低。

③一致性：

当样本容量无限增大时，估计量的值能越来越接近它所估计的总体参数值，这种估计是总体参数一致性估计量。

④充分性：

一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。

4.区间估计：

使用区间给出未知参数的估计，并进一步指出参数落入这一区间的概率的大小。

5.置信区间：

指在某一置信度时，总体参数所在的区域距离或区域长度。

6.置信水平：

作出某种推断时正确的可能性（概率），为1-α。

7.使用估计的情况：

①估计常使用于零假设被拒绝的假设检验中。

②已知存在效应，并且想找出效应大小时。

③估计用于想知道一个未知总体的简单的基本信息的情况。

8.假设检验与估计的区别

假设检验

估计

目标：

检验关于总体参数的假设（通常是零假设）

A.对于一个假设检验来说，我们首先对于未知总体参数假设一个值。

这个值在零假设中指出。

B.假设值被代入公式，并且t值被计算出来。

C.如果假设值代入后，产生了一个“合理”的t值，我们就认为假设是“合理”的，不能拒绝。

如果结果是一个极端t值，则拒绝。

D.该“合理”的t值是基于它在一个分布中的位置来说的，通常，“合理”值即是在分布中心，具有很高概率出现的值。

极端值的出现概率很低，被认为是“不合理”的。

目标：

估计未知的总体参数的值（通常是未知总体的平均值）

A.对于估计来说，我们不准备计算t值。

相反，我们估计t值应该是多少。

估计的策略就是选择一个“合理的”的t值。

（注意：

我们不是为t挑选一个值；而是估计样本在分布中的位置。

）

B.如假设检验一样，一个“合理的”的t值即是在分布中心，具有很高概率出现的值。

C.“合理的”t值代入公式，未知的总体参数被计算出来。

D.因为你在公式使用的是一个“合理的”t值，我们就假设该计算过程将会产生关于总体参数的一个“合理的”估计值

9.总体平均数=样本平均数±t×估计标准误

其中：

①对于点估计，最佳办法为使用t=0，即分布的精确中心，因为我们没有理由猜测分布存在偏差。

另外，t=0时最可能出现的值，当值从分布的中央到分布的尾端移动时，概率将稳定地递减。

②对于区间估计，应使用在零点附近的一个t值的值域。

12.2

1.对于单一样本t分数：

M-Z×

M<μ

M（总体方差已知）

M-t×sm<μ

2.对于独立测量t分数：

（M1-M2）-t×s（M1-M2）<μ1-μ2<（M1-M2）+t×s（M1-M2）

3.对于重复测验t分数：

MD-t×

<μD

12.3

1.影响置信区间宽度的因素：

①置信水平越大，宽度越大；②样本越大，宽度越小

第十三章方差分析

13.1

1.方差分析（ANOVA）：

是一种假设检验过程，用于评估两个或多个处理（总体）的平均数差异。

2.准自变量：

不受研究者控制的变量，通常由准自变量来分组

3.因素：

在方差分析中，用来表示作比较组的变量（自变量或准自变量）被称为因素。

4.水平：

组成一个因素的各个条件或数值

5.F分数：

13.2

1.处理间方差：

①处理效应：

差异是由处理引起的

②偶然：

差异是由偶然引起的

展开阅读全文

心理统计 定义汇总 上.docx

心理统计定义汇总上.docx