社会研究中的研究设计分析实验数据.docx

资源描述

社会研究中的研究设计分析实验数据.docx

《社会研究中的研究设计分析实验数据.docx》由会员分享，可在线阅读，更多相关《社会研究中的研究设计分析实验数据.docx（13页珍藏版）》请在冰豆网上搜索。

社会研究中的研究设计分析实验数据.docx

社会研究中的研究设计分析实验数据

社会研究中的研究设计——分析实验数据

有大量的统计技术可以用于分析实验数据。

本篇的目的就是对选择数据分析方法提供一些指导。

实验分析的核心是组间比较。

自变量存在差异的小组是否在因变量上也存在差异？

如果我们能够确定组件除了自变量意外，其他相似处越多，那么我们就越有信心认定组间结果变量的差异取决于干预。

比较中，需要强调三点：

（1）比较应聚焦于组而不是个人。

（2）在对差异的重要性作出判断之前，我们需要计算实验组和控制组之间差异多大才算显著。

例如，我们可能观察到细小却重要的差异，或者我们也可能观察到实质性的差异，而这些差异可能只是由于抽样和测量误差造成的。

（3）要用结果变量进行组间比较。

一.分析方法的选择

有非常多的技术可以用来分析实验数据。

分析技术的种类多少取决于变量种类的多少和数据的不同形式。

分析实验数据时我们要根据数据特征选择分析方法。

（一）需要哪种类型的分析：

描述或推论

数据分析为两个目的服务：

描述和推论。

描述性数据总结样本中的模式，而推论行数据意在确定样本中得到的结果是否能够外推到更广泛的总体。

理想情况下，分析应该包括描述分析和推论分析。

我们应该仔细地描述所有组间差异的程度，然后检验是否所有的差异也存在于更广泛的总体中。

（二）我们拥有哪类样本

样本分为两大类，一种是概率样本，另一种是非概率样本。

概率样本是指每个个体都有相等或已知的机会（概率）被抽中，获取这样一个样本的可靠方式是从已知和确定的总体中进行随机抽样。

对于一个概率样本，仅仅对从中抽出该样本的总体进行推论是合理的。

对总体之外的群体进行推论是存在风险的。

如果没有概率样本，那么用推论统计推论更大的总体是没有意义的。

在这种样本中，我们仅仅能够使用描述统计总结模式。

当概率抽样不可行时，对推论的检验多采用在不同的背景下使用不同样本重复实验的方法。

（三）我们拥有何种测量尺度的数据

统计分析中，变量的测量尺度对于选择统计分析方法是相当重要的。

变量有三种主要测量尺度：

1.定距/定比变量

有不同类别，能将各类从低到高排序，能测量出各类之间差异的大小。

2.定序变量

有不同类别，能将各类从低到高排序，不能测量出各类之间差异的大小。

3.定类变量

有不同类别，不能排序比较大小，不能测量各类之间差异大小。

（四）需要做何种类型的比较

可以根据结果变量对各组进行比较。

这些比较可以检测前测与后测在实验组和控制组中的变化大小，或者后测阶段组间的绝对差异。

结果变量的各个不同方面都可以进行比较。

1.集中趋势的差异

各组可以按照结果变量的平均值进行比较。

各种平均值（均值、中位数或众数）的使用取决于结果变量的测量尺度。

最普遍运用的方法是比较各组的均值，但这要求结果变量的测量尺度为定距。

在描述层面，仅需要比较均值。

然而，样本中的这些差异可能在总体中并不存在，它们可能仅仅是由抽样误差引起的，我们可以使用推论统计技术算出均值之间的差异是否反映了总体的真正差异或者仅仅是偶然产生的。

我们可以使用t检验、F检验或者是方差分析来检验。

不幸的是，均值可能会隐藏重要信息。

我们可能得到两组具有相同的均值，但是两个组的内部差异却非常显著，此时，如果只简单比较均值而不看其他分布因素就会导致错误的结论：

干预不起作用，因为均值既没有反映出改变，也没有反映出实验组和控制组之间的差异。

2.可变性的差异

各组比较的另一个选择是在每个组内部测量变异的程度。

某些组是否比其他组更具同质性？

与其他组相比，某些组是否边等更一致或更不一致？

干预的影响可能不会提高总的分值，但会使某一组更具同质性或更具异质性。

诸如极差、方差和标准差等统计方法可以描述各组一致（同质性）的程度，此外像直方图、箱线图等绘图技术也可以用于检验各组的离散趋势是否相同。

检验差异的技术有多种，选择哪一种部分地取决于相关变量的测量尺度。

3.形状

干预的效应能够通过结果变量分值的分布形状来体现。

组间同质性和差异性比较是比较分布形态的形式之一，其他的分布形状的性质有：

（下附图详释）

形态：

分布可以是单峰、双峰或者多峰。

对称：

定序或定距变量的分布可以是对称的或者偏态的。

偏态分布可以是正向的（个案聚集在结果变量的低端）或者是负向的（个案集中在结果变量的高端）。

一项干预可能改变分布的对称性。

峰度：

根据分布中心的集中方式的不同，各种分布会有所不同，这叫峰度。

分布可能是集中的或者是尖峰态的（频率分布曲线的尖顶峰度），钟形的（常峰态分布）或者是很平坦的（低峰态分布）。

这些不同的分布特征为检验干预变量对结果变量的影响提供了不同的途径。

除了仅仅关注其对一组均值的影响外，我们还可以通过结果变量的其他特征去检验干预的影响。

4.比例

这种组间比较的方式是比较每组已知应答的比例或者百分比，最适用于定类（名义）的结果变量或者包含很少类别的变量。

例如，我们要检验采用不同教学方法对一门大学课程通过比例的影响，发现面对面教学组有75%人通过，互联网教学组有60%通过，这些百分数是对两个组的不同结果的描述（描述性统计），然后我们可以分析组间差异是因为偶然因素、还是反映了总体的真实差异（推论性统计）。

对于本例，对组间比例差异进行双样本检验可以实现上述推论性统计。

5.变量之间的相关性

组间比较还可以通过检验变量之间的关联或相关性来实现。

关联的统计测量可以检验两个变量之间的共变程度，这种相关可以通过以下方法表示：

列联表、图形或统计描述，如相关系数。

除了对实验的干预和结果之间的相关性进行描述之外，我们还可以通过推论性统计来确定这种相关是否可以在更大的总体中存在。

对于不同的相关系数有不同的推论检验方法。

（五）我们需要哪种结果呈现方式

由于实验分析的目的是各组比较，我们必须决定怎样呈现组间差异。

我们可以选择表、图或者统计摘要。

选择哪一种（或几种）部分地取决于读者和数据的复杂性。

表呈现了频数分布和模式；最常用的图有直方图、茎叶图和箱线图；统计摘要用平均数、百分数或其他描述性统计指标来表示各组的差异。

（六）要比较多少组

确定以何种方式分析数据的另一个因素是我们需要比较的小组数量。

一些统计技术只限于比较两个组（如t检验），而其他方法可适用于多个组的比较（如F比值和方差分析）。

一些相关系数只是为少量的组设计的（如肯德尔系数等），而其他的则适用于包含很多种类的自变量。

同样，图表技术的适用性也取决于分析中组的数量。

1.单组结果与已知值进行比较

最简单的比较形式是只有一个组，并且我们希望将该组的结果同一个已知值进行比较。

这种分析方法成为单一样本设计。

这些结果与已知值可以是均值、比例或者单组方差等各种统计指标。

2.两组比较

经典实验设计通常比较两个组：

实验组和控制组。

当结果变量是定距尺度时，常用t检验来确定组间差异的显著性，它检验两组的平均值的差异是因为偶然性还是真实地反应总体的情况。

选择此种检验方法要考虑变量的分布。

其他检验方法，如临界比适用于在大样本且不满足正态性假设的情况下确定组间差异是否显著。

如果只有两组，同时结果变量是定序或者定类的时候，我们可以使用关联性测量的统计摘要来描述各组成员和结果之间的关系。

我们还可以选择列联表或者图来展示两组之间的差异，然后使用使用适当的推论统计方法将表或图显示的关系在更大范围的总体中推广。

卡方是一种广泛使用的统计方法，尤其适合于结果变量以定类尺度测量的情况，它可以告诉我们这两个变量是否相互独立，即是否组内成员对结果变量造成了差异。

3.三个或更多的组

一些实验设计要求使用三个或更多的组进行比较，例如，我们想要比较一系列干预，并且该实验需要包括一个实验组。

当结果变量是定类或定序变量时，我们很大程度上被限制在使用表、图、关联性测量和其他方法比较分布。

只要组数不过量且每组都有足够的个案数，这些方法都是适用的。

当要比较的组超过六个或七个时，比较将变得很困难。

如果结果变量是一个定距变量，最有效的方法是比较不同组的均值，此种情况下常用单因素方差分析。

单因素方差分析可以告诉我们一系列的平均值之间是否会有差异，但是问题在于我们无法知道哪些组间差异是重要的，是否在统计学意义上显著。

要找出那些组的平均值与其他组有统计性差异，需要进行多重比较，所有可能的两两组合都要进行比较，谢菲（Scheffe）检验是一种常用的多重比较技术。

（七）比较的组是否为独立样本

一些推论统计应该考虑成员被分配到不同的实验条件的方式，它们是通过配对入选择样本的，还是随机选入的？

1.独立样本设计

要建立具有初始可比性的组，最简单有效的方法就是随机分配，这可以保证组间的独立性，也可以使组内的个案之间保持独立。

由于一个样本元素的选择应当与其他所有元素的选择相互独立，所以一个包含夫妻的组不能产生独立样本设计。

（当实验的分析单位是个人的时候这是正确的，而如果分析单位是夫妇，那么样本中包含夫妇不违反独立性的要求。

）

2.配对样本设计

这是通过配对使样本具有可比性而不是通过简单随机分配。

这种设计中，一个组所选择的人并不独立于其他组，例如一对双胞胎，我们将其中一个分配在实验组另一个在控制组。

此外，我们还可能对同一各组在不同的时候采取不同的干预，这时理论上我们消除了任何可能的组间差异，这一过程实际上是实验组的成员在接受下次干预时，与自己本身进行配对。

（八）因变量是否满足正态分布

一些推论统计方法，也叫参数法，要求定距尺度的结果变量在总体中呈正态分布。

但遗憾的是，结果变量要么在总体中不呈正态分布（在统计学意义上），要么它们的总体分布是位置的。

当结果变量不是正态分布或者不能合理地假设其为正态总体分布时，我们有三种选择：

·我们可以通过变换使其分布正态化。

·我们可以在违背正态性假设的情况下，使用参数统计法。

有学者认为某些统计方法非常稳健且能在不考虑其前提假设的情况下，获得非常近似的结果。

·我们可以使用无须正态性假设的非参数统计方法。

怎样辨别结果变量在总体中是否呈正态分布呢？

假定有一个足够大的样本，一个条形图或一个直方图可以形象地给出分布是否呈现倒U形的单峰分布。

一条正常的曲线可以是偏度为0（对称）和峰度为3（常峰态）。

当样本规模很小（例如小于50）而且不是随机地从总体中抽取的，同时它的总体分布是未知的时候，最安全的策略是使用非参数统计方法或者稳健的参数统计方法。

（九）各组之间的因变量的方差是否相同

比较因变量的各组平均值是一种非常有效的组间比较方法，但是，当各组方差的差异非常大的时候，这种比较会失效。

对方差差异很大的组进行比较，会导致研究者难以确定均值差异是否代表集中趋势值的差异。

一些统计技术要求我们确定两组具有相同的方差，尤其是对均值差异的t检验。

如果是t检验，根据组间方差是否相同可以选择不同形式的检验方法。

大多数统计软件包都包含检验这个条件是否成立的统计方法。

（十）有多少自变量

最简单的实验设计只有一个自变量，但是，许多设计包含多个自变量。

因子设计和所罗门四组设计可以检验每个实验变量对结果变量的影响，还能识别自变量之间交互作用对结果变量的影响。

在田野实验中，随机分组不太可能，因此我们需要在统计学意义上估计并消除已知的组间差异，从而使我们可以检验实验变量的纯效应。

在设计多个自变量时，分析策略将取决于：

·所有变量（自变量和因变量）的测量尺度。

展开阅读全文