第三节实验数据的统计分析.docx
《第三节实验数据的统计分析.docx》由会员分享,可在线阅读,更多相关《第三节实验数据的统计分析.docx(27页珍藏版)》请在冰豆网上搜索。
第三节实验数据的统计分析
第三节实验数据的统计分析
一、统计表和统计图
在心理学实验研究中,一般都是先获得一大堆原始数据和观测材料,虽然这些数据乍看起来十分凌乱,但它们却是实验所获得的最宝贵的财富。
实验做完以后的分析和立论,都将以这些数据为基础。
因此,为使实验获得成功,数据的整理十分重要。
在数据整理的过程中,第一步是对数据的特点和种类加以分析,绘制出简单的统计图和统计表。
统计图和统计表的一个共同优点在于一目了然,它所表示的信息容易被人们理解和接受。
有人曾给予一个不甚恰当的比喻,如果文字的信息量是“I”,那么统计表的信息量就是“10”,统计图的信息量则是“100”。
艾宾浩斯(EbbinghausHermann,1850~1909)著名的遗忘曲线就是用一个统计图概述了他实验的全貌。
下面我们分别来介绍统计表和统计图的制作方法。
(一)统计表
L统计表的功能和结构在心理学研究报告中免不了要用几张统计表。
这是因为,统计表(statisticaltable)是对被研究的心理现象和过程的数字资料加以合理叙述的形式。
它在叙述统计资料方面有着重要的作用,有人称之为统计的速记。
设计良好的统计表使统计资料表现得充分、明显而又深刻、有力,可以避免冗长的叙述。
统计表由标题、横行和纵栏、数字资料等要素组成。
统计表的构造一般包括如下几个项目:
(1)序号:
序号就是表的编号,要写在表的上方,表题的左方。
序号一般以在文章中出现的先后顺序编列。
(2)名称:
乂称表题,是一个表的名称,应写在表的上方序号之后。
表题的用语要简洁扼要,使人•一望可知表的内容。
如果用语过简,可在下面附加说明,但这种情况不宜多用。
(3)标日:
又分横标ri和纵标日。
横行标ri写在表的左方;纵列标ri写在表的上方,分别说明横行和纵栏的内容。
(4)数字:
数字是统计表的语言,又称统计指标。
它占据统计表的大部分空间,书写一,定要整齐,位数要上下对齐,小数点后缺位的要补零,缺数字的项要用“一”符号表示,不能空白。
(5)表注:
写于表的下方。
它不是统计表的必要组成部分。
如果需要可对标目补充说明。
数据性质、数据来源、附记等都可作为表注的内容,文字可长可短,参见表2-15。
表2—1529名被试康复治疗前后体重差别阈值的变化
康复治疗
差别阈限(克)
刖
175±37.8*
后
84.4±35.2
为了使统计表能对所研究的心理现象以鲜明的数字叙述,制表时应注意以下几点:
(1)每一张统计表都必须有名称,统计表的各种标题,特别是表题的表达,应十分确切明了。
内容应紧凑而富有表现力,避免过分庞大和琐碎。
(2)表的各纵列之间要用线条隔开,表的两个纵线可以省去,上下两边须有横线,标目与数字之间、数字和总计之间、两个总标目之间都须用线条偏开。
表的上下二横线条要粗些。
(3)表中各栏,通常是根据由局部到全部的原则编列的。
(4)统计表应有计量单位名称。
计量单位名称,通常加用圆括号并置于表头的右上方,或者置于标题或标目的下面。
2.统计表的种类统计表可以以形式及内容的不同来作为分类标志,将其划分成不同的类型。
不同类型的统计表的具体功能不同。
下面简述儿种常用统计表:
(1)简单表:
只列出调查名称、地址时序或统计指标名称的统计表。
例如表2—15。
(2)复合表:
统计分组的标志有两个或两个以上的表。
若只有两个分组指标的称两项表;若分组指标有三个的称为三项表,依此类推。
表2-16就是-•个复合表,且分类的标目有五个:
间隔时间、实验数、节省百分数、节省百分数的中数、中数机误。
表2-16不同时间间隔后的记忆成绩
间隔时间
实验数
节省百分数的范围
节省百分数的中数
中数机误
1/3小时
12
45
—64
58.2
1
1小时
16
34
—54
44.2
1
8-9小时
12
28
—48
35.8
1
24小时
26
15
—46
33.7
1.2
6天
26
12
—46
27.8
1.4
31天
26
3-
-40
25.4
1.3
45
7-
-44
21.1
0.8
(采自Ebbinghaus,1885)
表2-16就是艾宾浩斯(Ebbinghaus,1885)
实验研究的主要结果,这个统计表集中了他对1,300个字表,反复测定了学习和回忆间隔时间的长短同遗忘的关系,分类统计而成。
有了这个表,他就可以绘制成著名的遗忘曲线(forgettingcurve)(见70贝图2—6)。
(2)统计图
为了写好实验报告,还需要利用统计图来表明心理现象的数量关系,这样就不需要作很多解释就可以让读者看懂。
统计图有明显的优点,它不仅对统计资料和实验结果做出具体、明确的表达,易为读者所理解和获得深刻印象,而且由于统计图的表现生动活泼、醒目动人,具有很强的说服力。
所以统计图是分析统计资料的重要工具,也是实验报告的重要内容。
通过作图,可帮助我们揭示心理规律。
但是统计图也有不足之处,它不能获得确切数字,如果作图不半反而会掩盖事实真相,因而我们不能用统计图来代替统计表。
在论文中,常将统计图和统计表一并列出。
下面我们分别来讨论统计图的功用、结构和种类。
1.统计图的功用和结构统计图(statisticalfigure)乃是依据数字资料,应用点、线、面、体、色彩等来绘制成整齐而又规律、简明而又数量化的图形。
统计图在数据整理中占有很重要的地位。
一图知万言,一张简单的图形,就可以把一大堆数据中有用信息概括地表现出来。
统计图一般多采用直角坐标系,横坐标用来表示事物的组成或自变量X,纵坐标常用来表示事物出现的次数或因变量Y,除直角坐标外还有角度坐标等。
2.统计图的结构与制图要点
(1)图号及图题:
统计图的名称为图题。
图题的文字应简要,只要求能扼要地叙述统计图的内容,使人一见就能知道图所要显示的是何事、何物,发生于何时、何地。
图号是图的序号,图题与图号1般写在图的下方。
图题的字体应是图中所用文字中最大的,但也不能过大,要与整个图形的大小相称,一般与图目文字的顺序一致,从左至右书写,放在居中的位置上。
(2)图目:
是写在图形基线上的各种不同类别、名称,或时间、空间的统计数量,即坐标上所有的各种单位名称。
在统计图的横坐标和纵坐标上都要用一定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数单位,百分单位等等,这要根据资料的情况加以选用,图尺分点要清楚,整个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺或对数法,进行技术处理,减少图幅,增强图形效果。
(3)图形:
是图的主要部分,图形曲线要清晰,一般除图形线外,应尽量避免书写文字。
为表示不同的结果,要用不同的图形线以示区别,各种图形线的含义用文字标明,选图中或图外一适当位置表示,目的是使整个图和谐美观且醒目。
(4)图注:
凡图形或其局部或某一•点,需要借助文字或数字加以补充说明的,均称为图注。
图注部分的文字要少,印刷字型一般要小,它可以帮助读者理解图形所示资料,提高统计图的使用价值,却又不破坏图的协调性。
此外,一个图形要使用各种线条,这些线条因在图中的位置不同而有不同的名称,如图形基线(横坐标)、尺度线(纵坐标)、指导线、边框线等。
3.统计图的种类常用的统计图有曲线图、条形图、直方图、点图、圆形图等等。
通常表示事物各组成部分的构成情况的资料可用圆形图;频数分布资料可用直方图;资料内容各个独立者W用直条图;表示事物数量发展过程的连续性资料可用曲线图;表示两种事物的相关性的趋势可用点图。
下面我们分别介绍这几种图。
(1)曲线图:
适用于连续性资料,表示事物数量在时•间上的发展变动情况。
因为借助于连续曲线,能够最恰当地描绘出心理现象在时间上的不断变化过程,见图2-6o
绘制曲线图时,以横轴尺度表示时间、年龄等等,纵轴表示频数。
纵、横轴尺度必须等距或有一定规则。
纵轴尺度一•般要从零开始,图线应按实际数字绘制,切勿任意描改为光滑曲线。
若有几根曲线,应用不同形式的线条(实线、断线、点线等)区别开来,并用文字说明。
对数尺度曲线图是动态曲线图的一种特殊图式。
图形的一轴制订出对数尺度,另一•轴则按原样。
图2-7是一个以分计的对数时间作横轴尺度,这样,我们从短短的横轴上看到了二年时间内的发展趋势,同时•还看到了与相对量有关的绝对量的大致变动情况。
(2)条形图:
以相同宽度的条形长短来比较图形指标的大小,它是比较图中最常用的图形。
条形图绘制方法简单,同时形式明确,图示效果好。
绘图时,须先绘制一水平线作为条形的共同基线,依此基线为起点所绘制的条形的长度,视图示的指标数值的大小而定。
因此,必须定出一个比例尺度,作为绘制条形图的依据,同肘各个条形的宽度要相等,各(组)条形间要有相当的间隙。
图2-8就是条形图。
条形图有好几种。
以同一水平线为基线的纵式条形图,也可制作成横式条形图。
(3)圆形图:
一般用来表示事物各组成部分的构成情况。
以一个圆的总面积代表总数,把面积按比例分成若干部分,以圆心角的角度大小来表示各组成部分的数量(如百分比)。
代表圆面积中1%面积的扇形有3.6度的弧,各扇形面积中要标明百分数,并加文字说明。
图2-9是一种表示被试来源的圆形图。
不过一般被试来源用不着作图,作了图就有强调被试构成成分的含义。
(4)点图:
表示两种事物相关性的趋势多采用点图。
图的纵轴尺度和横轴尺度代表一种变量值的大小。
习惯上自变量(X)的尺度放在横轴,因变量(Y)的尺度放在纵轴。
不论纵轴、横轴的尺度都不必从零点起。
在变量与因变量的交叉点绘一个点,我们依据点的情况可以推测两种事物的相关情况。
参见图2-10。
实验数据的初步整理
心理学研究的结果一般都有数量记录,这些原始的数字材料往往是复杂而分散的,使人读了难得要领。
因此必须经过分析整理,把材料有系统地组织起来。
经统计处理能使复杂的材料变得简单扼要,把事实要点表示出来。
下面我们从统计学的角度,概括地介绍如何对实验所得的大量原始资料进行科学的加工整理。
使用图表概括大量实验结果,这仅仅是对数据整理的第一步。
实验所得资料只是表明每个个体的详细资料,为了能够反映综合特征,集中量和差异量是两个特别重要的参数。
在次数分布上有两个重要特征:
即重心位置和分布范围。
用一定量数概括、规定重心位置的数字叫集中量,而用一定量数概括、规定分布范围的数字叫差异量。
在介绍集中量和差异量之前,我们先讨论有关误差的问题。
(-)偶然误差与系统误差
大家都有这样的经验,无论实验做得多么精密,获得的观测数据总不完全一致,表现为数据的波动。
产生数据波动的原因是因为有许多偶然因素影响着实验结果。
1.偶然误差偶然误差(fortuitouserror)或机误(chanceerror)是指实验中无法控制的偶然因素所引起的误差。
例如测量仪器的灵敏度的有限性。
又如,在有些测量中并未把温度、湿度看成影响因素,但是,湿度和湿度时刻都在变化,这些都是偶然因素。
无数的偶然因素影响着实验或观测结果,使得测出的数据范围绕真值有一些上下波动。
例如,用天平称某物体的重量,进行10次观测得到10个数据,记在表2-17的第二列(栏)。
如果此物体重量的真值为a=150.6克,表2-17中第三列(栏)记下的是各观测值与真值之差。
设:
a为某变量的真值,X:
X〃……,Xi为其各次的观测值,则数X-a(i=l,2,3,……,n)叫做Xi的偶然误差。
表2-1710次观测所得的原始数据
序号
观删值X(克)
Xi-角(偶然误差)
1
150.68
0.08
2
150.53
-0.07
3
15