教育研究方法.docx
《教育研究方法.docx》由会员分享,可在线阅读,更多相关《教育研究方法.docx(22页珍藏版)》请在冰豆网上搜索。
教育研究方法
About变量
(一)变量的定义
•变量是具有一个以上不同取值(不同的子范畴、不同的属性,或不同的亚概念)的概念。
如性别就包括男性和女性两个取值的变量。
•只有一个固定不变的取值的概念是常量。
•概念有两个类型:
一类概念仅仅标识某类现象,如太阳、月亮;另一类概念往往包括若干个子范畴、属性或亚概念,它们反映出概念所指称的现象在类别、规模、数量、程度等方面的变异情况。
•指标是指表示一个概念或变量含义的一组可观察到的事物。
•概念是抽象的,指标是具体的;概念是人们的主观印象,指标则是客观存在的事物;概念只能想象,指标则可以观察和辨认。
(二)数字变量与类别变量
根据变量取值性质的不同,可分为:
1.数字变量:
表示事物在程度上变化的变量,是从“较少”到“较多”的连续体上的一个点(而不表现为全有或全无的关系)。
也称连续变量
可以给不同的个体或事物分派数字,以表明它们所具有的变量的大小。
如身高
数字变量常常(但并不总是)能够被分解为更小的单位。
2.类别变量:
表现为事物质的不同,而不是程度或数量上的差异。
如教学方法,政党等。
(三)练习:
请你说出哪些是数字变量,哪些是类别变量?
1.种族2.凝聚力3.心率4.性别
(四)教育研究中变量关系类型
1.两个(或两个以上)数字变量之间的关系:
年龄与学习关系,阅读成绩与数学成绩,看电视的时间与行为的攻击性
2.一个类别变量与一个数字变量的关系:
阅读教学的方法与学生的阅读成绩,学生性别与得到老师表扬的次数
3.两个(或两个以上)类别变量之间的关系:
种族与父母的职业,教师的性别与其所教的科目,管理风格与大学所学专业
有时,研究者需要决定将一个变量是当作数字变量还是当作类别变量来处理。
如焦虑
(五)无关变量
•无关变量是与某特定研究目标无关的非研究变量,由于它对研究结果将产生影响,所以需要在研究过程中加以控制,因此也称控制变量。
•控制无关变量的一种方法就是使其保持恒定。
•研究者必须不断思考如何尽可能地控制无关变量的影响。
(六)练习
•在历史教学中,由同性教师所教的学生是否会比由异性教师所教的学生更喜欢这门课?
•这个问题中的各种变量分别是什么?
答案:
因变量是对历史课的喜欢程度,自变量是就是性别
可能的无关变量有:
教师的性格与能力水平、所使用的教学材料,如教材、教师的教学风格、教师和学生的种族或年龄、其他因素……
About文献
(一)什么是文献研究法?
文献是指记录知识的一切载体,包括图书、报刊、会议资料、各种文件、学位论文、科技报告、专利文献、磁盘、光盘及各种音像视听资料、微缩胶卷、胶片等。
(二)文献类型有哪些?
文献的内容多种多样,按照它的性质、内容、加工方式和用途大致可分为零次文献、一次文献、二次文献和三次文献。
零次文献是指经历过特别事件或行为的人撰写的目击描述或使用其他方式的实况纪录,是未经发表和有意识处理的最原始的资料。
也称作第一手文献,包括未发表的书信、手稿、草稿和各种原始纪录。
一次文献也称原始文献,一般指直接记录事件经过、研究成果、新知识、新技术的专著、论文、调查报告等文献。
是发表过的资料。
二次文献又称检索性文献,是指对一次文献进行加工整理过的文献,包括文献特征、内容要点,并按照一定方法编排成系统的便于查找的资料。
三次文献又称参考性文献,是在利用二次文献的基础上,对一次文献进行系统的整理并概括论述的文献,这类文献具有主观综合的性质。
About教育经验总结实施步骤
(一)确定总结对象
总结教育经验首先确定经验总结的对象,确定了总结对象就相当于确定了研究课题和研究对象,另外总结的对象必须具有先进性和典型性的两个特点。
(二)制定总结计划
制定总结计划是勾画经验总结的基本构想和总体框架,它是使经验总结具体化的中心环节,也是协调研究力量,保证经验总结顺利进行的必要措施,它包括开始、程序、实施、分析、综合和验证等过程。
(三)经验资料的积累、筛选和提炼
积累:
借助读书笔记、复印、专题索引和电子工具如U盘等从实践、书籍、报刊和文献中收集教育经验实践中的事实资料。
筛选:
所谓筛选就是对积累起来的经验事实根据一定的标准进行“由此及彼,由表及里,去粗取精,去伪存真”的思维加工过程,使得事实材料最具有代表性,最能反映事物的本质。
提炼:
它是根据经验总结的目的和要求,运用分析和综合的方法揭示事实材料的本质联系。
(四)教育经验总结的论证
进行教育经验总结论证有助于保证教育经验总结过程的科学性和结论的准确性,是教育经验总结实施步骤中不可缺少的一环。
(五)撰写经验总结报告
撰写经验总结报告是经验总结过程中的最后环节。
撰写报告时,要保证报告的内容和形式的完美统一,以便他人学习借鉴。
About教育调查研究
教育调查研究的方法:
问卷法、访谈法、观察法、个案调查、抽样调查。
(一)问卷法
一、问卷题目的类型
开放式题目(回答者任意作答)、封闭式题目(答案是限定的)、混合式题目(将封闭式题目与开放式题目组合在一起)
二、问卷设计的策略
围绕研究目的、留有余地、被试有能力和愿意回答、注意题目编排顺序
四、问卷的发放与回收及问卷法的优缺点
⏹问卷的发放与回收:
示范答题、具体做法
⏹问卷法的优缺点
⏹成本低、易量化、不记名、范围大
⏹难核实、易缺失
(二)访谈法
一、访谈法的种类
结构式访谈(访谈的问题和过程标准化)、非结构式访谈(不设定访问程序)、半结构式访谈(准备问题加自由交谈)
三、访谈法的优缺点
访谈法的优点:
可以作比较深入、详细的调查;疑问可以及时澄清,调查资料更加准确、可靠;能灵活地开展调查活动,安排合适的访谈时间;对于不会或不愿填写问卷的人,也可以用访谈法向他们了解情况。
访谈法的缺点:
成本高;难以量化;对访谈者的要求高。
(三)观察法
一、观察法的类型
⏹直接观察和间接观察:
是否使用仪器
⏹参与观察和非参与观察:
是否作为其中的一员
⏹结构式观察和非结构式观察:
是否有设计好的观察内容和项目
⏹时间取样观察和事件取样观察:
时间取样的重点是在一定时间内事件的有无或多少,事件取样的重点是事件发生的过程和规律
五、观察法的优缺点
观察法的优点:
直接获得许多可靠的第一手资料;可以在自然情况下了解事物的发展过程;可以对同一个人或同一个现象作较长时间的跟踪研究
观察法的缺点:
观察到的现象可能带有表面性或偶然性,不同的人对同一现象的观察会因视角不同或主观因素导致不同的观察结果;由于是现场观察,或多或少会影响被观察者的正常活动,所以可能会被拒绝观察,而不能采用观察法
(四)个案调查
⏹以某个具体单位(一个人或一个现象)作为调查对象,调查其具体状态和发生、发展过程,了解和分析相关或相对的事物或现象
⏹调查对象是根据调查目的人为选定的,如典型调查、重点调查
⏹常用的个案调查包括典型调查、重点调查。
为深入了解调查对象,通常要进行追踪调查
一、典型调查
优点:
调查对象代表性高;
缺点:
典型不好选择;典型的代表性受时间空间的限制;做结论时容易犯以偏概全的错误
二、重点调查
与典型的区别:
重点调查侧重集中性,侧重对重点的总体情况的了解和数量的估计以把握全局;典型调查侧重代表性,侧重对典型的全面深入的分析和本质的认识以总结规律
三、追踪调查
优点:
是一种深入的调查,从事物的过去、现在的状况推测其将来趋势
缺点:
费时费力,需要组织保证和稳定的调查队伍
(五)抽样调查
一、总体与样本
二、变量与数据
三、简单随机抽样
从有限总体中随机抽取样品,每个成员机会均等被选入
四、分层随机抽样
行政区域分类、城市学校和乡镇学校分类、重点学校和普通学校分类、年级甚至班、组分类。
五、整群抽样
从总体中抽出一些自然的子总体(群),由其中的个体合起来组成一个样本的抽样方法
六、等距抽样
又称机械抽样,是将总体的个体排队,按固定的顺序和间隔抽取样品。
等距抽样操作简便
七、随机抽样
八、准随机抽样
About大题目(2题,每题10~15分)
【写出三点问题,结论有无说服力】
1.题目:
在一项最近的为期6个月的研究中,我们为100名5至12岁的小学生在学校提供早餐;研究发现参加早餐计划的儿童比其他儿童更不容易缺席或迟到。
显然,上学前吃早餐对于减少学生的缺席和迟到作用很大。
而且众所周知经常吃健康早餐的儿童一般在学校的表现也更好。
因此,为减少缺席和迟到以及提高本区所有小学和初中的学习成绩,我们应该在每天上课前为所有学生提供早餐。
答案:
1.作者不能提供足够的证据证明这项计划是否具有代表性
2.其次,作者不能提供足够的信息证明是吃早餐造成这些孩子不迟到和早退
3.作者还忽略了其他因素:
首先,没有提供任何证据说明吃早餐能够让孩子们在学校的表现更好;其次,也没有说明即使这个计划在全国有效,在本区是否有效,可能当地习俗不符
2.题目:
15年前,Omega大学实施了一项新措施,鼓励学生对所有教授的教学效果进行评价。
从那以后,Omega的教授开始给予学生更高的分数,Omega的学生成绩总平均上升了30%。
未来的雇主显然认为Omega的分数贬值了;这可以解释为什么Omega的毕业生找工作时没有邻近的Alpha大学毕业生找到好工作。
为使Omega毕业生找到好工作,我们应立即停止学生对教授的评价。
答案:
1.没有信息说明30%的份数增长是评估教授效率的结果
2.没有信息说明是成绩缩水导致毕业生找不到好工作
3.其他因素:
没有考虑是否有其他因素帮助提高Omega学生的就业率;没有说明让学生评价教授是否有好的一面
3.题目:
两年前,我们的顾问预言WestEgg用于投放垃圾的填埋地将在五年内完全充满。
然而在过去两年间,市对于铝和纸张的循环再生的数量比以前翻了一番。
由于垃圾收集的收费在下个月将会加倍,循环再生的材料数量将进一步增加。
而且,最近一次调查超过90%的回应者表示他们将会在未来做更多的循环再生工作。
由于居民对循环再生的有力支持,我们填埋地可利用空间的使用时间将比预期的长得多。
答案:
1.没有说明,人口等其他因素是否会导致垃圾数量的增多,可能offsetthedeceaseof垃圾,由于循环和回收的增多导致的
2.没有说明会因为垃圾收集费用的提高导致循环数量的增加,更愿意花钱
3.其他因素:
调查的详细信息没有说明,比一定所有的人都会那样做;其外,没有证据说明垃圾总量的信息,可能现在的总数比过去多很多,而循环在回收的数量翻倍不能说明总量的情况
4.题目:
牛奶和奶制品富含维生素D和钙,这是骨骼生长和维持所必须的物质。
因此很多人相信多吃奶制品的饮食可以帮助预防骨质疏松症,这是一种骨骼随年龄而显著弱化而且与环境和基因因素相关联的疾病。
但是一项对大量人群的长期研究发现那些在研究期间经常食用奶制品的人骨折发病率比其他参加研究的人要高。
由于骨折是骨质疏松症的症状之一,这一研究结果表明富含奶制品的饮食实际上会增加而不是减少患骨质疏松症的危险。
答案:
1.作者没有提供足够的证据证明,使骨质酥松症而不是其他的因素导致了骨折。
可能有其他的原因
2.作者还忽略了导致骨质酥松的其他原因。
不一定是牛奶导致的
3.其他因素:
这个研究的具体过程以及对象的情况。
About教育统计与教育测验
About变量与变量的种类
(一)总体与样本
⏹总体--统计研究对象的全体(总体可以分为有限总体和无限总体)
⏹个体--组成总体的基本单位
⏹样品--被抽到的个体
⏹样本--样品的全体
⏹样本容量--样本个数,通常用n(或N)表示
(二)变量
⏹变量:
指研究对象的个体之间在性质和数量上可以变化并可以测量的条件、现象或特征。
⏹在统计分析中,人们感兴趣的不是研究对象本身,而是与研究目的有关的变量。
所谓变量是指研究对象的个体之间在性质和数量上可以变化并可以测量的条件、现象或特征。
例如,要研究学生的高考成绩,则语文成绩、数学成绩、英语成绩等等就是要考虑的变量。
⏹变量类型:
①定类变量、②定序变量、③定距变量、④定比变量
1.定类变量
定义:
是用数字表示个体在属性上的特征或类别上的不同的变量,也称类别变量。
特征:
没有绝对零点,没有测量单位,四则运算无意义
例如:
性别(男,编号为“1”;女,编号为“0”)
2.定序变量
定义:
用数字表示个体在某个有序状态中所处的位置(层次、水平)的变量,也称等级变量。
特征:
没有绝对零点,没有测量单位;可比较次序,四则运算无意义
例如:
文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。
这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。
但是,各个定序变量的值之间没有确切的间隔距离。
比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。
定序变量在各个案上所取的变量值只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。
例如:
学生品德(Y)Y=1(优秀)Y=2(良好)Y=3(一般)Y=4(差)
3.定距变量
定义:
取值具有“距离”(间距)特征的变量,也称间距变量。
特征:
有测量单位,无绝对零点;可比较大小,进行加、减运算,但乘、除无意义
定距变量没有一个真正的零点。
例如:
摄氏温度这一定距变量说明,摄氏40度比30度高10度,摄氏30度比20度又高10度,它们之间高出的距离相等,而摄氏零度并不是没有温度。
又比如调查数个地区的工人占全部劳动人口的比率时,发现甲、乙,丙、丁、戊五个地区的比率分别是2%、10%、35%、20%、10%。
甲区与丙区相差33%,丙区与丁区相差15%。
这也是一个定距变量。
定距变量各类别之间的距离,只能用加减而不能用乘除或倍数的形式来说明它们之间的关系。
例如:
考试成绩,温度
4.定比变量
定义:
既有测量单位又有绝对零点的变量。
特征:
有测量单位和绝对零点;可比较大小,能进行四则混合运算
例如:
年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。
如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。
智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相差70分。
因为0值是不固定的,如果将其向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。
摄氏温度这一变量也如此。
定比变量是最高测量层次的变量
例如:
人数、身高、速度
定比变量的级别最高,定类变量的级别最低;
定类变量属于定性型;定距和定比变量属于定量型;定序变量可以看成是定性型,也可以看成是定量型。
(三)样本的数字特征
集中量数:
反映了变量取值的集中趋势,主要包括平均值、中位数、众数。
差异量数:
反映了变量取值的离散程度,主要包括方差、标准差。
最常用的数字特征是均值和方差。
众数:
样本中变量取值次数最多的那个数值。
About相关与相关系数
(一)两个变量之间的关系可以分为两类:
一类是确定的函数关系。
函数关系是指变量之间的依存关系,其中一个或几个变量的取值可以决定另一个变量的取值。
例如总成绩与各科成绩也存在着确定的函数关系:
总成绩是各科成绩之和。
另一类是相关关系。
现实世界中的一些变量之间还存在着另外一种关系,它们的取值互相有影响,但又不存在任何确定的函数关系。
例如身高和体重,两个变量之间有一定程度的联系,但它们之间没有确定的函数关系,即身高不能由体重决定,反之亦然。
称变量之间的这种关系为相关关系。
相关关系在客观世界中广泛存在着,特别是在教育领域内更是如此。
例如,学生的入学成绩与毕业成绩、数学成绩与物理成绩、学业成绩与智力水平之间的关系都是相关关系
最常用的是线性相关,用相关系数来度量两个变量的线性相关程度。
(二)相关
相关:
是指事物或现象之间的相互关系。
事物之间在数量上的变化关系有的是属于因果关系(一种现象是另一种现象的原因,另一种现象是这种现象的结果),有的却不能直接作出因果关系的解释。
当一个或几个相互联系的变量取一定数值时,与之相对应的另一个变量的值虽然不确定,但它仍然按某种规律在一定范围内变化,变量间的这种关系,被称为相关关系。
(三)相关的种类
从变化方向上划分:
正相关、负相关、零相关。
从变量的个数上划分:
1、简相关:
两个变量之间的相关关系。
2、复相关;一个变量与两个或两个以上变量间的相关关系。
(四)相关系数
1.皮尔逊(积差)相关系数
设X和Y均为定距变量,在第i个样品上的取值分别是Xi和Yi,则X和Y的相关系数定义为:
称r为皮尔逊相关系数或积差相关系数。
积差相关:
两变量均为正态连续变量,(一般n≥30)。
相关系数的取值范围在-1~1之间,其绝对值越大,表明两变量间的线性关联越强。
2.相关系数的性质
当r>0时,X与Y是正相关;当r<0时,X与Y是负相关。
线性相关程度随r的减小而减弱。
当r=0时,X与Y是零相关。
About效度与信度
(一)效度
测验效度:
指测验实际能测出所要测的特质或能力的程度,即测验的有效性。
例如:
一个数学能力测验确实能测到小学生的数学能力,那么这个测验效度高。
如果该份测验是用英文书写的,对中国学生来说,测验效度就会大大降低。
因为测到的首先是英语理解能力,不是数学能力。
提高效度的方法:
提高测验的信度;精心编制测验;选择好的效标;如果是为了检查测验的质量而进行测验,样本容量要大,这样可以降低测验误差对效度以及信度的影响。
(二)信度
一、信度的定义
测验信度:
指测验结果的一致性或稳定性程度,即测验的可靠性。
信度实际上就是对测验误差大小的一种描述。
一般来说,误差越小,信度越大;误差越大,信度越小。
通常用满足某种条件的两次测验分数的相关系数作为测验信度,记为,介于0和1之间,其值越大测验越稳定、越可信。
二、信度的种类
1.重测信度
含义:
同组被试使用同份问卷(以及相同的评分标准),前后两次测验分数的相关系数。
使用要求:
①两次测验的时间间隔要适宜;②适用于速度测验、问卷调查等非难度测验;
③在第二次测验时,应注意提高被试的积极性。
2.复本信度
含义:
两份“等值”但具体题目又不同的两份试题,相继对同组被试进行两次测验所得分数的相关系数。
使用要求:
①两份试题的具体内容不要重复;②两次测验的时间间隔要适当短些。
3.分半信度
含义:
把一个测验中的题目按编号分成两半,分别计算出每个被试两部分的得分,然后计算这两个部分的相关系数。
4.α系数:
α系数也称内部一致性系数,是一个测验的所有可能的分半信度的平均值。
用于衡量若干问卷题目是否测量了同一特质。
三、提高测验信度的方法
适当增加测验长度;与能力有关的测验,其难易程度要适中;测验的内容不应过于复杂;测验的实施和评分方法要标准化。
(三)效度与信度的比较
区别:
效度是指测验的有效性;信度是指测验的可靠性。
联系:
信度是效度的必要非充分条件。
即信度高,效度不一定高;效度高,信度一定高。
(四)提高测验信、效度的方法
测验中题目的数量应适当,不能太少。
紧密围绕教学大纲和教学目标命题。
考核内容应全面,并能有效代表学生应掌握的知识领域。
测验的整体难度适当,不同类型、不同难度的题目应保持恰当比例。
少出偏题、怪题,一般应以考察基础知识和基本能力为主。
About内、外在效度
(一)实验控制与效度
实验控制:
实验中无关变量的控制。
无关变量是否控制得好,直接影响实验结论的真实性和推广价值,即影响实验效度。
实验效度:
实验结论基于事实或证据可以被证明或解释的程度。
类型:
内在效度和外在效度。
(二)内在效度
关于实验结论的真实性,用实验的内在效度来衡量。
内在效度,是实验结论的可解释程度。
其含义是,就实验样本而言,因变量的变化在多大程度上是由自变量引起的。
换句话说,内在效度反映了对实验样本而言实验结论的真实性程度。
假设一位体育教师要对两种不同的训练方案可能对四年级学生体育技能测试成绩产生影响的问题进行实验研究。
这位体育教师计划用两个总体情况相似的教学班,并且在每个班级随机指定学生作为研究对象。
将这两种训练方案分别运用到两个班级中,时间为16周。
最后,他本人负责对两个班级进行同样的体育技能测试。
这项实验具有较高的内在效度。
为什么说这个实验具有较高的内在效度呢?
这是因为:
如果两个班的体育技能测试成绩有差异,比如说,某班的平均分显著高于另一班的平均分,我们就可以充满自信地得出方案1比方案2更有效的结论。
因为两个班的基本情况是相似的,两组被试是随机抽取的,实施与测试的教师又是同一位体育老师,上课和训练时间也相同,只有“方案”的不同。
一个缺乏内在效度的例子。
一项实验研究是关于3种类型的教材对五年级数学课学习有什么不同影响。
有3位教师参与研究,他们分别在不同的学校教学。
其中两名教师每人教4个班的五年级数学课,一名教师教3个班。
有一所学校的班级是按照能力分班的。
碰巧参与研究的这个学校的这名教师教的是能力高的班级。
每位教师使用一种教材,为期9周。
9周后,对学生进行测试,每位教师都使用自己出的试卷。
对这个实验,无论测试结果如何,都无法得出哪套教材更好的令人信服的有效解释。
因为这个方案当中充满着变数:
学生能力不同,在多大程度上影响了测试结果?
三位教师的教学水平差异情况,在多大程度上影响了结果?
不同教师分别命题的试卷对测试结果又造成了多大的影响?
对于这三个问题,我们无法做出准确的判断。
就是说,该实验中至少有三个重要的无关变量没有得到控制:
学生能力、教师的教学水平、试卷。
我们也就无法凭借测试结果的不同推断三套教材的优劣。
所以,通过这个实验方案而得出的结论是无法“被证明的”,即缺乏内在效度。
(三)外在效度
由实验样本得到的实验结论推广到全体研究对象(目标总体)的有效程度
内在效度低的实验外在效度一定低。
影响内在效度的无关变量一定影响外在效度。
☆影响研究外在效度的因素:
1、取样的偏差;2、被试与实验处理的交互作用;3、实验安排的反作用;
4、新颖的干扰;5、实验者效应;6、时间效应(theeffectoftime)。
(四)常见无关变量对效度的影响及控制办法
1.经历
a)经历一些实验以外的偶然事件
b)影响内在效度
c)控制的方法是使用对照组,让实验组和对照组同时经历相同的事件,同时接受相同事件的影响
2.成熟
a)随着时间的推移,被试身心会发生变化,如生理、心理的发展和成熟,知识、经验、技能的增长等
b)影响内在效度
c)使用与实验组有相同成熟和发展的对照组,可以克服成熟因素的影响
3.样本选择
(1)如果实验组与对照组不是等组
影响内在效度。
解决的办法是随机分组或进行匹配。
(2)如果被试(包括实验组和对照组)不是从研究总体随机抽样选择的
影响外在效度。
解决的办法是从研究总体中随机抽样或选择有代表性的样本。
4.测验
a)前测对后测的影响
i.正面影响:
如练习效应、敏感效应等,特别是前、后测时间相距较短的情形。
因为前测使被试有一次练习的机会,熟悉题型、了解测验特点,在后测中的表现较为熟练。
ii.负面影响:
有时被试也会因前测产生思维定势,对后测不利。
b)测验可能影响内在效度
c)解决的办法
i.不作专门的前测,用