ImageVerifierCode 换一换
格式:DOCX , 页数:38 ,大小:34.38KB ,
资源ID:28508865      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/28508865.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第八章 如何编制一个测验pptConvertor.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第八章 如何编制一个测验pptConvertor.docx

1、第八章 如何编制一个测验pptConvertor第八章 如何编制一个测验定义测验的结构、对象和目的编制测验计划编写测验项目撰写施测指导语进行初测进行项目分析修订测验对测验效度进行检验编制常模编写测验手册测验结构、对象和目的编写一个测验计划编写测验项目编写测验指导语进行初测进行项目分析修订测验信效度检验编制常模编制测验手册必要时会重复测验开发流程图一、界定测验的结构、对象和目的心理测量的对象是?结构对文献进行全面的回顾,找出对于该结构进行了解释的研究。已有的测量该结构的测验。1.1 测验的结构明确量表将应用于那些个人或团体。通常以年龄、性别、职业、受教育程度、民族、文化背景等指标来区分测量对象。

2、开发者写出将要参加该测验的人的特征列表,尤其那些可能影响到测验参与者如何对测验做出反应的特征。测验对象的残疾或其他特征。视力、文盲、文化背景差异。参与者是否会诚实作答。不诚实的人想通过诚实测验;精神疾病的人想得到健康的诊断结果。1.2 测量对象举例:对于智力的界定文化差异容易导致心理结构取向有所不同。Rogoff and Morelli(1989)实验: 要求非洲原住民部族的被试将20中物品按照他们认为最聪明的方式进行分类,结果被试将橘子和小刀分为一类、把土豆和锄头归为一类。实验完毕,主试问“愚笨的人会怎样分类?”,被试迅速将物品分为两类:食物和工具。1.3 界定测验用途明确测验干什么用,包含

3、两方面的含义:一方面是测验将要测量的内容,是智力、人格还是注意力、创造力等。另一方面是对于测验分数如何使用。用于群体中的比较还是用于对个体心理特质的解释。描述还是诊断选拔还是预测科研还是应用返回流程图二、编制测验计划测验的结构及其定义与操作性定义选择测验的形式(项目的形式)规定施测的形式评分方法2.1 界定测验的结构及其定义通过对已有文献及测验的回顾,已经为编写测验的结构定义做好了准备。定义包括用可观察和可测量的行为使该构想可操作化。详细说明哪些内容应该被测量、哪些内容不适合被测量,为测验领域划定边界。从每个维度中应该抽取几个题目。举例:大学生适应量表的结构焦虑抑郁自杀意念物质滥用自尊问题人际

4、问题家庭问题学业问题职业问题自杀意念 定义:对最近想要自杀的意念程度的测量,包括绝望和放弃。 行为:自杀意念表现为报告自杀的想法或与自杀企图有关的行为,包括制定一个自杀计划。举例:大学生适应量表的结构2.2 选择测验形式选择测验的类型主观题、客观题投射测验2.3 规定施测形式测验如何实施:书面、口头、计算机测验时间群体施测、个体施测测验出版商、施测者、完成人进行评分数据类型转换2.4 评分方法对于测验项目如何进行计分各个指标的比重返回流程图三、编写测验项目(item)客观题单选判断迫选题主观题论述题面试题完成句子反应偏差有些测验参与者倾向于提供或者选择那些被社会所接受的答案或对自己有利的答案,

5、社会赞许(social desirability)。默认倾向(acquiescence),被试对所问及的任何观点和行为都表示同意的倾向。在崇尚尊崇和礼仪的文化中最为常见。随机反应。被试不愿意或者不能够对测验项目做出正确的反应。作假。加入一些特殊题目防止识别哪些被试的回答是诚实可信的。作假量表或效度量表。表面效度,强化被试在测验过程中的合作意愿。编写有效项目的技巧通过参考测验计划来寻找项目主题。将测验计划与测验本身紧密联系起来。每一个测验项目都要围绕着一个核心结构。测验项目应该来自于所测的心理结构,而不是通过常识就可以回答的内容。每个项目都要直接、清楚。精确的词汇、简单的句子结构以及正确的语法和

6、标点。使用对目标群体而言恰当的词汇或语言。不要使用俚语或口头语。使得每个项目独立于其他项目。在其他测验项目不要有对于另外测验项目的提示。请教专家进行核查。单选与判断题的注意事项:避免使用否定的题干或选项。最好不要这样问“下面哪一个选项不正确”。所有选项在细节和长度上都相似。确保每个选项只有一个答案或是最好的答案。避免使用“总是”、“从来没有”等词汇(测谎题除外)。避免选项间的重叠。A,10-20、B,20-30使用随机排序来设置正确答案的位置。返回流程图四、编写测验指导语施测者指导语被试的指导语评分及分数解释指导语施测者指导语:团体施测还是个体施测施测环境要求要求的工具:铅笔,网络连接测验的时

7、间限制向被试宣读的稿子,及被试经常会问到的问题资格证或需要接受的培训被试指导语:传达测验时需要注意的问题如何作答鼓励被试提供准确的和诚实的回答也有可能为被试设置一个背景:回答下列问题时,请考虑你当时的工作环境。简单明了,不能过于复杂。评分及分数解释指导语:确保对测验进行评分的每个人都会依据同样的程序进行。测验分数与测验结构之间的联系。高分意味着什么,低分意味着什么。返回流程图五、进行初测(预测)预测中的目标群体、环境预测群体的大小收集额外的数据(指导语、项目编写、被试的反应)初步的分析返回流程图六、项目分析难度区分度项目间的相关定性测验的分析(探索性因素分析)返回流程图七、修改测验修改、删减项

8、目修改指导语返回流程图八、信效度分析信度分析效度分析(验证性因素分析)返回流程图九、编写测验常模返回流程图十、编写测验手册编写过程一直伴随着测验开发过程测验的目的与功能理论依据与材料来源还包括:答案、指导语、测验开发的有关信息、信效度验证、常模以及临界值。返回流程图有什么问题吗?心理学是科学吗?与物理学、化学有何区别?第六章 测验题目性能与题目编写要点提示:1、测验题目有那些类型?各类型的题目功能如何?2、难度、区分度、猜测度,计算,控制3、选项分析与选项修改第一节测验题目类型、功能与题目编写一、测验题目类型及功能题目(item,也叫项目)。题目主要分为客观题和主观题。客观题有唯一标准答案主观

9、题只有一个参考答案客观题包括:选择题(含自陈选择题)、填空题、是非判断题、匹配题、行为情景判断题等。主观题包括:名词解释、简答题、计算题、证明题、论述题、案例分析题、作文题等。类型自陈选择题:给出一系列陈述句或问题,描述一种特定的心理特质的行为特征,同时提供两个以上的选项供被试选择。设置方式内容例子是否式选项为“是”和“否”两种我喜欢独自玩游戏。是 否是否折中式选项为“是”、“否”、“介于是否之间”三种我善于控制自己的情绪。A 是的 B 不是 C 介于A和B之间文字等级式5-7个程度不等的选项你对自己的生活满意吗?非常满意 比较满意 无所谓 不大满意 极不满意数字等级式是文字等级式的变式,将文

10、字变成数字你对自己的生活满意吗?非常满意非常不满意 1 2 3 4 5类型行为情景判断题:给出一个日常生活中或工作中的具体情境,并针对该情境提供若干解决这一情境下具体问题的行为选项,要求受测者进行选择/评价的题型。主要应用与实践能力及人格测量。二、测验题目的编写编写选择题的注意事项:题干要描述清楚,应该让被试明白问题是什么,希望被试解决什么问题。尽量避免与考核内容无关的材料设问应尽量正向,尽量少出现“下面哪个是不对的”这样的提问。题干文字的字体应尽量一致(不要有的粗体,有的斜体等),减轻被试的阅读负担。备选项避免出现逻辑上的包含关系。备选项的长度、结构、语言表达尽量一致。增加干扰项的迷惑性,在

11、干扰项中不要使用“绝对”、“总是”等词汇,避免暗示被试排除或确认某些选项。干扰项的设置应能反映出被试缺乏特定的知识或技能。案例分析题的注意事项实际生活中发生的,且与实际生活相贴近。试题材料必须条件充分,叙述完整,语言规范。被试利用所学知识和已有能力确实可以得出结论的问题。应该是有正确结论的案例,理论界还有正义的问题不宜作为考题材料以大纲对考核知识的最高要求为度,不能超纲。一般从不同的角度设问;也可通过递进式的层层设问,最终达到考察综合应用知识的目标。第二节难度一.定义测验项目的难易程度。二.计算根据计分方式的不同,测验难度的计算分为二分法难度的计算、非二分法难度的计算两种。二.计算(1)通过率

12、在不考虑猜测因素影响的情况下。可以用通过率来表示,答对该项目人数的比例。P=R/NP代表难度,P值越大,难度越小。R 答对该项目的人数N总人数1、二分法计分项目难度的计算二.计算(2)极端分组法在人数较多的情况下。可以取前27%作为高分组,后27%为低分组。P=(PH+PL)/21、二分法计分项目难度的计算二.计算对于简答、论述类的题目,被试的分数从零分到满分之间,有多种可能的结果。计算公式:P=平均分/满分2、非二分法计分项目难度的计算三.难度水平的确定难度水平的确定取决于测验的目的、项目形式、及测验的性质。考察性测试选拔性质的测试四.难度的等距变换根据通过率P,计算得到的难度值,属于顺序变

13、量,不方便进一步的分析。需要将其转换为等距量表。当被试样本容量很大时,其能力水平接近于正态分布。可以用正态分布曲线表,将试题的难度P作为正态曲线的下面积,转换成Z分数。五.难度对测验的影响测验难度偏高,被试得分集中在低分端,正偏态;测验难度偏低,被试得分集中在高分端,负偏态中等难度,正态分布。1、分布形态的影响五.难度对测验的影响过难、过易会使得测验分数集中在两端,分数的离散程度低。不易区分被试的能力水平。项目难度在0.5时,可以使被试分数分布的离散程度最佳。取得高的信度。2、分布的离散程度第三节测验的区分度一.含义及作用1、含义:测验项目对被试心理品质水平差异的区分能力。2、作用:区分度可以

14、作为一个测验是否具有效度的“指示器”。注意:区分度D的值介于-1到+1之间,D值越大,区分度越好。但是区分度的高低,依赖于对被试水平的精确测量(效标分数)。效标分数一般用的是测验总分,称作内部效标。1 项目鉴别指数法(二分法计分)取前27%的被试作为高分组,计算通过率(PH)取后27%的被试作为低分组,计算通过率(PL)两者之差D= PH PL 为鉴别力指数。注意:被试样本人数过少,不宜使用27%规则。二.区分度的计算2 相关法(注意各种相关法的适用条件)(1)点二列相关前提条件:项目是0、1计分(二分变量),效标是连续变量。注意:需要对其相关系数做显著性检验。二.区分度的计算2 相关法(注意

15、各种相关法的适用条件)(2)二列相关前提条件:都是连续的测量变量,但其中一组被人为分为两类。注意:对于分布形态有要求。需要相关的显著性检验。2 相关法(注意各种相关法的适用条件)(3)相关前提条件:两变量都是二分名义变量。注意:不满足其他相关条件的,可以用这个公式来计算。(4)积差相关前提条件:项目与效标均是连续性变量,正态分布。假设项目通过率为1,就是说高分组、低分组被试全部通过,即PH=1,PL=1。D=PH-PL=0;假设项目通过率为0,就是说高分组、低分组被试全部没通过,即PH=0,PL=0。D=PH-PL=0;假设项目通过率为0.5,那么有可能高分组全部通过、低分组被试全部没通过,即

16、PH=1,PL=0。D=PH-PL=1,取得最大值;三.区分度与难度的计算在实际运用中,应使难度分布广一些,呈正态分布,平均值在0.5左右。1 计算方法不同,所得值也不同2 样本容量大小3 分组标准4 被试样本的同质性5 所测心理品质的一致性6 题目本身的文字表述和内容质量四.区分度的相对性第三节猜测问题与猜测率一.猜测校正的性质与公式原因:在选择题测验中,猜测会引起项目难度的降低,使通过率或得分高于被试的实际水平,需要对猜测进行校正。在选择题中被选答案越少,机遇的作用越大。因此,需要对于难度系数进行校正:CP=(KP-1)/(K-1)CP为校正后的通过率;K为被选答案数;P为实际通过率。对于

17、单个被试来说,参加多个项目所组成的测验,由于猜测因素的存在,同样需要校正:S=R-W/(K-1)S校正后的得分;R被试答对的项目数;W被试答错的项目数;K选项数目。二、优缺点第七章 常模参照测验的设计与编制要点提示:什么是常模?常模有什么作用?常模的种类有哪些?常模是如何建构的?什么是标准化样本什么是原始分数和导出分数?不同常模分数之间的关系是怎样的?第一节分数转换一.定义导出分数:在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数。百分等级标准分数T分数二.百分等级分数1、概念2、计算:(1)未分组资料(2)分组资料3、评价(1)优点:是一

18、种相对位置量数,具有可比性、易计算、解释方便,不受原始分数分布状态的影响。(2)缺点:单位不等,只具有顺序性,相对于特定群体环境而言。三.标准分数四.标准分数的变式五.标准九分数六.导出分数间的相互关系第二节分数合成一.种类分数转换是对于一个测验而言的。高考?招聘将几个预测源结合起来,以获得一个总的分数或预测源,分数合成。基本测验项目组成分测验分测验得分组成 合成分数几个测验得分组合考虑:方法 形式 数量及性质二.合成的方法临床诊断-直觉合成填报志愿高度的综合性 灵活的针对性易受偏见的影响 缺乏精确的数量分析加权求和(1)单位加权X=X1+X2+X3+Xn(2)等量加权Z=Z1+Z2+Z3+Z

19、n(3)差异加权Z=W1Z1+W2Z2+W3Z3+WnZn多重回归测验结果估计预测效标根据高考各科成绩预测大一期末学习成绩。步骤:高考各科成绩的平均数、标准差;大一期末学习成绩的平均数和标准差;分数间的相关矩阵。输出:各预测源的加权量;决定系数R2注意:线性关系多重划分考研究生 专业课 英语 政治所测特质之间不具有互偿性。步骤:先把最有效的预测源放在前面;依次类推第二节常模参照测验概述一.含义及作用常模参照测验(norm-referenced test):是通过测试将被试个体的心理发展水平与某一特定群体(测试对象总体)的心理发展水平进行比较,从而确定被试个体心理发展水平在这一特定群体中相对地位

20、的测验。标准化测验的重要指标是:标准化的施测指导语、计分方法、结果解释以及分数报告模式。来自于被试总体的足够大的有代表性的样本就叫标准化样本(standardization sample)。把被试在测验中通过累加题目得分而获得的测验分数叫原始分数(raw score)。一.含义及作用1、含义:常模参照测验是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。2、作用:被试可以根据自己的分数,找到在团体中所处地位。步骤:确定测谁、获得分数、分数转化1定义: 具有共同特征的人所组成的一个群体,或者是该群体中的一个样本。一个测验可以有多个常模团体;常模团体要有代表性;二.常模

21、团体2 注意事项(1)界限明确 说明常模团体的性质与特征(2)代表性 (3)取样过程 详尽描述(4)大小适当 (5)时效性(6)一般常模与特殊常模相结合补充:为了便于确定个体测验得分在标准化样本群体中所处的地位,被试在测验中获得的原始分数经常会被转换成某种导出分数(derived score)。经常使用的分数转换方式有两种:一是纵向转换,即把个体得分与不同年龄的发展水平进行比较,并转换成相应的等级水平(发展性常模);另一种是把个体得分与同一群体内其他人的分数进行比较。1 发展量表:智龄、年级当量人的许多心理特质是随时间有系统发展的,所以可将个人的成绩和各种发展水平的人的发展水平相比较,而制成发

22、展量表。三.几种主要的常模参照分数1.1 智龄1908年比内和西蒙使用智龄来度量智力。在年龄量表中,题目被划入各个年龄水平。一个儿童的量表分数就是他所达到的最高水平。一个儿童在年龄量表上所得的分数,就是最能代表他智力年龄的水平,这种分数就叫智力年龄,简称智龄。中国比内测验(吴天敏)适用于:2-18岁。每岁三个项目,每题4个月1、比大小园;2、说出物体名称;3、比长短线;4、辨别图形;7、说出手指数30、迷津45、说明含义49、解释成语51、区别语义年龄常模的基本要素一组能区分不同年龄的题目一个由各个年龄被试组成的代表性样本一个表明答对那些题或得多少分该归入哪个年龄的对照表。1.2 年级当量是一

23、个特定年级的学生在测验中取得分数的平均值。年级常模通常以月为区间,每个年级有10个区间,并假定其寒暑假期间所关注的特质没有成长或发展。年级当量4.0,表示四年级开始时的平均成绩;4.5表示第五个月时的平均成绩需要注意的问题容易产生误解:二年级的学生得到了一个5.3年级当量。恰当解释是:在这些内容为2年级的测验中,这位被试与典型的5年级3月学生(期望)做的相似。同一被试不同科目间的年级当量不能比较年级常模仅适用于低年级及一般科目年级常模不是标准对于发展常模的评价基于发展常模的分数是粗略的,没有精确的统计方法。主要用于描述目的、临床病理诊断、科学研究。2 商数(智商 教育商数 成就商数)斯坦福比内

24、智力量表第二版的突出进步是引入了智商(Intelligence Quotient)来报告分数。IQ=智龄(MA)/实龄(CA)由L.W.Stern首先提出。智龄只能表示智力的绝对高低,不能比较不同实龄儿童智力高低;智商可以表示智力的相对高低。百分等级分数常模标准分数常模3 群体内常模(within-group norms)第九章 智力测验及其实施智力的含义是什么?智力测验有用吗?智力的因素分析理论和智力的信息加工理论的异同点是什么?常用的个别和团体智力测验有哪些?简述二者特点。第一节 智力测验概述1.1 智力的定义是什么?一、智力测验的相关概念可以通过外显的,可观察的行为来识别智力。有代表性的

25、定义:(1)智力是学习的能力(2)智力是适应环境的能力(3)智力是抽象思维的能力(4)智力是加工信息的能力(5)是个体心理能量的总和,能够使个体有目的的行动,使个体的思想有条理,并且能够对自身的环境作出有效的适应。一个综合的定义智力是人们认识、理解客观事物并运用知识、经验等解决问题的一般能力,它包括观察能力、注意能力、记忆能力、思维能力、想象能力、操作能力等。由于智力被看做人的各种能力的综合,因此智力测验也被称为普通能力测验。智力年龄比率智商:智力商数(Intelligence Quotient)。斯坦福比奈智力量表。离差智商:把测验分数按照正态分布曲线标准化,把原始分数转换为平均数为100,

26、标准差为15的标准分数。韦克斯勒智力量表。1.2 智力测验及其指标1.3 智力的分布和分类标准智商类别百分比理论分布斯比量表韦氏量表140以上高超常0.381.62.3120-139超常8.811.37.4110-119高于平常15.9618.116.590-109平常49.7246.549.480-89低于平常15.9614.516.270-79临界水平6.95.8670以下智力缺损2.282.92.2天才?gifted二、智力测验的理论依据智力的二因素说:(Charles E. Spearman)提出,(1)一般因素(G因素)代表个人的普通智力,是一切心智活动的主题和智力的基础,个体间智力

27、的差异决定于G因素的多寡;(2)特殊因素(S因素),代表个人的特殊智力,只有在某些特殊情况(特殊工作或活动)下才会表现出来。2.1 智力因素分析理论智力三因素说,(Edward L. Throndike):(1)抽象智力,处理语言和数学符号的智力;(2)具体智力,处理事物的智力;(3)社会智力,处理人际交往的智力。智力多因素说,(Louis L. Thurstone):智力可以分为语文理解(V)、词语流畅(W)、数字运算(N)、空间关系(S)、机械记忆(M)、知觉速度(P)、一般推理(R或I)其中因素。智力的层次结构模型(Phillip Vernon):把智力结构分为四层。第一层G因素;第二层

28、,大因素群,即“言语和教育因素”与“操作和机械因素”;第三层小因素群;第四层,更小的特殊因素。Joy P. Guilford的智力结构立体模型。内容、操作、产品。内容维度是指引起个体心智活动的各种刺激物;操作即智力的加工活动;产物即智力活动的结果。Remond B. Cattel的流体智力和晶体智力:流体智力,信息加工和问题解决过程中洞察复杂关系的能力,是一种普遍性能力,更多地依赖于遗传;晶体智力,知识与技能有效结合的一种能力,主要用于完成某种固定的任务,更多地依赖于环境的作用,取决于后天的学习。Cattell-Horn-Carroll(CHC)智力能力理论:该模型包含了十个宽层能力和七十多个

29、窄层能力,每个宽层能力包含多个窄层能力。十个宽层能力的编码和命名分别为:流体智力、晶体智力、数量知识、读写能力、短时记忆、视觉加工、听觉加工、长时记忆和提取、加工速度和决策/反应的时间或速度。Howard Gardner的多重智力理论:智力是个体用于解决问题和创造物质财富的能力。七种不同的智力成分:语文能力,说话、阅读、书写。数理能力,数字运算和逻辑思考。空间能力,认识环境、辨别方向。音乐能力,对声音的辨识和表达韵律。运动能力,支配肢体以完成精密作业的能力。人际关系能力,与人交往且和睦相处。反省能力,认识自己并选择自己生活方向。后来又加入了自然智力、精神智力和存在智力。2.2 智力的信息加工理论J.P. Das等人智力PASS模型,包括以下内容:(1)四种认知成分:计划(Plan)、注意(Attention)、同时性加工(Simultaneous process)、继时性加工(Successive process)。(2)三个系统:1注意唤醒系统(第一机能区),使大脑处于一种适宜的工作状态;2同时性继时性加工系统,又称编码系统(第二机能区)负责对外界输入信息的接收、解释、转换、编码、再编码和储存;3计划系统(第三机能区),执行

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1