测量Word下载.docx-资源下载

测量Word下载.docx

1、1 主观经验性考试阶段（1864年以前）2 客观标准化测验阶段（1864年1940年）3 客观测验的深入发展阶段（1940年）4 西方心理测量的发展5 心理测验在我国的发展（五）心理测量的道德准则1心理测量工作者的素质要求（1）心理测量工作的知识结构.（2）对心理测量的态度2心理测量工作者的道德准则（1）测验的保密和控制原则（2）测验中个人隐私的保护考核要求：1心理测量的种类2测量与测验（Test）、考试（Examination）、评价（Evaluation）联系与区别3测量的要素及量表类型单位，参照点，量表，称名量表，顺序变量，等距变量，比率变量4.心理测量的本质、基本条件及功能5.心理测

2、量发展简史第二章经典测验理论的基本假设教学要点：通过本章的学习，掌握经典测验理论的基本假设，心里特之及其特性，心里测量的误差和种类，以及真分数的含义等内容。6学时教学内容：一、心理特质（Trait）及其可测性假设1经典测验（Classical Test Theory ,CTT）理论2特质假设二、测量误差及其来源1. 测量误差的含义2误差种类随机误差，系统误差3误差来源（1）来自心理测量工具，（2）来自测量对象，（3）来自实测过程（二）真分数模型及其假设1. 真分数的含义2真分数数学模型解析领会：（1）几个推理，（2）CTT的基本含义，（3）CTT的基本公式3经典测验理论的不足1

3、心理特质（Trait）及其可测性假设 2测量误差及其来源3真分数模型及其假设4经典测验理论的不足第三章测验信度通过本章的学习，掌握信度的意义，信度系数的计算，了解影响信度的主要因素以及提高信度的常用方法等内容。4学时一、信度的意义1 信度指实测值和真值相差的程度2 信度指统计量与参数之间的接近程度3 信度是指一种测验对相同的应试者再次测验时引起同样反应的程度二、信度系数的计算1稳定性系数2等值性系数3等值稳定性系数4 内部一致性系数5 评分者的信度系数三、提高测验信度的方法1 信度系数以多大为宜2 影响信度的因素3 提高测验信度的方法考核要求：1.信度的意义2.信度系数的计算稳定性系数，

4、等值性系数，等值稳定性系数，内部一致性系数，评分者的信度系数3.提高测验信度的方法请列举一些你所使用过或接触过的量表思考: 量表的作用是什么？你如何解释下述现象？一个很聪明的孩子，测得智商是80分一个学习很好的学生，考试成绩为60分一个人缘很好的人，人际关系测量低于常模值量表帮助我们了解心理现象（心理特质），就像尺子帮助我们测量身高。我们如何知道我们有多高？有两个工具：尺子 / 秤尺子的数据与我们的目测更一致，而秤盘的数据则与我们的目测不一致。因此，尺子是测量身高的有效工具效度。什么材料的尺子？钢铁（热胀冷缩）涉及到一致性的问题。信度物理不等于数学 1.70与1.7的关系总结：量表是我们

5、用来了解心理特质的工具，但这个工具是有误差的。误差要控制在一个许可的范围内。什么是误差? 误差的种类? 误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。误差分为随机误差和系统误差。高尔顿的智力观比奈的智力观判断题、选择题和问答题 SX2 = ST2 + SE2ST2 = SV2 + SI2SX2 = SV2 + SI2 + SE2ST2 SX2 稳定性可靠性一致性信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。 rXX=ST2/SX2 信度乃是一个被测团体真分数与实得分数的相关系数的平方。 rXX=P2TX 思考：相关系数的平方？信度乃是一个测验X与它的

6、任意一个平行测验X的相关系数。 rXX=PXX 重测信度（Test-Retest Reliability）定义：同一量表，同一被试群体，在不同时间，两次施测，求其相关。实质：表示测验结果的稳定性。故称之为稳定性系数（Coefficient of Stability）形式：施测适当时间再施测间隔时间越长，稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的间隔不能太长。一般间隔时间不超过六个月。（即不能让被试记住上一次测验的内容，又不能让其特质发生变化，或对所学知识产生遗忘）在一般情况

7、下，间隔施测的副本信度最低，因为很多因素有机会影响到分数。相反，校正过的分半相关，因为影响的因素少，所得的信度估计为最高。实际上，有多少种误差来源，便有多少种估计信度的方法。一个测验哪种误差大，便应该用哪种误差估计。有时一个测验需要有几种信度系数，这样我们就把总分数的变异数分成不同的分支。假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本，所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分半信度为0.80 （先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正）。同时，我们让另一个评分者随机抽取50份卷子另

8、外评分，得到评分者信度为0.92。然后，我们对这三种方法所产生的误差变异进行分析。一个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度（间隔施测）1-0.70=0.30时间与内容取样分半信度1-0.80=0.20内容取样上述二者差异0.30-0.20=0.10时间取样评分者信度1-0.92=0.08评分者差异误差变异总和0.20+0.10+0.08=0.38真实变异1-0.38=0.62误差变异时间上的稳定性，复本之间的一致性，评分者之间的一致性内容取样误差时间取样误差评分者间差异62%20%10%8%第四章测验的效度通过本章的学习，掌握效度的含义，效度估计方法，了解

9、影响信度与效度的关系，影响效度的因素以及提高信度的几种方法等内容。一、效度概述1 效度的一般定义及其内涵效度是指测验的准确性，即测验能够测出他们所欲测的特质的程度。2 效度的统计与原理3 效度的信度关系（1）高效度，高信度（2）高信度，低效度（3）低信度，低效度二、效度的估计1966年美国心理学会在教育心理测验值标准中将效度分为三大类：1 内容效度（Content Validity）内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2 结构效度（Construct Validity）结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3 实证效度（Criterion r

10、elated Validity）实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。三、提高测量效度的方法1 各种测量效度的要求2 提高效度的方法（1）控制系统误差，（2）精心编制量表，（3）妥善组织测验，（4）扩充样本容量，（5）适当增加测验的长度3 效度的一般定义及其内涵4 效度的统计与原理5 效度与信度的关系四、效度的估计五、提高测量效度的方法1.效度的一般定义及其内涵2.效度的统计与原理3效度与度的信度关系4.效度的估计内容效度，结构效度，实证效度5.提高测量效度的方法第五章测验的难度和区分度通过本章的学习，掌握测验难度和区分度的含义，以及难度、区分度的计算，了

11、解难度、区分度对测验质量的影响等内容。10学时一、测验难度的计算1 计算难度的基本公式（1）以试题通过率计算难度：P=R/N，（2）用平均数计算试题的难度2 用极端分组法计算难度二、难度的转换难度转换的方法三、测验题目难度水平的确定四、区分度的定义1 定义：区分度是指测验对于考生实际水平的区分度程度或鉴别能力。2 区分度与测验信度、难度的关系五、区分度计算1 用极端分组法计算（1）客观题计算，（2）论文题计算2 用内部一致性系数（Internal Consistency）计算区分度（1）用点二列相关计算区分度（2）用二列相关计算区分度（3）用相关计算区分度（4）用四分相关计算区分度（5

12、）用皮尔逊相关法计算区分度（6）D（鉴别指数）的经验标准1.测验难度的计算2.计算难度的基本公式3难度的转换 4.测验题目难度水平的确定5.区分度的含义6.区分度与测验信度、难度的关系7.区分度计算用极端分组法计算，用内部一致性系数（Internal Consistency）计算区分度第二编测量的一般步骤和方法第六章测验的编制与实施通过本章的学习，掌握编制测验的基本程序，测验的实施过程及须注意的事项等内容。教学时数：第一节编制心理与教育测验的基本程序一、确定测验的目的1 明确测量对象2 明确测量目标3 明确测量用途二、制定编题计划三、编辑测验项目1 收集测验资料2 选择项目形式

13、3 编写测验项目四、测验与项目分析1 预测2 项目分析五、合成测验1 测验项目的选择2 测验项目的编排3 编制副本六、测验标准化1 测验内容2 实测过程3 测验评分4 测验分数解释七、鉴定测验1 信度2 效度3 测验量表与常模八、编写测验说明书第二节测验的实施一、测验的实施过程1 实测前的准备工作2 指导语3 测验情境4 测验焦虑5 与受测者建立良好的协调关系6 评分技术二、测验分数的解释1 如何看待测验分数的意义2 如何向受测者报告测验分数1. 编制测验的基本程序确定测验的目的，制定编题计划，编辑测验项目，测验与项目分析，合成测验，测验标准化，鉴定测验，编写测验说明书2测验

14、的实施过程及须注意的事项等内容3.测验分数的解释第七章测验分数的解释与应用通过本章的学习，掌握测验分数的类型，常模及常模类型，以及测验分数的解释和常模的应用等内容。一、分数与常模1 分数的种类和含义（1）原始分数，（2）导出分数2 常模3 年龄常模4 年级常模5 百分等级常模6 标准分数常模二、测验的等值1 测验等值的实质2 测验等值的条件（1）同质性，（2）等信度，（3）公平性，（4）可递推性，（5）对称性，（6）样本不变性3 测验等值的基本算法（1）百分位等值（2）线性等值4 常用等值设计5 测验等值误差估计1.分数原始分数，导出分数2常模年龄常模，年级常模，百分等级常模，标准分数常

15、模3.测验的等值的实质与条件4.测验等值的基本算法：百分位等值，线性等值第八章测验的项目分析项目分析包括定性分析和定量分析。定性分析包括考虑内容效度、题目编写的恰当性和有效性等；定量分析主要是指题目难度和区分度的测量。对项目进行筛选和修订，可以提高测验的信度和效度。第一节测验的难度一、难度（difficulty）的意义难度，指项目的难易程度。在最高作为测验中，称为“难度”，而在典型作为测验中，则指“通俗性”。两者都是指在总体中，能够正确或确切回答某项目的人数。二、难度的计算（一）二分法记分项目的难度1通过率 P=R/N2极端分组法（上下27%） P=（PH+PL）/2（二）非二分法记

16、分项目的难度 P=X / XmaxX为所有被试在该项目上的平均得分， Xmax为该项目的满分。三、测验难度水平的确定效标参照测验、掌握测验：不考虑难度；选拔测验：难度=录取率；对于选择题来说，难度一般应大于猜测概率；无论是速度测验，还是难度测验，一般都应防止被试得满分，因为满分的意义是不明确的。大体而言，难度为0.50时最理想，此时项目具有最大的鉴别力。但在实际操作中，让所有项目难度都到达0.50困难很大，而且也不必要，一般只需使项目的平均难度接近0.50，而各个项目的难度在0.50 0.20之间变化。四、难度的等距变换根据正态分布表，将难度P作为正态曲线下的面积，转换成相应的Z分数

17、，这就是等距量表。P Y 0 Z美国教育服务中心以作为难度指标：=13+4ZP = .0013 Z = +3 = 25P = .16 Z = +1 = 17P = .50 Z = 0 = 13P = .84 Z = -1 = 9P = .9987 Z = -3 = 1五、难度对测验的影响（一）测验难度影响测验分数的分布形态难度大，正偏态难度低，负偏态（二）测验难度影响测验分数的离散程度测验过难或过易，分数全距缩小，信度降低。P=0.50时最佳第二节测验的区分度一、区分度的意义区分度（discrimination）是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验

18、是否有效的“指示器”。二、区分度的计算（一）项目鉴别指数法1鉴别指数（index of discrimination，D）的计算D = PH - PL取值范围：-1 +12极端组的划分27%规则一般情况下，取上下25%33%均可。样本少时，可以取50%注意：由于计算机的方便使用，可以上下50%作为划分高低组的标准，或者多分几组，对区分度和难度作详细分析。因为只取上下两端，只利用了一部分资料，浪费了很多信息，有可能得出错误结论。（二）相关法（项目-总分相关）1点二列相关 Xp-Xq rpb= pq St2二列相关 Xp - Xq pq Xp - Xt p rb= 或 rb= St y St y3

19、相关 ad-bcr= （a+b）（c+d）（a+c）（b+d）4四分相关5. 项目和总分相关重叠的校正当测验项目超过20个项目时，校正法通常毫无意义。 rtpSt Sprpq = St2+ Sp2 2rtpStSp（三）项目特征曲线（item characteristic curve, ICC）项目特征曲线描述了效标分数不同的被试在该项目上的通过率。曲线坡度越陡，鉴别力越好，预测的误差越小。三、区分度与难度的关系难度和区分度都是针对一定团体而言的。一般来说，较难的项目对高水平被试区分度高，较易的项目对低水平被试的区分度高。四、区分度的相对性（一）不同的计算方法，所得区分值不同区分度有几种计

20、算方法？（二）样本容量大小影响相关法区分度值的大小样本越大，区分度越（三）分组标准影响鉴别指数分组越极端，区分度越（四）被试样本的同质性程度影响区分度值的大小样本越同质，区分度越第三节项目分析的特殊问题一、多重选择题的项目分析（诱答分析）对于多重选择题，除了分析难度和区分度外，还要对每个选项进行分析。下列哪一个最有可能是偏执型精神分裂症患者的次级症状：A 幻听B 瘫痪C 记忆丧失D 厌食如果所有被试都选择某一正确的选项，说明该选项如果没有一个被试选择某个错误选项，说明该选项如果所有被试都选择某个错误选项，说明该选项如果高分组被试的选择集中在两个选项上，说明该选项如果高分组和

21、低分组对正确选项的选择没有区别，说明该选项如果所有被试都未回答某个题目，说明该题如果选择各个选项的人数几乎相等，说明该题二、速度测验的项目分析对前面部分的测验项目，难度和区分度都对后面部分的测验项目，难度和区分度都三、标准参照测验的项目分析在标准参照测验中，无须考虑项目的难度和区分度，只要项目的内容很重要就行。也可以通过比较教学或训练的前测和后测结果来进行项目分析，用来说明教学或训练的效果以及项目编制是否适当。四、项目-团体的相互作用具有不同性质（性别、种族、职业等）的团体，在测验得分上也存在差异，即同样的项目可能有不同的难度。如果测验要求对所有个体都相对“公平”，那么，就应该排除

22、那些有利于或不利于不同性质的亚团体的项目；如果测验的目的就是为了考察不同亚团体的差异，那么，就应选择使团体差异尽可能大的题目。五、有效性与可靠性的矛盾o 同质性信度要求项目之间有高相关，各项目的难度均等；对于预测效度来说，因为效标的变异范围较大，如果项目越同质，那么效标关联效度则低；因此，效标关联效度要求各项目之间要有一定的差异，即项目之间相关低，这样才能保证测验得分与效标之间有高相关，即高的效标关联效度。因此，对于多数心理测验来说，项目之间中等程度的相关，可使二者调和，获得较为满意的（同质性）信度和（效标关联）效度。第九章学绩测验第一节学绩测验概述一、学绩测验的性质最高作为测验可以

23、分为：学绩测验、能力测验、能力倾向测验。学绩，指经过一定的教学或训练后所学到的东西，是在一个比较明确的、相对限定的范围内的学习结果。能力倾向指学习的能力，是在给予适当的机会时获得某种知识或技能的能力。能力介于学绩和能力倾向之间，指的是当前的知识或技能的水平，既有正式学习的，也有非正式学习的结果，既包括学术技能，又包括非学术技能。学绩测验用来描述现状，指明一个人已经学会了什么和能做什么。二、学绩测验的基本假设1 学绩测验所测量的知识和技术的范围能明确界定。2 测验所测量的是研究者认为重要的东西，而不是与测量目的无关的东西。3 被试有同样的机会学习测验所包含的材料。三、学绩测验的分类（一）按测验的编制方法分教师自编课堂测验，标准化学绩测验（二）按测验内容分单科测验，多科测验单元测验，总测验（三）按测验的用途分考察性测验，诊断性测验，准备性测验，选拔与安置测验，职业水平测验，用于研究的测验（四）按测验评分的参照系分常模参照性测验，目标参照性测验（五）按测验的题型分客观测验，论文式测验四、学绩测验的应用1 反馈功能2 诊断功能3 辅助教学管理4 研究工具5

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？