级免师教育硕士学科英语教育测量与评价参考答案.docx
《级免师教育硕士学科英语教育测量与评价参考答案.docx》由会员分享,可在线阅读,更多相关《级免师教育硕士学科英语教育测量与评价参考答案.docx(18页珍藏版)》请在冰豆网上搜索。
级免师教育硕士学科英语教育测量与评价参考答案
西南大学研究生课程考试
答卷纸
考试科目教育测量与评价
院、所、中心外国语学院
专业或专业领域
研究方向
级别
学年2013-2014学年
学期2014年秋季学期
姓名
学号
类别③
(①全日制博士②全日制硕士③教育硕士④高师硕士
⑤工程硕士⑥农推硕士⑦兽医硕士⑧进修)
2014年7月18日
研究生院(筹)制
课程类别
课程考试方式
题号
得分
教师评价
一
二
三
四
五
六
七
八
九
十
总分
任课教师签名:
备注:
成绩评定以百分制或等级制评分,每份试卷均应标明课程类别(①必修课②选修课③同等学力补修课)与考核方式(①闭卷笔试②口试③开卷笔试④课程论文)。
课程论文应给出评语。
西南大学外国语学院
免师教育硕士2014级
“学科(英语)教育测量与评价”课程作业
要求:
保留原题题干及数据,然后在其下面插入空白来呈现答案。
不得篡改问题或者数据。
在编辑将要提交的作业的Word文件时,需确保欲呈现的内容能被打印出来。
一、简答题(50分)
1.测量的基本要素有哪些?
(1分)
答:
测量的量具、测量的单位和测量的参照点是测量的三个基本要素。
2.什么是教育测量?
(1分)
答:
教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
3.教育测量有哪些量表类型?
(1分)
答:
有称名量表、顺序量表、等距量表和比率量表。
4.什么是教育评价?
(1分)
答:
教育评价是指根据一定的标准,对教育事物或现象进行系统的调查,在获取足够多的资料事实(定性与定量资料)基础上,做出价值分析和价值判断。
5.教育测量与教育评价有什么不同?
(1分)
答:
教育测量时一种以量化为主要特征的事实判断,而教育评价是指根据一定的标准,对教育事物或现象进行系统的调查,在获取足够多的资料事实(定性与定量资料)基础上,做出价值分析和价值判断。
所以教育评价最根本的特征是做出价值判断;而教育测量过程的完结,在给出数量事实的描述与判断之后,不一定都要做出价值判断。
6.教育评价与教育评估有什么异同?
(1分)
答:
教育评估和教育评价是两个近义词,他们在内容上有交叉,也有区别。
教育评估可能有价值判断,也可能没有价值判断当教育评估过程含有价值判断时,它和教育评价是一样的;当教育评估过程没有价值判断时,它和教育评价就有一定的差别。
7.教育测验、考试与教育测量有什么不同?
(1分)
答:
教育测验是教育测量的一个工具,在教育评价和教育评估过程中常被用来收集资料(如有关态度测验、民意问卷测验、学科成就测验等)。
教育考试是根据教育内容和目标,选择有代表性的内容与问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。
考试也是一种教育测验。
测验或考试皆是教育测量与评价的一种工具。
8.教育测量与评价,按照实施的时间阶段的不同,可以区分为哪几种类型?
各自使用的目的是什么?
(1分)
答:
可以分为形成性测量与评价、诊断性测量与评价和终结性测量与评价。
形成下测量与评价的目的对于老师而言是为了获得教学延续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,随时修正自己的教学参考;对于学生而言可以根据反馈的结果获知自己学习后的表现情况。
从而肯定或修正自己的学习方式。
诊断性测量与评价的目的是对个人的问题行为及原因进行诊断。
终结性测量与评价的目的有两个,一是在教学目标之下,检查学生一学期的学业达到了什么程度,从而判断教学效果的得失;二是评定学生的学业成就,并将评定结果通知家长或记入档案。
9.教育测量与评价,按照参照点的不同,区分为哪几种类型?
各自适用的情形是什么?
(1分)
答:
分为常模参照、标准参照和潜力参照。
常模参照适用于评价被团体中的相对地位;标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到标准;潜力参照测量与评价是将被试实际水平与其自身潜在水平相比较,以评价被试有无充分发挥自身潜力的目的。
10.教育测量与评价,按照被测量与评价的行为的性质,区分为哪些类型?
它们各自适用于什么情形?
(1分)
答:
分为最佳行为测量与评价和典型行为测量与评价。
最佳行为测量与评价适用于以能力为基础的评价情景,例如学校教学后的考试或升学考试;典型行为测量与评价适用于测量被试的态度、情感、人格、兴趣等。
11.按照教育测量与评价的内容,教育测量与评价区分为哪几种类型?
它们各自适用于什么情形?
(1分)
答:
分为智力与评价、能力倾向测量与评价、成就测量与评价和人格测量与评价。
12.什么是重测信度?
(1分)
答:
重测信度指的是用同一个量表(测验和评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。
13.什么是复本信度?
(1分)
答:
复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
14.Kappa一致性分析可以用来说明教育测量与评价的哪些类型的信度?
(1分)
答:
Kapa一致性系数是指实际别评定为一致的百分比与在理论上被评定为一致的最大可能次数百分比的比率。
15.肯德尔和谐系数分析的功能是什么?
(1分)
答:
肯德尔和谐系数时表示多列等级变量相关程度的一种方法,既让K个评价者对N个被试的试卷(或作品)进行登记评定,每个评价者都对N份试卷(或作品)排出一个等级顺序。
16.什么叫分半(half-split)信度(1分)
答:
分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
17.什么叫克伦巴赫alpha系数?
(1分)
答:
克伦巴赫alpha系数是一套常用的衡量心理或教育测验可靠性的方法,依一定公式估量测验的内部一致性,是目前社会研究最常使用的信度指标,它是测量一组同义或平行测"总和"的信度其公式为:
a=[K/(K-1)][1-(∑S2i)/(S2x)].其中,K为量表中题项的总数,S2i为第i题得分的题内方差,S2x为全部题项总得分的方差.从公式中可以看出,a系数评价的是量表中各题项得分间的一致性,属于内在一致性系数.这种方法适用于态度、意见式问卷(量表)的信度分析。
18.什么叫效度(validity)?
什么叫效度验证(validation)?
(1分)
答:
效度指的是一次测量的有效程度,通过收集大量资料和证据来检验测量效度的工作过程叫做效度验证。
19.什么叫内容效度?
什么叫表面效度?
什么叫反应效度?
(1分)
答:
内容效度指的是测验样本对于应测内容与行为领域的代表性程度,表面效度指的是在被试和非专业人士看来,测试表面上是否在有效的测量着应测特质的量的程度。
20.什么叫构念(construct)什么叫构念效度(constructvalidity)(1分)
答:
构念指的是心理学或社会学上的一种理论构想或特质,结构效度指的是测验能够测量到理论上所定义的某一心理结构或特质的程度。
21.什么叫效标(Criterion)?
什么叫效标效度(criterion-relatedvalidity)(1分)
答:
效标志的检验测量效度的外在的、客观的标准,即效度标准,效标关联效度指的是一个测验对于处于特定情境中的个体行为进行预测时有效性。
22.什么叫同期效度(concurrentvalidity)和预测效度(predictivevalidity)(1分)
答:
测验分数与效标资料的取得约在同一时间内连续完成,计算这两种资料的相关系数即代表测验的同时效度,在测验分数取得一段时间后才获得效标资料,计算这两种资料间的相关系数即代表测验的预测效度。
23.试题的难度系数可以怎么计算?
(1分)
答:
对于二值记分题可以用题目的答对率来表示,对于多值记分题可以用平均分和满分的比值来表示,此外还可以全体被试失分率为难度系数,以两端被试得分率的均值为难度系数。
24.什么是测试题目的区分度(DiscriminationIndex)题目的区分度如何计算?
(1分)
答:
区分度就是题目区分被试谁批能力的量度,计算区分度可以用点双列相关系数法,二双列相关系数法,积差相关系数和高低分组法来计算。
25.什么是级差相关(Pearsoncorrelation)(1分)
答:
级差相关指的是对非二分法积分的项目,因得分具有连续性,在被试团体较大时,可以认为题目分数服从正态分布,题目总分与测验总分级差相关系数。
26.什么是等级相关(Spearmancorrelation)(1分)
答:
对不服从正态分布的资料、原始资料等级资料、一侧开口资料、总体分布类型未知的资料不符合使用积矩相关系数来描述关联性。
此时可采用秩相关(rankcorrelation),也称等级相关,来描述两个变量之间的关联程度与方向。
27.什么是点二列相关(point-biserialcorrelation)在SPSS中,怎么计算点二列相关系数?
(1分)
答:
点二列相关指的是两个变量都是正态连续变量,但其中一个变量因为某种原因被人为地分成两类。
28.什么正相关?
什么是负相关?
(1分)
答:
正相关指的是因变量随着自变量的增大而增大,负相关因变量随着自变量的增大而变小。
29.什么是相关系数显着性检验中的双侧(2-tailed)检验和单侧(1-tailed)检验?
(1分)
答:
在相关系数显着性检验中,1-tailedtest和2-tailedtest分别指单侧检验和双侧检验,单侧检验具有方向性,更有针对性,而双侧检验是指一组数据的方差可能大于,等于或小于另一组数据的方差的情况,不具有方向性。
30.什么是独立样本(independentsamples)?
什么是相关样本(relatedsamples)?
(1分)
31.什么是独立样本t检验中的双侧(2-tailed)检验和单侧(1-tailed)检验?
(1分)
32.通常情况下,教育评价表的构成要素有哪些?
(1分)
答:
(1)评价指标
(2)指标权重(3)评价标准
33.什么是评价标准的标度,标号,强度或频率?
(1分)
答:
标度是达到标准的程度,它说明什么样的程度属于什么等级。
所谓的标准强度和频率,是指评价标准的内容,也就是各种规范行为或对象的程度或相对次数。
标准强度和频率属于评价的主要组成部分。
所谓标号,是指不同强度的频率的标记符号,
34.什么是客观性试题和主观性试题?
客观性试题和主观性试题分别有些什么类型?
(2分)
答:
客观性试题评分客观,不同评分者独立评分,所得结果基本上是相同的,客观性试题主要包括选择题、匹配题和供答题中地简答题、填空题;主观性试题指的是答案不固定,被试可以自由作答,被试只要在题目所限的范围内,在深度、广度、组织方式等方面享有很大的自由,包括论述题、作文题与表现性测验题等题型。
35.什么是表现性测验?
表现性测验有些什么类型?
(2分)
答:
所谓表现性测验是指以行动、作品、表演、展示、口头回答、操作、写作、科学研究、制作等更真实的行为表现,来测量与评价学生在真实情景或模拟真实情景下的所知所能的一种测验类型。
表现性测验分为
(1)纸笔的表现性测验、辨认的表现性测验、结构化的表现性测验、模拟情景的表现性测验、工作样本的表现性测验。
36.教育目标,教学目标,测验目标几者之间有什么关系?
(2分)
答:
教育目标分为终极教育目标、中程教育目标和具体教育目标。
教学目标是中程教育目标,是对终极教育目标的细化和具体落实,他对学生应掌握的知识,应发展的能力和应该形成的优良品德提出了明确要求,将教学目标进一步分化,用测试题的形式加以表达就是测验目标。
37.布卢姆教育目标分类的认知领域的内容,在早期理论和修订版框架之间,有什么异同?
(2分)
38.答:
原始的分类法(1956)分成知识和心智的能力与技巧两部分,共6个类别。
除了应用外,每一个类别都包含了子类别。
这些类别是从简单到复杂、具体到抽象进行排列,强调累积性的阶层概念。
修订版将教育目标的分类分成知识向度和认知历程向度。
知识向度包含四个主要的类别(事实、概念、程序、元认知)。
前三个类别包括了原始分类中知识的子类别。
元认知知识是新增加的类别。
认知历程向度分成6个类别,由较低层级的记忆、了解、应用和分析,到较高层级的评价和创造,其中记忆和学习保留有密切的关联,其余五者和学习迁移较有关。
原始分类中的三个类别被重新命名,两个类别的顺序被交换。
39.布卢姆教育目标分类的经典理论中的认知领域的1级和2级目标内容有哪些?
(3分)
40.答:
认知领域的一级目标是知识,二级目标是领会、运用、分析、综合和评价。
41.布鲁姆教育目标分类体系的情感领域的1级和2级目标内容有哪些?
(3分)
答:
情感领域的1级目标内容有接受和反应,二级目标有价值评价、组织、有价值和价值复合体形成的性格化。
42.布鲁姆教育目标分类体系的动作技能领域的1级和2级目标内容有哪些?
(3分)
答:
动作技能领域的1级目标内容包括知觉、准备、指导反应;2级目标包括机械化、复杂反应、适应性和独创性。
二、计算题(35分)
1.有30个被试在间隔不久的时间内前后两次接受了同一个测试。
其测试结果如下表所示。
问这个测试的信度如何?
(2.5分)
被试
前测
后测
被试
前测
后测
1
87
88
16
78
82
2
67
70
17
76
69
3
75
73
18
81
80
4
66
68
19
90
88
5
81
78
20
88
87
6
90
87
21
87
76
7
69
71
22
75
74
8
73
72
23
76
78
9
81
79
24
81
82
10
79
80
25
87
88
11
69
71
26
79
83
12
69
72
27
82
80
13
75
74
28
87
89
14
73
78
29
89
86
15
79
73
30
85
84
答:
本次测试的重测信度为0.41,信度较低。
2.有一个测验含A、B卷。
30个被试分别接受了A卷和B卷的测验,测验结果如下表所示。
问这个测验的A、B两份试卷的等值系数如何?
(2.5分)
被试
A卷
B卷
被试
A卷
B卷
1
87
88
16
78
76
2
67
66
17
76
75
3
75
73
18
81
80
4
66
68
19
87
88
5
81
80
20
88
87
6
71
72
21
86
83
7
69
71
22
75
74
8
73
72
23
76
74
9
72
73
24
81
82
10
79
80
25
87
85
11
73
71
26
79
81
12
69
72
27
82
80
13
74
74
28
87
86
14
73
78
29
84
86
15
74
73
30
85
84
3.有100个被试接受了一个测验,其测验结果被两个评分员独立地进行了二分法的评价(即“及格”与“不及格)。
两个评分员对这些被试的评价结果的频数信息见下面的频数分布表。
问这两个评分员的评价结果的一致性如何?
(5分)
评分员B
及格
不及格
评分员A
及格
70
10
不及格
5
15
解:
两位评分员的百分比一致性PA=0.85;k一致性系数k=0.36。
两位评分员评分的一致性较高。
4.有一电影网站对观看其电影的10名观众进行了调查。
调查的是他们对于各类电影的偏爱程度,从1到8,代表从“最喜欢”到“最不喜欢”的8种态度。
问这10个接受调查的观众的电影爱好显着一致吗?
平均而言,他们对被调查的8种电影类型各自的偏爱程度如何?
(5分)
电影类型
观众
1
2
3
4
5
6
7
8
9
10
犯罪
3
5
2
3
4
4
3
2
4
3
战争
6
6
7
8
7
5
7
8
8
6
谍战
5
4
5
7
6
6
8
4
5
4
武侠
1
8
1
2
8
2
2
1
1
2
悬疑
4
3
4
4
3
8
5
6
3
8
喜剧
2
2
8
1
1
1
1
3
2
1
爱情
8
7
6
5
5
7
6
5
7
7
伦理
7
1
3
6
2
3
4
7
6
5
解:
这十位观众的肯德尔和谐系数W=0.57,10位观众对8种类型喜爱程度的显着性较一致。
观众对8种类型的电影的喜爱程度的平均数分别为3.3,6.8,5.4,2.8,4.3,2.2,6.3,4.4,由此可见观众最喜欢的类型是战争类和爱情类电影,其次为谍战、伦理、悬疑类,最不喜欢的喜剧和武侠类。
5.一研究者进行了一个教学实验。
在实验班采用积极培养和引导学生使用优秀学习者的学习策略的方法进行阅读理解的教学,而在对照班则按照传统的讲解和完成多项选择练习的方法进行教学。
研究者期望实验班的教学效果优于对照班的效果。
在实验开始前挑选了实验组与对照组的受试,各有36人,并对他们的阅读能力进行统一的测试(前测)。
然后,实施了教学实验。
经过一个学期后,研究者对两个组的受试实施了题型和难度与前测近似的另一个测试(后测)。
两个组受试的前测和后测成绩如下表所示。
问两个组的受试在实验前的阅读水平相当吗?
研究者的新的教学方法有明显的优势吗?
(请报告结果并解释结果)(10分)
被试
前测
后测
实验组
对照组
实验组
对照组
1
61
57
72
60
2
60
59
73
61
3
63
58
71
59
4
62
73
75
72
5
63
60
72
61
6
78
62
73
62
7
66
57
74
57
8
69
70
75
58
9
65
60
70
59
10
63
59
71
60
11
77
60
70
61
12
66
66
72
62
13
65
62
74
60
14
60
57
78
58
15
61
56
73
55
16
61
58
76
59
17
67
62
72
63
18
62
62
77
64
19
62
61
75
60
20
52
66
73
67
21
66
65
74
64
22
67
59
77
58
23
65
58
77
59
24
68
67
76
68
25
53
68
75
69
26
56
59
76
60
27
70
59
75
61
28
68
61
77
60
29
53
56
78
59
30
55
63
74
62
31
69
60
74
58
32
72
62
73
61
33
64
60
75
59
34
54
61
76
60
35
69
68
72
65
36
71
68
73
63
6.下面是5个受试做一个试卷的5个部分的得分数据。
问这个试卷的内部一致性信度如何?
请分析一下第3部分的区分度?
(10分)
Subject
Part1
Part2
Part3
Part4
Part5
Total
1
8
7
7
9
8
39
2
12
10
11
12
12
57
3
9
8
7
7
9
40
4
12
9
9
9
12
51
5
12
10
10
4
12
48
解:
5个受试的克龙巴赫系数?
=0.54,由此可见,试卷的内部一致性不高,第三部分的积差相关系数r=0.94,区分度很高。
三、图表制作题(15分)
1.请绘制一个测验的命题双向细目表,并做简单的文字说明。
(10分)
高二英语期末测试试题双向细目表
题型
考查内容
题量/题号
识
记
理解
掌
握
综合应用
小记分
分值比例
听力
听力
1-20
√
√
1
30
语
言
知
识
、
语
法
单
项
选
择
交际用语
21、35
√
√
2
15
倒装:
As引导的让步状语从句的倒装、only接状语从句引起的倒装
22、28
√
√
2
时态:
一般现在时、过去进行时、过去完成进行时
23、24、29
√
√
3
连词辨析
25
√
1
动词短语辨析
26
√
√
1
非谓语动词:
V-ing形式作后置定语
27
√
√
1
副词短语辨析:
ratherthan\otherthan
30
√
√
1
限制性定语从句:
whose
31
√
√
1
情态动词:
shouldhavedone
32
√
√
1
冠词
33
√
1
动词词义辨析
34
√
√
1
完
形
填
空
名词词义辨析
7个
√
10.5
30
动词词义辨析
9个
√
13.5
动词短语辨析
1个
√
1.5
形容词词义辨析
3个
√
4.5
阅读
综合
能力
考查
A
记叙文
推理判断
56、57、59
√
6
40
细节判断
58
√
2
B
说明文
推理判断
60、61、62
√
6
细节理解
63
√
2
C新闻实事
词义猜测
64
√
2
细节理解
65
√
2
主旨大意
66
√
2
D广告宣传
细节判断
67
√
2
推理判断
68、69、70
√
6
短
文
改
错
非谓语动词
√
1
10
副词herethere
√
1
冠词
√
1
连词:
but/and
√
1
介词错用
√
1
介词多余
√
1
名词单复数
√
1
名词所有格
√
1
主谓一致
√
1
时态
√
1
书面
表达
应用文:
求助信
25
25
合计
86
45
23
150
2.请按照布鲁姆教育目标分类的修订版中