试题库与试卷测评系统的设计与实现Word文件下载.doc
《试题库与试卷测评系统的设计与实现Word文件下载.doc》由会员分享,可在线阅读,更多相关《试题库与试卷测评系统的设计与实现Word文件下载.doc(7页珍藏版)》请在冰豆网上搜索。
如何从大量的试题库中抽取出满足不同用户的教学要求的试卷供不同层次的用户使用是试题库建设的关键性技术,抽取试题的方式多种多样,抽出的试题组成试卷的质量好或坏,能真实地反映出教师的教学水平以及学生对知识技能的掌握程度。
抽题成卷后,要根据试卷的测评成绩,应用教育学中对试卷测评的各项质量指标全面评价试卷。
本文就结合开发网络考试系统的一点实践经验和教育学中的4个主要测评指标作了一些研究和探讨。
2自动组卷算法设计与实现
试题库经过前期的建设最终目的是要生成相应的试卷,这些试卷满足一定的知识点分布,能够达到相应的测试要求。
自动组卷首先应该设置相应的参数,然后系统根据这些参数自动生成试卷的过程。
另外,对于从试题库中抽取的试题的输出方法,输出的格式也是本模块在设计时需要考虑的问题。
2.1组卷系统的数据结构
2.1.1试卷的难度级别
一套试卷是否合理,能否考察到学生的应用能力,主要通过试题的难易程度来体现,合理的设置试题的难度级别是优化试卷的核心。
这里所说的难度级别只是用以表示试题难易程度的标识符,以《C程序设计》为例,分为容易题
(1),较容易的题
(2),中等难度的题(3),较难的题(4),难题(5)共5类级别。
2.1.2试题的题型及特征符号
按教学内容、测试形式、测试目的等不同要求,将试题分成不同类型。
如《C程序设计》试题库,就将试题分为选择题、填空题、程序阅读填空题、判断题、程序设计题,系统为了使系统通用性,把这些题型又分为四大类选择类、填空类、判断类和简答类,分别用XZ、TK、PD、JD表示。
在试题库组卷系统中把试题的题型和难度系所进行统一编号用“|”分隔,以便系统组卷时能正确识别每道试题。
如较难的选择题标识符为“XZ|4”,较容易的填空题标识符为“TK|2”。
2.2自动组卷的设计
组卷参数设置,组卷参数包括试卷的题型、题目个数、知识点分布等参数信息,在设置完试卷参数信息后系统自动根据参数信息随机抽取试题。
试题的抽取必须保证是随机的而且不能出现同一套试卷中题目的重复抽取。
因此,这部分的时序对象包括课程负责人、试题库、试卷参数库、抽取的试卷信息。
具体的时序图如图1所示。
图1自动组卷时序图
自动组卷功能在系统设计中仅提供给课程负责人,课程负责人登录系统后,选择自动组卷模块,首先设置试卷的参数信息包括题型信息、知识点分布信息、难度系数信息。
然后,系统按照课程负责人所设的参数自动生成试卷,在生成试卷过程中会检查试卷的参数设置是否合理,如果不合理就停止试卷的生成。
最后,把生成的试卷导出Word文档,包括试卷、参考答案以及答题纸。
具体的活动图如图2所示。
图2自动组卷活动图
2.3自动组卷的实现
为了提高自动组卷的成功率和试卷的质量,系统采用分阶段迭代组卷策略实现系统自动组卷。
第一阶段为组卷参数设置阶段,主要由用户输入的试卷试题的分布情况难度系数等试卷参数信息,如图3所示。
图3试卷试题分布情况设置窗口
第二阶段为粗略知识点匹配阶段,主要是根据设置的试题分布情况粗略生成试卷。
算法的实现如下:
输入:
组卷方案分布矩阵P,试题建设情况矩阵S
输出:
抽取试题矩阵Q
第1步:
检查方案矩阵P和矩阵S。
两个矩阵的分别为公式2.1和公式2.2,在公式2.1中表示第m个知识点第n中题型所需抽取的试题个数矩阵,这个矩阵是一个一行三列的矩阵。
(2.1)
公式2.2是试题建设情况矩阵,表示第m个知识点第n种题型中具有的题库总量。
这里要求必须是小于等于的一个子集。
在程序设计中将通过一个循环监察方案矩阵是否成立。
程序的伪代码如下:
(2.2)
functionIsLegalScheme():
bool
varm,n:
integer;
//m为知识点个数,n为题型个数
p[0..n,0..m],s[0..n,0..m]:
integer;
//p组卷方案,s为题库建设情况
begin
forvari:
integer=0ton
begin
forvarj:
integer=0tom
begin
ifp[i][j]>
s[i][j]then
returnflase;
//返回假表示组卷方案不成立
endif
end
end
returntrue;
//返回正表示组卷方案成立
end
函数的执行结果如果为真则说明这个组卷方案可行,开始按照方案抽取试题,如果此方案为假则说明组卷方案不可行,则返回第一阶段,重新进行试卷组卷方案设置。
第2步:
按照知识点覆盖要求初步组成试卷。
在组卷过程中按照公式2.3从中随机的抽取个试题存放到Q矩阵中。
(2.3)
期中表示i大题中的第j小题所抽取的试题题号。
接下来判断是否在已经抽取的试题中存在()。
如果存在则重新抽取试题,否则按照公式2.4方式组合形成试卷。
(2.4)
第3步:
计算所抽取试题Q的平均难度系数。
难度系数在计算时首先先计算每一大题的难度系数,然后再对所有大题的难度系数求其平均值得到试卷的难度系数。
具体算法如公式2.5和2.6所示。
期中表示第i道大题的难度系数。
(2.5)
D表示所抽取试卷的难度系数,表示第i道大题的难度系数。
(2.6)
第三阶段为难度精确匹配阶段。
在第二阶段根据试题的知识点情况粗略匹配生成初步试卷信息,本阶段主要根据前面的生成的试卷进行修改以精确匹配难度系数。
每种题型的题库建设难度系数,试卷要求达到的难度系数,组成的试卷矩阵Q.
最终的抽取的试题矩阵。
比对抽取试卷Q中的每道大题的难度和题库建设时的试题库中本类型的所有试题的平均难度。
如果则认为抽取的第i大题的试题矩阵是一个具有偏差无用的试题矩阵予以丢弃。
返回第二阶段从新抽取第i大题的试题矩阵。
计算抽取的试题的平均难度,比对试卷要求达到的难度系数。
如果则认为抽取的试题具有偏差,丢弃难度最大和难度最小的试题。
从题库中抽取两道难度系数为的试题,补全上面丢弃的试题。
重新计算试题的平均难度,再次比对试卷要求达到的难度系数。
如果重复第2步操作。
3试卷质量的测评
采用分阶段迭代组卷策略自动组成的试卷是否能够真实地反映出教师的教学水平以及学生对知识的掌握程度,需要我们对试卷的质量进行评测。
对试卷质量的评测就是对难度、信度、区分度和覆盖度。
我们用带抽样的试题的题目数量为n,以100分制计,每题满分为(j=1,2,3,…,n);
抽查的容量为N,其样本值为(i=1,2,3,…,N)为抽查的试卷数。
抽查的N份试卷其各题的实际得分为(i=1,2,3,…,N;
j=1,2,3,…,n)。
则样本值为。
第j题的平均值为
3.1难度
题目的难度是衡量题目难易水平的数量指标,通常以题目的答错比率来表示
则试卷的难度。
3.2区分度
题目的区分度也叫题目的鉴别力,它是衡量题目对不同水平被测试者的心理特质的区分程度的指标。
区分度的取值范围于-1.0~+1.0之间,值越大,区分的效果越佳。
设、分别表示高分组和地方组第j题的平均分。
第j题的区分度为,则试卷的总区分度为。
则在0.4以上为优秀题目,在0.3~0.39为良好题目,在0.2~0.29为合格题目,在0.19以下为不合格题目。
3.3覆盖度
反映学生掌握知识的广度的重要指标,也反应了试卷考察知识的全面程度,试题应该尽量多的反映该门课程的知识点,试卷的覆盖面越广,则各题之间的交叉相关系数就越小,反之则越大。
3.4实验分析
通过该试卷质量测评系统对《C程序设计》2010~2011年度第二学期的试卷进行测评,其中选择题30分,填空题20分,程序填空题30分,编程题20分。
随机地抽取了30份试卷应用3个指标进行测评其测评结果为表1所示。
表1测评结果
测评项目
测评统计结果
难度
各小题的难度分别为:
0.32、0.34、0.5、0.8
区分度
各小题的区分度为:
0.41、0.29、0.3、0.34
覆盖度
0.8
由各项评价指标计算值可知:
(1)该试卷较好地达到了检查学生掌握知识的目的,切实地反映了学生的实际水平。
(2)从各小题的得分情况看填空题和最后的程序设计题略差一些,在今后的教学中需要加强学生程序设计能力的培养,提高学生的具体操作能力。
4结束语
本文的目标是建立一个通用、可靠、安全的具备可控性的、能够自动组卷的基于B/S模式的试题库管理系统和试卷质量评测系统,在自动组卷方面,针对组卷过程中组卷约束条件多,组卷效率和组卷质量不能兼备的情况下研究实行了分步式迭代组卷算法并用于实现。
最后通过实验对试卷的区分度、覆盖度和难度进行测评,验证了迭代组卷算法是可行的。
在今后的研究中需要加强改进该算法的执行效率,使之能够快速的生成高质量的试卷。
参考文献:
1.石中盘,韩卫.基于概率论和自适应遗传算法的智能抽题算法.计算机工程,2002,28
(1):
141~143
2.毛秉毅.基于遗传算法的智能组卷系统数据库结构的研究.计算机工程与应用,2003,6:
230~232
3.闭应洲,苏德富,陈宁江.基于矩阵编码的遗传算法及其在自动组卷中的应用.计算机工程,2003,29(6):
73~75