NAEP和TIMSS教育评估体系的比较研究和启示.docx

资源描述

NAEP和TIMSS教育评估体系的比较研究和启示.docx

《NAEP和TIMSS教育评估体系的比较研究和启示.docx》由会员分享，可在线阅读，更多相关《NAEP和TIMSS教育评估体系的比较研究和启示.docx（7页珍藏版）》请在冰豆网上搜索。

NAEP和TIMSS教育评估体系的比较研究和启示.docx

NAEP和TIMSS教育评估体系的比较研究和启示

　　教育，是关乎一个国家和民族希望的大事。

对国家而言，教育的成败决定了国家未来竞争力的强弱。

尤其是近些年，在世界范围内，无论是发达国家还是发展中国家，对教育的关注度都在逐年提高，因而各种先进的教育理论也随着时代的进步得到不断的发展。

多年来人们都认为教育是多方面作用的长期结果，无法界定好坏与成败。

一直以来，没有一个完善的、被普遍认同的评价体系来对教育理论和国家教育政策，以及公民受到的教育水平进行评价。

因此，建立一个合理的教育评估体系，从而全方位地对一个国家、地区的教育水平进行评价就显得尤为迫切与重要。

　　在美国，目前存有一些针对全美公民的教育评估体系，其中认可度较高的是国家教育进展评估（NationalAssessmentofEducationalProgress,NAEP）和国际数学和科学教育趋势评估（TrendsinInternationalMathematicsandScienceStudy,TIMSS）。

NAEP是美国国内的教育评估体系，TIMSS则是由国际组织开展的教育评估。

这两种教育评估体系各有针对，具有较为成熟的体系。

了解和研究这两种教育评估体系，能够使我们更好地深入了解国际上对学生学业成就评估的方式。

为了有针对性和可比性，本文比较了这两种体系中科学课程方面的教育评估，通过对这两种教育评估体系在科学课程方面的评估模式以及侧重点的比较研究，期望获得一个更适合我国的中小学教学和评估体系。

　　一、NAEP和TIMSS的概况

　　NAEP是由美国国会授权的一项全国性学生学业成就调查。

它由美国教育部任命，又独立于教育部的国家评估理事会（NationalAssessmentGoverningBoard）负责制订NAEP的政策，设计其评估体系。

它是美国国内最大的、针对美国学生的学业成就进行周期性评价的评估体系。

体系涵盖的内容有数学、阅读、科学、写作、艺术、公民教育、经济、地理和美国历史。

调查的对象是美国4、8和12年级的学生，该年龄段的学生在教育界普遍被认为是个人成长的关键时期。

　　TIMSS是由国际教育成就调查委员会（InternationalAssociationfortheEvaluationofEducationalAchievement,IEA）负责运行的国际性教育评估项目。

TIMSS每4年开展一次调查，目的是比较不同国家的学生在数学和科学学科的学业成就。

最近的一次评估是在2007年开展的，参与的国家和地区将近60个，评估的对象是4和8年级的学生。

为确保评估的科学性和可信性，NAEP和TIMSS的运作过程都有科学家、教育专家和评估专家全程参与。

　　众所周知，人类对世界的认识来源于科学思想，这些科学思想是在人类探索世界的过程中不断获得的，而探索科学思想的过程，是从人们观察自然现象开始的。

人们在观察结果中找到规律，并建立其理论模型来解释规律，最终利用这些规律改变周围世界。

这些科学实践活动需要人们具有一定的科学认知能力。

所以，为了很好地评估学生的科学认知能力，NAEP和TIMSS在考察学生的科学课程方面学业成就时，除了设定科学课程中的科学内容考察，还对科学认知能力进行了评估。

这两种评估体系都依赖评估试题对学生的评价。

这些评估试题每个都有两个分类编码：

一个对应科学内容，一个对应科学认知能力。

因此，两种评估体系对科学内容和科学认知能力的评估是同时继续的。

笔者从三个方面对这两个体系进行了比较。

　　二、NAEP和TIMSS在科学课程中的异同

（一）NAEP和TIMSS在科学课程中科学内容上的异同

　　NAEP和TIMSS在科学内容的覆盖面上基本相同，但是TIMSS的覆盖面稍微大些，而其两个体系在不同年级对各部分的内容侧重点也有所区别，如表1、表2。

　　表1和表2是NEAP和TIMSS评估体系评估时各个科学部分的试题占总数的百分比。

NAEP科学内容包括三个部分：

生命科学、自然科学和地球和空间科学。

从表1中我们可看出，4年级对各部分都一样重视，8年级则偏重地球和空间科学。

从这个分布可以看出，NAEP认为4年级学生的认知水平决定4年级各部分内容应保持均衡；8年级学生则更加强调地球和空间科学，目的是着重培养学生的理性思考能力和想象力。

TIMSS覆盖的科学内容具体如表2所示。

TIMSS为了照顾不同国家和地区的课程内容，对4年级和8年级设置了不同的内容类目，4年级没有关于化学的内容，8年级由于化学内容的加入减少了生物和物理的占比，地球科学则保持不变。

　　这里需要说明的是两个体系中的自然科学包含的内容有所不同：

在NAEP中是包含物理和化学，在TIMSS中只包含物理内容。

从两个表中我们也可看出TIMSS和NAEP有明显不同。

TIMSS更强调生物、物理和化学，在4年级时生命科学内容占45%，8年级时是物理和化学合起来占45%。

TIMSS认为4年级学生对于生命现象有很强的好奇心，所以因势利导地加强生命科学的内容，而到8年级则通过物理和化学来培养学生的逻辑分析能力。

（二）NAEP和TIMSS在科学课程中科学认知能力的异同

　　在科学认知能力上，TIMSS比NAEP更重视学生对基本科学规律和现象的认知能力。

在更深层次的科学认知能力上，两种体系都强调解决问题的能力，但NAEP更重视科学内容的应用，而TIMSS则更重视学生的逻辑和推理能力。

　　NAEP的科学认知包括四个层次：

识别科学原理、应用科学原理、实施科学探究和技术设计。

对这四个层次NAEP有明确要求：

识别科学原理要求学生能够了解、回忆、关联和表述基本科学原理；应用科学原理则要求学生能够解释现象，预估某一现象可能的结果和能够举例说明的科学原理；实施科学探究则关注学生设计和评判一个科学调查的能力，选用合适工具和技术进行科学探索的能力，分辨实验数据的规律或者与其相关的理论模型的能力，使用实验数据证实或评估结论的能力；技术设计则关注学生在真实的环境中，系统地应用科学知识和技能处理问题的能力。

这些能力要求对每个年级都适用，但是各年级有所不同。

从表3中，我们可以看出4年级的科学实践部分主要强调前三个层次，8年级则更加强调应用科学原理。

　　TIMSS在科学认知方面则分为三个层次：

知道、应用和推理。

在TIMSS中对这三方面的认知是这样要求的：

知道认知要求学生了解科学事实、名词、模型、单位，并能选择合适的工具和实验方法用在科学调查上；应用认知要求学生应用科学的概念和原理比较、区分和解释科学信息，并能利用自己对概念和原理的理解找到解决问题的方法或者提供现象的解释；推理认知则要求学生分析问题并确定其蕴涵的科学原理，设计和解释处理问题的方法，应用合适的公式和分析方法评估解决问题的方案。

这些认知方面的要求也是贯穿在每个年级里，但从表4中我们可以看出4年级学生更关注了解科学知识，8年级学生则有增加推理与应用方面的要求。

　　（三）NAEP和TIMSS在科学课程评估中试题形式和分布的异同

　　NAEP和TIMSS的试题都包含选择题和开放性试题（ConstructedResponseorOpenEndedQuestion）。

但NAEP的试题中的选择题比例远低于TIMSS，开放性试题中两种体系采用的方式也有很大区别。

　　TIMSS中的选择题是单项选择题，开放性试题包括简答题（ShortConstructedResponseQuestion）和拓展题（ExtendedConstructedResponseQuestion）。

简答题用一个句子或者单词简要回答，拓展题则因为需要利用相关知识和技能解决问题或解释现象，所以要求学生根据题意安排自己的答题内容。

拓展题根据学生回答的完整程度给出了相应分数，并且评价的重点是在问题解决上而不是在写作能力上。

比如“字和句子写得是否规范”，这样的评分细则和我国的小学考试评分标准还是有区别的。

　　NAEP的选择题也全部是单项选择题，开放性试题包含简答题、拓展题和概念图任务（ConceptMappingTasks）。

概念图任务题要求学生在6~8个概念间用箭头建立联系，并在箭头上用单词或短语简要描述概念间的联系。

这种题主要考查学生对科学内容或概念有精准的认识，并要求学生有一定的想象能力。

这种题型类似目前国内流行的思维导图。

另外，从工作量和评估的有效性考虑，NAEP对一小部分的测试对象进行了加试，这部分内容包含的题型主要是实验题（Hand-onPerformanceTask）和计算机交互模拟试题（InteractiveComputerTask）。

通过这些内容的评价，我们可以得到更加全面和丰富的学生学业成就信息。

因为TIMSS中没有相应的内容，加试题型也不在这次对比的内容内。

　　从表5中可以看出，NAEP的4年级和8年级评估试题中选择题和开放性试题基本保持一样的份额，而TIMSS的试题则有将近三分之二是选择题。

在开放性试题中，TIMSS有很高的比例是拓展题，这一比例大约占开放性试题的一半。

所以，拓展题的总体占比还是比NAEP要高。

开放性试题的评分标准在两个体系中也有所不同，在TIMSS中，简答题只有正确和错误两个评判结果，拓展题有3个，分别是正确、部分正确和错误。

在NAEP中，简答题则可能有2个或者3个评分标准，拓展题则有4个，分别是正确、部分正确、少量正确和错误。

特别需要提出的是，在每个年级中的TIMSS有部分题没有唯一答案，要求学生对这个问题有两种回答，根据回答内容对其进行评价，评价结果分为3类（2个都正确，1个正确和没有正确）。

　　三、NAEP和TIMSS教育评估体系对我国教育评价机制的启示

（一）培养专业的教育评估团队，建立专业的教育评估机构

　　NAEP和TIMSS科学教育评估体系都由一批专业人士组成的专业化的教育评估机构制订并完成实施的。

这些人员主要有政府人员、教育家、科学家、大学教授和中小学任职教师。

他们组成了一个独立于政府的机构，负责建立评估体系并实施，然后进行统计分析，以分析报告的形式向社会提供研究成果，并帮助政府机构评估国家的教育水平。

其中NAEP是在由美国教育部和国会授权的国家评估理事会监管下运作的，但是国会和教育部不介入具体工作。

国家评估理事会联合多家机构完成NAEP体系的制订和执行。

这其中有美国国内的大教育机构，比如国家科学教师协会（NationalScienceTeachersAssociation）等；还有顶尖的科研机构和学校，比如美国物理学会（AmericanPhysicalSociety），美国化学学会（AmericanChemicalSociety），美国生物科学研究所（AmericanInstituteofBiologicalSciences），斯坦福大学（StanfordUnivesity），加州大学伯克利分校（UniversityofCalifornia,Berkeley），等等。

这些组织将有大量的教育专家、统计专家和顶级的科学家参与体系的框架制订和试题开发，并致力于对学生学业水平进行科学的统计和评估。

TIMSS是由IEA制订并实施的，而IEA是个独立的公益性国际组织，不隶属于任何政府，它的资金来源也非常广泛。

参与TIMSS项目的人员和NAEP一样，都是来自于教育、科研和政府的专家，只是这些人员不仅仅来自于美国。

IEA的研究中心有三个，分别是美国的波士顿、荷兰的阿姆斯特丹和德国的汉堡，这些研究中心为TIMSS项目提供了全方位的支持。

　　反观我国现状，则没有一个相对专业并真正致力于对学生学业成就进行评估的机构，更没有一个相对健全的全国性教育评估体系。

就算高考，这个号称是国内的第一大考，目前也因为各个省的各种制度而采取分别命题的方式。

其命题质量和评估方式不一，造成不能科学地评估和分析国内整体教育水平和学生学业成就，更不可能对各省的教育水平进行比较和分析。

另外，中小学的其他考试则是由在职教师和教研员等人员组成命题组组织和完成的，造成编制的试题具有很大的经验性和非科学性，不能对学生的学业成就进行全面评估，对目前的素质教育和新课改实施没能起到导向作用。

所以，我国应建立一个专业的教育评估机构，人员应包括教育、科学和统计方面的专家，把教育评估从职能化向专业化转变，并开展全国性的学生学业成就评估和调查。

我们利用这种专业化机构进行全国性教育的科学评估，一方面可以使政府对我国教育现状有全面和科学的认识，另一方面也可以对各个省和地区的教育水平进行对比，这将有效地推动新课改和其他教育方针的实施。

（二）开展科学命题工作，保证命题和评价目标的统一

　　从教育学角度看，任何一门课程的开发都包含三个核心内容：

内容标准、表现标准和评价标准。

内容标准即本文讨论的两个评估体系中科学课程内容范围，我国的教学大纲里也有类似内容；表现标准就是两个体系中要求学生具有的认知能力。

这些在我国的教学大纲中也有涉及，但是相关的要求内容过于简单和粗糙。

因此，评价标准主要应由试题来体现。

　　课程标准要求学生在学习过程中获得一定的能力，最后通过测试评价学生获得的知识和能力，这是一个完整的课程体系。

在这个过程中，最重要的环节是评价。

因为评价是对学生在课程内容和课程表现上获得的程度进行的评估，对学生的学习过程也有引导作用。

从讨论中我们可以看到，无论NAEP还是TIMSS都对评估这个环节很重视。

它们都提出了对学生的科学认知能力考察和评估，并把这些作为重要的评估内容。

NAEP为了对学生的实际能力进行考核，还增加了实验和计算机模拟试题。

　　目前，我国已制订了中小学生学业成就评价的内容标准和表现标准，但是在评价标准上没有明确的方式和方法。

如没有体现相应内容的标准和表现标准的试题库，不能科学地对学生学业成就进行评估。

正是没有合理和科学的评估标准，使我国在推行新课改时，各地的试题仍然按照课改之前进行命题。

这很难起到评估对教学实践活动和学生学习活动的引导作用。

这样就出现了各地课改实行不到位，甚至放弃新课改。

所以，建立科学的评估体系和评估标准，即保证命题工作和课程标准的统一，是推动我国整体教育水平的关键。

　　（三）积极参加国际教育评估工作，学习和借鉴国外的先进经验，逐步建立我国的教育评估体系

　　为了尽快科学地认识和了解我国教育现状，最有效的方法是直接参加国际性的教育评估工作，比如TIMSS等。

这些教育评估体系在某些学科和我国的课程要求很接近。

我们参加这些国际间的评估，不仅可以了解我国教育水平在世界上的位置和不足，还可以利用评估结果，对国内各个地区的教育水平进行比较和分析，引导我国教育活动向国外先进国家靠拢。

在2007年的TIMSS科学评估中，新加坡排名第一，美国排名第八，当时引起了美国方面的反思。

　　我国没有系统地参与到国际间教育评估中，只是参与了部分的测试和评估，而且不是很全面。

上海曾于2009年参与了国际学生评估项目（ProgrammeforInternationalStudentAssessment,PISA），并在阅读、数学和科学项目上获得过全球第一的成绩。

但是，最近的杜克国际教育报告显示：

我国学生在学术能力评估测试（美国的一种学生评价体系，英文名ScholasticAssessmentTest,简称SAT）中，平均成绩只有1213分，远远低于美国大学理事会1550的官方基准分，比美国学生平均分低了300分；报告中还显示北京学生在参加省市中最高，为1446分，上海只有1211分。

以上两个例子的结果是有矛盾的，这主要是因为这些测试的重点和方式不同，另外还有最重要的一点是样本的选择不同或者不够全面。

所以目前我们很难得到我国教育水平在国际上的地位和差距。

在我们没有能很好地建立自己的评估体系时，应该积极参与国际间合作，及时和充分了解我国教育现状，并在参与中建立自己的教育评估体系。

展开阅读全文