拓展评价的视阈20世纪美国教育评价研究的发展历程.docx
《拓展评价的视阈20世纪美国教育评价研究的发展历程.docx》由会员分享,可在线阅读,更多相关《拓展评价的视阈20世纪美国教育评价研究的发展历程.docx(7页珍藏版)》请在冰豆网上搜索。
拓展评价的视阈20世纪美国教育评价研究的发展历程
拓展评价的视阈——20世纪美国教育评价研究的发展历程
摘要:
美国教育评价研究的发展经历了三个阶段:
20世纪初期至50年代的屏蔽价值关注“目标达成”的阶段、20世纪50年代至70年代的价值渗透关注过程的“方案评价”阶段、20世纪70年代至今的关注价值评定“综合”阶段。
研究视域围绕着对教育目标的批评和实施过程的批评得到拓展,其中缠绕着各类教育参与者的价值的融合。
关键词:
教育评价;课程评价;价值;目标
20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究,30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。
随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:
一是针对教育目标本身的攻击。
反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。
二是针对教育目标实施过程的关注。
这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。
教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。
这些批评带来了教育评价革命性的发展。
与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。
一、屏蔽价值:
目标达成的“科学”评价
20世纪30年代,美国俄亥俄州立大学教授泰勒(Ralph)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。
不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:
将课程视为目标的存在。
泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learningexperience)的发展”。
为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-penciltests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actualproducts)等。
30年代早期,泰勒的评价方法在俄亥俄州得以实践。
经济大萧条时期(The GreatDepression),学校和其他公众组织遭受资源短缺的困扰。
此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(NewDealProgram)。
在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导着名的“八年研究”,并在卡内基机构(CarnegieCorporation)资助下,尝试比较不同学校教育的有效性。
泰勒的教育评价(educationevaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。
而且,评价确定了预定的目标规范,关注预期目标的实现。
泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。
早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。
20世纪40年代以后,泰勒也对自己的工作进行了反思,其论着在以后的25年中产生了持续的影响。
20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。
但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。
社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。
不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educationaltestingservice)。
20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。
1954年,美国心理学家协会(Americanpsychologicalassociation)提供《心理测量和诊断技术的具体建议》(TechnicalRecommendationsforpsychologicaltestsanddiagnostictechniques,简称APA)的报告。
1955年,美国教育研究协会(Americaneducationresearchassociation,简称AERA)和国家教育测量委员会(Nationalcouncilonmeasurementusedineducation,简称NCME)发布了《成就测验的技术建议》(TechnicalRecommendationsforAchievementTests)。
1966年,前面三个机构联合发布了“教育和心理测量的标准手册”(StandardsforEducationandPsychologicalTestsandManuals)并于1974年进行了修订。
此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。
包括性向测验(Aptitudetests)、成就测验(Aptitudetests)以及兴趣、个性和态度测验(Interest,Personalityandattitudeinventories)。
这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。
不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。
二、价值渗透:
关注过程的“方案”评价
进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。
评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。
50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。
1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(NationalDefenseEducationAct,1958)。
整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。
学科专家组织了科学和数学的课程发展计划(curriculumdevelopmentproject),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论着既无助于课程研制,也不对有效性的检测负责。
1963年,心理测量专家克龙巴赫(Lee)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Courseimprovementthroughevaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。
但是,这并未引起美国教育评价领域学者的关注。
几年之后,情况变得不同了。
1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(SenatorHubertHumphrey)和约翰逊总统(PresidentLyndonJohnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。
20世纪早期积累的财富促使联邦政府开始资助这些福利计划。
《初等和中等教育法案》(1964)(TheElementaryandsecondaryeducationActof1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。
随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。
很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。
由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。
费黛奥塔·卡朋(PhiDeltaKappa)联合会建立了“国家评价研究委员会”(NationalStudyCommitteeonEvaluation),针对评价存在的问题进行调查。
1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。
教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。
1967年,美国教育研究协会(AmericanEducationResearchAssociation,简称AERA)的罗伯特·斯蒂克(RobertStake)对课程评价的研究引发了公众的关注。
此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。
其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。
争论由此扩大化,就连泰勒(RalphTyler)、斯克里文(MichaelScriven)和斯蒂克(RobertStake)也开始批评心理测验手段是否可以用于满足评价的目的。
1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。
评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。
到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。
接着,课程实施的过程开始容纳进入课程评价的眼帘。
斯克里文的《应答性评价》(ResponsiveEvaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(DemocraticEducation,1974)、里庇(Rippey)的《交互式评价》(Transactionaleducation,1973)论着发表,这些论着鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。
三、重构价值:
关注评定的“综合”时代
1973年,评价领域开始成为一个专业研究和测验的领域。
教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(EducationalEvaluationandPolicyAnalysis)、《评价研究》(StudiesinEvaluation)、《评价和方案计划》(EvaluationandProgramPlanning)、《评价新闻》(EvaluationNews)等陆续产生。
专业机构如“五月十二日”(TheMay12thGroup)、H区域(DivisionHofAERA)、评价网络(theEvaluationNetwork)以及评价研究社会(TheEvaluationResearchSociety)专攻评价研究。
许多大学也开始设计评价方法的课程,例如伊利诺斯州立大学(UniversityofIllinois)、斯坦福大学(StanfordUniversity)、波士顿学院(BostonCollege)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(theUniversityofMinnesota)、西密歇根大学(WesternMichiganUniversity)。
各种形式的专业研究机构开始组建,如UCLA的评价研究中心(CenterforthestudyofevaluationatUCLA)、西北地区教育实验室(NorthwestRegionalEducationalLaboratory)、斯坦福评价联盟(theStanfordEvaluationConsortium)、伊利诺斯州教学研究和课程评价中心(theCenterforInstructionalResearchandCurriculumEvaluationatTheUniversityofIllinois)、西密西根大学的评价中心(theEvaluationCenteratWesternMichiganUniversity)、测验研究中心(theCenterfortheStudyofTesting)、波士顿大学评价和教育政策机构(EvaluationandEducationalPolicyatBostonCollege)等。
交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。
这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。
学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。
在这个时代,评价者意识到评价技术必满足各种各样的需求,委托人的需求、中心的价值、真实的情况、探究的需要、精确的要求,评价的方法得到了发展,例如,目标游离评价(goal-freeevaluation,Scriven,1974,Evers,1980)、支持一对手小组(Adver-sary-advocateteams,Stake&Gjerde,1974)、支持小组(Advocateteams,Reinhard,1972)、元分析(Metaanalysis,Glass,1976;Krol,1978)、应答性评价(responsiveevaluation,Stake,1975)、自然主义评价(naturalisticevaluation,Guba&Lincoln,1981)等等。
此时,更受人青睐的是案例研究(casestudy),案例分析可以避免破坏其他参与者对潜在事件的透视,它不仅仅作为汇报的方式,更是提供了丰富信息。
1980年,12个关心教育评价问题的组织构成了联合委员会,共同发布了文件《教育方案、计划和资料的评价标准》(The standardsforevaluationofeducationalprograms,projectsandmaterials),1981由麦格罗·希尔(McGraw-Hill)出版公司出版。
随着联邦政府对教育领域的渗透,评价开始作为政治的行动,评价者以智囊团的方式存在,努力地为相关的政治社区提供信息。
克龙巴赫也将评价纳入了政策的领域,认为评价主要是提供信息、思考和决策的材料。
20世纪的最后十年,教育评价已经成为一个成熟的专业领域。
不过,专业机构之间的合作虽能很好地用于提升行为和提高评价的质量,实际的评价却很少发生变化;而且,人们需要教导评价者如何获得、尝试、反馈和发展新的评价技术。
四、研究发展的两条路径:
反思范式的递进
教育投资体系的变革对评价研究的发展提供了物质基础,评价研究问题领域的成熟带来了评价理论的演进。
第一,评价对象不断得到拓展,从单纯学生成就评定到教学过程的评定,以课程领域为例,从课程目标的评价到整个课程改革方案(如CIPP模式,即context,input,process,product)的评价。
第二,评价目标从单一到多样,从衡量预期目标的达成,到关注实施过程中的即时目标达成。
第三,评价标准多元化,随着对实施过程的重视,实践过程的各种参与者的立场开始被评价者关注,这种参与者的价值渗入影响了评价研究的发展。
第四,评价方法的宽容,随着评价对象的拓展、评价目标的多样、评价标准的多元,评价方法也发生了相应的转换,从单一的测量方法,到关注实践历程的人类学方法。
对教育目标的攻击、对教育方案实施过程的反思促动了教育评价的发展路向:
首先,针对教育目标本身的攻击去除了所谓的客观价值的假象,教育评价的作用从“证明(prove)”走向了“改进(ireprove)”。
如1972年,斯克里文提出的目的游离评价(goal-freeevaluation,简称GFE)模式,将评价的重点从“课程计划预期的结果”转向“课程计划实际的结果”。
他认为一般评价是为了检测“是否能够达成预先存在的目标”,从而忽略了那些积极的非预期的结果。
在他看来,评价的原则应该是“有效的结果”而非“目标”,为此评价者必须意识到所有的结果,还要创建一个被评价对象的档案袋。
“空白课程”的提出者艾斯特在《教育的想象》一书中提出要以“表现性目标(theexpressiveobjectives)”为标准,进行“启示性评价(illuminativeevaluation)”。
其次,为了促进方案的改进,教育评价的对象发生了变化:
以课程领域为例,必须针对课程研制的全面过程采取考察。
就将课程实施的背景(context)、过程(process)、成果(product)全部纳入评价的范畴,如20世纪60年代的CIPP方案评价模式、60年代后期应用广泛的评价学习中心(CenterfortheStudyofEvaluation,简称CSE)评价模式等。
当我们发现课程评价已经转向“教程的决策”、“关于个体的决策”和“行政的调控”的时候,就不得不意识到课程本身所具有的计划性、目的性与组织性。
因此,人类学的方法开始作为评价方法的基础,如“应答式评价(responsive)”、“启示性评价(illuminative)”或“案例研究”等。
再次,由于容纳了相当多的评价对象,也就是说将各种时空的人的价值都纳入其中,为此课程的评价标准也发生了变化,从“有效”的功利价值到包含了“生命”原则的伦理价值。
故此,人们开始关注课程评价的价值主体、价值主体的需求问题。
既然如此,在评价的过程中就需要关注到评价者、被评价者各自的价值立场,注意到评价标准和评价对象之间的匹配,关注到评价手段与评价对象的匹配。
现代课程评价研究力图在制定评价标准、收集评价资料、采取评价方法上能够兼顾到更多价值取向。
藉着对评价历史的回顾,我们可以看到直到今天为止,这些变革造就了三个具有差异的评价范式(见图1),每个范式都具有自己的目的、偏好的技术、关注的焦点等等。
由此,我们便获得了对研究发展的一种沉思:
现代化促使我国的教育研究面临着巨大的危机,我们的学者不得不一边追赶,一边进行着反思,步伐在国际化与本土化之间交替,踉踉跄跄地前进。
研究主题的变化代表了一种景况的转变,以及对研究者自身角色和地位的反思。
图1课程评价范式图解
参考 文献:
[美]泰勒。
课程与教学的基本原理[M].中国台北:
桂冠图书有限公司,
[美]泰勒。
怎样评价学习经验的效用[A].施良方译。
瞿葆奎。
教育评价[C].北京:
人民教育出版社,
施良方。
课程理论——课程的基础、理论与问题[M].北京:
教育科学出版社,
[美]斯塔弗尔比姆。
方案评价的CIPP模式[A].陈玉琨译。
瞿葆奎。
教育评价[C].北京:
人民教育出版社,1989.298.
黄甫全。
当代课程评价的价值准则:
文化哲学的观点[A].“课程领导与课程评价的理论与实践”学术研讨会暨第五届两岸三地课程学术研讨会提交论文[C].2002-10-13.
王文科。
课程论[M].中国台北:
五南图书出版有限公司,