化学教育测量与评价知识点.docx

资源描述

化学教育测量与评价知识点.docx

《化学教育测量与评价知识点.docx》由会员分享，可在线阅读，更多相关《化学教育测量与评价知识点.docx（67页珍藏版）》请在冰豆网上搜索。

化学教育测量与评价知识点.docx

化学教育测量与评价知识点

化学教育测量与评价

第一章化学教育测量概述

学习目标：

理解认识与测量的概念和涵义，从认识与测量的关系来理解测量的重要性和实际意义，理解教育测量及其特点，教育测量与物理或化学测量的异同，进而理解化学教育测量。

重点：

认识；测量；认识与测量的关系；测量的要素；心理测量；教育测量；化学教育测量。

第一节测量的涵义

一、认识

（一）认识的定义

1.认识就是人们的头脑对客观世界的反映，是主体对客体的能动的反映。

2.认识是主体对信息的选择。

3.认识是主体在思维中对客体信息的重新构造。

4.认识是反映、评价、决策的统一。

5.认识是反映、评价、创造的统一。

（二）认识的要素

1.认识的主体

“主体是人”

2.认识的客体

也就是“认识的对象”。

自然界、人、人类社会、人的精神现象。

3.认识的中介

人的活动；信息中介。

（三）认识的过程

1.是反映过程；

2.是信息选择、加工和改造的过程；

3.是重构的过程；

4.认识的误差——认识的误差是永远存在的。

（四）认识的方法

1.比较和类比2.归纳和演绎3.分析与综合

4.猜测法5.等效法6.假说与模型

7.证明和反证8.运用数学工具

二、测量的涵义

（一）测量的定义

测量（measurement）就是根据法则赋予事物数量。

即用一定的规则给事物属性指派数字或符号的过程即测量。

测量就是人类认识自然界的一种方式，是认识的一种方法。

（二）测量的定义分析

1.事物及其属性：

测量的对象或目标。

2.数字或符号：

代表某一事物或事物的某一属性的量。

3.法则：

测量所依据的规则和方法，是测量的关键。

人们通过一定的方式对物质的某种属性进行测量来对物质进行认识。

测量是人们认识自然界的一种方式。

本章是从认识与测量的关系来理解测量的涵义，理解和认识教育测量与化学教育测量。

三、认识与测量的关系（以科学认识活动为例）

（一）科学认识活动中的定量方法就是测量。

（二）分类、比较和定量的概念。

P17-18

（三）测量就是定量描述自然界、人类社会和人类自身规律性的一种方式。

Q：

从认识的定义，认识的主体，认识的对象，认识的中介等角度来讨论和理解化学中的测量。

阅读P19-21

第二节化学教育中的测量

一、心理测量与教育测量

二、教育测量的涵义

教育测量，主要是针对狭义的教育即学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。

（从认识主体、认识对象，认识中介角度进行理解）

三、教育测量的要素与特点

（一）测量的要素

1.单位：

用于计算的标准，是测量的基本要求，没有单位就无法测量。

2.参照点：

是计算的起点，参照点不统一，量数所代表的意义就不同，测量的结果就无法进行比较。

两种：

绝对零点和相对零点。

3.量具：

教育测量中所使用的量具也称为量表，多以文字试题的形式出现，也有以图形、符号、操作要求的形式出现的。

（二）教育测量的特点

1.间接性和推断性

只能通过人的外显行为或通过人对来自外界的一些刺激所做出的反应，对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、思想道德等做出间接性的推断性的测量。

2.测量对象的模糊性和测量误差的不可避免性

教育测量只能是对外显行为与反应的取样分析加以推断，这就使教育测量的对象具有模糊性和不确定性。

教育测量的误差除了随机误差、系统误差之外，还存在抽样误差。

（三）教育测量的基本步骤及要求

1.明确所要测量的属性（为什么测量和测量什么）

2.确定显示属性的方法

如通过测试题给学生提供问题情境。

学生在此情境中进行一系列的思维操作，最后给出操作结果，并显示出其外在行为，给出问题的答案。

学生在试卷上给出的一系列答案，即可作为教学测量的结果。

3.属性数量化

（1）命名量表

（2）顺序量表

（3）等距量表（4）比率量表

4.对测量工具的质量要求

（1）可靠性（信度）

（2）有效性（效度）

第二章课程评价

学习目标：

理解评价、教育评价、课程、课程评价的概念，评价与测量的关系，了解课程评价的发展过程和基本模式，理解课程评价的本质和标准，了解课程评价的类型，通过具体实例重点掌握档案袋评价、苏格拉底式评价、单元诊断式评价和学生表现性评价。

重点：

教育评价；课程评价；评价与测量的关系；课程评价的本质；档案袋评价；学生表现性评价。

第一节教育评价概述

一、评价的基本问题

（一）评价的含义

广义地讲，评价泛指衡量、判断人物或事物的价值。

评价活动的过程是对人物或事物的价值进行分析、衡量和判断的过程。

以事实为依据，通过收集多方面的资料证据，对人类社会活动的效果、物质产品和精神产品的质量及价值等做出判断。

（二）教育评价的概念

指按照一定的价值标准和教育目标，利用测量种种方法系统地收集资料信息，对学生的发展变化及影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。

二、教育评价与教育测量的基本关系

（一）教育评价最根本的特征是做出价值判断。

（二）教育测量过程的完结，在给出数量事实的描述与判断之后，不一定都要做出价值判断。

（三）教育测量可以为教育评价提供价值判断的基本数量事实，教育测量是教育评价的基础；而教育评价往往是教育测量过程的延续，是对测量结果的解释与应用，并朝着价值判断与释放教育功能的方向拓展。

（四）教育测量与教育评价既有区别又有联系。

第二节课程评价的模式

一、课程评价的目的和内容

（一）课程的概念

广义：

课程是指学生在学校获得的全部经验。

其中包括有目的、有计划的学科设置，教学活动，教学进程，课外活动以及学校环境和氛围的影响。

狭义：

课程是指各级各类学校为了实现培养目标而开设的学科及其目的、内容、范围、活动、进程等的总和，它主要体现在教学计划、教学大纲和教科书中。

（二）课程评价的定义

1．从课程评价对课程编制的功能看：

课程评价是依据课程编制过程搜集并提供信息，以判断课程的有效性、适用性和独创性，并为课程改进做出决策的过程。

2．从社会学的角度看

课程评价是指收集并提供论据以判定课程实施的可能性、效用性和教育价值的过程。

主要包括三个方面内容：

（1）课程编制；

（2）学生学业成绩的评价；

（3）课程决策与管理成效的评价。

通常以第二个方面为主。

（三）课程评价发展史

（四）课程评价的目的

1．广义目的

（1）检视新课程对于特定的学校、特定的学生是否适用；

（2）对正在实施的课程进行改进；

（3）在几种可供选择的课程方案中选择一种最优的。

2．功能目的

（1）判断课程的有效性、适用性和独创性。

（2）为改进教材做出决策。

3．社会目的

确定课程设计的效果，阐明和周围环境的关系，并以有利于教育决策者的形式提供信息，以便估计采取这种方案的可能结果。

（五）课程评价的内容

1．课程的价值取向

2．科学性

3．课程的教育功能

二、课程评价的基本模式

（一）目标模式—泰勒模式

基本原则是：

先确定教育目标，然后再给这些目标下一个“可操作的”或是行为的定义。

各种测量手段就是在这一原则上制订的。

测定课程有效性的一条标准就是要看教育目标究竟实现到什么程度，而确定这种标准的过程就是课程评价过程。

该模式主要用于自然科学和数理学科的评价。

（二）CIPP模式

背景——输入——过程——输出模式。

课程评价不应局限于确定目标的达成度，而应成为为决策者提供信息的过程。

在整个评价过程中，居于中心的是决策者，其任务是要改进现行课程。

（三）CES评价模式

与CIPP模式最为接近。

主要内容：

1.需要评定。

2.方案评定。

3.形成性评价。

4.总结性评价。

（四）感应式模式

由斯克特利用、古巴和林肯进一步发展起来的课程评价模式。

所谓感应性模式就是以所有与方案有厉害关系或切身利益的人所关心的问题为中心的一种评价。

（五）教育鉴赏与教育批评模式

教育鉴赏：

指欣赏细致教育现象及其重要质素的能力。

教育批评：

指展示鉴赏结果的方法（通常以批判论文形式表达）。

教育批评包括三个阶段，即描述课堂事件、诠释教育事件和对所描述、诠释的现象做出优缺点的价值判断。

（六）表象模式（countenancemodel）

根据泰勒的目标模式发展而来，也是最早反映多元论观点的模式之一。

该模式认为时刻注意那些与评价利害相关的人的需要是至关重要的。

主张在最初评价时，就应发现当事人和参与者实际上想要从教学大纲的评价中得到些什么。

在设计评价方案之前应当要发现这些问题。

（七）“质”的评价模式

是相对于科学的、量化的评价模式而言的，它不再依赖于实验心理学或心理测量，而依据社会学、文化人类学和历史等学科，采用解释学的方法，注重叙述和解释，而不是测量和预测；重视教育的实际问题，而非行政上的考虑。

质的评价模式的主要目的在于探讨一种革新方案，而不在于操作、控制或去除情景的因素。

（八）司法式评价（judicialEvaluation）

其目的在于对一项复杂的方案显现两种相反的观点，以使决策能建立在更为可靠的基础之上。

该模式包括四个步骤：

问题提出、问题的选择、论点的准备、问题讨论会。

在这一过程中，调查小组要找出最突出的问题。

问题讨论采取听证形式，要有证人的证明和对他的反诘问以及陪审团的审议。

（九）对手式评价

通过相互对立的评价者出示更有说服力的证据、相互诘问、努力获胜的过程的展示来评论。

对手式评价的评价主体包括非教育专家的参与，因此在评价过程中所展示的观念，都使评价中的价值判断增加了大众因素。

第三节课程评价的本质

一、课程评价的本质

课程评价是对课程能否满足学生与社会发展的需要以及满足需要的程度做出判断的教育活动。

课程是用来满足学生发展与社会发展的需要的，是价值客体，价值主体则是学生和社会。

二、课程评价模式的评价指标

方法上的经验性：

指评价者所使用的观察、搜集以及描述、解释评价数据和材料的方法，在性质是否可信、适用。

价值上的可估性：

指评价得到的各种数据和资料在价值上是可以确定的。

用途上的目的性：

指评价在使用上能解决什么问题、具备何种功能。

三、课程评价的标准

建立课程评价标准的实质是分析、明确课程的价值主体对于课程的需要。

（一）学生与社会都是价值主体，课程评价如何综合考虑学生与社会的需要。

（二）课程评价的标准如何既体现学生群体的共同需要又体现每个学生的不同需要。

（三）评价者对价值主体的认识、理解是评价成功与否的关键因素。

（四）当评价主体就是价值主体时，评价者必须清醒地认识自身的需要，尽量使“愿望”与“需要”一致，使主观价值标准与客观价值标准一致。

第四节课程评价的原则和类型

一、课程评价的原则（P43-44）

（一）整体性原则

（二）过程性原则

（四）综合性原则

（三）多元化原则

二、课程评价的类型（阅读P44-45）

（一）形成性评价与总结性评价

（二）目标本位评价与目标游离评价

（三）效果评价与内在评价

（四）内部人员评价与外部人员评价

（五）量化评价与质性评价（档案袋评定和苏格拉底式评定）

（六）发展性课程评价

Q：

阅读P48-52，P58-62，结合课程评价的本质和标准，试讨论档案袋评价与学生表现性评价的评价模式、评价目的、评价内容。

通过查阅文献，试讨论课程评价的现状和发展。

结合中学化学课程标准，试述对化学新课程评价的认识。

第三章教育统计基础

学习目标：

掌握教育统计基础的概念及相应的数理统计方法，能应用教育统计方法定量地研究相关的教育现象。

重点：

数据的概念、统计相关概念、推断统计

难点：

方差、标准差、概率、正态分布、推断统计、假设检验

第一节教育统计概述

一、教育统计学的概念

教育统计学是把数理统计学的一般原理和方法应用于教育研究的一门应用学科，是教育科学研究的科学工具。

数理统计学是通过大量表示随机现象数量特征的数据的搜集、整理、分析和推断，从而发现随机现象的统计规律。

教育领域存在着大量的随机现象。

二、教育统计学的作用

（一）探明教育现象的性质

（二）探索教育现象间的关系

（三）由局部推断总体

（四）比较两种教育现象的差异

（五）分析和辨明影响教育现象变化的因素

三、教育统计学的内容（P64）

（一）描述统计

主要研究如何整理教育科学实验、调查、测验得到的大量数据，描述数据的全貌，从而表达事物或现象某一方面的特征与相互关系。

描述统计分为集中趋势分析和离中趋势分析和相关分析。

（二）统计推断

统计推断是在描述统计的基础上发展起来的，主要研究如何通过局部数据所提供的信息，推断总体的有关特征。

推断统计的的具体内容有：

总体参数的估计方法、假设检验的各种方法、技术资料假设检验方法、各种非参数的统计方法等。

（三）实验设计

实验设计是研究者为了揭示实验中的自变量与因变量的关系，在实验前所做的一种研究程序或方案。

第二节数据的初步整理

一、数据的概念

数据——是指带有单位的数，它是通过对具体事物进行计数或者测量所得到的描述事物特征的数量依据。

变量——由于客观事物始终处于运动、变化和发展中，对其某一特性进行观察或测量所得到的数据总是变化的。

（一个班级学生身高与体重、考试成绩、学校每年支出的教育经费、每年的学生数）

常量——标定统计事项某一项特性的量。

与变量相对应的恒定不变的量。

二、数据的特点

变异性——指对客观事物观察或测量所得到的一组数据，其数值大小总是在一定的范围内不断变化，表现出不同程度上的差异，倘若观测的结果都是某一固定的常数，观测的本身也就失去了意义。

离散性——数据通常以一个个分散的、有一定间隔的数字形式出现。

规律性——在一定的范围内，其数值呈现出差异的同时又存在着一定的规律性，即数据的分布具有规律性。

三、数据的种类

（一）按数据的来源划分

（二）按反应的变量性质划分

（三）按数据分布形式划分

四、统计图

统计图是整理数据的一种方法，即依据数字资料，应用点、线、面、体、色彩等的描绘制成整齐而又规律，简明而又知其数量的图形。

统计图分为三类：

1.几何图2.象形图3.统计地图

重点了解几何图，包括曲线图、条形图、平面图、直方图等。

第三节统计相关概念分析

一、算术平均数

计算公式：

二、方差和标准差

一组数据中每个数据与该组平均数之差平方之和，再除以数据的个数，用σ2x表示，称为方差：

标准差是方差的平方根:

三、概率

（一）概率的意义

一个试验可以在相同的条件下反复进行，而且每次试验的结果可以不同，那么这种试验叫随机试验，这种随机事件在多次重复中呈现出一定的规律性，概率论就是研究这种规律。

（二）概率的基本性质P72-73

（三）概率的加法定理

（四）概率的乘法定理

（五）概率分布的类型

四、正态分布

概念：

指变量的频数或频率呈中间最多，两端逐渐对称地减少，表现为钟形的一种概率分布。

从理论上说，若随机变量x的概率密度函数为：

则称x服从均数为μ，标准差为σ的正态分布。

特征：

1.均数处最高

2.以均数为中心，两端对称永远不与x轴相交的钟型曲线

3.有两个参数：

均数——位置参数，标准差——形状（变异度）参数。

4.正态曲线下的面积分布有一定规律

5.正态分布具有可加性

⏹正态分布的曲线

标准差相同、均数不同的正态分布曲线

⏹正态分布的参数

均数相同、标准差不同的正态分布曲线

正态曲线下面积的意义：

正态曲线下一定区间内的面积代表变量值落在该区间的概率。

整个曲线下的面积为1，代表总概率为1。

曲线下面积的求法：

定积分法和标准正态分布法

标准正态分布：

指均数为0，标准差为1的正态分布。

常称z分布或u分布。

标准正态分布与正态分布的转换公式：

即若x服从正态分布N（μ，σ2），则z就服从均数为0，标准差为1的正态分布。

正态分布曲线下的面积

μ±σ范围内的面积为68.27%

μ±1.96σ范围内的面积为95%

μ±2.58σ范围内的面积占99%

五、统计推断

（一）统计推断：

根据样本的观察结果以及样本统计量的抽样分布，对总体的数量特征作出具有一定可靠程度的估计和判断。

（二）统计推断的基本内容有两个：

1.参数估计

利用样本指标来推断估计未知的总体指标。

2.假设检验

先对总体参数做一个假设，然后利用样本资料检验这个假设是否成立。

（三）抽样（阅读p74-75随机抽样）

研究课题所明确划定了的范围，即全部应被研究的对象叫做总体（Population）。

如果对总体中所有个体（Individual）逐一进行调查测试就称为普查。

如果从总体中抽出一部分个体进行测试，并根据测试结果推断总体的一般特征，就叫做抽样调查。

被抽出的个体所组成的集体（子集）则叫做样本（Sample）。

抽取样本的过程叫做抽样（Sampling）.

（四）假设检验

1.几个基本概念

（1）假设检验：

根据随机样本提供的信息来判断对总体参数事先所作的假设是否是可信的统计分析方法.

（2）假设：

对总体参数的具体数值所作的陈述。

（3）假设检验中的两种假设：

原假设和备择假设

a.通常将研究者想要收集证据予以支持的假设称为备择假设。

b.通常将研究者想要收集证据予以否定的假设称为原假设。

确定原假设和备择假设在假设检验中非常重要，它直接关系到检验的结论。

（4）几点注意的问题：

a.原假设和备择假设是一个完备事件组；

b.设立假设时通常先设备择假设，因为它是我们关心的，想予以证实的，因而比较清楚；

c.等号“＝”总是在原假设上面。

2.假设检验的基本思路

（1）对研究问题提出假设，因为等号在原假设所以就有一个总体参数，而且其分布也是已知的。

（2）计算样本统计量的取值。

利用样本统计量和总体参数的差别来判断总体是否发生变化。

（3）要求两者完全一致的可能性很小，那么差异要多大才算显著呢？

引起差异的原因有两种

a.条件差异；

b.随机差异。

如果证明差异是有随机因素引起的那么就接受没有显著差异的原假设，否则拒绝。

（4）确定显著性水平（阅读P74）

由于原假设的分布是已知的，因而样本统计量和总体参数的离差在一定范围的概率也可以知道，离差超过某一范围的概率也是知道的，那么就根据显著性水平将概率分布化为两个区间，离差（或其绝对值）大于给定的标准的概率分布区间称为拒绝域；小于这个不标准的则为接受域。

3.假设检验的基本原理

（1）小概率事件原理：

概率很小的事件在一次试验中几乎是不可能发生的。

这个小概率标准称为显著性水平。

（2）概率反证法：

如果小概率事件发生了，那么证明原假设是错误的。

4.假设检验中的两类错误

（1）第一类错误（弃真错误）

原假设为真时，也有可能被错误的否定掉，这种否定真实原假设的错误称为第一类错误。

犯第一类错误的概率为α，即显著性水平

（2）第二类错误（纳伪错误）

原假设为假时，作出接受原假设的选择，这种错误称为第二类错误。

犯第二类错误的概率表示为β（Beta）

（3）两类错误的关系

两类错误不可能同时犯，而且两者是此消彼长的关系。

同时减少犯两类错误的概率的唯一方法就是增大样本容量。

由于犯第一类错误的概率是可以由研究者事先控制的，因此在假设检验中，人们往往现控制第一类错误发生的概率。

第四节平均数差异显著性检验

一、平均数差异显著性检验的类型与条件P75-76

二、平均数差异显著性检验的一般步骤

在平均数差异显著性检验时，一般应遵循以下四个步骤：

（1）建立假设（包括虚无假设H0和备挥假设H1）。

在建立假设时，根据给定条件确定为何种检验（即双侧检验或单侧检验），然后建立相应的假设。

双侧检验的假设为：

H0：

μ=μ0或H0：

μ1=μ2

H1:

μ≠μ0或H1：

μ1≠μ2

单侧检验的假设为：

H0:

μ≤μ0或μ≥μ0

或者H0：

μ1=μ2

或者H1：

μ＞μ0或μ＜μ0

或者H1：

μ1＞μ2或μ1＜μ2

（2）根据给定条件确定样本分布为何种抽样分布，确定相应的检验方法，并计算出统计量的值。

（3）确定显著性水平α，查相应分布表中的理论值确定为临界值，从而确定出H0的拒绝和接受区间。

（4）作出判断，把临界值与计算所得的统计量的值相比较，若统计量值落在H0的拒绝区间内，则拒绝H0，接受H1；若统计量落在H0接受区间内，则接受H0，拒绝H1。

三、单总体平均数差异显著性检验

单总体平均数差异显著性检验依据总体分布、总体参数情况和样本容量的不同，需要采取不同的检验方法。

具体有如下三种情况。

1、总体分布未知．总体方差已知

2、总体分布为正态，总体方差未知P77-79

3、总体为非正态分布

（一）总体分布未知，总体方差已知

由抽样分布的讨论可知．当总体分布为正态，总体方差已知时．无论样本容量的大小，其样本平均数的分布均为正态分布，因此可用z检验方法进行检验。

在检验中，计算统计量值的公式为：

例某地区统考数学，假设该统考数学成绩服从正态分布，已知其总平均分为50分，标准差为12分。

从该地区随机选择一个班作为样本，该班有学生50人，经计算该班平均成绩为53分，试问该班成绩与总平均沉积的差异是否显著。

解：

①建立假设。

由于本题是需要了解样本平均数与总平均数的差异是否显著，投有提及高于或低于总平均数的问题，故用双侧检验：

H0：

μ=μ0

H1：

μ≠μ0

②计算统计量值。

由题意知，该题总体分布为正态，总体方差已知．故用z检验。

已知，

由公式得

③查附表1，当a=0.05时=1.96（双侧）。

④判断结果：

因为1.76<1.96，所以P>0.05

差异不显著，接受H0，拒绝H1。

故该班数学成绩写平均成绩的差异不显著

四、双总体平均数差异显著性检验

双总体平均数差异显著性检验虽然与单总体平均数差异显著性检验相类似，但它需要考虑的条件要复杂得多，它不仅像单总体检验那样考虑总体分布，样本容量和方差已知与否等情况·还要考虑好样本的独立与相关以及方差齐性与否等条件，在不同的条件下，检验手段和所用公式不尽相同，其具体检验过程可以分为以下几种情况。

1、两总体分布为正态，两总体方差都已知

2、两总体都是正态分布，两总体方差都未知

3、总体为非正态分布

（一）两总体分布为正态，两总体方差都已知

1．两样本相互独立

当两样本相互独立时，取r=0，公式就可以写为：

若两样本容量不等，标准误公式还可以写为

则检验统计量公式为：

2.两样本相关

当两样本相关时，我们可以直接引用公式来计算两样本之差的标准误，但应注意的是此时的相关，是指两样本之间必须存在一一对应的关系。

（二）两总体都是正态分布，两总体方差都未知

1.两样本容量不等，标准误差为：

都未知，此时可用方差的无偏估计量来替代形成公式：

若假设两总体方差相等即

就可以把公式写成

此时，

由此，我们可对来自于两独立正态总体的两个容量不等的样本，当总体方差齐性时，进行均数差异的显著性检验。

其检验公式为：

（三）总体为非正态分布

1.独立样本

当总体方差已知时，可得该检验统计量z′为

当总体方差未知时，可得该检验统计量z′为：

2.相关样本

根据总体方差已知与未知情况，也有两种计算检验统计量的方法。

当总体方差已知时：

当总体方差未知时，可得

例3-

展开阅读全文