1、检验6欲研究某班统计学考试成绩是否存在显著的性别差异,应使用何种表?t分布表三、应用题1试比例下列两学生某科两次考试总绩哪个优?其中学生第二次考试是否退步?甲、乙生两次成绩分别转为标准分数再相加或比较2.试对下列某校办二厂两个班组职工的月收入情况予以比较,并说明理由。(单位:元)甲组:672,672,666,660,654,648,648乙组:690,684,672,660,648,636,630综合应用平均数和标准差比较四、简答题如何理解一个人的测量结果只是他的真实水平的估计值?据随机误差进行思考应用哪些统计方法可以全面评价教学实验后学生的学习兴趣情况?独立主体和相关总体比例差异分析结合教育
2、统计学:教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。教育评价:教育评价是按照一定 的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。借助于这些综合指标,进行比较并作出结论。推断统计:根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(
3、样本)推论总体,由已知推论未知。横向评价:是将评价对象与其他对象进行比较。它的特点是在评价时不考虑评价对象的背景情况和今后的发展趋势,只是考察评价对象在特定的时间和特定的空间中的现实状态,所以又称静态评价。纵向评价:是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。绝对评价:是将病人对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。相对评价:是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。相对评价也称常模参照性评价。定性评价:是对教育客观事物的性质进行分析,即从质的方面说明教育问题。定量评价:是
4、对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。安置性评价:是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。即为作出某种安排,一般在教育教学活动前进行。诊断性评价:是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。即为发现问题,一般在教育教学活动前或中进行。形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即为揭示存在的问题,及时反馈信息,及时进行调控管理。即为提供过程中的信息,一般在教育教学在活动中进行。终结性评价:是在教育教学活动的终止时,对成果的
5、核定、鉴定,或对评价对象作出某种资格证明。即为作出某种鉴定,一般教育教学在活动终进行。限制式问卷:是对提出的问题,根据测评的需要以及实际情况,事先安排好答案,由对方从中选择适当的答案。即找出问题后安排答案,让对方从中选择。限制式问卷又分为单选、多选和排序三种。开放式问卷:是对提出的问题不事先安排答案,而留出空位,让对方自由回答。即找出问题后不安排答案,让对方自由回答。半限制式问卷:找出问题后既安排答案,也有自由回答。类别量表:表示事物的分类。(统计人数)顺序量表:表示事物的顺序。(排名次)等距量表:既可表示事物的分类、顺序,也有相等的计量单位和相对零点。比率量表:既可表示事物分类、顺序,也有相
6、等的计量单位和绝对零点。一般来说,类别量表测量得到的数据库的类别数据;顺序量表测量得到的数据称为顺序数据,等距量表和比率量表测量得到的数据均称为测量数据。描述性评价:是对数据资料计算综合指标值,然后根据综合指标值对教育客观事物给予评价。综合指标:指的是从教学方面综合说为事物特征的指标。常用的综合指标有绝对数、相对数、平等数和标准差。集中趋抛:指大多数数据比较趋近的水平。通常把集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。离中趋势:指数据之间变异程度或离散程度。通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。标准分数的作用:把各种不同类型的分数统一在高于或低于集体
7、平均分多少的标准上衡量。标准分数的具体应用1 正确评价同一学生科目的成绩,如前面例子。2 正确评价同一学生同一科目不同阶段的成绩。如前面例子。3 正确评价不同学生多科总成绩。例如p129表8-10。高考标准化考试报告的分数是已经对z进行了线性变换,即y=500+100Z,这并不会改变原来z的排序,线性变换避免了负数的出现,且有利于选拔。推断性评价:对数据资料进行统计检验,然后依据统计检验的结果并以一定的置信度对教育客观事物给予评价。统计检验:数据资料进行统计检验独立总体:两个总体的对象不同,对它们的差异评价,也可称为横向评价。相关总体:两个总体的对象相同,对它们的差异评价,也可称为纵向评价。t
8、检验:独立总体和相关总体的检验都应用了t分布表,这种应用t分布表进行统计检验的方法,通常称为t检验。显著性水平:效度是考试的有效性。内容效度:考试内容与预定要考内容一致性程度。内容效度的分析方法:利用双向细目标进行分析。注意编制双向细目表的步骤和要求。效标关联效度:考试结果与效标的一致性程度。效标关联程度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。信度:考试的可靠性。再测信度:用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。再测信度的分析方法:主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且
9、进行显著性检验。再测信度的不足之处:前后两次考试的时间间隔不易把握。分半信度:有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。需理解的问题1、四种收集资料方法及各自所适用的情况观察法(1)、观察法的主要特点是到现场观察,特别适用于行为表现方面的评价。(2)、问卷法的主要特点是填答问题表格,主要适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。(3)、访问法的主要特点是直接交谈,特别适用于深入了解情况以及不具备填答问卷能力的对象。(4)、测量法的主要特点是具体测试。2、选用问卷
10、种类的原则(1)、能比较简明扼要表达答案意思的可用限制式问卷。(2)、所比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用来限制式问卷。(3)、对于复杂的一些探讨性的问题。可采用开放式问卷3、对测量结果的正确理解(重要)鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p55第五段。我们不能把测试结果看作一个确定的点,而是具有一定分布范围的或带状的。一个人测试的结果只是他的真实结果的估计值。认识到这一点,我们即可避免对两次测试结果之间小的差别作过分的解释,或不会将两位被测者之间分数不甚大的差别当作有意义的事情看待。4、各种综合指标的作用绝对数说明
11、事物的规模。相对数说明事物的程度或幅度。平均数说明事物的水平。标准差说明事物或现象内部差异情况的一个指标。5、对标准差的解释标准差的值愈大,则说明差异愈大,否则说明差异较小。但究竟标准差大好还是小好?这不能一概而论需要具体问题具体分析。6、等级平均数:是对总体中各个体根据一定的标准、条件赋予不同等级并按等级归类汇总以后再计算加权平均数的方法。公式:X为代表各等级编号,为代表各等级次数,N代表总次数。等级平均既可用于总体的评价,也可用于对个体的评价。标准分数: 标准分数的解释1Z0时,该成绩高于集体平均水平。2Z0.7时较易2)P0.3时较难3) 时较适中客观题:公式p=k/N。K为某题答对人数
12、,N考生总人数。一般来说,全卷的平均难度应在0.45-0.55之间。全卷的题目难度分配一般为 易:中:难=3:5:2。当然结合考试目的灵活处理。区分度:试题的鉴别能力。区分度分析:1相关法:计算学生试题得分与试卷总分的相关系数并且进行显著性检验。2两端分组法 两端分组法区分度(D)的计算公式; D= 其中 分别为学生高分组和低分组中的难度。注意高分组和低分组各取27%的学生。两端分组法区分度D的解释1)当D 时区分度属好2)当 时区分度比较好3) 时区分度还可以4) 计算公式及应用一、独立总体差异检验规则若 则认为两个比例差异不显著,否则认为差异显著。可查正态分布(附表一)得到。例1:某方案的
13、态度:80教师70赞成,100学生74赞成则P1=70/80=0.875 P2=74/100=0.74 n1=80 n2=100计得Z=2.360查得Z1-0.05/2=0.975=1.96因l2.3601.96故该方案的态度存在显著差异例2:某市甲校参加课外活动的学生占64%,忆校占58%。解:本题属于“独立总体比例的差异分析”情形。但本题缺少条件:假定甲120人,忆110人。1、 算也z值,将数据代入公式算得Z=0.942、 检验:因为Z=0.94 Z1-0.05/2=0.975=1.96所以可以认为两校参加课外活动的人数比例没有差异。二、相关总体差异检验规则公式中的b、c是看法不一致的两
14、类人数。例如100人对两个方案的表态有下面四种情况:a=55 b=5 c=15 d=25其中第、两类人数即为b和c以上关于比例的差异分析,无论是独立总体还是相关总体的检验都应用了正态分布表,这种应用正态分布表进行统计检验的方法,通常称为u检验。例1解:1、算出Z值,将数据代入公式, 计得Z=2.242、检查:因为Z=22.4 Z1-0.05/2=Z0.975=1.96说明教师对两个方案的态度存在显著差异,方案2比方案1容易接受例2 100青年作两个实验。结果:两个都通过有45人,实1通过而实2未通过有23人,实1未通过而实2通过有5人,两个实验都不通过有27人。本题属“相关总体比例的差异分析”
15、情形1、算出Z值,将数据代入公式, 计得Z=3.4因为Z=3.4 Z1-0.01/2=Z0.9995=3.29说明两个实验的成绩结果相差非常显著,方案1比方案2简单得多。三、 检验(两事物均为类别数据)x21(0.05)=3.841 x21(0.02)=5.412 x21(0.01)=6.635 x21(0.001)=10.82722的 检验规则(均为二分型的类别数据)则认为两事物关系不显著,否则关系显著例1 参加公益态度:积极:男20 女30消极:男25 女16本题属“ 检验”情形1、 算出x2值将各数据代入公式x2= =3.17df=(r 1)(k-1)=(2-1)(2-1)=1查表x21
16、(0.05)=3.841因为x2=3.17x21(0.05)=3.841,所以学生参加公益活动与性别不存在显著关系(青年的地区来源对电影的评价态度没有差异)作业1:数学成绩是否存在显著差异?男:96 -72-83-67-78-92-89-54-87-74-74-68-71-63女:95-76-88-81-68-77-47-72-83-62-67-59-74-85-87-76解:本题属于:独立总体平均数的差异分析”情形.1、 算标准差代入数据,算得S1=11.91同理,算得S2=12.252、 算t值算得t=0.3333、 检验:df=n1+n2-2=14+16-2=28查表得t(28)0.05
17、=2.048因为|t|=0.333t(28)0.05=0.05所以该班男女生的数学成绩不存在显著差异。作业2:教师宣称,他的学生在期中和期未考试成绩相似,为检验他所宣称的是否属实,随机抽取九名学生考察,结果如下,这些资料是否证实教师所宣称的结果是事实?学生号1 2 3 4 5 6 7 8 9期中66-67-80-83-92-54-89-67-85期未81-82-73-84-87-68-97-76-91本题属于“相关总体平均数的差异分析”情形1、 求数据差的平均数Xx1-x2(期未为1、期中为2)代入数据算得Xx1-x2=52、 求配对数据差的标准差S x1-x2代入数据算得S x1-x2=7.
18、48333、 算得t值4、 检验:df=9-1=8 查表得t(8)0.05=2.306因为|t|=2.004t(8)0.05=0.05所以期中、期未考试成绩不存在差异。该教师所宣称的结果属实作业3:下列学生的历史、地理成绩,能说明学生的历史、地理成绩有显著的关系吗?学生号1 2 3 4 5 6 7 8 9-15历史81-86-73-81-77-78地理80-84-80-72-77-72本题属于“积差相关”情形1、 算出标准差。可算出S x=5.26, S y=5.99 S x-y=7.32、 计算相关系数r将以上的数据代入公式r=3、 检验 df= 15-2=13查p381的附表得r(13)0
19、.05=0.5139, r(13)0.01=0.641因为r =0.163r(13)0.01=0.641所以认为历史与地理成绩差异不显著。作业4:20名同龄青年的身高,能说明身高与性别有显著的关系吗?性别 女 男 女 男 女 男 女 男 女 男 女 男 身高153 155 146 156-156 169本题属于“点双列相关”情形:1、 分别算得X指标 Xp=158.839(男生) Xq=151.25(女生) P=0.6 q=0.4 Sx=6.722、 算出相关系数rpq=3、 检验df =20-2=18查表r(18)0.05=0.444, r(18)0.01=0.5614因为rpq=0.553
20、r(18)0.05=0.444所以身高与性别有显著差异。第一讲教育统计学:应用统计学的一个分支,是统计学与教育学的一门交叉科学.它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学教育评价:包含评价依据、评价技术和评价作用三部分;是一个系统的综合性的活动过程。强调定量分析判断与定性分析判断的结合。贯穿于一切教育活动之中。描述统计:对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标.借助于这些综合指标,进行比较并作出结论推断统计:在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由
21、已知推论未知横向评价:将评价对象与其他对象进行比较,不考虑评价对象的背景情况和今后的发展趋势只考察评价对象在特定的时间和特定的空间中现实状态,又称静态评价纵向评价:对评价对象的过去和现在进行比较,即考察其历史情况注意其发展的潜力和发展趋势,又称动态评价.绝对评价:将评价对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价.(毕业考、年轻教师合格课).相对评价:将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序,也称常模参照性评价.定性评价:对教育客观事物的性质进行分析,即从质的方面说明教育问题.定量评价:是对教育客观事物的数量方面进行分析,即从量的方面
22、说明问题,或者说对教育问题的说明提供数量的依据安置性评价:采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等(新生实施摸底测验、在教育教学活动前进行)诊断性评价:采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施.(专项如口算测验、阅读测验、写作测验在教育教学活动中进行)形成性评价:旨在改进和发展正在进行着的教育教学活动或方案,即及时揭示存在的问题,及时反馈信息,及时进行调控管理.(平时的测验、单元测验在教育教学活动中进行)终结性评价:在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明(毕业考、年
23、终考核、评选优秀工作者在教育教学活动结束时进行)教育统计学的作用1教育统计学是教育科学研究中定量分析的重要工具, 唯物辩证法告诉我们,任何客观事物都有其质与量的两个方面,教育现象作为客观存在的一种事物也不例外,因此,教育教学必须对事物进行全面的分析,不要有质的研究分析,也要有量的研究分析.2教育统计学是教育评价技术中的重要方法, 在众多的教育评价技术中,定量评价是很重要的一个方面,而教育统计方法又是定量评价中分析资料的重要方法。3教育统计学有助于增强教育决策的科学性。教育统计学中收集资料、分析资料的科学方法以及科学的推断,都可以为教育决策提供依据,提供资料,从而增强教育决策的科学性,提高管理的
24、科学水平。4教育统计学有助于培养科学的思维方式在新的时期,思维应具有科学性。在教育统计学内容中,无论是描述统计或是推断统计,都可以培养人们的统计思维,学会科学的推论与思考问题的方法,形成实事求是地对待一切事物的辩证唯物主义态度。教育评价的作用:1导向作用2.管理作用 3.激励作用 4.诊断作用 5.鉴定作用教育统计与教育评价的联系与区别:教育统计与教育评价既有联系,也有区别。联系:教育统计是教育评价技术中的重要方法,而教育评价是教育统计的深化,它是在统计基础上进一步对事物作出价值判断。区别:教育统计主要目的:数据分析 技术特点:数量化活动特点:单一性活动;教育评价主要目的:价值判断技术特点:定
25、量与定性结合活动特点:综合性活动第二讲 指标:狭义的概念:被评价的因素。广义的概念:包括因素、数量、标准和文字描述。 指标体系:被评价的全部因素的集合设计指标体系的六个原则1方向性(思想)2.一致性(思想)3.系统性(技术)4独立性(技术)5.可测性(操作)6.可接受性(操作)指标体系在评价中的作用1对评价对象的行为起质的导向作用。2有助于评价反馈功能的发挥。3有助于提高评价的客观性和精确性。4有助于增强评价结果的可比性。总的来说,指标体系即是评价工作的基础,也是评价工作的核心,它对评价起着统揽全局的作用。第三讲权重:每一指标在指标体系中的重要性程度。布鲁姆“分类学”中认知领域的作用及分类特点
26、:对教育目标分解为认知领域、情感领域和动作技能领域。认知领域又分为 记忆 、理解 、应用 、分解 、应用 、分解 、综合 、评价 六个方面。适用:重点是认知领域的分类,它主要用于学业方面的评价,如学科考试的命题可灵活运用认知领域的分类,例如P332表12-2,P50 表3-1以及P28表2-3。对照配权法确定权重的步骤:由评价者对评价指标中的每两个指标进行对照比较赋分,然后分别计算各个指标的得分和,最后将每个指标的得分和除以全部指标的总得分,所得结果即为每个指标的权重。咨询法确定权重的步骤让每个被咨询者对指标排序,重要至次要的序数从大到小排列(如表2-7)把众多被咨询者排序结果放在一个表(如表
27、2-8)计算每个指标的总序数将每个指标的总序数除以全部指标的总序数即为每个指标的数量。(见p35表2-8)第四讲限制式问卷:对提出问题根据测评的需要以及实际情况,事先安排好答案,让对方从中选择。限制式问卷又分为单选、菜单式多选和排序式三种。开放式问卷对提出问题事先不安排答案,让对方自由回答。半限制式问卷对提出问题事先既有安排好答案,也有自由回答。类别量表(主要用来测,分等级如统计人数情感、品德、非智力因素 ,得到类别数据)表示事物的分类。表示事物的顺序 (排名次) 等距量表、比率量表(又统称测量数据因为都有计量单位学业、年龄、分数)等距量表:1四种收集资料方法及各自所适用的情况 2选用问卷种类的原则 能比较简明扼要表达答案意思的可用限制式问卷。 能比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用半限制式问卷。 对于一些复杂的探讨性的问题,不易简明扼要提安排答案的,可采用开放式问卷3对测量结果的正确理解:误差 不能把学生的
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1