教育统计学.docx
《教育统计学.docx》由会员分享,可在线阅读,更多相关《教育统计学.docx(24页珍藏版)》请在冰豆网上搜索。
教育统计学
教育统计学
▪教育统计与测量教育科学一门分支学科。
它是将统计与测量学原理和方法应用于教育实践和研究领域而形成的一门应用性教育学科。
属于工具性学科,具有基础性地位。
第一节什么是教育学
▪一、什么是教育统计学
教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。
它的主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。
▪例:
我们可以通过调查把握近五年来某地区小学教师学历达标的比例、逐年变化的情况。
通过调查我们也可以了解学校各种设施逐年改善的情况,了解学生的升学率、辍学率等等。
▪教育统计学与教育调查、教育试验的关系:
教育调查与教育试验会提出具体的研究任务,解决具体的问题。
而教育统计学主要是对数据进行分析和处理。
如果统计学不与一定的调查和试验联系起来,研究者就不知自己在干什么,说明什么问题。
反过来,调查和试验不与统计联系起来,则它们会是杂乱无章的,这样教育的规律就显示不出来。
▪二、教育统计学的内容
从具体应用的角度来分,可以分成:
1.描述统计。
就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。
2.推断统计。
根据样本提供的信息,运用概率理论进行分析论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
其内容包括总体参数估计和假设检验两部分。
第二节学习教育统计学的意义
▪首先,统计学是教育科学研究的工具。
如教育者对随机因素的处理。
▪其次,是提高专业素养、专业水平的需要。
如可以帮助你阅读大量统计说明的资料,否则就不能理解别人的研究。
▪再次,提高教育实际工作的效率和科学性。
可以帮助了解现有的教育管理,从而在此基础上制定新的计划,提高教育实际工作的效率和科学性。
同时,还可不断发现问题,提出调整的方法和方案,因而能够提高工作效率。
最后,是科学训练的需要。
可以学会科学研究所需的推理和逻辑的能力训练。
第三节统计学中的几个基本概念
一、随机变量
试验结果数值不是恒定不变的量,我们把它称为变量。
和它相反的量叫做常量,即数值保持恒定的量。
表示随机现象各种结果的变量称为随机变量。
统计处理的变量都是随机变量。
一般用X、Y、Z表示。
▪具有以下三个特性的现象,称为随机现象。
第一,一次试验有多种可能结果,其所有可能结果是已知的。
第二,试验之前不能预料哪一种结果会出现。
第三,在相同的条件下可以重复试验。
随机现象的每一个结果叫做一个随机事件。
二、总体和样本
总体是我们所研究的具有某种共同特征的个体的总和。
比如我们要了解全国初中生的英语水平,只有具有“全国的”“初中生”“英语”这些共同特征个体才构成一个总体。
总体中的每个单位称为个体。
▪总体和样本的分类:
▪总体可以分为两种,一种为有限总体,另一种叫做无限总体。
当总体所包含的个体数目有限时,这一总体称为有限总体。
而总体所包含的个体数目无限时,则称为无限总体。
▪样本种包含的个体数目称为样本的容量,一般用n表示。
样本中个体数目大于30称为大样本,等于或小于30称为小样本。
▪总体和样本的关系:
具有相对性,即在一定的条件下可以相互转换。
比如我们想研究目前南阳师院在校大学生的外语水平,那么目前在校大学生就可以构成一个整体。
如果现在想研究全国大学生的外语水平,那么南阳师院在校大学生就是全国范围内的一个样本。
在这种情况下,总体就变成样本。
▪总体,样本,与研究的目的相联系。
▪三、统计量和参数
▪样本上的数字特征是统计量。
也就是说,根据教育调查或试验获得的数据所计算出来的能够描述这组数据各种特征的数量是统计量。
▪总体上的各种数字特征是参数。
也即反映总体上各种特征的数量是参数。
第二章数据的初步整理
第一节数据的来源、种类及其分类
一、教育统计资料的来源
1.经常性资料(档案性资料):
如学生、家长和老师的资料等。
2.专题性资料:
主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题,通过调查或实验的方法来搜集的。
二、数据的种类
数据就是随机变量的观察值。
1.按来源分:
点计数据和度量数据。
点计数据指计算个数的数据。
它具有独立的分类单数,如人口数、学校数、男女数等,一般都取整数形式。
度量数据是指用一定的工具或一定的标准测量所获得的数据。
如身高、体重、成绩分数。
按测量数据是否等距和有绝对零,又可分三种水平:
①有相等单位又有绝对零的数据称为比率变量数据,如身高、体重、反应时。
②有相等单位但无绝对零的数据,称为等距变量数据,如温度、各种能力分数、智商等。
③既无相等单位也无绝对零的数据称为顺序变量数据,如等级评定、品质评定、能力等级等。
计数数据常用百分比率的检验方法,χ2检验等,比率或等距变量常用T检验及方差分析,顺序变量常用等级相关、等级差异数分析等。
2.按随机变量取值是否具有连续性,分为间断型随机变量的数据和连续型随机变量。
取值个数有限的数据,称为间断型随机变量的数据。
这种数据的单位是独立的,两个单位之间不能再划分成细小的单位,一般用整数表示。
许多调查得来的数据属此类。
取值个数无限的数据,称为连续型随机变量的数据。
它们可能的取值范围能连续充满某一个区间。
数据的单位之间可以在划分成无限多个细小的单位。
数据可以用小数表示。
第二节统计表
1.标题:
表的名称。
上方,简明扼要。
2.表号:
表的序号。
左方,时间顺序。
3.标目:
表中对统计数据分类的项目。
4.线条:
四条基本线条;不宜多。
5.数字:
小数数位要一致,对齐;尽量不留空格;无数字可画横杠,可用省略号或问号表示。
6.表注:
补充说明表的来源;字号不要大于表中的其它文字。
简单明了、重点突出。
二、统计表的种类
1.简单表:
只列出观察对象的名称、地点、时序或统计指标名称的统计表。
2.复合表:
按两个或两个以上标志分组的统计表。
三、频数分布表列法
频数:
某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。
一般用f表示。
频数分布:
各种随机事件在n次试验种出现的次数分布称为频数分布,即把随机事件出现的次数都呈现出来。
频数分布表:
把频数分布用表格的形式表示出来就是频数分布表。
频数分布表分类:
1.简单频数分布表
(1)间断变量的频数分布表
(2)连续变量的频数分布表
第一步:
求全距
R=最大值—最小值=128—81=47
第二步:
决定组数和组距
k:
一般分为10~15组。
i:
一般定为1、2、3、5、10。
本例k=10,i=R/k=47/10≈5
第三步:
决定组限,即决定各组的上下限。
组中值=(上限+下限)/2
第四步:
登记频数
2.累积频数和累积百分比分布表:
累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。
累积百分比就是把频数用百分比变成相对频数。
用表格把这两种频数表示出来就是累积频数分布表和累积百分比分布表。
(1)累积频数分布表制作
A.先制作频数分布表B.从最低一组的频数开始登记,
思考题:
将下列30名学生的英语分数编制成组距为5的简单频数,累积频数(上限以下)分布表,并绘制简单频数直方图。
767166638883777268647076817973716661556574867882748467727674
第三节统计图
统计图是用来表达统计指标与被说明的事物之间数量关系的图形。
它是整理数据的一种方法。
在运用统计图时,一般附有统计表。
一、统计图的结构及其绘制规则
1.标题。
简明扼要,切合内容,必要时注明时间地点。
字体在图中为最大;一般在图下方。
2.图号。
3.标目。
对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。
4.图形。
图形线在图中为最粗,要清晰,图形的高与宽之比3:
5为宜,以美观为准。
5.图注。
文字简明扼要,字体要小,写在图题的下方。
二、表示间断变量的统计图
1.直条图:
用直条的长短表示统计事项数量的图形为直条图。
常用来表示点计数据。
制作直条图的方法
(1)条宽应一致。
只是高度不同,从而控制高度来表示大小。
(2)各直条之间要有一定的间隔。
因为它表示的是间断变量;但间隔不要太宽、或太窄,一般是一个到半个直条宽度之间。
(3)各直条的安排要有一定的顺序。
如时间前后、数字大小、等级次序等。
(4)为了直观,直条的附近不要写数字。
如需特别说明,可以安排一些图例。
直条图的分类:
单式直条图和复式直条图
直条图还可分为横条图和纵条图。
常见的为纵条图。
2.圆形图。
是用来表示间断性资料构成比的图形。
三、表示连续变量的统计图
1.频数分布图
(1)直方图用面积表示频数分布,用各组上下限上的矩形面积表示各组频数。
直方图的制作:
以组距为底边,以分组区间的上下限为底边二端点,以次数为高画矩形,各直条距形间不留空隙。
直方图与直条图的异同
同:
都是用矩形来表示数据;
异:
直条图表示间断变量,而直方图来表示连续变量;直条图各直条之间有间距,直方图各直条之间没有间隔;直条图是以直条的长短高低来表示数量关系,而直方图是以面积来表示频数分布。
多边图:
多边图是以纵轴上的高度表示频数的多少的图形。
制图方法大体与直方图相同,其不同之处在于:
以各组中点为横坐标,以各组的频数为纵坐标描点,然后把每相邻的两点用直线连接起来,即成多边图。
若两组数据总频数不相同时,其纵轴应当以频数百分比表示。
(3)累积频数与累积百分比图
制作方法与多边图制作方法很相像,其区别在于:
描点时应以各组的上限为横坐标,以各组的累积频数或累积百分比为纵坐标,然后描处标点,然后形成一个曲线。
第三章集中量
▪二、算术平均数的计算方法
▪第二节加权平均数、几何平均数、调和平均数
一、加权平均数:
是不同比重数据(或平均数)的平均数。
▪例:
某门课程期中考试成绩与期末考试成绩的权数分别为3和7。
已知某个考生期中考了92分,期末考了85分。
若不考虑其他因素,问该生在这门课上的成绩是多少?
▪
▪二、几何平均数。
当一个数列的后一个数据以前一个数据为基础成比率(即等比级数)增长时,要用几何平均数求其平均增长率(即等比级数中的比率)。
常用作速率的集中量。
例如:
某大学连续四年的毕业人数为:
980、1100、1200、1300,问毕业生平均增长率是多少?
▪三、调和平均数:
是一组数据倒数的算术平均数的倒数,亦称倒数平均数。
用公式表示为:
▪
第三节中位数
一、中位数的概念
▪二、中位数的计算方法
▪三、百分位数的概念及其计算方法
1.概念:
百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数
2.计算方法
第三节众数
对众数有理论众数及粗略众数两种定义方法。
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点(积分)。
粗略众数是指一组数据中频数出现最多的那个数。
▪二、众数的求法
1.观察法。
先把数据列出来,然后找出现频数最大的数,即为众数。
例如:
有人想了解大学二年级一个半学生的年龄大概是多少。
就可以把学生的年龄抄下来。
发现18岁有3个人,19岁8人,20岁4人,21岁2人,还有22岁1人。
这时就可知这个班的年龄众数是19岁。
▪三、算术平均数、中位数和众数的评价及关系
(一)评价与应用
1.算术平均数:
最常用,优点也最多。
优点:
(1)感应灵敏
(2)严密确定
(3)简明易懂,计算简便
(4)适合代数运算
(5)受抽样变动的影响较小
▪
(二)三者的关系
当频数分布呈正态时,
第四章差异量
▪第一节方差和标准差
一、方差和标准差的概念
方差也叫变异数(均方),是指离差平方的算术平均数。
▪2.频数分布表计算法:
▪2.百分位距:
百分位距是指两个百分位数之差。
例:
某研究者对100名小学生进行智商测试,数据经过整理,结果如下,现要计算这100名学生智商的百分位距:
第三节相对差异量
一、概念带有与原观察值相同单位的名数,称为绝对差异量。
如前面所学的全距、四分位距、平均差及标准差等。
这些差异量对两种单位不同,或单位相同而两个平均数相差较大的资料,都无法比较差异的大小。
如比较身高和体重的离散程度。
这时就需要用相对差异量(即差异系数)进行比较。
▪小结:
差异量和集中量的比较
联系:
都是一组数据的特征量,区别:
从不同角度来反映数据的特征。
1.集中量如果在数轴上表示,它是一个点,而差异量则可表示为一段距离。
2.这段距离越宽,说明数据的离散程度越大,数据的集中量代表性越差;反之,数据则比较整齐,分布范围比较窄,数据的集中量代表性越好。
第六章抽样分布与总体平均数的推断
第一节抽样分布
▪1.总体分布:
总体内所有个体数值的频数分布。
▪例如:
我们想研究去年全市中考语文的考试情况,把去年全市参加中考的所有考生的语文分数拿来制作一个频数分数,这个分布就是总体分布。
☺二、平均数抽样分布的几个定理
▪1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。
▪平均数抽样分布的形态及特征
▪形态上:
如果是大样本,不管总体是正态分布的还是非正态分布的,平均数的抽样分布都是正态分布或接近正态分布;如果是小样本,那么只有总体呈正态分布时,平均数的抽样分布才是正态分布的。
▪特征上:
一切可能样本平均数的分布以总体平均数为中心,其取值围绕总体平均数在上下波动,平均数抽样分布的平均数等于总体平均数。
而抽样分布的标准差与总体标准差成正比,与样本容量成反比。
▪标准误
▪抽样误差我们用抽样分布上的标准差来表示。
因此,某种统计量在抽样分布上的标准差称为该种统计量的标准误。
▪e=-μ
☺三、样本平均数与总体平均数离差统计量的形态
从正态总体中,随机抽容量N的一切可能样本的平均数,是以总体平均数为中心呈正态分布的。
▪1.当总体标准差已知时
▪2.当总体标准差σ未知时
▪t分布与正态分布的区别之处
▪t分布的形态随自由度(df=n-1)变化呈一簇分布形态(即自由度不同的t分布形态也不同)。
自由度越小,分布范围越广。
第二节总体平均数的参数估计
▪根据样本对总体参数的推断有两种:
总体参数估计和假设检验。
☺一、总体参数估计的基本原理
▪根据样本统计量对相应总体参数所作的估计叫总体参数估计。
总体参数估计分为点估计和区间估计。
▪1.点估计
▪用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。
▪例如,有人通过抽样,对大学生做了一个调查。
当研究者问“你认为谁对你影响最大?
”,经统计,这个样本中有36.6%的认为父亲对自己的影响最大。
▪2.区间估计
☺二、σ已知条件下总体平均数的区间估计
▪1.当总体σ已知,总体呈正态分布,大样本(n>30)或小样本(n≤30)时。
不管大小样本,抽样分布都是正态的。
▪2.当总体σ已知,总体虽不呈正态分布,大样本(n>30)时,样本平均数的分布近似正态。
▪已知某年某区高考数学成绩的方差为100,从该地区随机抽20名考生的数学成绩为:
65、68、38、56、72、75、47、58、70、63、67、64、60、69、61、66、55、76、68、62,试求该地区这一年高考数学平均分95%和99%的置信区间。
▪总体平均数99%置信区间为:
☺三、σ未知条件下总体平均数的区间估计
▪1.σ未知条件下总体平均数区间估计的基本原理
▪
(1)当总体σ未知,总体呈正态分布。
无论大小样本,样本平均数与总均的离差是不能转成标准正态分布的。
可按T分布做推断。
▪
(2)当总体σ未知,总体虽不呈正态分布,大样本容量较大(n>30)时,样本平均数可以转换成t值。
▪
第三节 假设检验的基本原理
▪以总体平均数的假设检验为例:
当对某一个总体平均数(μ)进行假设检验时,首先从这个总体中随机抽取一个样本,计算出样本平均数的值。
然后,假定样本所属总体的平均数(μ)等于某个假设总体的平均数(μ0),那么,这个样本就来自这个假设总体,样本统计量的值是这个假设总体平均数值的一个随机样本值,样本平均数与总体平均数之间的差异是由抽样误差造成的。
▪从假设总体中抽取的一切可能样本统计量的值应当以假设的总体平均数为中心形成一个正态分布。
这个分布可以分成两个区域。
▪如果这个样本统计量的值落在了这个抽样分布中出现概率比较大的区域里,这时只好保留零假设,即研究者不得不承认这个样本来自这个假设的总体,或者这个样本所属总体与假设总体没有真正的差异。
如果这个样本统计量的值落在了抽样分布中出现概率极小的区域里,根据小概率事件在一次随机抽样中几乎不可能发生的原理,不得不承认样本统计量与假设总体的平均数存在着本质的差异。
▪二、小概率事件
▪三、显著性水平
▪统计学中把这种拒绝零假设的概率称为显著性水平,表示为:
▪检验的形式:
▪双侧检验只强调差异不强调方向的检验为双侧检验。
所提出的假设检验的问题是是否一样、相同、有差异等等。
▪单侧检验既检验差异又考虑差异的方向的检验为单侧检验。
具体来说,又分为左侧检验和右侧检验。
▪四、统计推断的两类错误及其控制
▪对于总体参数的假设检验,有可能犯两种类型的错误:
α错误和β错误。
▪假设有一个样本平均数值落到抽样分布的零假设的保留区间,这时认为样本平均数与总体的差异是由抽样误差造成的,没有真正差异,或者说差异不显著,差异没有达到显著性水平,这时就不能拒绝零假设。
如果样本平均数落到了零假设的保留区间以外,小概率事件发生了,则有相当大的把握拒绝零假设,即认为样本平均数与总体平均数的差异不是由抽样误差造成的,而是有真正的差异,或显著的差异。
第四节 总体平均数的显著性检验
▪显著性检验的一般步骤:
▪
(1)提出假设
▪
(2)选择检验统计量并计算其值
▪(3)确定检验形式
▪(4)统计决断
一、σ已知条件下总体平均数的显著性检验例子:
某小学历届毕业生汉语拼音测验平均分66分,标准差11.7。
现以同样的试题测验应届毕业生,并从中随机抽取18份试卷,算得平均分为69分,问该校应届与历届毕业汉语拼音测验成绩是否一样?
▪解:
(1)提出假设
▪
(2)选择统计量并计算其值
▪(3)确定检验形式
▪双侧检验
▪(4)统计决断
▪查Z值表,
二、σ未知条件下总体平均数的假设检验
▪通常要做t检验。
同时还要看样本的大小,小样本一定要做t检验,大样本通常还可以转换成Z检验作近似处理。
▪3、确定检验形式
▪双侧检验
▪4、统计决断因为当df=20-1时,查附表2
第七章平均数差异的显著性检验
数理统计学的研究表明,假若
第二节相关样本平均数差异的显著性检验
例1:
有人做了一项分散识字教学法与集中识字教学法的比较实验。
根据研究的需要,将学生配成了10对,再把每对学生中的一个随机地指派到实验组,另一个指派到对照组。
两组学生分别接受用不同的教学法进行的教学。
经过一段时间的学习之后,两组学生接受统一的测试,结果如表7.1所示。
现在问,两种识字教学法是否有显著性差异?
例:
某小学在新生入学时对28名儿童进行了韦氏智力测验,结果平均智商=99,标准差=14,一年后再对这些被试施测,结果平均智商=101,标准差=15,已知两次测验结果的相关系数r=0.72,问能否说随着年龄的增长与一年的教育,儿童智商有了显著提高?
第三节独立大样本平均数差异的显著性检验
定义:
两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系,这样的两个样本称为独立样本。
假设某小学从某学期刚开学就在中、高年级各班利用每周班会时间进行思想品德教育,学期结束时从中、高年级各抽取两个班进行道德行为测试,结果如下表所示,问高年级思想品德教育的效果是否优于中年级?
第四节方差齐性检验
定义:
对两个总体的方差是否有显著性所进行的检验称为方差齐性(相等)检验。
F分布的特点是:
1.F分布是一簇分布,随分子和分母的自由度不同而有不同的分布曲线。
2.F分布是正偏态的,即一簇正偏态的曲线(不过,随着分子和分母自由度的增大而逐渐趋于正态)。
3.F比值都是正的。
4.由于计算F比值时总把大的方差估计值作为分子,小的作为分母,所以F比值≥1。
两个独立样本的方差齐性检验
例:
某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21。
男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致?
第八章方差分析
下表是A、B、C三种实验处理的数据,其中k=3表示有三种实验处理;n=5表示每种实验处理中有5个实验数据;表示某一种实验处理的平均数;表示总平均数。
三组平均数之间存在差异,每一组内的5个数据彼此也有差异,这两部分的差异合起来即为实验结果总的差异。
或者说,每一数据与总平均数的差异等于它与本组平均数之差加上小组平均数与总平均数的差异。
第二节 完全随机设计的方差分析
为了检验某一个因素多种不同水平间的差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理以后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。
又叫做独立组实验设计。
例如,为了提高初三学生的物理成绩,物理教师设计了A、B、C、D四种计算机辅助教学软件,为了检查四种软件的教学效果,从某校初三学生中随机抽取了24名学生,分成四组,然后随机指派一组学生去使用一种教学软件。
学期结束时进行统一考试,成绩如下。
问四种教学软件产生的助学效果有无不同?
第三步:
统计决断
根据分子和分母自由度查F值表,得
例2:
为了研究作业量对小学五年级学生学习成绩的影响,从某小学五年级各班中随机抽取A、B、C三个平行班来做实验(假定该校五年级有三个以上的平行班,各班的平均学习成绩、智力水平及各种教学条件都基本相等),研究者让A班教师每天布置10道作业题,B每天布置3道作业题,C班每天都不布置作业。
学期结束时三个班进行统一的数学考试,这三个班学生的成绩如下,问作业量不同是否影响了数学成绩?
第二节 随机区组设计的方差分析
用方差分析法对多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。
每一区组内被试的人数分配有以下三种方式:
(3)区组内以一个团体为一个基本单元。
在被试的安排上也有两种方式,一种是从每个区组中只抽取一个团体,这个团体接受所有的处理;另一种是从每个区组中抽取的团体数是实验处理数的整数倍,将这些团体分成若干等份,每一部分被试接受一种实验处理。
例如,将某市的学校分成五个区组:
全国重点、市重点、区重点、一般学校和较差的学校,从这五个区组中分别抽取4所学校,实验中安排了A、B、C、D四种处理,这样每个区组各有一所学校接受一种处理。
第九章卡方检验
第一节 χ2及其分布
一、卡方检验的特点
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
即根据样本的频数分布来推断总体的分布。
它属于非参数检验。
参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体