教育统计学.docx
《教育统计学.docx》由会员分享,可在线阅读,更多相关《教育统计学.docx(12页珍藏版)》请在冰豆网上搜索。
教育统计学
0055《教育统计学》2016年12月期末考试指导
一、考试说明
(一)说明
考试为开卷考试,考试题型为撰写论文,主要考察对四种分析方法的应用分析能力,考试时随机抽取一种方法考核,试卷满分为100分,考试时间90分钟,考试时可携带相关资料。
(二)论文选题及内容要求
1、论文选题为教学课件讲授内容中的如下知识点:
(1)应用独立样本T检验方法进行数据统计分析的研究。
(字数不限)
根据试卷中提供的数据和分析结果,进行讨论:
差异与显著性差异的关系。
a.讨论包括:
本题所使用的数据统计分析方法的解释说明、结果分析和解释等2部分。
b.解释为什么均值差异要分辨显著与不显著,为什么会出现有很大差异却不显著的现象。
(2)应用协方差分析方法进行数据统计分析的研究。
(2000字左右)
在问题提出部分需要说明协变量(至少要有1个)的选择理由,采用自己虚拟的数据来阐述研究方法和结论解释。
(3)应用卡方检验统计分析方法进行数据统计分析的研究。
(字数不限)
期望分布1(%)
53
13
11
6
14
3
总计:
100%
实际分布2(%)
44
11
15
5
16
9
总计:
100%
根据试卷提供的数据,分析模拟结果,注重解释所研究问题为什么要选择卡方检验的研究方法,并对统计分析结果做解释和讨论。
(4)应用偏相关分析方法进行数据统计分析的研究(2000字左右)
在问题提出部分必须说明中介变量(或称为桥梁变量)的判定与选择理由,采用自己虚拟的数据来阐述研究方法和结论解释。
2、论文结构包括:
问题提出,研究意义,实验过程,使用的数据统计分析方法,结论分析等5部分。
3、研究中使用的数据一律采用考生自己虚拟的数据,只注重研究问题的价值和意义,为什么选择这样的研究方法和统计分析结果的解释和讨论。
4、考试采取随机抽题的方式,随机抽取其中的一个选题考试(即一套试卷),考试期间仅允许携带平时个人研究撰写(手写)的资料(不允许电子打印版及手写复印版)、教材(教育统计学和数据统计分析与实践SPSSforWindows),不允许带其他材料。
5、学生将研究论文写在学院的统一考试答题纸上,要求字迹工整。
考试结束后现场密封答题随期末试卷一同寄回学院批改。
二、论文大纲
(一)问题提出
这部分首先需要阐述研究问题提出的背景,其次是说明研究问题,以及具体研究的问题维度,最好是能结合自己工作的实践确定问题。
例如:
(二)研究意义
研究问题必须具有明确的意义和研究价值,该部分主要描述通过这项研究,能获得什么样的价值,对什么有意义、有价值,研究的意义应当扎根于社会问题、教育问题或者是国民经济有关的问题。
(三)实验过程
这部分内容包括:
1.被试的选取及样本的大小和特征;
2.对被试采用的测试是:
问卷、访谈、行为观察还是系统测试;
3.在考题指定的研究方法中,相应的变量(如协变量、中介变量)是什么?
有几个?
对变量的数值有什么要求?
同时一定要说出中介变量(或称为桥梁变量)的判定与选择理由。
例如:
(四)使用的数据统计分析方法
采用试题中指定的研究方法,说明为什么要使用这种研究方法,描述方法的适用性。
(五)结论分析
这部分主要是对研究结果、分析结果的分析与解释讨论。
由于部分试卷中的数据是虚拟的,因此要对实验可能产生的不同结果都需要分析解释。
1.对于独立样本T检验,两个独立样本的均值差异是否显著,对应的结论是什么?
2.对于协方差分析,影响因素的作用显著表示什么结果?
不显著又是什么结果?
3.对于偏相关分析,显著性水平sig<=0.05(0.01)怎么解释?
显著性水平sig>0.05(0.01)又怎么解释?
4.对于卡方检验,观察值和理论值偏离程度太大,代表什么意义,是否有显著性差异?
三、重点内容
第六章抽样样本及总体平均数的推断
1、对使用独立样本T检验方法的解释说明
可以从独立样本T检验方法的特点、适用条件、适用性等方面说明,同时结合具体问题,阐述独立样本T检验方法的应用,并根据问题做出假设。
独立样本是指两个样本之间彼此独立,没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。
检验的前提条件是:
(1)两个样本应是相互独立的,即从总体中抽取一批样本对从同意总体抽取的另一样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整;
(2)样本来自的总体应该服从正态分布。
独立样本T检验的零假设H0为两总体均值之间不存在显著差异。
T检验主要用于检验两个处理平均数差异是否显著。
2、结果分析和解释
在题目中会给出对应的数据和分析结果,请结合题目作答。
对结果表格中的数据进行分析,可从df自由度、显著性水平sig、t值之间的比较来说明,重点阐述两个独立样本的均值差异是否显著,对应的结论是什么?
例如:
又如,假设数据是考生自己虚拟的,需要考虑两种情况:
3、解释为什么均值差异要分辨显著与不显著,为什么会出现有很大差异却不显著的现象。
解释回答时可借助实例来分析。
显著性差异就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断原假设是否合理,即判断总体的真实情况与原假设是否存在显著差异。
所谓显著就是指两种或多种处理试验结果之前,本身确实存在差异。
如果不显著,就说明它们之间的差异是由抽样或偶然的因素引起的,不是真正有实际差异存在。
若两个样本来自同一总体,但是二者的样本平均数本身存在一定差异,那么这两个样本的差异则来源于随机抽样造成的随机误差,因而有可能出现有很大差异却不显著的现象。
第八章方差分析
方差分析主要用于检验多个处理平均数间差异是否显著。
协方差是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进行统计控制的一种综合方差分析和回归分析的方法。
协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。
协方差分析有两个意义,一是对实验进行统计控制,而是对协方差组分进行估计。
具体的分析结果如下:
这是数据的描述性统计分析结果。
这是主要的统计分析结果,一个典型的方差分析表,解释一下:
1、表格的第一行“校正模型”是对模型的检验,零假设是“模型中所有的因素对因变量均无影响”(这里包括分组、年龄及他们的交互作用),其P<0.001,拒绝零假设,说明存在对因变量有影响的因素。
2、表格的第二行是回归分析的常数项,通常无实际意义。
3、表格的第三行、第四行是对组和年龄的检验,P均<0.05,有统计学意义,说明分组和年龄对胆固醇的影响均有统计学意义。
4、表格的第五行是对分组和年龄的交互作用的检验,其P=0.935>0.05,说明分组和年龄无交互作用,也就是说,年龄对胆固醇的影响不随分组的不同而不同,这也是协方差分析的基本条件之一。
这里是满足的。
第十章χ2检验
卡方检验主要用于由质量形状得来的次数资料的显著性检验等。
1、χ2检验的特点
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
即根据样本的频数分布来推断总体的分布。
它属于自由分布的非参数检验。
它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。
所以,凡是可以应用比率进行检验的资料,都可以用卡方检验。
检验统计量χ2值反映了实际频数与理论频数的吻合程度。
2、χ2检验的基本思想
首先假设H0成立,计算出χ2值,它表示观察值与理论值之间的偏离程度。
根据χ2分布,χ2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。
如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。
3、χ2检验的具体分析
例1:
例2:
结论:
χ2=12.857,df=1,双侧P<0.01,按照α=0.05检验水准,可认为两组总体有效率差异显著,即试验组的疗效优于对照组。
第十一章相关分析
1、相关系数
用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。
相关系数通常用r表示。
首先,相关系数的数值范围是从-1到+1,其中r=1表示两个变量为完全正相关,R=-1,表示两个变量为完全负相关。
其次,分析相关系数的绝对值。
相关系数的绝对值越接近于1,表明两个变量之间的关系越密切;越接近于0,就表明两个变量之间的关系越不密切。
例如,r=-0.89的相关强度高于r=0.12。
2、偏相关分析
偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。
p值是针对原假设H0:
假设两变量无线性相关而言的。
一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:
如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,R越大,说明越相关。
R越小,则相关程度越低。
描述性统计量
均值
标准差
N
综合得分
94.344
3.4460
27
授权渠道得分
58.708
1.6749
27
直供渠道得分
27.582
2.3207
27
相关性
控制变量
综合得分
授权渠道得分
直供渠道得分
-无-a
综合得分
相关性
1.000
.550
.610
显著性(双侧)
.
.003
.001
df
0
25
25
授权渠道得分
相关性
.550
1.000
.013
显著性(双侧)
.003
.
.948
df
25
0
25
直供渠道得分
相关性
.610
.013
1.000
显著性(双侧)
.001
.948
.
df
25
25
0
直供渠道得分
综合得分
相关性
1.000
.684
显著性(双侧)
.
.000
df
0
24
授权渠道得分
相关性
.684
1.000
显著性(双侧)
.000
.
df
24
0
a.单元格包含零阶(Pearson)相关。
该数据表格为上下两部分,上半部分输出的是变量两两之间的PEARSON简单相关系数,如综合得分和授权渠道得分的相关系数为0.550,下半部分为排除直供渠道得分的结果,也就是偏相关的分析结果,可以看出综合得分和授权渠道得分的相关系数为0.684,显著性为0.000.因此两者相关性显著相关。
说明:
本考试指导只适用于201609学期12月期末考试使用,包括正考和重修。
指导中的章节知识点涵盖考试所有内容,给出的习题为考试类型题,习题答案要点只作为参考,详见课程讲义或课程ppt。
在复习中有任何问题请到课程答疑区咨询。
祝大家考试顺利!