教育统计学.docx
《教育统计学.docx》由会员分享,可在线阅读,更多相关《教育统计学.docx(12页珍藏版)》请在冰豆网上搜索。
教育统计学
0055《教育统计学》2016年12月期末考试指导
,、考试说明
(一)说明
考试为开卷考试,考试题型为撰写论文,主要考察对四种分析方法的应用分析能力,考试时随机抽取一种方法考核,试卷满分为100分,考试时间90分钟,考试时可携带相关资料
(二)论文选题及内容要求
1、论文选题为教学课件讲授内容中的如下知识点:
(1)应用独立样本T检验方法进行数据统计分析的研究。
(字数不限)
GroupStaGsti匚5
N|
SidErrcr
血鋼
翩
FcSa:
1•鬧聊
2S
29124
5.222
SampleeTest
tBwria'sTesttor
Vanjnee1
WestfOCSqU-S商朗LI曲刨谊,
Sig.-
t
(24aited>
liuarL
Differeriet
D.iPferer}c^
95%Cflli
Lower
nfideirc?
IDftheence
UPPBF
夸试威議Equal
.1547
12.374
SlOT
149
2453S
dimmedEqual
t9S9
47JG21
根据试卷中提供的数据和分析结果,进行讨论:
差异与显著性差异的关系。
a.讨论包括:
本题所使用的数据统计分析方法的解释说明、结果分析和解释等2部分
b解释为什么均值差异要分辨显著与不显著,为什么会出现有很大差异却不显著的现象。
(2)应用协方差分析方法进行数据统计分析的研究。
(2000字左右)
在问题提出部分需要说明协变量(至少要有1个)的选择理由,采用自己虚拟的数据来阐
述研究方法和结论解释。
(3)应用卡方检验统计分析方法进行数据统计分析的研究。
(字数不限)
期望分布1(%)
53
13
11
6
14
3
总计:
100%
实际分布2(%)
44
11
15
5
16
9
总计:
100%
根据试卷提供的数据,分析模拟结果,注重解释所研究问题为什么要选择卡方检验的研究方法,并对统计分析结果做解释和讨论。
(4)应用偏相关分析方法进行数据统计分析的研究(2000字左右)
在问题提出部分必须说明中介变量(或称为桥梁变量)的判定与选择理由,采用自己虚拟
的数据来阐述研究方法和结论解释。
2、论文结构包括:
问题提出,研究意义,实验过程,使用的数据统计分析方法,结论分析等5部分。
3、研究中使用的数据一律采用考生自己虚拟的数据,只注重研究问题的价值和意义,为什么选择这样的研究方法和统计分析结果的解释和讨论。
4、考试采取随机抽题的方式,随机抽取其中的一个选题考试(即一套试卷),考试期间仅允
许携带平时个人研究撰写(手写)的资料(不允许电子打印版及手写复印版)、教材(教育统
计学和数据统计分析与实践SPSSforWindows),不允许带其他材料。
5、学生将研究论文写在学院的统一考试答题纸上,要求字迹工整。
考试结束后现场密封答题随期末试卷一同寄回学院批改。
二、论文大纲
(一)问题提出
这部分首先需要阐述研究问题提出的背景,其次是说明研究问题,以及具体研究的问题维最好是能结合自己工作的实践确定问题。
例如:
imra民工子弟小学生早餐疔为研究・
问罰?
岀
早番F彌寸小学主的健康、学习效率等育垂宴意义.本硏究的早餐行打培君肖关克恂営
禅借康现念支配的人们在早農的摄侵活3如包括吃早聲的频率纭早甘恸事食物选抹等.
呈割®率指再周烁中吃早餐的天轨早賽悟董包括早餐前是否洗鶉灘餐地吊+起就眷
的人员視食物选择包括选择早簷横郴时色恵的值氤注枣取早瞽时早停穩物的進备舌食韧种类和沁隠乘紐量堵父母威三區主活负同牍曲絡细g的材饉*廊傩就京市團稱辞测鞍的寸津生为研删紡通过誠海餐行为的调叠分析旦早餐讦拘现忧^釜响氏盍.期畫对促逛北京打1子鶴小学生早餐赠康捋阻垃抿和厘
(二)研究意义
研究问题必须具有明确的意义和研究价值,该部分主要描述通过这项研究,能获得什么样的价值,对什么有意义、有价值,研究的意义应当扎根于社会问题、教育问题或者是国民经济有关的问题。
(三)实验过程
这部分内容包括:
1.被试的选取及样本的大小和特征;
2.对被试采用的测试是:
问卷、访谈、行为观察还是系统测试;
3.在考题指定的研究方法中,相应的变量(如协变量、中介变量)是什么?
有几个?
对变
量的数值有什么要求?
同时一定要说出中介变量(或称为桥梁变量)的判定与选择理由
例如:
碉斷用的育法主要苞间卷週乐祐请法和炳楓監iw调童的尚齟厦赳浙大轍磨燥it縑业辭陽樱黔嗥慵藏嶽障苇會畴属揄棋样萃畫公为总1>禺也癡:
瞬統編.琳揃戚曲農抽蒯E转专业学生样名哪射阴韓皆业学生的嚴扱中随机抽取一劉两喜菲转专业学勲•人敷爆執媾粉臟惑瞇•学生,耒用分昙抽拝的办社抽瞬本卑客左看.炖分斩主翌是对辭;I阴表去秣总业
政坯猎福列丈件如相关I畑逾知弄进行理斓阪■鬓问匪旳爾客*
(四)使用的数据统计分析方法
采用试题中指定的研究方法,说明为什么要使用这种研究方法,描述方法的适用性。
(五)结论分析
这部分主要是对研究结果、分析结果的分析与解释讨论。
由于部分试卷中的数据是虚拟的,因此要对实
验可能产生的不同结果都需要分析解释。
1.对于独立样本T检验,两个独立样本的均值差异是否显著,对应的结论是什么?
2.对于协方差分析,影响因素的作用显著表示什么结果?
不显著又是什么结果?
3.对于偏相关分析,显著性水平sigv=0.05(0.01)怎么解释?
显著性水平sig>0.05(0.01)又怎么解释?
4.对于卡方检验,观察值和理论值偏离程度太大,代表什么意义,是否有显著性差异?
三、重点内容
第六章抽样样本及总体平均数的推断
1、对使用独立样本T检验方法的解释说明
可以从独立样本T检验方法的特点、适用条件、适用性等方面说明,同时结合具体问题,阐述独立样本T检验方法的应用,并根据问题做出假设。
独立样本是指两个样本之间彼此独立,没有任何关联,两个独立样本各自接受相同的测量,
研究者的主要目的是了解两个样本之间是否有显著差异存在。
检验的前提条件是:
(1)两个样本应是相互独立的,即从总体中抽取一批样本对从同意总体抽取的另一样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整;
(2)
样本来自的总体应该服从正态分布。
独立样本T检验的零假设He为两总体均值之间不存在显著差异。
T检验主要用于检验两个处理平均数差异是否显著。
2、结果分析和解释
在题目中会给出对应的数据和分析结果,请结合题目作答
对结果表格中的数据进行分析,可从df自由度、显著性水平sig、t值之间的比较来说明,重点阐述两个独立样本的均值差异是否显著,对应的结论是什么?
例如:
输出结果:
由于FWL586,P7218>0.05,所以男女青少年曹
高方差齐性。
经t检验得知,t^l.502,P=0.144
>0-05,应接受原假设,即可以认为该市男女奇少呻的身高不存在显著差异.
又如,假设数据是考生自己虚拟的,需要考虑两种情况:
:
、主壬主学刁勺电谡左匸雲兀二嘗疋厚臣汗i汕止斗左冬血
iances中月到
对于谏恿連三持艰挖滴整异性袪琥之中的*)幔(]閔嗣・J靜fi旬(|血丫of
却瓯軒可以判聊/盪潼锌的显番性*等干表丽方淳差畀显著.0.05>
苔古年茅异見著.吗H嗟具生酬看上2」耳1variancesnetasstmedF
若方差濫舒不显荡.沟漕董畀判斷書口制
「金”怕…亠表示均侑差异显盍兩男立生学习鞄理谍程先題和对谍程带
若訂“砒•:
纬齐丁卢匡干吕二忌菁「聊虫:
-卡学说;湃剛?
弓殺⑴邇评遠
3、解释为什么均值差异要分辨显著与不显著,为什么会出现有很大差异却不显著的现象
解释回答时可借助实例来分析
显著性差异就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断原假设是否合理,即判断总体的真实情况与原假设是否存在显著差异。
所谓显著就是指两种或多种处理试验结果之前,本身确实存在差异。
如果不显著,就说明
它们之间的差异是由抽样或偶然的因素引起的,不是真正有实际差异存在
若两个样本来自同一总体,但是二者的样本平均数本身存在一定差异,那么这两个样本的差异则来源于随机抽样造成的随机误差,因而有可能出现有很大差异却不显著的现象。
第八章方差分析
方差分析主要用于检验多个处理平均数间差异是否显著。
协方差是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进行统计控制的一种综合方差分析和回归分析的方法。
协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。
协方差分析有两个意义,一是对实验进行统计控制,而是对协方差组分进行估计。
具体的分析结果如下:
鮭性轨鹹
「囉1
KI
092
■
招重组
6786
13
!
总计
5,938
26
这是数据的描述性统计分析结果。
III型平方和
奶|
F
3ig:
」
枕型
43;092a
14.9S9
.000
:
截距:
1.2D2
1
1.202
:
1:
257
.247
1
.259
J516
年龄
19.053
1
BOO
爼暮年龄
1
.006
J&0?
.035
◎说範
>22
3^6
总计
98OJ40
26
苦正的总计
25
主体间效应的检验
这是主要的统计分析结果,一个典型的方差分析表,解释一下:
1、表格的第一行“校正模型”是对模型的检验,零假设是“模型中所有的因素对因变量均
无影响”(这里包括分组、年龄及他们的交互作用),其P<0.001,拒绝零假设,说明存在对因
变量有影响的因素。
2、表格的第二行是回归分析的常数项,通常无实际意义。
3、表格的第三行、第四行是对组和年龄的检验,P均<0.05,有统计学意义,说明分组和年龄对胆固醇的影响均有统计学意义。
4、表格的第五行是对分组和年龄的交互作用的检验,其P=0.935>0.05,说明分组和年龄无
交互作用,也就是说,年龄对胆固醇的影响不随分组的不同而不同,这也是协方差分析的基本条件之一。
这里是满足的。
第十章x2检验
卡方检验主要用于由质量形状得来的次数资料的显著性检验等。
2
1、x检验的特点
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
即根据样本的频数分布来推断总体的分布。
它属于自由分布的非参数检验。
它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。
所以,凡是可以应用比率进行检验的资料,都可以用卡方检验。
2
检验统计量x值反映了实际频数与理论频数的吻合程度。
首先假设Ho成立,计算出x2值,它表示观察值与理论值之间的偏离程度。
根据x2分布,X2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。
如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有
显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。
3、x2检验的具体分析
例1:
就1
获1
豊站血实验组计救
;帕时赦
99
9Q.E
5
1乳枣
104
1?
&4/®
拥^的进敵
:
Tin
«3t5
21
1让
96
g鼠0
IT4
1740
28
26,0
£
S00
卡苛检魅
茧
—
秋侧》
悄侧)
1
a.asr1
L
.Q00
j
i
1
i
・Q00
Fisher的箱确并愉
.001
皿
住性和就燃in會
]
1X793
i
.000
200
百:
0H3的期翊豪少于乩JM'■期里Mdlr12;M
结论:
X2=12.857,df=1,双侧P<0.01,按照a=0.05检验水准,可认为两组总体有效率差异显著,即试验组的疗效优于对照组。
第章相关分析
1、相关系数
用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。
相关系数通
常用r表示。
首先,相关系数的数值范围是从-1到+1,其中r=1表示两个变量为完全正相关,R=-1,表
示两个变量为完全负相关。
其次,分析相关系数的绝对值。
相关系数的绝对值越接近于1,表明两个变量之间的关系
越密切;越接近于0,就表明两个变量之间的关系越不密切。
例如,r=-0.89的相关强度高于r=0.12。
2、偏相关分析
偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析
另外两个变量之间相关程度的过程。
p值是针对原假设H0:
假设两变量无线性相关而言的。
一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:
如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,R越大,说明越相关。
R越小,则相关程度越低。
描述性统计里
均值
标准差
N
综合得分
94.344
3.4460
27
授权渠道得分
58.708
1.6749
27
直供渠道得分
27.582
2.3207
27
相关性
授权渠道得
直供渠道得
控制变量
综合得分
分
分
-无-a
综合得分
相关性
1.000
.550
.610
显著性(双侧)
-
.003
.001
df
(
25
525
授权渠道得分
相关性
.550
1.000
.013
显著性(双侧)
.003
-
.948
df
25
0
25
直供渠道得分
相关性
.610
.013
1.000
显著性(双侧)
.001
.948
-
df
25
25
50
直供渠道得
综合得分
相关性
1.000
.684
分
显著性(双侧)
-
.000
df
(
24
授权渠道得分
相关性
.684
1.000
显著性(双侧)
.000
-
df
24
0
a.单元格包含零阶
(Pearson)
相关。
该数据表格为上下两部分,上半部分输出的是变量两两之间的PEARSON简单相关系
数,如综合得分和授权渠道得分的相关系数为0.550,下半部分为排除直供渠道得分的结
果,也就是偏相关的分析结果,可以看出综合得分和授权渠道得分的相关系数为0.684,
显著性为0.000.因此两者相关性显著相关。
ppt。
在复习
说明:
本考试指导只适用于201609学期12月期末考试使用,包括正考和重修。
指导中的章节知识点涵
盖考试所有内容,给出的习题为考试类型题,习题答案要点只作为参考,详见课程讲义或课程
中有任何问题请到课程答疑区咨询。
祝大家考试顺利!