现代心理与教育统计学.docx-资源下载

现代心理与教育统计学.docx

1、现代心理与教育统计学心理统计学第一章概述描述统计定义：研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用：使杂乱无章的数字更好的显示出事物的某些特征，有助于说明问题的实质。具体内容：1数据分组：采用图与表的形式。2计算数据的特征值：集中量数（平均数中数）离散量数（方差）3计算量事物间的相关关系：积差相关（ 2列3列多列）推断统计定义：主要研究如何利用局部数据（样本数据）所提供的信息，依据数理统计提供的理论和方法，推论总体情形。作用：用样本推论总体。具体内容：1如何对假设进行检验。2如何对总体参数特征值进行估计。3各种非参数的统计方法。心理与教育统计基础概

2、念数据类型一从数据来源来划分1计数数据：计算个数或次数而获得的数据。（都是离散数据）2测量数据：借助一定测量工具或测量标准而获得的数据。（连续数据）二根据数据所反映的测量水平1称名数据（分类）定义：指用数字代表事物或数字对事物进行分类的数据。特点：数字只是事物的符号，而没有任何数量意义。统计方法：百分数次数众数列联相关卡方检验等。（非参检验）2顺序数据（分类排序）定义：指代事物类别，能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。（年级）特点：没有相等单位没有绝对零点。不表示事物特征的真正数量。统计方法：中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方

3、法。3等距数据（分类排序加减（相等单位）（真正应用最广泛的数据）定义：不仅能够指代物体的类别等级，而且具有相等的单位的数据。（成绩温度）特点：真正的数量，能进行加减运算，没有绝对零点，不能进行乘除计算。统计方法：平均数标准差积差相关 Z 检验 t 检验 F 检验等。4比率数据（分类排序加减法乘除法（绝对零点）定义：表明量的大小，也具有相等单位，同时具有绝对零点。（身高反应时）特点：真正的数字，有绝对零点，可以进行加减乘除运算。在统计中处理的数据大多是顺序数据和等距数据。三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量：指心理与教育实验观察调查种想要获

4、得的数据。数据获得前用“ x ”表示，即为一个可以取不同熟知的物体的属性或事件，其数值具有不确定性，因而称为变量。观测值：是研究中确定的某一变量的取值。随机变量：表示随机现象各种结果的变量称为随机变量三总体样本个体总体：具有某种共同特质的一类事物。（欲研究的研究范围）样本：构成总体的每个基本单元。个体：从总体重抽取的部分个体组成的群体。样本容量超过 30 为大样本反之为小样本。四次数比率频率与概率次数：某一事件在某一类别中的数目。比率：（比例百分数）两个数相比。频率：（相对次数）某一事件发生的次数被总的事件数目出。常用比例百分数表示。概率：用符号 P 表示，指某一事件在无限观

5、测中所能预料的相对出现的次数。五统计量和参数1参数：（总体参数）描述一个总体情况的统计指标用希腊字母表示。（小写）（大写表示运算符）总体平均数总体标准差总体相关系数总体回归系数2统计量：（特征值样本统计量）描述一组数据的情况。样本统计量用英文表示样本平均数样本标准差样本相关系数样本回归系数小结描述统计心理与教育统计学内容推论统计实验设计计数数据测量数据数据类型称名数据顺序数据等距数据比率数据离散数据计数数据变量观测值随机变量心理与教育统计基础概念总体样本个体次数频数概率参数统计量练习题1等距量表的特点是（）A 无绝对零点，无相同单位。B 无绝对零点，有相同单位。C 有绝对零

6、点，无相同单位。D 有绝对零点，有相同单位。2下列量表中具有绝对零点的是（）A 称名量表B 顺序量表C 等距量表D 比率量表3教师的职称和薪水这两个变量的数据类型分别属于（）A 命名数据等比数据B 等距数据等比数据C 顺序数据等距数据D 顺序数据等比数据4下列数据类型属于比率数据的是（）A 智商分数B 反应时C 年纪D 数学成绩练习题思路解析1 B 见第一页2 D 见第一页3D 职称：讲师副教授教授这三个职称能排序，但不能做加减法。（顺序数据）薪水： x y z 能排序能做加减法，也具有绝对零点（没工资）能做乘除法。（比率数据）4B 智商分数：加减法可做不能做乘除（智商测量表

7、测量出来人为规定零）（等距数据）反应时：有绝对零点（比率数据）年级：只能大小排序（顺序数据）数学成绩：人为规定零点（等距数据）第二章统计图表重要但不怎么考）（图表的特点）第一节数据的初步整理（将数据制成统计图表的第一步）一数据排序排序就是按照某种标准，对收集到的杂乱无章的数据按照一定的顺序标准进行排列。数据排序是正理数据最简单的方法。二统计分组统计分组只根据被研究对象的特征，将所得到的数据划分到各个分组中去。数据的取舍原则：三个标准差原则二统计表统计表：用来表达统计指标与被说明的事物间关系的表格。特点：简洁清晰准确表中数据易于比较分析。三线表RIn 忸詁 r rf jxi i t

8、譬 ki1!*1.BH! iH A El 嘗1 KttK 的评定Aft 11 hllf1篇斗塔舉&30L J严一10厂4尽职251 M J5辞常BODC F m：冨g四统计图统计图：用来表达统计指标与被说明事物之间数量关系的图形，是统计数据资料的可视化显示方式。第二节次数分布表（最重要的一类统计表）（皮尔逊次数分布表次数分布图）一简单次数分布表（既可用于计数数据的整理，又可用于测量数据的整理）简单次数分布表：依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。特点：对数据资料的来源没有过多要求，编制过程简单，应用广泛。二分组次数分布表当数据的取值过多时，不适合每个值记录一个

9、频次。分别计。把所有数据先划分为若干个分组区间，然后将数据按其数值大小划归相应组内，算各个组别中的数据个数，再用列表的形式呈现出来，就构成了分组次数分布表制作过程：1求全距（离散量度）全距=最大值-最小值（离散2决定组数0.4组数K 1.87 N 1 （N为数据个数，K取近似整数）（经验公式）3决定组距（任意一组的起点和终点之间的距离）组距是一个组的上限与下限之差组距=全距/组数4列出分组区间（组限）（一个组起点值与终点值之间的距离）组上限：一个组的终止点组下限：一个组的起始点表示方法：表述组限：10-19 20-29 30-39精确组限：9.5-19.499 19.5-29.499 2

10、9.5-39.499分组次数分布表的意义与缺点意义：显示数据的分布状况，集中状况。假设：各区间的数据均匀分布，并用各组的组中值代表各原始数据。缺点：由于假设所造成的误差为归组效应。三相对次数分布表1含义：相对次数是指各组次数 f对数据总个数 N的比值，用符号f/N表示。所有相对次数之和 U/N等于1.2制作：将分组次数分布表的各组次数转化为相对次数，用f/N或f/N X100%作标志来表示次数就制成了相对次数分布表。四累加次数分布表1实际累加次数把各组次数f由下而上或由上而下依次累加的和，用符号 cf表示。2相对累加次数把各组的相对次数 p由上而下或由下而上依次累加的和，累加之和为 1.五

11、双列次数分布表（相关次数分布表）1含义：对有联系的两列变量用一个表来表示次数分布。（体重与血压；智力与成绩）2制作：先按照分组次数表的编制方法，分别列出各变量的分组区间，登记时，每次同一对变量同时登记在相应的格内。第三节次数分布图一直方图（又称等距直方图，用于等距变量）用一系列宽度相等、高度不一的矩形表示数据分布的统计图。以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数，用数轴表示数据的等距分组点，也就是各组分组区间的上限和下限，有时也使用组中值。次数多边图（变化趋势）一种线形图，凡是等距分组的可以用直方图表示的数据，都可以用次数多边图表示。绘制时，横坐标是用各分组区间

12、组中值表示的连续变量，纵坐标是数据的次数。以每个分组区间的组中值为横坐标，一个组的次数为纵坐标标点，连接各点，就成为一条折线。三累加次数分布图在累加次数分布表的基础上绘制的，有直方图式和曲线式两种，最为常用的是累加曲线图。累加次数分布曲线横轴：原始分数百分位数纵轴：等级排名百分等级长于下肢。（分数分布在低端）负偏态分布：大端的数据比较多，小端的数据不是很多，但比较分散，表现在曲线就是下肢长于上肢。（分数分布在高端）正态分布：中端的数据最多，两端的数据少，平均两侧的数据个数差不多，表现在曲线是上肢和下肢长度相当。（中数众数平均数三合一、曲线上拐点 50%）第四节其他类型的统计

13、图表条形图表示的是离散型数据资料，宜用宽度相同的条形长短或高低来表示统计数据的大小或变动情况的统计图。一个是分类轴（横轴），表示类别，描述的是计数的数据。（离散数据（类别）一个是数量轴（纵轴），表示大小多少，描述的是计量数据。（连续数据（测量数据）条形图与直方图的本质区别（选择简答多选）条形图与直方图的本质区别条形图直观图数据类型离散数据（分类）连续数据（分组区间）数据表示方式直条的长度面积坐标轴（横轴）分类轴刻度值直观状态有间隔没有间隔圆形图（饼图）以整个圆的面积带鞭被研究对相的总体，按照组成部分占总体的比重大小，把圆面积分成若干扇形，用来表示某一现象的部分对总体的比例关系。适用于离散

14、性的数据。三线形图1用来表示连续性资料，是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。（考点）2表示的是两边两之间的函数关系或描述某种现象的发展趋势，或一种现象随着另一种现象变化发展的情形。3通常用横轴表示自变量，用纵轴表示因变量。四散点图1用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。2还可以表示相关程度。（正相关、负相关、无相关、可能相关）练习题1某考生最高分为 81 分，在下列次数分布表中，能直接判断有多少考生得分比他低的是（）A 简单次数分布表B 分组次数分布表C 累加次数分布表D 相对次数分布表2运用相对累加次数分布曲线，可以快速计算出原始分数相对应

15、的统计量是（）A 百分等级B Z 分数C T 分数D 频次3适用于描述某种心里属性在时间上的变化趋势的统计分析图（）A 茎叶图B 箱形图C 散点图D 线形图4用于描述两个变量之间相关关系的统计图（）A 直方图B 线形图C 条形图D 散点图答案及解析1 C 见第 5 页2A3 D 见第 7 页4 D*UXIIIM1丿12:1X1线ri(YIIa(” J尚 bPf 1丿伙数刁卜 Z 心 M ?欠 J /门 Jj (17欠数七JZH杉！1K力II山h HA1K 力 llllll前两章没什么特别重要的知识但不要放松必拿分数。第二章集中量数（2-3选择）用于描述数据集中程数据的集中趋势就是指数据分布中

16、大连数据朝向某个方向集中的程度, 度的统计量。第一节算书平均数一概念及计算公式1概念算术平均数，是所有观测值（或变量）的总和除以总数所得得商。符号：X或M2计算公式例题计算他们的平均数。现有一组实验观测数据， 25 27 28 27 25 29 30 34 32 33.解法一:根据题意已知 N=10，根据公式:解法二:先设定一个估计平均数 AM=27，求x=Xi-A的值。Xi 25 27 28 27 25 29 30 34 32X -2 010 -2 2375先估计平均值为27 （预估计）（大的数据用估计法好算计算过程）有利于简化二平均数的特点1 一组变量值的和等于变量的个数与平均数的乘积，

17、X N X2 一组变量值的离均差之和等于零，（说明了平均数是一组数据的重心最能表达组数据的集中趋势）（X X） 03在一组变量中，每个变量值加上或减去、乘以或除以常数c,所得的平均数等于原平均数加上或减去、乘以或除以常数 c。三平均数的意义1平均数是应用最普遍的一种集中量数。2是真值渐进、最佳的估计值。（概率分布中心极限定理）（真值 =总体平均数）3当观测次数无限增加时，算术平均数趋近于真值。（样本平均数量趋近于总体平均数）（观测次数较少时样本统计量是总体参数的无偏估计）四平均数的优缺点（选择题的重要内容）1优点：反应灵敏；计算严密；计算简单；内容容易理解；适合进一步代数运算、较少受抽样变动的

18、影响。2缺点：容易受极端数据的影响；如果出现模糊不清的数据，无法使用。第二节中数与众数一中数中数又称中位数，间称中数用亘表示，是按一定顺序排列的一组数中央位置的数值。中数是一种位置量数。中数的计算（主要考中数的计算方式）1中数附近无重复数时若数据个数（N ）奇数时，中数则为（N+1）/2 位置的那个数。若数据个数（N）偶数时，中数则为居于中间两个数的平均数X N / 2X N / 2 1 / 22中数附近有重复数时（难点没考过考很正常）采用画图法（王老师开创）例：求 11 11 11 11 13 13 13 17 173个13，意味着3个13分析：N=9中间位置为5，第5个数为13。但数

19、据中有间划分为三段,众数1含义:示。2计算方法：（1）直接观察法未分组数据-次数最多的数值次数分布表-次数最多一组的组中值（2）公式计算法皮尔逊经验公式：（牢记）X。 3Md 2X1正态分布 Md MO X2偏态分布 XO 3Md 2X左偏分布=负偏态右偏分布=正偏态（比较三数大小直接画图即可直观看出）第三节其他集中数（往往没怎么考过）（统计中基本不考）一加权平均数是观测数据（Xi ）与相应的权数（W ）乘积的和除以总权数（W, W2 W4 Wn）所得的商。用符号Mw表示。权数是指各变量在构成总体重的相对重要性，权数的大小，由观测者依据一定的理论或经验而定。n” W,X, W2X2

20、WnXnMn丄 2 2 n nW W2 Wn每个数对总体的贡献不一样权重不一样二几何平均数三调和平均数：先将各个数据取倒数平均，然后再取倒数，表述符号为 Mh,主要用于描述速度方面的集中趋势。练习题1 现有一列数据，4 4 5 3 5 5 2 。这列数据的平均数、众数和全距依次是（）A 4 4 2B 4 5 3C 5 4 4D 5 5 1量是（）A 平均数B 中数C 四分位数D 众数3数据 2 5 9 11 8 9 10 13 10 24 的中位数是（）4一组数据的分布曲线称双峰状态，据此可以推测改组数据中可能有两个（）A 中数B 众数C 平均数D 几何平均数5要比较几个不同性质的测验分数

21、，比较恰当的是比较（）A 原始分数B 众数C 百分等级D平均数6测验总分呈负偏态分布说明测验难度（）A偏难B偏易C适中7甲乙两图表示数据分布形态分别是（）8描述甲乙靓图特征的集中量数中，数据最大的分别是（）答案及解析1B选择题用省时间的方式哪个好算先算那个2A见第39.54B5C 百分等级是原始分数在所在团体中的位置位置量数6B7正偏态负偏态框架小结算术平均数（定义公式特点）集中量数中数（特点计算方法）众数（计算特点）三者之间的关系（正态偏态）众数最具代表性的最具优势的中数当个别数据偏大或偏小时用中数比较合适平均数第四章差异量数表示一组数据的差异情况或离散程度的量数；反应数据

22、的分布的离中趋势；描述事物差异性的表现。差异量越小，平均数的代表性越好。差异量越大，平均数的代表性越差。第一节全距与百分位差（容易受极端数据影响不怎么用）一全距（没用）定义：一列数据中最大数与最小数之差特点：不可靠不灵敏二百分位差（一）百分位数（原始分数） -百分等级量尺上的一个点，在此点以下包括数据分布中全部数据个数的一定百分比，符号为Pp。5 90百分位数为90 （ 90为原始分数）在90分以下的包含了整个数据的 75%（二）百分位差BoRo三四分位差1四分位数可视为百分位数的特例，用 Q来表示。2 P25 P50 P75把数据分成四等份，所以称为四分位数。巳5（第一个四

23、分位，Qi）Ro（第二个四分位，Q2）R75（第三个四分位，Q3）3四分位差是百分位差的特例：（P75 %）/2 （Q3 Qi）/2实质：反映了中间50%数据的离散程度。四分位差越小中间 50%数据越集中四分位差越大中间50%数据越离散四百分等级（Pr表示）1含义：指某个数据在整个数据中所处的百分位置。2作用：可以表示任何一个分数在该团体中的相对位置。Pp百分等级一百分位数PR百分位数百分等级第二节平均差/方差与标准差（有单位不能比较不同事物的离散程度）一平均差1含义：原始数据与平均数绝对离差的平均值。2符号：AD.AD. 平均差x 离均差3特点：较好反映了数据分布的离散程度；平均差是绝对

24、值，使用受到了限制； (绝对值不容易进一步代数运算)属于低效的差异量数。方差与标准差含义: (1)方差：离均差平方的算数平均数，表示一列数据平均差距的平方。S23(定义公式)N(2)标准差：方差的算数平方根，表示一列数据的平均差距。总体标准差计算过程 1先计算平均数2求离均差的平方和3代入方差和标准差的公式完整表述一列数据： X（M,S）2方差、标准差的性质和意义（1 ）性质每一个观测值加一个常数 C标准差不变。每一个观测值乘一个常数 C ,新数据标准差为原标准差乘此常数。（2）意义表述数据离散程度的最好指标。第三节标准差的应用一变异系数（CV）（相对离散程度没有单位可以比较不同类型数据

25、的离散程度）一组数据的标准差与其相应的均值之比。sCV - 100%X适应范围：（1）不同质的数据（2 ）同质但是差距大二标准分数（没有单位有正负）（线性变换变换完了保持相对位置）（一）概念和公式一个原始分标准分数：又称Z分数，是以标准差为单位的一种量数。表示的是数在团体中所处的相对位置。计算公式：Z X XsX 原始数据X 原始数据的平均数s 原始数据的标准差Xi Z1X2 Z2 -X X. 用Z 将X转换为ZsXn（二）性质:1 Z分数是一个相对量，以平均数为参照点，以标准差为单位。2 组原始数据的Z分数分布：平均数为 0,标准差为1。3 Z分数的均值为0。所以Sz 1即一组原始数

26、据的 Z分数分布：平均数为 0,标准差为1标准分数的应用1观测值在数据分布中相对位置的高低2当已知各不同质的观测值的次数分布为正态时，可用 Z分数求不同的观测值的总和或平均值，以表明在总体中的位置。（可加性）3表示标准测验分数转换成正态标准分数，线性转换Z aZ b4异常值的取舍标准：Z 3 三个z就占了 99.73 。个加flrlK计Hanif 价ftJE曲3讥用予 tt餐”#百JTft亨均弄r*/i JE 杯 41X 1n2擔论馥计前四种低效的用的不多方差标准差表示离散程度最好的差异量数。百分等级无相等单位是顺序数据 z分数有相等单位（标准差）等距数据框架小结仃分位总四分位才方兼

27、与标准差雄并系数*小分数68.26% 95.44% 99.73%Z分数只适合符合正态分布的的数据网上资料所有正态分布都可以通过 Z分数公式转换成标准正态分布将成正态分布的数据中的原始分数转换为 z分数，我们就可以通过查阅 z分数在正态曲线下面积的表格来得知平均数与 z分数之间的面积，进而得知原始分数在数据集合中的百分等级。第五章相关量数描述统计的重点（理解记忆）两列或两列以上的的数据第一节相关系数与散点图一相关（一）实物可能存在的关系1因果关系：A是引起B的原因，B是导致A的结果。2共变关系：表面看似有关系的两个事物，实际上是因为两者都与第三个事物有关的缘故。3相关关系：A与B在发展变化方向

28、与大小方面（关系密切程度）存在一定关系。（二）相关类别1方向上正相关负相关零相关2形状上直线相关曲线相关3相关程度上完全相关强相关弱相关零相关相关系数概念：相关系数是变量之间相关程度的指标，计算相关系数一般需要大样本。符号：样本相关系数：r总体相关系数：取值：-1 +1性质：顺序数据（没有单位）第二节积差相关一概念级适用范围是计算两个变量线性相关的一种方法适用范围：数据成对。两变量总体正态分布或接近正态分布。两变量是连续变量。两变量为线性关系。二计算公式（定义公式）(X X)(Y 丫)r NSxSyN为成对数据的数目或 r Z xZ yN y协方差：两个变量离均差乘积的平均数，协方差的绝对值越大 xy之间的相关关系越强这些点越接近一条直线。xyNxy(X X)(Y Y)第三节等级相关一等级相关的意义等级相关是根据等级资料（顺序数据）来研究变量之间相互关系的方法。数据来源：一是等级评定的资料，二是等

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？