4.已知一组数据服从正态分布,平均数为70,标准差为10。
Z值为-2.58的原始数据是()。
A.95.8B.44.2C.45.8D.55.8
5.相关系数的取值范围是()。
A.|r|<1B.|r|≥0C.|r|≤1D.0<|r|<1
6.假设两变量线性相关,一变量为正态等距变量,另一变量也为正态变量,但被人为地分为多类,计算两变量的相关系数时应选用()。
A.积差相关B.斯皮尔曼等级相关C.肯德尔W系数D.肯德尔U系数
7.从某正态总体中随机抽取一个样本,其中n=10,S=6,其样本平均数分布的标准差为()。
A.1.7B.1.9C.2.1D.2.0
8.F分布是一个正偏态分布,其分布曲线的形式随分子、分母自由度的增加而()。
A.渐近x2分布B.渐近二项分布C.渐近t分布D.渐近正态分布
9.特别适用于描述具有百分比结构的分类数据的统计分析图是()。
A.散点图B.圆形图C.条形图D.线形图
10.某年级三个班的人数分别为50,38,42人,若用方差分析方法检验某次考试平均分
之间有无显著性差异,那么组间自由度为()。
A.127B.129C.2D.5
11.上海市1997年8岁男童身高的平均数为130厘米,标准差为10厘米,现有一8岁男童身高为137厘米,该男童身高的Z值是()。
A.0.7B.0.3C.1.1D.0.5
12.已知某次数分布的平均数为68.6,中数为65.3,其众数为()。
A.58.7B.57.8C.59D.61
13.仅是类别符号,没有在量方面的实质性意义,一般不能对这类数据进行加减乘除运算,但通常可对每一类别计算次数或个数的数据是()。
A.顺序变量B.等距变量C.称名变量D.比率变量
14.某项调查选取三个独立样本,其容量分别为n1=10,n2=12,n3=15,用方差分析法检验平均数之间的显著性差异时,其组内自由度为()。
A.2B.5C.36D.34
15.已知一组数据是69101011141416,则其算术平均数为()。
A.10B.10.125C.11.25D.10.25
16.每一个观测值都加上一个常数C后,则计算得到的标准差和方差()。
A.标准差不变,方差等于原方差加上常数C B.标准差等于原标准差加上常数C,方差不变
C.标准差扩大C倍,方差扩大C的平方倍 D.都不变
17.五选一的选择题100道,考生全凭猜测作答,问猜测的标准差是()。
A.20B.4C.25D.5
18.一组数据73861720,用何种集中量数作为其代表值更好?
()
A.众数B.算术平均数C.几何平均数D.中数
19.当自由度趋近于无穷时,F分布()。
A.趋近于正态分布 B.趋近于t分布C.趋近于标准正态分布D.趋近于x2分布
20.从一副洗好的扑克(52张)中每次抽出一张,问抽出一张6的概率为()。
A.1/52B.4/52C.13/52D.6/52
21.虽然随机变量事先无法确定,但仍有其特点,即离散性、变异性和()。
A.必要性B.充分性C.规律性D.集中性
22.数据051820-4-100的标准差为()。
A.11.14B.90.3C.9D.12
23.以下哪个不是算术平均数的优点?
()
A.适合进一步的代数运算B.反应灵敏C.简明易解D.不易受极端数据的影响
24.斯皮尔曼等级相关适用于两列具有()的测量数据,或总体为非正态的等距、等比数据。
A.类别B.等级顺序C.属性D.等距
25.反映样本特征的量数统称为()。
A.样本统计量B.样本参数C.总体参数D.总体统计量
26.推断统计的创始者是()。
A.皮尔逊B.费舍C.瑟斯顿D.桑代克
27.以下各种图形中,表示间断性资料频数分布的是()。
A.圆形图B.直方图C.散点图D.线形图
28.当一组数据中出现个别极端值时,反映该数据分布集中情况的最好的代表值是()。
A.算术平均数B.调和平均数C.加权平均数D.中位数
29.一组数据4、5、6、7、8、29,使用何种集中量数表示集中情况其代表性更好()。
A.算术平均数B.几何平均数C.中数D.众数
30.已知某次“心理与教育统计学”的考试的标准差为4.2分,考虑到这次考试的题目
太难,评分时给每位应试者都加了10分,加分后成绩的标准差是()。
A.9.2B.4.2C.14.2D.42
31.假设两变量线性相关,一变量为正态等距变量,另一变量也为正态变量,但被人为地分为两类,计算它们的相关系数时应选用()。
A.积差相关B.斯皮尔曼等级相关C.二列相关D.点二列相关
32.如果由某一次数分布计算得SK=-0.35,则该次数分布为()。
A.高狭峰分布B.低阔峰分布C.正偏态分布D.负偏态分布
33.从正态总体中随机抽取样本,若总体方差σ2未知,则样本平均数的分布为()。
A.正态分布B.F分布C.t分布D.χ2分布
34.某实验选取三个独立样本,其容量分别为n1=4,n2=5,n3=6,用方差分析法检验平均数之间的显著性差异时,其组内自由度为()。
A.2B.5C.12D.14
35.某项调查选取三个独立样本,其容量分别n1=10,n2=12,n3=15,用方差分析法检验平均数之间的显著性差异时,其组间自由度为()。
A.2 B.5C.36D.34
36.下列描述离中趋势的统计量是()。
A.算术平均数B.方差C.中数D.众数
37.假设两变量线性相关,一变量为正态、等距变量,另一变量为二分称名变量,计算它们的相关系数时应选用()。
A.积差相关B.二列相关C.点二列相关D.斯皮尔曼等级相关
38.设A、B为两个独立事件,则P(A·B)为()。
A.P(A)B.P(B)C.P(A)·P(B)D.P(A)+P(B)
39.如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有()。
A.负相关B.正相关C.完全相关D.零相关
40.对某中学初中一年级学生实施了标准化的数学考试,全体学生成绩的平均分为83分,某一学生得了80分,他数学成绩的Z值为-0.5,问全体考生数学成绩的标准差为()。
A.12B.6C.8D.10
41.当样本数据按A和B两个特征进行双项多类分析时,以A特征分类分为4个小类,以B特征分类分为3个小类,如果对这组数据进行x2独立性检验,问自由度df为()。
A.7B.6C.8D.5
42.数据32625629681的平均数为()。
A.4.55B.5C.5.9D.7
43.20道四选一的测验题,学生全凭猜测平均能做对多少道?
()
A.4B.15C.5D.8
44.有10名学生参加了100米和5000米的两项运动水平测试,经过数据的整理得到∑D2=45,这两项运动能力之间的等级相关系数是()。
A.0.27B.0.54C.0.65D.0.73
45.在假设检验中,α取值越大,称此假设检验的显著性水平()。
A.越高B.越低C.越明显D.越不明显
46.样本标准差的表示符号是()。
A.QB.M0C.σD.s
47.每一个观测值都乘以一个常数C后,则计算得到的标准差和方差,()。
A.标准差不变,方差等于原方差加上常数CB.标准差等于原标准差加上常数C,方差不变
C.标准差扩大C倍,方差扩大C的平方倍D.都不变
48.百分等级分数指出原始数据在常模团体中的相对位置,百分等级越大,原始数据在分布中的相对位置()。
A.越低B.越高C.不变D.无法确定
二、简答题
1.简答方差分析的基本条件。
2.二列相关适用于哪种资料?
3.简述点二列相关系数的应用条件。
4.简述t分布与标准正态分布的关系。
5.简述判断估计量优劣的标准。
6.什么是相关样本?
请列举相关样本显著性检验的各种情况。
7简述图形知觉的拓扑研究
8简述kahneman对人在不确定情景下的决策策略研
9.有人说:
“t检验适用于样本容量小于30的情况。
Z检验适用于大样本检验”,谈谈你对此的看法
10.什么是标准分数?
使用标准分数有什么好处?
11.方差分析是逻辑是什么?
12.如果有两个样本,一个是实验组,另一个对照组,分别施以两种教学方法,后期测验后如何对其成绩(百分制)进行统计检验,以确定两种教学方法有无显著差异?
13、完全随机设计的方差分析和随机区组设计的方差分析有什么区别?
14、什么是非参数检验?
它有什么特点?
15、为了建立最好的多元线性回归方程,一般采取什么方式选择自变量?
16.简答标准Z分数的用途。
17.简答χ2分布具有哪些特点。
18.简述区间估计的涵义。
19.简述正态分布的基本性质。
20.简述x2检验的应用条件
3.一次招工考试报考人数540,实际招工人数120,考试结果,成绩服从正态分布,平均分4.标准差15,若现要按实际录用人数1∶1.2的比例确定面试分数线,此分数应为多少?
5.医学上测定,正常人的血色素应该是每100毫升13克,在某学校进行抽查,26名学生血色素平均值
=14(克/100毫升),标准差S=2.0(克/100毫升),问该校学生的血色素与正常人的血色素是否有显著差异?
6..已知某校的一次考试全体考生成绩总体方差σ2=100,从中抽取5位考生的成绩为65,83,94,70,88,试求全体考生成绩均值μ的99%的置信区间。
7.某校历年招收新生都要测其IQ,历年新生的IQ服从正态分布,μ=110,σ2=100,今年抽取一个n=50的样本测验,测得其平均数为113,问今年新生的IQ同往年一样吗?
(α=0.05)
附:
(1)α=0.05,则Zα/2=1.96
(2)α=0.01,则Zα/2=2.58
(3)在正态分布表中,P=0.23333,则Z=0.6229
94,70,88,试求全体考生成绩均值μ的99%的置信区间。
8.有5名女生,物理测验成绩分别是68,69,70,71,72;另有7名男生,成绩分别是40,50,60,70,80,90,100。
现需要知道男女生成绩是否方差齐性,请计算相应的统计量。
(不需要查表)
9.某小学根据各方面条件基本相同的原则将32名学生配成16对,然后把每对学生随机分入实验组和对照组,实验组的16名学生参加课外科研活动,对照组的16名学生不参加此活动,一学期后统一进行理解能力测验。
结果发现,有9对学生的理解能力测验成绩明显打开了距离,其中有8对是实验组学生得到“及格”,对照组学生得到“不及格”;1对是对照组学生得到“及格”,实验组学生得到“不及格”。
问:
参加课外科研活动对理解能力测验成绩有无显著
10、有40人接受调查。
支持不支持
观看比赛前3010
观看比赛后1525
看比赛前后有否差异?
11.有一个持错误观点的博士生,认为只有研究检验达到显著性水平才会通过论文答辩,他自编了量表,希望发现正常人和有犯罪前科的人在量表得分上有显著差异,现在他有一个50人的正常人得分38,他可以在找到一个100人的有犯罪前科的大学生样本或者25人有犯罪记录的高中生样本,现知道前者可能来自总分为35的总体,后者来自30分,那么他应选哪个组?
(要写明计算过程,只写答案不给分)
12.研究人员对10个家庭的儿童的问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价,结果如下:
家庭12345678910
儿童得分72405287399512644946
母亲得分79625389819010827870
求X与Y的相关系数。
注:
X与Y的总体均不为正态
13.通过随机抽样,抽取了A、B两组被试,施以不同的教学方法,期末考试成绩如下:
A组:
119,110,132,106,121,120;
B组:
133,128,130,134,129,136,133;
为检验教学方法的效果有无显著差异,请计算必要的检验统计量。
(10%)
14、有3位教师对5位学生的作文进行等级评定,结果如下:
A生得到的等级评定分别是:
3、5、3;
B生得到的等级评定分别是:
1、2、2;
C生得到的等级评定分别是:
2、1、1;
D生得到的等级评定分别是:
2、3、2;
E生得到的等级评定分别是:
2、4、3;
请计算3位老师评定的肯德尔和谐系数。
(10%)
15、134个学生参加寒假长跑训练,开学后发现,长跑成绩显著进步(由不及格变成及格)的有38人,显著退步(由及格变成不及格)的有19人,问长跑训练有无显著效果?
(5%)
16、100名学生的数学成绩和语文成绩之间的斯皮尔曼等级相关系数为0.78,问,二者从总体上说是否存在相关?
(5%)
17.已知某班A、B两门课的考试成绩服从正态分布,A课程平均分为86,标准差为12;B课程平均分为82,标准差为14。
而小东A课程成绩92分,B课程成绩88分;小红A课程成绩88分,B课程成绩92分。
问小东和小红A、B两课程考试总分在班里的相对位置谁更高?
18.某心理学家认为一般人的视反应时平均170毫秒,有人随机抽取37名汽车司机进行测试,结果平均175毫秒,标准差25毫秒。
问汽车司机的视反应时与一般人的视反应时有无显著差异?
19.某校高考考生语文科平均分为63分,标准差为11分,数学科平均分为75分,标准差为12分,试比较该校考生哪一科离散程度大。
20.对某地区大量的初中三年级学生实施标准化的语文、数学、外语测验,所得的三科原始分数都服从正态分布,全体考生各科平均数、标准差与该年级某考生的成绩如下表,问该生这三科成绩哪一科最好?
科目全体考生
语文原始分数平均数标准差
81.5
8
85
数学
89.5
13
92
外语
72.5
9
75
21.某次语文考试成绩服从正态分布,σ2=81,从中抽取n=25的样本,计算得其平均分为58,试估计总体平均数μ的0.95的置信区间。
22.全市统一考试的数学平均分为62分,标准差为10.2,该市一个学校的90名学生在这次考试中的平均成绩为68分,问该校成绩与全市平均成绩差异是否显著?
(α=0.05)
重要概念
1、总体:
具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体
2、样本:
由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本
3、参数:
描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到
4、统计量:
描述样本的数值,与参数的获得方式相同
5、协方差
6、中心极限定理
7、决定系数
8、车比雪夫定理
9、描述统计
10、推论统计
11、标准误
12、统计检验力
13、α错误、β错误
简述题
1、区间估计的基本原理
2、标准分数的运用
3、标准差的运用
4、方差分析的基本假定
5、算术平均数的优缺点
6、中数的优缺点
7、众数的优缺点
8、回归分析的基本假定
9、斯皮尔曼等级相关的适用资料
10、样本容量的影响因素
具体内容
一、描述统计
描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。
(二)集中量数
集中量数又叫集中趋势,是体现一组数据一般水平的统计量。
它能反映频数分布中大量数据向某一点集中的情况。
1.算数平均数
(1)定义
算数平均数:
即所有观察值的总和与总频数之商,简称为平均数或均数
(2)特点
①在一组数据中每个变量与平均数之差的总和等于零
②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C
③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C
(3)意义
算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。
(4)优缺点
优点:
反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响
缺点:
易受极端数据的影响、不能在出现模糊数据时计算
2.中数
(1)定义
中数:
按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小
等价于百分位数是50的那个数。
(2)算法
①数列总个数为奇数时,第(n+1)/2个数就是中数
②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数
③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法
(3)优缺点
优点:
计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用
缺点:
代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算
3.众数
(1)定义
众数:
在次数分布中出现次数最多的那个数的数值
众数可能不只一个。
在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间。
(2)优缺点
优点:
能在数据不同质的情况使用,能避免极端值干扰缺点:
不稳定、代表性差、不够灵敏、不能做进一步的代数运算
(三)差异量数
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1.离差与平均差
离差:
分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离
离差之和始终为零。
平均差:
次数分布中所有原始数据与平均数绝对离差的平均值
2.方差与标准差
(1)总体的方差和标准差
方差:
每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数
标准差:
方差的平方根
(2)样本的方差和标准差
(3)性质
①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差
②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数
(4)意义
方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:
反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了
3.变异系数
当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。
①两个或两个以上样本所使用的观测工具不同,所测的特质相同
②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大
差异系数:
一种最常用的相对差异量,为标准差对平均数的百分比
(四)相对量数
1.百分位数
百分位数:
在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数
百分位数和百分等级是同一操作定义的两端。
当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级。
2.百分等级
百分等级:
常模团体中低于该分数的人所占总体的百分比
百分等级一定要对应分数区间的精确上限。
百分等级和百分位数都可以由已知数据用差值法求解。
3.标准分数
(1)定义
标准分数:
以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数
离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。
(2)性质
①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量
②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零
③原始数据的Z分数的标准差为1
④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布
(3)优点
①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较
②可加性——不同性质的原始数据具有相同的参照点,因此可相加
③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级
④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样
(4)应用
①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低
②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置
③若标准分数中有小数、负数等不易被人接受的问题,可通过Z'=aZ+b的线性公式将其转化成新的分数(如韦氏成人智力量表)
(五)相关量数
相关系数:
两列变量间相关程度的数字表现形式
作为样本的统计量用r表示,作为总体参数一般用ρ表示。
正相关:
两列变量变动方向相同
负相关:
两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动
零相关:
两列变量之间没有关系,各自按照自己的规律或无规律变化
1.积差相关
也就是Pearson相关。
(1)前提
①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立
②两列变量各自总体的分布都是正态的,至少接近正态
③两个相关的变量是连续变量,也即两列数据都是测量数据
④两列变量之间的关系应是直线性的
(2)公式
2.等级相关
也就是Spearman相关
(1)适用范围
①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据
②当研究考察的变量为非线性数据时
(2)公式
将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可。
3.肯德尔等级相关
(1)肯德尔W系数
也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。
其原理是评价者评价的一致性除以最大变异可能性。
(2)肯德尔U系数#
其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较
4.点二列相关与二列相关
(1)点二列相关
适用于一列数据为等距正态变量,另一列为离散型二分变量。
是与二分称名变量的一个值对应的连续变量的平均数
是与二分称名变量的另一个值对应的连续变量的平均数
p与q是二分称名变量两个值各自所占的比率
st是连续变量的标准差