完整版心里统计课后习题16章习题解答.docx
《完整版心里统计课后习题16章习题解答.docx》由会员分享,可在线阅读,更多相关《完整版心里统计课后习题16章习题解答.docx(28页珍藏版)》请在冰豆网上搜索。
完整版心里统计课后习题16章习题解答
统计学参考答案
第01章习题解答
1.随机变量:
某一变量在实验、调查和观测之前,不能预知其数值的变量。
随机变量的特点是:
离散性、变异性、规律性。
总体(population)又叫“母体”,是指具有某一种特征的一类事物的全体。
个体亦称“单位”、“样品”,统计学术语,统计学术语指总体中的每一个单位、样品或成员。
是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。
在心理学研究中,个体根据研究目的的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
在总体中按照一定的规则抽取的部分个体,称为总体的一个样本(sample)。
根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。
根据两样本来自的两总体是相关还是独立,可分为相关样本和独立样本。
次数:
某一随机事件在某一类别中出现的数据多少,亦称频数(frequency)。
频率:
某一事件发生的次数与总事件的比率。
概率(probability):
某随机事件在某一总体中出现的比率。
表示样本的数字特征的量叫统计量。
如描述数据集中趋势的一些统计指标称为平均数;描述一组数据离散程度的统计指标称为标准差。
表示总体的数字特征的量叫参数。
如反应总体集中情况的统计指标称为总体平均数;反应总体离散程度的统计指标称为标准差。
观测值(observation):
实验、调查和观测某些个体在某一变量上的具体的数值,即为观测值。
2.何谓心理与教育统计学?
学习它有何意义?
心理与教育统计学是专门研究如何搜集、整理、分析在心理教育方面由实验和调查所获得的数据资料,并如何根据这些数字所传递的信息,进行科学推论找出客观规律的一门学科。
它是应用数理统计学的一个分支,是心理与教育研究中的科学工具。
意义:
(1)研究心理与教育现象变化的统计规律;
(2)为心理与教育研究提供科学的依据;(3)促进量化研究的发展……
3.选用统计方法有哪几个步骤?
(1)实验或调查设计是否合理,即所获得的数据是否适合用统计方法去处理,正确将其数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的;
(2)要分析实验或调查数据的类型,不同数据类型所使用的统计方法有很大差别,针对不同的数据类型选用与之相应的统计方法至关重要;(3)要分析数据的分布规律,看数据是正态分布还是非正态分布,方差是否已知,以及是大样本数据还是小样本数据。
4.随机变量:
某一变量在实验、调查和观测之前,不能预知其数值的变量。
随机变量的特点是:
离散性、变异性、规律性。
心理与教育科学实验所获的数据大多是随机变量。
5.总体(population)是指具有某一种特征的一类事物的全体;如研究大学生的心理健康状况,全国的大学生即为总体。
构成总体的每一个基本元素叫个体;如具体的每一个大学生即为个体。
在总体中按照一定的规则抽取的部分个体,称为总体的一个样本(sample)。
如湖北师范学校的大学生就为其中一个样本。
6.表示样本的数字特征的量叫统计量。
如描述数据集中趋势的一些统计指标称为平均数;描述一组数据离散程度的统计指标称为标准差。
表示总体的数字特征的量叫参数。
如反应总体集中情况的统计指标称为总体平均数;反应总体离散程度的统计指标称为标准差。
联系:
参数通常通过样本的特征值来预测,已知总体的某一参数时,即可知道样本的随机变量的分布特点,当样本容量越来越大时,样本统计量与总体参数之间的误差会越来越小。
区别:
统计量表示样本的数据特征,参数反映的总体的状况;统计量是变量而参数是常量;统计量和参数所用的表示字母不同。
7.
(1)计数数据和测量数据:
计数数据指具有某一属性的个体的数目,一般都取整数是离散数据;测量数据借助测量工具获取的数据,是连续数据。
(2)称名数据、顺序数据、等距数据、等比数据。
称名数据说明一事物与它事物在属性上的不同或类别上的差异,一般取整数只计算个数不说明事物之间的差异大小。
顺序数据是按次序对事物进行排序后所获得的数据,没有相等的单位和绝对的0点,不能说明事物之间的差异大小,不能进行加减乘除运算。
等距数据有相等的单位,无绝对的0点的数据,能作加减运算,不能做乘除运算。
等比数据是有相等的单位又有绝对0点的数据,能进行加减乘除运算。
(3)离散数据与连续数据:
离散数据一般取整数是不连续的数据,任意两点之间不能无限细分;连续数据的任意两个相邻数据之间可以无限细分。
8.
(1)
(2)(3)(6)是测量数据,(4)(5)是计数数据
9.
统计指标
统计量
参数
平均数
μ
标准差
S
σ
相关系数
r
ρ
回归系数
b
β
10.
(1)心理统计是将心理现象以数据的形式进行量化
(2)心理统计是有用的,反映所研究的心理变量的变化的规律性
(3)统计不是万能的,统计所得出的结论会有一定的偏差
(4)进行统计分析时,一定要依据数据类型选择正确的统计方法,作结论时一定要小心谨慎。
……
Chapter021.统计分组应注意哪些问题?
答:
进行统计分组进需要注意下列问题:
(1)分组要以被研究对象的本质特性为基础
面对大量原始数据进行分组进,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的本质有关的特性为依据,才能确保分类或分组的正确。
在心理学与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要作用。
例如在学业成绩研究中按学科性质分类,在整理智力测验结果时,按言语智力、操作智力和总的智力分数分类等。
(2)分类标志要明确,要能包括所有的数据
对数据进行分组时,所依据的特性称为分组或分类的标志。
整理数据时,分组标志要明确并且在整理数据的过程中前后一致。
这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。
另外,所依据的标志必须能将全部数据包括进去,不能有遗漏,也不能中途改变。
2.直条图适合哪种资料?
自选数据绘制直条图。
直条图又叫条形图(barcharts),主要用于表示离散型数据资料,即计数资料。
它是以条形的长短表示各事物间数量的大小与数量之间的差异情况。
条形图中一个轴是分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据,在这个轴上数据单的大小取决于原始数据。
条形图因使用的条形形状不同而有多种名称,如矩形条图、梯形条图、尖形条图等,其中矩形图应用最多,一般说的条形图就是指这种矩形条形图、条形图又分为简单条形图、分组条形图和分段条形图三种。
条形图与直方图的区别如下:
①描述的数据类型不同。
条形图用来描述称名数据或计数数据,而直方图主要用来描述分组的连续数据;
②表示的数据多少的方式不同。
条形图用直条的长短或高低表示数据的多少和大小,而直方图用面积表示数据的多少和大小。
直方图的总面积与总次数相等。
③坐标轴上的标尺分点意义不同。
条形图的一个坐标轴是分类轴,而直方图的一个坐标轴上表示的是另一个刻度值。
图形直观开关形状不同。
绘图(略)
3.圆形图适合哪种资料?
自选数据绘制图形图。
圆形图又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较。
绘图(略)
4.答:
(1)求全距:
R=Xmax-Xmin=242.2-116.7=125.5
(2)确定组数和组距:
N=65代入公式K=1.87(N-1)2/5,得K=9.8,理论组数为10,组距为12.5,由于理论分组不能包括116.7,因此组数定为11,组距定为12.5
(3)列分组区间,登记与计算次数
分组区间
次数
1125.
1
125
1
137.5
10
150
6
162.5
11
175
16
187.5
9
200
4
212.5
4
225
1
237.5
2
合计
65
(4)编制次数分布表
表2-1 反应时的次数分布表
分组区间
组中值
次数
1125.
118.75
1
125
131.25
1
137.5
143.75
10
150
156.25
6
162.5
168.5
11
175
181.5
16
187.5
193.5
9
200
206.5
4
212.5
218.5
4
225
231.5
1
237.5
243.5
2
合计
65
(5)编制累积次数分布表
表2-2 反应时的累积次数分布表
分组区间
次数
向上累加次数
向下累加次数
f
实际累加次数
相对累加次数
实际累加次数
相对累加次数
1125.
1
65
1.00
1
0.02
125
1
64
0.98
2
0.03
137.5
10
63
0.97
12
0.18
150
6
53
0.82
18
0.27
162.5
11
47
0.73
29
0.44
175
16
36
0.56
45
0.69
187.5
9
20
0.31
54
.083
200
4
11
0.17
58
0.89
212.5
4
7
0.11
62
0.95
225
1
3
0.05
63
0.97
237.5
2
2
0.03
63
1.00
合计
65
5.统计全班学生的“身高”和“体重”,然后制作一个双列次数分布表。
××班学生“身高”和“体重”双列次数分布表
体重/kg
身高/cm
40-45-55-60-65-70-75--80
Yf
185-
180-
175-
170-
165-
160-
155-
Xf
6.7.(略)
Chapter31.应用算术平均数表示集中趋势要注意什么?
①数据必须同质。
同质指使用同一观测手段,采用相同的观测标准,能反映某一问题同一方面特质的数据。
因为不同质的数据观测手段、测量标准不一致。
②平均数与个体数据相结合。
在作出结论时,把总体的平均水平与个体数据结合起来会能更加说明问题。
③将平均数与标准差和方差结合。
平均数只是反映数据的集中趋势,而标准差和方差能够反映数据差异趋势,将二者结合起来才能全面准确的反映总体数据的分布特征。
④当出现极端数据或模糊数据时,用中数或众数表示数据的集中趋势会更好。
2.中数、众数、几何平均数、调和平均数各适合哪些资料?
①中数适用于:
一组观测数据中出现极端数据时;一组数据的两端有模糊数据出现;需要快速估计一组数据的代表值时。
②众数适用于:
当一组数据出现不同质的情况或分布中出现极端数据时;数据分布中出现双众数时。
③几何平均数主要适用于:
一组数据中有少量数据偏大或偏小,数据分布呈偏态分布;数据按一定的比例关系变化。
④调和平均数主要用于描述学习速度方面的问题。
3.对于下列数据,使用何种集中量数表示集中趋势更好?
并计算其值。
(1)4566729。
――>中数或众数6
(2)345575-------平均数,其值为5
(3)2356789――>平均数40/7=5.71
4.求下列次数分布的平均数、中数
5.求下列四个年级的总平均成绩
6.求平均联想速度:
答:
平均联想速度为1.3个
7.平均增加率是多少?
估计10年后毕业人数有多少
1120×1.1110=3180
答:
平均增长率为11%,10后毕业人数为3180人
Chapter4
1. 度量离中趋势的量有哪些?
为何要度量离中趋势?
度量离中趋势的量有全距、离均差、标准差或方差、全距、平均差、四分差及各种百分差。
要准确的反映一组数据的变化趋势,既要度量其集中趋势又要度量其离中趋势。
2.各种差异量数各有什么特点?
全距:
优点:
全距是最简单,最容易理解的差异量数;缺点:
不稳定、不可靠、不灵敏,受抽样变动的影响,是一种低效的差异量数。
平均差:
优点:
平均差是一个很好的差异量数,容易计算理解,说明全部数据的差异情况;缺点:
易受两极数据的影响,由于取绝对值应用受限制,不利于代数方法运算;不具备标准差的优越性不用于进一步的分析,故被列入低效差异量数。
标准差:
基本具备了良好的差异量数所具备的条件:
反映灵敏,每个数据的取值变化它们也随着变化;有一定的计算公式严密规定;容易计算;适合代数运算;受抽样变动的影响不大,即不同样本的标准差或方差比较稳定;简单明了。
缺点:
较难理解、计算复杂,易受极端数据影响。
方差:
优点:
可加,通过方差分析可以分辨不同来源的变异对总变异贡献的大小。
缺点:
较难理解、计算复杂,易受极端数据影响。
百分位差:
优点:
容易理解、计算、不受极端值影响;缺点:
不能反映其他数据的差异情况。
四分差:
优点:
计算简便,意义明确,对极端值不敏感;缺点:
不能反映所有数据的差异情况,受抽样变化的影响较大。
3. 标准差的其他用途
①和平均数一起,计算差异系数,即进行不同质数据的差异大小比较
②计算标准分数,将等级数据转化成等距数据,由此可知个体在群体的相对位置。
4.应用标准分数求不同质的数据总和时,应注意哪些问题?
(1)这些不同质的数据须服从正态分布;
(2)求各个标准分数的代数和;
(3)为了符合人们的习惯计算出Z分数的总和可以用10Z+50转化成T分数。
5.S=1.37;AD=1.19
6.S=26.3;Q1=159.1,Q3=192.45,Q=16.68.
7.解此题它们的平均数相差较大,故用差异系数比较其离散程度的大小
5厘米组的误差的离散程度大于10厘米组。
8.解
9解
所以四分差为Q=Q3-Q1/2=7.61175
Chaper5
1.解释相关系数时应注意什么?
相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。
相关系数的数值大小,表示两个变量关联的强弱。
相关系数即使是1,也不能推出因果关系的结论。
要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。
在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。
2.假设两变量为线性关系,计算下列各种相关应用什么方法?
(1)积差相关
(2)斯皮尔曼等级相关(3)二列相关
(4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数)
3.如何区别点二列和二列相关?
主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关
4.品质相关有几种?
各种品质相关的条件?
主要有四分相关、φ相关、列联表相关
四分相关:
当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时,求两个变量之间的相关。
Φ相关:
当两变量是真正(自然)的二分变量时,求两变量之间的相关。
列联相关:
当两个变量都是计数数据时,求它们的相关。
5.
用肯德尔和谐系数
6.将数据带入公式计算得:
解
7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数
8.解此题符合点二列相关的条件
成绩与性别有关,即男女生的成绩存在显著差异
9.此题该用二列相关求解
在某题上及格或不及格对总分的影响不大,亦即该题几乎没有区分度。
10.该题属于多列相关
11.下表是9名被试评价10名著名天文学家的等级评定结果,问这9名被试的等级评定是否具有一致性?
被试
被评价者
A
B
C
D
E
F
G
H
I
J
1
1
2
4
3
9
6
5
8
7
10
2
1
4
2
5
6
7
3
10
8
9
3
1
3
4
5
2
8
9
6
10
7
4
1
3
4
5
2
6
10
8
7
9
5
1
9
2
5
6
3
4
8
10
7
6
1
4
9
2
5
6
9
7
8
4
7
1
3
5
10
2
6
9
7
8
4
8
1
3
5
7
6
4
8
10
2
9
9
1
2
8
4
9
6
3
7
5
10
该题应求肯德尔和谐系数
其相关系数为0.481,说明对天文学家的等级评定一致性不高。
12解
对11题的数据两两进行比较形成对偶等级表,然后根据数据等级计算肯德尔U系数。
A
B
C
D
E
F
G
H
I
J
A
9
9
9
9
9
9
9
9
9
B
0
7
7
5
8
7
7
8
8
C
0
2
6
5
6
7
7
7
2
D
0
2
3
5
6
5
8
7
8
E
0
4
4
4
5
5
6
6
9
F
0
1
3
3
4
6
7
2
7
G
0
2
2
4
4
3
5
6
6
H
0
2
2
1
3
2
4
4
5
I
0
1
2
2
3
2
3
5
5
J
0
1
2
1
0
2
3
4
4
Chaper6
概率的定义与性质
反应随机事件出现可能性大小的统计指标即为概率。
概率有两类:
后验概率(统计概率):
指对随机事件进行n次观测时,其中某一事件出现的次数m与总的次数n的比值。
先验概率是指在特殊情况下,直接计算的比值。
这种特殊情况是:
(1)试验(基本事件)的每一种可能结果是有限的;
(2)每一个基本事件出现的可能性相等。
如果基本事件的总数为n,事件A包括m个基本事件,则事件A的概率为:
P(A)=m/n
概率的性质
有关概率的一些公理
(1)任何随机事件A的概率都是非负的。
(2)必然事件的概率为1,但是概率等于1的某个事件,并不能断定它是必然事件,只能说它出现的可能性非常大。
(3)不可能事件的概率为0,但是概率为0的事件,也不能说它是不可能事件,只能说它出现的可能性非常小,几乎接近于0。
(4)随机事件的概率介于0到1之间,越接近1说明发生的可能性很大,越接近0说明发生的可能性很小。
概率的加法定理:
是指两个互不相容事件A和B之和的概率,等于这两个事件的概率的和。
写作P(A+B)=P(A)+P(B)。
互不相容(非独立相关)事件:
是指在一次试验或者调查中,若事件A发生,事件B就一定不会发生,则事件A和B为互不相容事件。
由此可以推到出n个互不相容事件中去:
P(A1+A2+A3+…+An)=P(A1)+P(A2)+P(A3)+…+P(An)
概率的乘法定理:
两个独立事件同时出现的概率,等于两个事件概率的乘积。
独立(相容无关)事件是指一个事件的出现对另一个事件的出现不发生影响。
若A和B是两个相互独立的事件,则A和B同时发生的概率为:
P(A*B)=P(A)×P(B)。
由此推到n个独立事件同时发生的概率为:
P(A1A2…An)=P(A1)P(A2)…P(A3)。
2概率分布的类型?
简述其特点
概率分布是指对随机变量取值的概率分布情况用数学方法进行描述。
1.离散分布与连续分布
离散分布的随机变量是计数数据(离散数据)。
常用的离散分布为二项分布、泊松分布、超几何分布。
连续分布的随机变量是连续数据(测量数据)。
常见的连续分布为正态分布、负指数分布、威布尔分布。
2.经验分布与理论分布
经验分布是指根据观察和实验所得的数据而编制的次数分布或相对频数分布。
理论分布①指随机变量概率分布的函数(数学模型);②指依据某种数学模型推算出的总体的次数分布。
3.基本随机变量分布和抽样分布
基本随机变量分布有正态分布和二项分布。
抽样分布是样本统计量的理论分布。
3.何谓样本平均数的分布?
样本平均数的分布是指从基本随机变量为正态分布的总体中,采用放回式随机抽样的方法,每次从这个总体中抽取大小为n的一个样本计算出它的平均数(x1),然后将这些样本放回总体中,再次取n个个体,又可计算出一个(x2)……这样反复可以计算出无限多个x,这无限多个样本平均数的分布为正态分布。
4.0.35
5.1/36
6.6/25,9/25,4/25
7.2/27,13/54,13/545/27.
8.1/4,1/16,1/8,1/16,1/256.
9.该二项式为(1/5+4/5)25
平均数为标准差为
10-12(略)
13解
6σ/6=1σ,要使各个等级等距每个等级应占1个标准差的距离。
分组
各组界限
比率
人数
A
2σ以上
0.02275
23
B
1σ-2σ
0.13591
136
C
0σ-1σ
0.34134
341
D
―1σ―0σ
0.34134
341
E
―2σ-―1σ
0.13591
136
F
-2σ以下
0.02275
23
答:
略
14解
分组
组中值
f
上限以下累加
各组中点以下累加次数
累积百分比(%)
Z
正态化T分数
55
57
2
100
99
99
2.33
73.3
50
52
2
98
97
97
1.88
68.8
45
47
6
96
93
93
1.48
64.8
40
42
8
90
86
86
1.08
60.8
35
37
12
82
76
76
0.71
57.7
30
32
14
70
63
63
0.33
53.3
25
27
24
56
44
44
-0.15
48.5
20
22
12
32
26
26
-0.64
44.6
15
17
16
20
12
12
-1.17
39.3
10
12
4
4
2
2
-2.05
29.5
合计
100
15解
依题意有:
答:
略
16解
此题np>5,所以
所以作对32题以上是真会而不是猜测。
17解此题P=1/15
该题np<5,所以
猜测答对的平均6题(95%的概率)
18此题np<5所以
须5个以上才是真能看清
19.略(和上面的题是类型题)
20.解
按照录取率20个学生,只有8人能被录取。
所以至少有10人被录取的概率为8/10=80%。
随着录取人数的增多,录取概率随着下降。
21-23略
24.解
Z以上的概率为0.5-0.34134=0.15866
25由于总体方差未知用样本的标准差作为总体的代表值,所以
,大于该平均数的概率为:
0.5-0.19146=0.30854
26.查表可知df=7时,卡方为12以上的概率为0.1,以下的概率为0.9
27.此题须先计算卡方值
以df=14查表得:
概率值为0.25,所以该卡方值以下的概率为0.75
28该题须先求样本标准差
以自由度为9查表得:
P=0.25,所以该卡方值以