现代心理与教育统计学课后题完整版.docx
《现代心理与教育统计学课后题完整版.docx》由会员分享,可在线阅读,更多相关《现代心理与教育统计学课后题完整版.docx(31页珍藏版)》请在冰豆网上搜索。
现代心理与教育统计学课后题完整版
第一章绪论
1.名词解释
随机变量:
在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量
总体:
又称为母全体、全域,指据有某种特征的一类事物的全体
样本:
从总体中抽取的一部分个体,称为总体的一个样本
个体:
构成总体的每个基本单元称为个体
次数:
指某一事件在某一类别中出现的数目,又成为频数,用f表示
频率:
又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示
概率:
又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率
统计量:
样本的特征值叫做统计量,又叫做特征值
参数:
总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标
观测值:
在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据
2.xx心理与教育统计学?
学习它有何意义
心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤?
首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的
其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要
第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件
4.什么叫随机变量?
心理与教育科学实验所获得的数据是否属于随机变量
随机变量的定义:
①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量
5.怎样理解总体、样本与个体?
总体N:
据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
特点:
①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定
样本n:
从总体中抽取的一部分交个体,称为总体的一个样本。
样本数目用n表示,又叫样本容量。
特点:
①样本容量越大,对总体的代表性越强②样本不同,统计方法不同
总体与样本可以相互转化。
个体:
构成总体的每个基本单元称为个体。
有时个体又叫做一个随机事件或样本点
6.xx次数、频率及概率
次数f:
随机事件在某一类别中出现的数目,又称为频数,用f表示
频率:
即相对次数,即某个事件次数被总事件除,用比例、百分数表示
概率P:
又称机率或然率,用P表示,指某事件在无限管侧重所能预料的相对出现次数。
估计值(后验):
几次观测中出现m次,P(A)=m/n
真实值(先验):
特殊情况下,直接计算的比值(结果有限,出现可能性相等)
7.统计量与参数之间有何区别和关系?
参数:
总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标
统计量:
样本的特征值叫做统计量,又称特征值
二者关系:
参数是一个常数,统计量随样本而变化
参数常用希腊字母表示,统计量用英文字母表示
当试验次数=总体大小时,二者为同一指标
当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值
8.试举例说明各种数据类型之间的区别?
9.下述一些数据,哪些是测量数据?
哪些是计数数据?
其数值意味着什么?
17.0千克89.85厘米199.2秒93.5分是测量数据
17人25本是计数数据
10.说明下面符号代表的意义
μ反映总体集中情况的统计指标,即总体平均数或期望值
反映样本平均数
ρ表示某一事物两个特性总体之间关系的统计指标,相关系数
r样本相关系数
σ反映总体分散情况的统计指标标准差
s样本标准差
β表示两个特性中体之间数量关系的回归系数
N
n
第二章统计图表
1.统计分组应注意哪些问题?
1分类要正确,以被研究对象的本质为基础
2分类标志要明确,要包括所有数据
3如删除过失所造成的变异数据,要遵循3σ原则
2.直条图适合哪种资料?
条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。
3.圆形图适合哪种资料
又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较,显示的资料多以相对数(如百分数)为主
4.将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。
177.5
167.4
116.7
130.9
199.1
198.3
225.0
212.0
180.0
171.0
144.0
138.0
191.0
171.5
147.0
172.0
195.5
190.0
206.7
153.2
217.0
179.2
242.2
212.8
171.0
241.0
176.5
165.4
201.0
145.5
163.0
178.0
162.0
188.1
176.5
172.2
215.0
177.9
180.5
193.0
190.5
167.3
170.5
189.5
180.1
217.0
186.3
180.0
182.5
171.0
147.0
160.5
153.2
157.5
143.5
148.5
146.4
150.5
177.1
200.1
137.5
143.7
179.5
185.5
181.6
最大值242.2最小值116.7全距为125.5
N=65代入公式K=1.87(N-1)2/5=9.8所以K取10
定组距13最低组的下限取115
表2-1次数分布表
分组区间
组中值(Xc)
次数(f)
频率(P)
百分次数(%)
232~
238
2
0.03
3
219~
225
1
0.02
2
206~
212
6
0.09
9
193~
199
6
0.09
9
180~
186
14
0.22
22
167~
173
16
0.25
25
154~
160
5
0.08
8
141~
147
11
0.17
17
128~
134
3
0.05
5
115~
121
1
0.02
2
合计
65
1.00
100
表2-2累加次数分布表
分组区间
次数(f)
向上累加次数
向下累加次数
实际累加次数(cf)
相对累加次数
实际累加次数(cf)
相对累加次数
232~
2
65
1.00
2
0.03
219~
1
63
0.97
3
0.05
206~
6
62
0.95
9
0.14
193~
6
56
0.86
15
0.23
180~
14
50
0.77
29
0.45
167~
16
36
0.55
45
0.69
154~
5
20
0.31
50
0.77
141~
11
15
0.23
61
0.94
128~
3
4
0.06
64
0.98
115~
1
1
0.02
65
1.00
7.下面是一项xxxx打工方式的调查结果。
根据这些数据用手工方式和计算方式个制作一个条形图。
并通过自己的体会说明两种制图方式的差别和优缺点
打工方式
高二(%)
高三(%)
看护孩子
26.0
5.0
商店销售
7.5
22.0
餐饮服务
11.5
17.5
其他零工
8.0
1.5
左侧Y轴名称为:
打工人数百分比
下侧X轴名称为:
打工方式
第三章集中量数
1.应用算术平均数表示集中趋势要注意什么问题?
应用算术平均数必须遵循以下几个原则:
1同质性原则。
数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。
2平均数与个体数据相结合的原则
3平均数与标准差、方差相结合原则
2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?
中数适用于:
①当一组观测结果中出现两个极端数目时②次数分布表两端数据或个别数据不清楚时③要快速估计一组数据代表值时
众数适用于:
①要快速且粗略的求一组数据代表值时②数据不同质时,表示典型情况③次数分布中有两极端的数目时④粗略估计次数分布的形态时,用M-Mo作为表示次数分布是否偏态的指标(正态:
M=Md=Mo;正偏:
M>Md>Mo;负偏:
M几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态②等距、等比量表实验③平均增长率,按一定比例变化时
调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间②学习时间一定,记录一定时间内各被试完成的工作量
3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?
并计算它们的值。
⑴4566729中数=6
⑵345575众数=5
⑶2356789平均数=5.71
4.求下列次数分布的平均数、中数。
分组
f
分组
f
65~
1
35~
34
60~
4
30~
21
55~
6
25~
16
50~
8
20~
11
45~
16
15~
9
40~
24
10~
7
解:
组中值由“精确上下限”算得;设估计平均值在35~组,即AM=37;中数所在组为35~,fMD=34,其精确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=64
分组
f
组中值
d=(Xi-AM)/i
fd
65~
1
67
6
6
60~
4
62
5
20
55~
6
57
4
24
50~
8
52
3
24
45~
16
47
2
32
40~
24
42
1
24
35~
34
37
0
0
30~
21
32
-1
-21
25~
16
27
-2
-32
20~
11
22
-3
-33
15~
9
17
-4
-36
10~
7
12
-5
-35
∑N=157
∑fd=-27
5.求下列四个年级的总平均成绩。
年级
一
二
三
四
90.5
91
92
94
n
236
318
215
200
解:
6.三个不同被试对某词的联想速度如下表,求平均联想速度
被试
联想词数
时间(分)
词数/分(Xi)
A
13
2
13/2
B
13
3
13/3
C
13
25
-
解:
C被试联想时间25分钟为异常数据,删除
7.下面是某校几年来毕业生的人数,问平均增加率是多少?
并估计10年后的毕业人数有多少。
年份
1978
1979
1980
1981
1982
1983
1984
1985
毕业人数
542
601
750
760
810
930
1050
1120
解:
用几何平均数变式计算:
所以平均增加率为11%
10年后毕业人数为1120×1.1092510=3159人
8.计算第二章习题4xx次数分布表资料的平均数、xx数及原始数据的平局数。
解:
组中值由“精确上下限”算得;设估计平均值在167~组,即设AM=173;中数所在组为167~,fMD=16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20
分组区间
组中值(Xc)
次数(f)
d=(Xi-AM)/i
fd
232~
238
2
5
10
219~
225
1
4
4
206~
212
6
3
18
193~
199
6
2
12
180~
186
14
1
14
167~
173
16
0
0
154~
160
5
-1
-5
141~
147
11
-2
-22
128~
134
3
-3
-9
115~
121
1
-4
-4
合计
∑N=65
∑fd=18
平均值
中数
原始数据的平均数=176.8
第四章差异量数
1.度量离中趋势的差异量数有哪些?
为什么要度量离中趋势?
度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。
在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。
因此只有集中量数不可能真实的反映出样本的分布情况。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2.各种差异量数各有什么特点?
见课本103页“各种差异量数优缺点比较”
3.标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?
可以计算差异系数(应用)和标准分数(应用)
4.应用标准分数求不同质的数据总和时应注意什么问题?
要求不同质的数据的次数分布为正态
5.计算下列数据的标准差与平均差
11.013.010.09.011.512.213.19.710.5
6.计算第二章习题4所列次数分布表的标准差、四分差Q
设估计平均值在167~组,即AM=173,i=13
分组区间
Xc
f
d=(Xc-AM)/i
fd
fd2
232~
238
2
5
10
50
219~
225
1
4
4
16
206~
212
6
3
18
54
193~
199
6
2
12
24
180~
186
14
1
14
14
167~
173
16
0
0
0
154~
160
5
-1
-5
5
141~
147
11
-2
-22
44
128~
134
3
-3
-9
27
115~
121
1
-4
-4
16
合计
65
18
250
N=6565×25%=16.2565×75%=48.75所以Q1、Q3分别在154~组(小于其组精确下限的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36),其精确下限分别为153.5和179.5,所以有:
7.今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm,10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比较其离散程度的大小?
并具体比较之。
用差异系数来比较离散程度。
CV1=(s1/)×100%=(0.7/1.3)×100%=53.85%
CV2=(s2/)×100%=(1.2/4.3)×100%=27.91%所以标准线为5cm的离散程度大。
8.求下表所列各班成绩的总标准差
班级
平均数
标准差
人数
di
1
90.5
6.2
40
0.3
2
91.0
6.5
51
-0.2
3
92.0
5.8
48
-1.2
4
89.5
5.2
43
1.3
其值见上表
即各班成绩的总标准差是6.03
9.求下表数据分布的标准差和四分差
设估计平均数AM=52,即在50~组,d=(Xc-AM)/I计算各值如下表所示:
分组
f
Xc
累加次数
d
d2
fd2
fd
75~80
1
77
55
5
25
25
5
70~
2
72
54
4
16
32
8
65~
4
67
52
3
9
36
12
60~
5
62
48
2
4
20
10
55~
8
57
43
1
1
8
8
50~
10
52
35
0
0
0
0
45~
9
47
25
-1
1
9
-9
40~
7
42
16
-2
4
28
-14
35~
4
37
9
-3
9
36
-12
30~
2
32
5
-4
16
32
-8
25~
2
27
3
-5
25
50
-10
20~
1
22
1
-6
36
36
-6
合计
55
312
-16
55×25%=13.7555×75%=41.25所以Q1在40~组,其精确下限Lb1=39.5,小于其组的次数为Fb1=9,其组次数f1=7;Q2在55~组,其精确下限Lb2=54.5,小于其组的次数为Fb2=35,其组次数f2=8。
计算Q1、Q2如下:
即四分位差为7.76
第五章相关关系
1.解释相关系数时应注意什么?
(1)相关系数是两列变量之间相关xx的数字表现形式,相关程度指标有统计特征数r和总体系数ρ
(2)它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比r小相关密切,不能说r大=0.8是r小=0.4的两倍(不能用倍数关系来解释)
(3)当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值
(4)-1≤r≤1,正负号表示相关方向,值大小表示相关程度;(0为无相关,1为完全正相关,-1为完全负相关)
(5)相关系数大的事物间不一定有因果关系
(6)当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象
(7)计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算
(8)非线性相关的用r得可能性小,但并不能说不密切
2.假设两变量为线性关系,计算下列各情况的相关时,应用什么方法?
(1)两列变量是等距或等比的数据且均为正态分布(积差相关)
(2)两列变量是等距或等比的数据且不为正态分布(等级相关)
(3)一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关)
(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关)
(5)一变量为正态等距变量,另一列变量为二分称名变量(点二列相关)
(6)两变量均以等级表示(等级相关、交错系数、相容系数)
3.如何区分点二列相关与二列相关?
主要区别在于二分变量是否为正态。
二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。
4.品质相关有哪几种?
各种品质相关的应用条件是什么?
品质相关分析的总条件是两因素多项分类之间的xx程度,分为一下几类:
(1)四分相关,应用条件是:
两因素都为正态连续变量(eg.学习能力,身体状态))人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况
(2)Φ系数:
除四分相关外的2×2表(最常用)
(3)xx表相关C:
R×C表的计数资料分析相关程度
5.预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?
等级相关
6.下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?
被试
A
B
A2
B2
AB
RA
RB
RARB
D=RA-RB
D2
1
86
83
7396
6889
7138
2
3
6
-1
1
2
58
52
3364
2704
3016
7
8
56
-1
1
3
79
89
6241
7921
7031
4
1
4
3
9
4
64
78
4096
6084
4992
6
4
24
2
4
5
91
85
8281
7225
7735
1
2
2
-1
1
6
48
68
2304
4624
3264
9
6
54
3
9
7
55
47
3025
2209
2585
8
9
72
-1
1
8
82
76
6724
5776
6232
3
5
15
-2
4
9
32
25
1024
625
800
10
10
100
0
0
10
75
56
5625
3136
4200
5
7
35
-2
4
∑
670
659
48080
47193
46993
55
55
368
34
或
用积差相关的条件成立,故用积差相关更精确
7.下列两列变量为非正态,选用恰当的方法计算相关
本题应用等级相关法计算,且含有相同等级
X有3个数据的等级相同,等级3.5的数据中有2个数据的等级相同,等级为6.5和8.5的数据中也分别有2个数据相同;Y有3个数据等级相同,等级为3的数据中有3个数据等级相同,等级为5.5的数据中有2个数据等级相同,等级为9的数据中有3个数据等级相同。
被试
X
Y
RX
RY
D=RX-RY
D2
1
13
14
1
1
0
0
2
12
11
2
3
-1
1
3
10
11
3.5
3
0.5
0.25
4
10
11
3.5
3
0.5
0.25
5
8
7
5
5.5
-0.5
0.25
6
6
7
6.5
5.5
1
1
7
6
5
6.5
7
-0.5
0.25
8
5
4
8.5
9
-0.5
0.25
9
5
4
8.5
9
-0.5
0.25
10
2
4
10
9
1
1
N=10
4.5
8.问下表中成绩与性别是否相关?
被试
性别
成绩
男成绩
女成绩
成绩的平方
1
男
83
83
6889
2
女
91
91
8281
3
女
95
95
9025
4
男
84
84
7056
5
女
89
89
7921
6
男
87
87