13.下列关于“回归分析和相关分析的关系”的说法中不正确的是( )
A.回归分析可用于估计和预测
B.相关分析是研究变量之间的相互依存关系的密切程度
C.相关分析不需区分自变量和因变量
D.回归分析是相关分析的基础
14.相关比率测量法是以( )作为预测的准则
A.众值 B.标准差 C.均值 D.每对个案的相对等级
得分
评卷人
二、多项选择题,至少两个答案正确,少选,多选给零分计算。
(在答题栏中填上正确选项的序号,每小题2分,共16分)
题号
1
2
3
4
5
6
7
8
答案
BCE
CE
BCD
ABCE
ABCDE
ABE
BC
ACE
1.下列变量中属于定类层次的是( )
A、教育程度 B、专业 C、班级 D、考试分数 E、学号
得分
评卷人
2.下列基本技术中不适用于分类数据的是( )
A.比例 B.比率 C.累加百分率 D.饼图 E.散点图
3.数据离散程度的测度值中,不受极端值影响的是( )
A.全距(课本第59页) B.异众比率 C.四分位差 D.十分位差 E.标准差
4.下列关于消减误差比例的说法正确的有( )
A.可适用于变量的各测量层次
B.可适用于对称或不对称的两变量
C.取值范围是[0,1]
D.E1表示在知道X的情况下,预测Y所产生的全部误差
E.如果E1=E2,则反映X与Y无相关
5.下列关于Gamma系数的说法正确的有( )
A.是一种对称测量
B.Ns和Nd相差越大,两个变量的相关越强
C.Ns和Nd相差越小,两个变量的相关越弱
D.以每对个案之间的相对等级作为预测的准则
得分
评卷人
E.一般Gamma系数比dy系数大
6.以下系数中具有消减误差比例意义的有( )
A.λ系数 B.Gamma系数 C.eta系数(E) D.回归系数 E.r2
7.简单线性回归分析中的回归系数b可以表示( )
A、两个变量之间相关关系的密切程度
B、两个变量之间相关关系的方向
C、当自变量增减一个单位时,因变量平均增减的量
D、当因变量增减一个单位时,自变量平均增减的量
E、回归模型的拟合优度
8.相关比率可以分析( )A.一个定类变量与一个定距变量
B.一个定类变量与一个定序变量
C.一个定序变量与一个定距变量
D.两个定序变量
E.两个定距变量的非线性关系
三、判断题(在括号中填上“√”或“×”,每小题1分,共10分)
[ √]1.某电视台抽取100人进行民意调查,发现其中有55人支持普选,支持率为55%。
这里体现的是描述统计法。
[ ×]2.定序测量层次的变量肯定不能用众值测量。
[ √]3.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。
[ ×]4.标准差愈大,表明该总体的中位值的代表性愈差。
[ √]5.若某同学英语考试成绩的标准值为零,则表示他的成绩正好等于平均分数。
[ ×]6.PRE值越小,用X预测Y所产生的误差就越小,说明X与Y的相关程度就越高。
[ √]7.在次数表中,如果是以同序对为主,则表示变量X和变量Y呈正相关。
[ ×]8.积矩相关系数r=0表示X与Y不相关。
[ ×]9.Eta系数测量要求自变量为定距或以上测量层次,因变量为定类测量层次。
[ ×]10.回归系数是一种对称测量。
三、简答题(每小题5分,共15分)
1.举例简要说明社会研究过程。
例如:
(答案不唯一,有举例解释2分,研究过程3分)
1.确定课题:
研究某国公民犯罪与否与其文化程度的关联性
2.初步探索:
通过查阅文献
3.建立假设:
文化程度越低,越容易犯罪
4.理论解释和澄清概念:
文化程度定义为受学校教育的年限
5.设计问卷 6.试填问卷 7.调查实施 8.资料整理:
问卷的核对、登录
9.统计分析与命题检验
2.条形图(长条图)和直方图(矩形图)有什么区别?
1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的(2分)2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义(2分)3.直方图的各矩形通常是连续排列,条形图则是分开排列(1分)
或:
直方图用于定距以上测量层次的数据,条形图用于定类数据(1分)
3.简述相关分析和回归分析之间的联系。
一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。
相关程度越高,回归预测越准确。
因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。
(2分,只要体现相关分析是回归分析的前提和基础即可)
与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数r的PRE性质。
回归分析可用于估计和预测,而相关分析从本质上讲只是对客观事物的一种描述,不知道变量间是否有因果关系。
因而从分析层次上讲,回归分析更深刻一些。
(3分,只要体现回归分析是相关分析的深入/表现相关的具体数量关系即可)
得分
评卷人
四、计算题(要求写出过程,结果保留两位小数,共4题,第一题15分,第二题和第三题各9分,第四题12分,共45分)
1.岭南师范学院社会工作专业某班学生的统计学成绩如下表所示。
(直接用标示上/下限即可,不用考虑真实上/下限)求:
(1)在表中写上:
①组中值②累加频数③累加频率;[3分]
(2)计算①均值②第一四分位数(Q1)③离异比率④方差 [12分]
某班同学统计学成绩分组数据表
按成绩分组(分)
人数(个)
组中值
累加频数
累加频率
60分以下
2
55
2
6.67%
60~70
7
65
9
30%
70~80
9
75
18
60%
80~90
7
85
25
83.3%
90~100
5
95
30
100%
合计
30
1.
2.N/4=7.5,所以Q1所在组为60-70
2.v=(n-fmo)/n=(30-9)/30=0.7
3.
2.某公司招聘职员时,要求对职员进行两项基本能力测试。
已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。
一位应试者在A项测试中得了102分,在B项测试中得了215分。
若两项测试的成绩均服从正态分布,
(1)该位应试者哪一项测试更理想?
[5分]
(2)若B项测试的合格通过率为30%,该应试者能否合格通过?
[4分]
(1)
(2分)
(2分)
>
,所以A项测试更理想(1分)
(2)P(X>215)=0.5-P(X<215)=0.5-P(0.6)=0.5-0.2257=0.2743<30%(3分)
所以能合格通过(1分)
3.随机调查某地区中学生的升学意愿,得到结果如下表。
试对学生类型与升学意愿两者之间的关系进行测量并简略提出研究结论。
(9分)
两类中学生的升学意愿(%)
学生类型
升学意愿
城市中学生
农村中学生
想考大学
不想考大学
78.6
21.4
65.9
34.1
(合计)
(309) (44)
解:
上表可变成以下的次数分布表(3分):
学生类型
升学意愿
城市中学生
农村中学生
想考大学
不想考大学
243(=309*78.6%)
66(=309*21.4%)
29(=44*65.9%)
15(=44*34.1%)
(合计)
(309) (44)
(学生类型与升学意愿两者都是二分变量,所以都可以看做定类或者定序的变量。
此处应为不对称关系。
因此,用tau-y系数、Gamma系数或Q系数都行,但用Lambda系数的要酌情扣1-3分)
Tau-y=(E1-E2)/E1=124.83-123.59/124.83=0.01
G(或Q)=(243*15-29*66)/(243*15-29*66)=0.31 (5分,其中选对系数2分,公式和正确数字代入2分,结果1分)
研究结论:
学生类型与升学意愿两者有较弱的(正)相关关系,用学生类型预测升学意愿可以消减1%(或31%)的误差(1分)