社会统计学与spss应用练习题Word下载.docx
《社会统计学与spss应用练习题Word下载.docx》由会员分享,可在线阅读,更多相关《社会统计学与spss应用练习题Word下载.docx(16页珍藏版)》请在冰豆网上搜索。
![社会统计学与spss应用练习题Word下载.docx](https://file1.bdocx.com/fileroot1/2022-11/22/f104629e-4e09-4acc-814b-ecc21dd20f1c/f104629e-4e09-4acc-814b-ecc21dd20f1c1.gif)
8.下两图是正态分布密度曲线,两图的σ2相同,图1较之图2的密度曲线向左移了一些,这说明(C)。
A.µ
1>µ
2B.µ
1=µ
2C.µ
1<µ
2D.µ
1≥µ
2
9.在SPSS软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C)
10.下图所示的若为了测量集中趋势,需要在哪个□前打“√”的是(B)。
11.下图包含两条正态分布密度曲线,它们的µ
相同,那么上方曲线的σ1与下方曲线σ2的关系是(C)。
A.σ1>σ2B.σ1=σ2C.σ1<σ2D.σ1≥σ2
12.下列哪类分布图形随着自由度k无限增加,逐渐趋于标准正态分布。
(D)
A.E分布B.χ2分布C.F分布D.t分布
13.在进行区间估计时,置信度与显著性水平之和为(C)。
A.0B.-1C.1D.2
14.在进行区间估计时,显著性水平为α,置信度为(C)。
A.0B.-αC.1-αD.2α
15.在拒绝原假设时出现的错误称为(D)。
A.第二类错误B.纳伪的错误C.以假当真错误D.弃真的错误
16.大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A)。
A.标准差B.均值C.统计量分布D.临界值
17.大样本二总体成数差进行统计检验时与单样本成数检验相比,主要区别是(A)。
18.如下表所示,求出2×
2表中相关强度φ系数为(C)。
消费状况
群体划分
市民
民工
消费场所
大型超市
30
10
小型商店
A.1B.0.3C.0.5D.0.4
19.如下表所示,求出该表中同序对的个数为(B)。
受教育状况
父辈
大学
中学
小学
子辈
6
3
8
7
4
A.310B.624C.524D.314
20.两个定序变量之间Gamma系数取值范围为(A)。
A.[-1,1]B.[-∞,0]C.[0,+∞]D.[0,1]
21.为测量两个定类变量相关系数,需要在下列哪项功能□前打“√”?
(A)
二、填空题
1.所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分布。
2.在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精度要高一位,例如,原统计资料的年龄以年计算,统计范围为1~2岁、3~4岁、5~6岁、7~8岁等分为四组,实际分组为0.5~2.5岁、2.5~4.5岁、4.5~6.5岁、6.5~8.5岁等四组,那么,原统计资料的分组组界称为标明组界。
3.统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,这样才能构成一份完整的统计表。
4.某村家庭子女数量频次分布:
2、3、1、4、2、4、3、2、1、2、0、1、2、3、1、3、2、0、4、2,在家庭子女数量这个变量取值中众值是2。
5.某社区六个家庭人口数量分布:
3、4、5、8、9、9在家庭人口数量这个变量取值中中位值是6.5。
6.方差与标准差用来度量定距变量的离散程度的测量方法。
7.当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随机变量的概率分布。
8.古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率。
9.统计推论的基础是概率论,内容包括两部分:
参数估计与假设检验。
10.从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量ξ1,ξ2,……,ξn,那么,随机变量ξ1,ξ2,……,ξn的任何函数f(ξ1,ξ2,……,ξn)也是随机变量。
我们把函数f(ξ1,ξ2,……,ξn)叫作统计量。
11.根据随机变量的观测值X1,X2,……,Xn计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布。
12.原假设(H0)又称虚无假设或解消假设,常常是根据已有的资料,或根据周密考虑后确定的。
13.备择假设(H1)又称为研究假设,当经过抽样调查,有充分根据否定原有假设时,就产生了需要接受其逻辑对立面的假设。
14.假设检验的基本原理是小概率原理。
15.在某个列联表中,只观察其中某一变量的分布,而不管另一个变量的取值,这样就得到边缘分布。
16.协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差。
17.两个定距变量的相关系数r是度量变量间的线性相关程度的,具有PRE性质,r的平方又称为判定系数有着直观的解释意义。
18.方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同。
19.方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率。
20.非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法。
21.非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定,也不是检验总体分布的某些参数,而是检验总体某类有关的性质。
三、判断题(根据题意,表述正确的在后面括号内打“√”,表述错误的在后面括号内打“×
”)
1.在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况。
(×
)
2.在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。
(√)
3.直方图可以用来反映定类变量的取值状况。
4.直方图与条形图形状相同,没有什么本质区别。
5.中位值比较适用于定距变量。
6.某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。
7.某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠。
8.统计推论是根据局部资料(样本资料)对总体的特征进行推断。
9.“抽样结果与总体参数不一致”是随机现象在推论中所特有的。
10.总体分布为正态分布N(µ
,σ2),且方差已知,随着样本容量n的增加,也不能减少样本均值抽样分布的分散程度。
11.若总体分布为正态分布,且方差已知,样本均值分布服从t分布。
12.若总体分布为正态分布,大样本均值的极限分布不是N(0,1)。
13.在区间估计中,置信度表示用置信区间估计的可靠性。
14.在区间估计中,显著性水平表示用置信区间估计不可靠的概率。
15.大样本二总体均值差的分布不服从正态分布。
16.大样本二总体成数差的分布不服从正态分布。
17.两个定类变量之间以χ2为基础的相关性测量得到C系数具有减少误差比例性质。
18.两个定类变量之间相关性测量得到λ系数不具有减少误差比例性质。
19.Gamma等级相关的G系数具有减少误差比例的性质。
20.斯皮尔曼等级相关系数rs具有减少误差比例的性质。
四、计算题(要求步骤完整,计算结果正确)
1.根据下表2008年某班级Q课程成绩统计分布情况,求某班级Q课程成绩的中位值。
2008年某班级Q课程成绩统计分布情况
成绩等级
频次
累计频次
不及格
及格
12
15
中
18
33
良好
22
55
优秀
5
60
2.根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中位值。
某城市抽样调查家庭月收入统计分布情况
家庭月收入
频次
累计频次(cf↑)
累计百分比(%)
500及以下
10
500—1000
20
30
1000—2000
35
65
2000—3000
25
90
3000及以上
100
3.下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况:
社区类别
抽样数量(个)
受教育年限分布状况(年)
A
7、3、11、10、4
B
6、5、5、8、10、8
根据抽样数据,求出两个社区的平均受教育年限各是多少?
相同吗?
4.某系大学一年级共550人,Z课程期末考试成绩统计如下表,求该课程的平均分数是多少?
某系大学一年级Z课程期末考试成绩统计分布状况
分数
学生数量
50
28
63
40
70
290
74
160
80
17
总和
550
5.针对某村返乡人口状况进行调查,抽取11户大型联合家庭进行调查,各自家庭返乡人口数量分别为:
2、2、3、4、4、4、5、5、6、6、7。
求样本中返乡人口数量的四分互差是多少?
答案:
Q=3
6.为了解某种新型奶制品的消费者偏好状况,访问了80个消费者,其中,选择喜欢的有25个,选择一般的有30个,选择不喜欢的有20个,选择无所谓的有5个。
求反映偏好状况的四分互差是什么?
有50%的消费者在喜欢与不喜欢之间。
7.设某工厂妇女从事家务劳动时间服从正态分布N(µ
,0.662)。
根据36人的随机抽样调查,每天平均从事家务劳动时间为2.65小时,求µ
的双侧置信区间(置信度0.95,Zα/2=1.96,保留小数点后两位)
[2.44,2.87]
8.为了对某工厂职工休闲时间进行研究。
根据一次样本(n=33)的调查,平均每天看电视时间为:
=0.96小时,S=0.47,试求全厂职工平均每天看电视时间的区间估计(置信度为95%)。
假定看电视时间服从正态分布N(µ
,σ2),其中σ2未知。
解析:
只知道总体的分布状况而不知道方差,只是样本均值分布服从t分布,需要查表,并且要注意t分布是对称分布。
查表:
tα/2=2.0369≈2.04tα/2=±
2.04
[0.79,1.13]
9.设某社区受教育程度服从正态分布N(µ
,3.62),根据25人的随机调查,平均受教育年限均值为11.5年,求µ
的双侧置信区间(1-α=0.99,Zα/2=2.58,保留小数点后两位)
[9.64,13.36]
10.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有=871元,S=21元,问能否证明统计报表中人均收入µ
=880元是正确的(显著性水平α=0.05,Zα/2=±
1.96)
分析与解析步骤:
(一)原假设H0:
µ
=µ
0=880
(二)备择假设H1:
µ
≠µ
0≠880
(三)统计量与拒绝域:
根据显著性水平α=0.05,查表拒绝域临界值:
Zα/2=±
1.96
(四)判断:
Z=-3.03<-1.96,拒绝原假设,即根据抽样调查不能认为人均收入为880元,统计报表是有误的。
11.某地区成年人中吸烟者占75%,经过戒烟宣传之后,进行抽样调查,发现100名被调查的成年人中,有63人是吸烟者。
问戒烟宣传是否收到了成效?
(α=0.05,Zα=-1.96)
解析步骤:
p=p0=0.75
p<p0=0.75
Z=-1.96
Z=-2.77<-1.96,否定原假设,即认为戒烟宣传是有成效的,吸烟比例有所下降。
12.已知初婚年龄服从正态分布,根据9个人的抽样调查有:
=23.5岁,S=3岁,问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?
解:
原假设H0:
=20岁
备择假设H1:
单边µ
>20岁
统计量
查表自由度为8,α=0.05,t临界值为1.86,小于3.5,所以拒绝原假设,认为平均初婚年龄超过了20岁。
13.就近上学(表示为A)与乘车上学(表示为B)对学习影响,抽样结果如下:
问两者学习成绩是否有差别,如果有,哪种方式更好些?
(α=0.05)
(1)原假设H0:
A-µ
B=0
备择假设H1:
B≠0
(2)统计量
(3)拒绝域
查表α=0.05,Zα/2=1.96,小于7.04,所以,认为有差别,而且就近入学要好。
14.以下表中是5对子代和父代之间年收入状况的抽样调查,求两者回归直线方程。
代际差别
年收入状况(万元)
父代
子代
9
解析过程:
15.以下表中是5对子代和父代之间人际网络(好朋友数量)的抽样调查,求两者回归直线方程。
好朋友数量(个)
16.求下列表的λ系数与τ系数(α=0.05)。
(1)检验相关;
(2)求λ系数;
(3)τ系数
表4-3:
某地区男女工作经历状况(单位:
个)
不同状况
男
女
共计
无“跳槽”经历
120
150
有“跳槽”经历
20
140
200
检验两者之间存在相关。
17.为了解学生活动能力与智商间是否有关,作了10名学生的抽样调查,结果如下:
学生
活动能力名次
智商
1
110
C
105
D
95
E
FJ
94
G
100
H
I
J
问:
学生活动能力与智商是否有显著差异(α=0.05)?
无显著性差异,0.54<
2.30
解答思路:
参见320~321页例2,首先对智商进行排序,相同智商名次求取平均名次,然后按照以下步骤:
(1)原假设:
ρ0=0或变量是相互独立的,备择假设
(2)统计量:
(3)临界值确定,做出判断。