社会统计学综合练习题.docx

上传人:b****5 文档编号:7818591 上传时间:2023-01-26 格式:DOCX 页数:14 大小:30.51KB
下载 相关 举报
社会统计学综合练习题.docx_第1页
第1页 / 共14页
社会统计学综合练习题.docx_第2页
第2页 / 共14页
社会统计学综合练习题.docx_第3页
第3页 / 共14页
社会统计学综合练习题.docx_第4页
第4页 / 共14页
社会统计学综合练习题.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

社会统计学综合练习题.docx

《社会统计学综合练习题.docx》由会员分享,可在线阅读,更多相关《社会统计学综合练习题.docx(14页珍藏版)》请在冰豆网上搜索。

社会统计学综合练习题.docx

社会统计学综合练习题

社会统计学期末复习训练

一、单项选择题

1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。

此处800人是()

A.样本

B.总体

C.统计量

D.变量

2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()

A.频率

B.累积频数

C.累积频率

D.比率

3.离散系数的主要目的是()

A.反映一组数据的平均水平

B.比较多组数据的平均水平

C.反映一组数据的离散程度

D.比较多组数据的离散程度

4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有()

A.50%的数据

B.68%的数据

C.95%的数据

D.99%的数据

5.在某市随机抽取10家企业,7月份利润额(单位:

万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为()

A.39.19

B.28.90

C.19.54

D.27.95

6.用样本统计量的值直接作为总体参数的估计值,这种方法称为()

A.点估计

B.区间估计

C.有效估计

D.无偏估计

7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(

)偏高。

如果要检验该说法是否正确,则假设形式应该为()

A.

≥0.1;

<0.1

B.

≤0.1;

>0.1

C.

=0.1;

≠0.1

D.

>0.1;

≤0.1

8.下面哪一项不是方差分析中的假定()

A.每个总体都服从正态分布

B.观察值是相互独立的

C.各总体的方差相等

D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数()

A.-0.9

B.0

C.0.5

D.1.2

10.用于说明回归方程中拟合优度的统计量主要是()

A.相关系数

B.离散系数

C.回归系数

D.判定系数

11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。

这项研究的总体是()

A.332.1万户家庭

B.3000户家庭

C.332.1户家庭的年均收入

D.3000户家庭的年均收入

12.下列变量属于数值型变量的是()

A.工资收入

B.产品等级

C.学生对考试改革的态度

D.企业的类型

13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

A.环形图

B.饼图

C.直方图

D.条形图

14.在频数分布表中,频率是指()

A.各组频数与上一组频数之比

B.各组频数与下一组频数之比

C.各组频数与总频数之比

D.各组频数与最大一组频数之比

15.两个定类变量之间的相关分析可以使用()

A.

系数

B.

系数

C.

系数

D.Gamma系数

16.根据一个样本均值求出的90%的置信区间表明()

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

17.已知某单位职工平均每月工资为3000元,标准差为500元。

如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的()

A.95%

B.68%

C.89%

D.90%

18.方差分析的目的是()

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

19.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间()

A.相关程度越大

B.相关程度越小

C.完全相关

D.完全不相关

20.正态分布中,

值越小,则()

A.离散趋势越小

B.离散趋势越大

C.曲线越低平

D.变量值越分散

21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为()

A.简单随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

22.某地区2001-2010年人口总量(单位:

万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据()

A.茎叶图

B.环形图

C.饼图

D.线图

23.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值()

A.是平均数的-1.5倍

B.比平均数少1.5

C.等于-1.5倍标准差

D.比平均数低1.5个标准差

24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是()

A.89

B.72

C.88

D.95

25.某班级学生期末英语考试平均成绩为75分,标准差为10分。

如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的()

A.68%

B.89%

C.90%

D.95%

26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为()

A.700

B.0.2

C.3500

D.175000

27.在假设检验中,不拒绝虚无假设意味着()

A.虚无假设是肯定正确的

B.虚无假设肯定是错误的

C.没有证据证明虚无假设是正确的

D.没有证据证明虚无假设是错误的

28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间()

A.相关程度越高

B.相关程度越低

C.完全相关

D.没有任何关系

29.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为()

A.234,121

B.117,121

C.234,48.4

D.117,81

30.在回归方程中,若回归系数等于0,这表明()

A.因变量y对自变量x的影响是不显著的

B.自变量x对因变量y的影响是不显著的

C.因变量y对自变量x的影响是显著的

D.自变量x对因变量y的影响是显著的

31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于()

A.简单随机抽样

B.整群抽样

C.分层抽样

D.系统抽样

32.某企业职工的月收入水平分为以下五组:

1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为()

A.3000元

B.3500元

C.2500元

D.3250元

33.对于右偏分布,平均数、中位数和众数之间的关系是()

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

34.两组数据的平均数不相等,但是标准差相等。

那么()

A.平均数小的,离散程度小

B.平均数大的,离散程度大

C.平均数大的,离散程度小

D.两组数据离散程度相同

35.在假设检验中,如果所计算出的P值越小,那么检验的结果()

A.越显著

B.越不显著

C.越真实

D.越不真实

36.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着()

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

37.回归平方和(SSR)反映了y的总变差中()

A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分

D.由于x与y之间的函数关系引起的y的变化部分

38.根据一个具体的样本求出的总体均值90%的置信区间()

A.以90%的概率包含总体均值

B.绝对包含总体均值

C.10%的可能性包含总体均值

D.绝对不包含总体均值

39.在假设检验中,虚无假设和备择假设()

A.都有可能成立

B.都不可能成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

40.在方差分析中,某一水平下样本数据之间的误差称为()

A.组内误差

B.组间误差

C.组内平方

D.组间平方

二、名词解释

1.抽样单位与抽样框

2.普查与抽样调查

3.参数与统计量

4.方差与标准差

5.独立样本与配对样本

6.总体与样本

7.抽样分布

8.二维表

9.相关系数

10.组内均方

11.普查

12.误差减少比例

13.散点图

14.正态分布

15.最小二乘法

16.概率抽样

17.中位数

18.相关系数

19.区间估计

20.中心极限定理

21.假设检验

三、简答题

1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名

(2)每月的网络服务费

(3)每月上网时间

(4)上网的主要目的

(5)上周收到的电子邮件数量

(6)每月用于网上购物的金额

(7)上月网上购物的次数

(8)使用的电脑的品牌

(9)上网是否玩游戏

(10)电脑是否带有光盘刻录机

2.调查方法主要包括哪几种?

简要说明各种方法的优缺点。

3.什么是简单一元线性回归分析?

其作用是什么?

4.简要说明社会研究过程。

5.按测度水平,变量可分为哪几类?

并举例说明。

6.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。

7.等距分组和不等距分组有什么区别?

请举例说明。

8.举例说明什么是自变量和因变量,二者之间是什么关系?

9.简要说明卡方的拟合优度检验和独立性检验的含义。

10.条形图和直方图有什么区别?

11.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。

13.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。

14.举例说明什么是离散变量和连续变量。

15.SPSS主要有哪些功能?

16.在SPSS中如何定义变量属性?

17.统计表主要由哪几部分构成?

18.简述相关系数的取值与意义。

四、计算题(每题15分,共30分)

1.某校社会学专业同学统计课成绩如下表所示。

社会学专业同学统计课成绩表

学号

成绩

学号

成绩

学号

成绩

101023

76

101037

75

101052

70

101024

91

101038

70

101053

88

101025

87

101039

76

101054

93

101026

78

101040

90

101055

62

101027

85

101041

76

101056

95

101028

96

101042

86

101057

95

101029

87

101043

97

101058

66

101030

86

101044

93

101059

82

101031

90

101045

92

101060

79

101032

91

101046

82

101061

76

101033

80

101047

80

101062

76

101034

81

101048

90

101063

68

101035

80

101049

88

101064

94

101036

83

101050

77

101065

83

要求:

(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。

2.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。

通过分析得到以下结果:

方差分析表

变差来源

SS

df

MS

F

Sig.

回归

A

B

C

D

0.000

残差

205158.07

E

F

总计

1642866.67

11

要求:

(1)计算上面方差分析表中A、B、C、D、E、F处的值。

(2)商品销售量的变差中有多少是由价格的差异引起的?

(3)销售量与价格之间的相关系数是多少?

3.某公司招聘职员时,要求对职员进行两项基本能力测试。

已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。

一位应试者在A项测试中得了102分,在B项测试中得了215分。

若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?

4.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进行线性回归分析,得到:

方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。

要求:

(1)写出广告费用y与销售量程x之间的线性回归方程。

(2)假如广告费用投入50000元,根据回归方程估计商品销售量。

(3)计算判定系数

,并解释它的意义。

5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。

(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。

(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。

以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。

注:

6.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用其中的一种方法。

通过对每个工人生产的产品数进行分析得到下面的方差分析表。

请完成方差分析表。

变差来源

SS

df

MS

F

Sig.

组间

210

0.000

组内

3836

总计

29

7.某校社会学专业共有两个班级。

期末考试时,一班同学社会学理论平均成绩为86分,标准差为12分。

二班同学成绩如下所示。

二班同学社会学理论成绩分组数据表

按成绩分组(分)

人数(个)

60分以下

2

60~70

7

70~80

9

80~90

7

90~100

5

合计

30

要求:

(1)计算二班同学考试成绩的均值和标准差。

(2)比较一班和二班哪个班成绩的离散程度更大?

(提示:

使用离散系数)

8.某调查公司研究出租司机每天收入(元)与行驶里程(公里)之间的关系。

对30位出租车司机进行调查,并根据每天的收入y、行驶里程x进行回归,得到:

方程的截距为162,回归系数为0.6,回归平方和SSR=2600,残差平方和SSE=513。

要求:

(1)写出每天的收入y与行驶里程x之间的线性回归方程。

(2)假如某司机某天行驶了300公里,根据回归方程估计他该天的收入。

(3)计算判定系数

,并解释它的意义。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 农学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1