统计学原理试题答案.docx
《统计学原理试题答案.docx》由会员分享,可在线阅读,更多相关《统计学原理试题答案.docx(19页珍藏版)》请在冰豆网上搜索。
统计学原理试题答案
1、单项选择题
1.在企业统计中,下列统计标志中属于数量标志的是()
A、文化程度B、职业C、月工资D、行业
2.下列属于相对数的综合指标有()
A、国民收入B、人均国民收入C、国内生产净值D、设备台数
3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有()个变量?
A、0个B、两个C、1个D、3个
4.下列变量中属于连续型变量的是()
A、身高B、产品件数C、企业人数D、产品品种
5.下列各项中,属于时点指标的有()
A、库存额B、总收入C、平均收入D、人均收入
6.典型调查是()确定调查单位的
A、随机B、主观C、随意D盲目
7.总体标准差未知时总体均值的假设检验要用到():
A、Z统计量B、t统计量C统计量D、X统计量
8.把样本总体中全部单位数的集合称为()
A、样本B、小总体C、样本容量D、总体容量
9.概率的取值范围是p()
A、大于1B、大于-1C、小于1D、在0与1之间
10.算术平均数的离差之和等于()
A、零B、1C、-1D、2
11.统计有三种含义,即统计活动、统计学和()
A、统计数据B、人口统计C、外贸统计D、数理统计
12.()尺度只能区分事物的类别,但无法比较类别间的大小。
A、定类尺度B、定序尺度C、定距尺度D、定比尺度
13.时间数列包括绝对数数列、相对数数列和()
A、时期数列B、平均数数列C、时点数列D、属性数列
14.下列变量中不属于连续型变量的是()
A、企业产值B、毕业生人数C、生产工人数D、工资额
15.对种子的发芽率进行质量检验,需要采用下列那种方法取得数据()
A、全面调查B、普查C、重点调查D、抽样调查
16.分配数列由统计分组和()两个要素组成
A、频数或频率B、观察值C、随机变量D标准差
17.在假设检验中,如果希望所考察的数值越小越好,一般要进行():
A、左单侧检验B、右单侧检验C、双测检验D、单侧检验
18.序时平均数是一种()
A、中位数B、众数C、动态平均数D、静态平均数
19.频率的取值范围是()
A、大于1B、大于-1C、小于1D、在0与1之间
20.指数按其研究现象的范围不同分为个体指数和()。
A、总指数B、平均指数C、平均数指数D、可变指数
二、多项选择题
1.数据的计量尺度包括():
A、定类尺度B、定序尺度C、定距尺度D、定比尺度E、测量尺度
2.下列属于连续型变量的有():
A、工人人数B、商品销售额C、商品库存额D、商品库存量E、总产值
3.测量变量离中趋势的指标有()
A、极差B、平均差C、几何平均数D、众数E、标准差
4.在工业企业的设备调查中()
A、工业企业是调查对象B、工业企业的所有设备是调查对象C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位
5.下列平均数中,容易受数列中极端值影响的平均数有()
A、算术平均数B、调和平均数C、几何平均数D、中位数E、众数
6.指数编制中样本的选择应具备以下要求()
A、代表性B、充分性C、可比性D、主观性E、具体性
7.指数的性质有():
A、可比性B、随意性C、相对性D、综合性E、平均性
8.下列统计调查中属于非全面调查的包括()
A、普查B、统计报表C、抽样调查D、重点调查E、典型调查
9.方差分析的基本假定有()
A、每个总体均应服从正态分布B、每个总体的方差相同C、观测值彼此独立D、观测值彼此关联E、每个总体的方差不相同
10.下列平均数中,最容易受数列中极端值影响的平均数有()
A、算术平均数B、众数C、几何平均数D、中位数E、调和平均数
三、判断题
1、“性别”是品质标志。
()
2、方差是离差平方和与相应的自由度之比。
()
3、标准差系数是标准差与均值之比。
()
4、算术平均数的离差平方和是一个最大值。
()
5、区间估计就是直接用样本统计量代表总体参数。
()
6、在假设检验中,方差已知的正态总体均值的检验要计算
统计量。
()
7、统计方法包括推断统计方法和描述统计方法。
()
8、在一般情况下,当统计量
时,通常选择
>
作为备择假设。
()
9总体比例方差的理论最大值是0.25。
()
10均发展速度是增长量与基期水平的比值。
()
11.平均差是度量集中趋势的统计指标。
()
12.概率的取值范围在0~1之间。
()
13.在社会经济统计中,最常见的统计分布是t态分布。
()
14.参数估计包括点值估计和区间估计两种基本方法。
()
15.在假设检验中,
是一个原假设为假时被拒绝的概率。
()
16.方差分析是检验一个总体均值是否相等的一种统计分析方法。
()
17.相关系数的取值范围在0到1之间。
()
18.平均发展速度是各期环比发展速度的算术平均数。
()
19.平均发展速度等于平均增长速度加1。
()
20.总指数包括平均指标指数和综合指数两种计算形式。
(
四、简答
1、怎样理解统计的三种含义
2、什么是统计指标?
它有哪些特点?
3、什么是动态数列?
试举一个时点数列的例子。
4、何谓标准差?
写出均值标准差的计算公式。
5.抽样调查与重点调查有何区别?
6.什么是指标体系?
举一例说明。
7.统计的含义有哪些?
8.什么是中位数?
试写出组距数列计算中位数的公式。
五、计算(要求计算过程保留4位小数,计算结果保留两位小数)
1、以下为10位工人2005年11月11日的产量资料:
(单位:
件):
100120120180120192120136429120。
试据以计算其中位数、均值及众数。
2、某厂2005年第四季度各月的生产工人人数和产量资料见下表:
时间
10月
11月
12月
月初人数(人)
2000
2080
2200
产量(万件)
260
280
369
又知2005年12月31日的生产工人数为2020人,试计算第四季度的劳动生产率。
3、从一火柴厂随机抽取了100盒进行调查,经检查平均每盒装有火柴98支。
标准差10支,试以95%的概率(置信水平)推断该仓库中平均每盒火柴支数的可能范围。
4、某商店2005年的营业额为12890万元,上年的营业额为9600万元,零售价格比上年上升了11.5%,试对该商店营业额的变动进行因素分析。
5.某国对外贸易总额2003年比上年增长7.9%,2004年比上年增长4.5%,2005年比上年增长10%,试写出2002~2005年每年平均增长速度的计算公式(不要求算出结果,只要求写出计算公式即可)。
6.某地区2002~2006年粮食产量资料如下表:
年份
2002
2003
2004
2005
2006
产量(万吨)
240
300
320
340
380
试用最小二乘法配合直线趋势方程,并预测2007年的粮食产量。
7.某商店有三种商品的有关资料如下表所示:
商品
销售额(万元)
价格上升或下降的%
2005年
2006年
D
360
400
15
E
500
600
-12
G
40
45
10
合计
900
1045
-
试计算三种商品的价格总指数,以及由于价格变动对商品销售额的影响额。
8、某灯泡的质量标准是平均使用寿命不得低于1200小时。
已知该灯泡的使用寿命服从标准差为100小时的正态分布。
一商场打算从该厂进货,随机抽取121件进行检验,测得其平均寿命为1100小时,问商场是否应决定购进这批灯泡?
(已知
)
答案
一、单项选择题
1-10、CBBAABAADA11-20AABCDACCDA
二、多项选择题
1、ABCD2、BE3、ABE4、BDE5、ABC6、AC7、CDE8、BCDE9、ABC
10、ACE
三、判断题
1-10、√×√×××√×××11-20×√×√××××√×
四、简答
1、答:
统计包含统计工作、统计资料和统计学三个方面的含义。
一是统计工作,即统计实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。
二是统计资料(统计信息):
统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。
三是统计学,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。
2、答:
统计指标是十分重要的统计学基本范畴。
对统计指标通常有两种理解和使用方法:
一是用来反映总体现象总体数量状况的基本概念;二是反映现象总体数量状况的概念和数值。
统计指标主要有两个特点:
第一,同质事物的可量性。
没有质的规定性不能成为统计指标,有了质的规定性不能用数量表示,也不能成为统计指标。
有些抽象度较高的社会经济概念难以量化是不能直接用来作为指标名称的,必须将其分解为可以量化的概念才能成为统计指标。
第二,量的综合性。
统计指标反映的是总体的量,它是许多个体现象的数量综合的结果。
3、答:
动态数列指社会经济现象在不同时间上的一系列指标按时间先后顺序加以排列后形成的数列,也称时间数列。
各年年末居民储蓄存款余额就是时点数列。
4、答:
标准差(StandardDeviation)也称均方差(meansquareerror),各数据偏离平均数的距离(离均差)的平均数,它是离均差平方和平均后的方根。
用σ表示。
因此,标准差也是一种平均数。
公式为:
5、答:
抽样调查是指从研究对象的总体中抽取一部分个体作为样本进行调查,据此推断有关总体的数字特征。
抽样调查的特点是经济性好、实效性强、适应面广、准确性高,被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法抽样调查。
重点调查是根据研究需要来调查特定的对象,不能代表和反映总体特征;抽样调查一般的代表性较好。
重点调查通常用于不定期的一次性调查,但有时也用于经常性的连续调查。
6、答:
统计指标体系是指用来刻画于描述总体基本状况和各个变量分布特征的综合数量。
例如,全国人口总体的基本状况和性别分布特征可用总人口数,男性人口数,女性人口数,男女性别比例,男性人口比重,女性人口比重等指标来描述。
7、答:
统计包含统计工作、统计资料和统计学三个方面的含义。
一是统计工作,即统计实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。
二是统计资料(统计信息):
统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。
三是统计学,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。
8、答:
中位数(Median)表示一组数据按照大小的顺序排列时,中间位置的那个数值,即针对某个变量,有50%的个案的取值在中位数以下。
通俗的讲,样本的所有观测值中,有一半数比中位数大,有一半数比中位数小。
中位数的计算时会面临两种情况:
当样本数(n)是奇数时,将样本的所有观测值按由小到大(或由大到小)的顺序排列,排在中间位置上的数值即为中位数;当样本为偶数时,排在中间两个位置上的数值的平均值即为中位数。
中位数适用于定序变量,对于定距变量,还是首先对观测值进行分组,简单的方法就是用中间那一组的组中值作为变量的中位数。
单变量或组距分组的次数分布,(1)对次数做以上累计或以下累计,观察N/2所在组即中位数所在组;(2)对于单变量分组的次数分布,中位数所在组的变量值即中位数;(3)对于组距分组次数分布,可以用中位数所在组的组中值作为中位数。
也可以用计算公式:
五、计算
1、将100120120180120192120136429120按大小排序
产量
100
120
136
180
192
429
人数
1
5
1
1
1
1
中位数:
120;平均数:
163.7;众数:
120
2、劳动生产率(元/人)=报告期工业总产值(万元)÷报告期全部职工平均人数(人)
或:
报告期工业增加值÷报告期全部职工平均人数
(260/(2000+2080)/2+280/(2080+2200)/2)+369/(2200+2020)/2))/3=0.1445
3、体分布形式和总体方差σ2均未知,但由于n=100>30,属于大样本,故可近似地采用正态分布处理,并用样本方差代替总体方差。
依题意又知:
s=10,α=0.05查标准正态分布表得:
Zα/2=1.96,于是抽样平均误差:
δ=10/10=1抽样极限误差△=1.96*1=1.96。
X=98,
∴概率为95%的条件下,平均每盒火柴支数范围为:
98-1.96<X<98+1.96
置信区间的公式为:
计算结果为:
(96.04,99.96)
4、销售额指数=
=1.3427,价格指数等于1.115,则销售量指数为:
1.3427/1.115=1.2042.表明,2005年与2004年相比,销售额提高了34.27%,其中由于零售价格的变动使销售额提高了11.50%,由于销售量的变动使销售额提高了20.42%。
5、
,即:
平均增长速度等于
6、采用最小二乘分拟合,公式为:
计算结果为
,x=1为2002年,以此类推。
2007年的粮食产量为:
412
7、
=0.9761,表明三种产品的销售价格平均降低了2.39%。
影响额为:
1045-1045/0.9761=-25.59,表明价格变动使得商品销售额降低了25.9元。
8、
<-1.645,拒绝原假设,不能认为灯泡质量合格。
卷2
一、填空题(每空1分,共15分)
1、按照统计数据的收集方法,可以将其分为和。
2、收集数据的基本方法是、和。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:
1080,750,780,1080,850,960,2000,1250,1630(单位:
元),则人均月收入的平均数是,中位数是。
其他
(a
4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密度函数为
则X的期望值为,方差为。
5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)=。
6、概率是___到_____之间的一个数,用来描述一个事件发生的经常性。
7、对回归方程线性关系的检验,通常采用的是检验。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、和
二、判断题,正确打“√”;错误打“×”。
(每题1分,共10分)
1、理论统计学与应用统计学是两类性质不同的统计学()
2、箱线图主要展示分组的数值型数据的分布。
()
3、抽样极限误差可以大于、小于或等于抽样平均误差。
( )
4、在全国人口普查中,全国人口数是总体,每个人是总体单位。
( )
5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
()
6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少()
7、在单因素方差分析中,SST=SSE+SSA()
8、右侧检验中,如果P值<α,则拒绝H0。
()
9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
( )
10、当原假设为假时接受原假设,称为假设检验的第一类错误。
()
三、单项选择题(每小题1分,共15分)
1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本()。
A、2000个家庭B、200万个家庭
C、2000个家庭的人均收入D、200个万个家庭的总收入
2、当变量数列中各变量值的频数相等时()。
A、该数列众数等于中位数B、该数列众数等于均值
C、该数列无众数D、该众数等于最大的数值
3、某地区商品销售额增长了5%,商品零售价格平均增长2%,则商品销售量增长()。
A、7% B、10% C、2.94%D、3%
4、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有()。
A.68%的数据B.95%的数据C.99%的数据D.100%的数据
5、某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们每月平均生活费支出是500元。
该研究人员感兴趣的参数()
A、该大学的所有学生B、所有大学生的总生活费支出
C、该大学所有的在校本科生D、所调查的200名学生
6、为了了解女性对某种品牌化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。
这种调查方式是()
A、简单随机抽样B、分层抽样C、方便抽样D、自愿抽样
7、某居民小区为了了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。
物业管理部门利用最初的居民户登记名单进行抽样。
但现在的小区中,原有的一些居民户已经伴奏,同时有些是新入住的居民户。
这种调查产生的误差属于()。
A,随机误差B抽样框误差C回答误差D无问答误差
8、若投掷一枚骰子,考虑两个事件:
A:
骰子的点数为奇数;B:
骰子的点数为偶数大于等于4,则条件概率P(A︱B)=()
A、1/3B、1/6C、1/2D、1/4
9、如果峰态系数k>0,表明该组数据是()
A、尖峰分布B、扁平分布C、左偏分布D、右偏分布
10、回归平方和占总平方和的比例称为()。
A、相关系数B、回归系数C、判定系数D、估计标准误差
11、某班学生的平均成绩是80分,标准差是10分。
如果已知该班学生的考试分数为对称分布,可以判断成绩在70~90分之间的学生大约占()
A、95%B、89%C、68%D、99%
12、一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下表1:
表1
男学生
女学生
合计
赞成
45
42
87
反对
105
78
183
合计
150
120
270
这个表格是()。
A、4×4列表B、2×2列联表C、2×3列联表D、2×4列联表
13、方差分析的主要目的是判断()
A、各总体是否存在方差B、各样本数据之间是否有显著差异
C、分类型自变量对数值型因变量的影响是否显著D、分类型因变量对数值型自变量的影响是否显著
14、变量x与y之间的负相关是指()。
A、x值增大时y值也随之增大B、x值减少时y值也随之减少C、x值增大时y值随之减少,或x值减少时y值随之增大D、y的取值几乎不受x取值的影响
15、对于有线性相关关系的两变量建立的直线回归方程Y=a+bx中,回归系数b()
A、肯定是正数 B、显著不为0C、可能为0D、肯定为负数
四、不定项选择题,答案少选,多选或不选给零分计算。
(每小题2分)
1、推断统计学研究的主要问题()。
A、如何科学确定目标总体范围B、如何科学地从总体中抽样样本
C、怎样控制样本对总体的代表性误差 D、怎样消除样本对总体代表性误差
E、如何科学地由所抽样本去推断总体
2、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明()
A、商品零售价格平均上涨17.5% B、商品零售额上涨17.5%
C、由于价格提高使零售额增长17.5%D、由于价格提高使零售额减少17.5%
E、商品零售额增长17.5%
3、在直线相关和回归分析中( )
A、据同一资料,相关系数只能计算一个
B、据同一资料,相关系数可以计算两个
C、据同一资料,回归方程只能配合一个
D、据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个
E、回归方程和相关系数均与自变量和因变量的确定无关
4、在各种平均指标中,不受极端数值影响的平均指标是()
A、算术平均数B、调和平均数C、几何平均数D、中位数E、众数
5、下列动态指标中,可能取负值的指标是()
A、增长量B、发展速度C、增长速度D、平均发展速度E、平均增长速度
五、计算题
1、设X~N(9,4),试描述10X的抽样分布。
(7分)
2、某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100名下岗职工,其中65人为女性。
试以95%的置信水平估计该城市下岗职工中女性所占比例的置信区间。
(
)(8分)
3、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%。
25岁以下青年在小学、初中、高中以上文化程度各组中的比例分别为20%,50%,70%。
从该厂随机抽取一名职工,发现其年龄不到25岁,问他具有小学、初中、高中以上文化程度的概率各为多少?
(8分)
4、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(
)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?
(设边际误差E=0.08)(6分)
5、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
1
A
1422708.6
C
2.17E-09
残差
10
220158.07
B
总计
11
1642866.67
参数估计表
Coefficients
标准误差
tStat
P-value
Intercept
363.6891
62.45529
5.823191
0.000168
XVariable1
1.420211
0.071091
19.97749
2.17E-09
1求A、B、C的值;(3分)
2销售量的变差中有多少是由于广告费用的变动引起的?
(3分)
③销售量与广告费用之间的相关系数是多少?
(3分)
④写出估计的回归方程并解释回归系数的实际意义。
(3分)
⑤检验线性关系的显著性(
0.05,
)(3分)
答案
一、填空题(每空1分,共15分)
1、观测数据、实验数据2、自填式、面访式和电话式3、1153.3、10204、
、
5、-56、0、17、F8、有效性、一致性。
二、判断题,正确打“√”;错误打“×”。
(每题1分,共10分)
1、√2、×3、√4、×5、√6、√7、√8、√9、×10、×
三、单项选择题(每小题1分,共15分)
1A2C3C4B5B6C7B8A9A10C11C12B13C14C15、B
四、不定项选择题,答案少选,多选或不选给零分计算。
(每小题2分)
1、