统计学原理形成性考核答案6Word文件下载.docx
《统计学原理形成性考核答案6Word文件下载.docx》由会员分享,可在线阅读,更多相关《统计学原理形成性考核答案6Word文件下载.docx(18页珍藏版)》请在冰豆网上搜索。
![统计学原理形成性考核答案6Word文件下载.docx](https://file1.bdocx.com/fileroot1/2023-1/4/dfb2c317-008b-45d6-bcfa-8af03ee9236b/dfb2c317-008b-45d6-bcfa-8af03ee9236b1.gif)
(×
)
3.信息构成要素中的实体,只能是通过普通感官直接感知的内容。
4.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦缺少了组件,实体便不完整。
5.数量属性与质量属性是属性的基本分类,也是最重要的分类。
6.统计学中将由许多个小实体构成的同类实体看作集合,称之为总体;
将构成总体的许多小实体看成集合的元素,特别的,如果小实体都不可再分,则称之为个体。
(√)
7.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终目标却是要获得总体数据所包含的信息。
8.统计数据的获取过程包含调查和汇总两个阶段。
9.数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、图像并不包括在内。
10.如果在总体的每个层里独立的进行抽样,则称为分层抽样。
四、简答题
1.简述分类变量与数值变量的根本区别。
(仅供参考)
答:
数值变量是可以自然地直接使用数值表示其变量值;
分类变量是并非可以自然的直接使用数值表示其变量值。
2.简述信息与数据的异同。
举例说明有些信息不是数据。
答:
信息由实体和属性构成,信息表现形式繁多,包括文字、符号、数字、数值、文本、音频、视频、图像等。
数据是可以概况归纳为量化凭据或依据的信息,一般包括文字、符号、数字、数值,个体信息量巨大的文本、音频、视频、图像等并不包括在内。
例如地图很难数字化。
3.请分别指出下列描述中的实体与属性。
(仅供参考)
1)汽车的颜色实体:
汽车属性:
颜色
2)家庭的人口数实体:
家庭属性:
人口数
3)国内生产总值最多的国家实体:
国家属性:
国内生产总值
4)人的身高实体:
人属性:
身高
4.统计调查的八要素有哪些?
调查主体、调查客体、调查内容、调查方法、调查工具、调查准则、调查程序、调查结果。
5.简述抽样设计的内容和抽样的一般步骤。
P24
形成性考核二(第三章、第四章)
1.对一个变量而言,其(B)指的是全面调查获得的所有变量值(或组)与其对应频率的一揽子表示。
A.分布B.总体分布C.样本分布D.频数
2.(C)指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。
A.分布B.总体分布C.样本分布D.联合总体分布
3.以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是(A)。
A.语示法B.表示法C.图示法D.函数法
4.以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是(B)。
5.以图形方式表达复杂变量的分布的表达方法是(C)。
6.(B)既可以反映较少类数也可以反映较多类数的分类变量分布,甚至也能反映分组化的数值变量分布,居于优先选择地位。
A.饼形图B.柱形图C.条形图D.直方图
7.在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即占整个圆形面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。
这样的图称为(A)。
A.饼形图B.柱形图C.条形图D.直方图
8.在所有总体分布特征中,最重要的分布特征是(D)。
A.中位数B.众数C.标准差D.均值
9.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是(D)。
A.二者均为离散变量B.二者均为连续变量
C.前者为连续变量,后者为离散变量D.前者为离散变量,后者为连续变量
10.总量指标数值大小(A)
A.随总体范围扩大而增大B.随总体范围扩大而减小
C.随总体范围缩小而增大D.与总体范围大小无关
11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C)
A.小于100%B.大于100%C.等于100%D.小于或大于100%
12.众数是(C)。
A.出现次数最少的次数B.出现次数最少的标志值
C.出现次数最多的变量值D.出现次数最多的频数
13.在一组数据中,每个数据类型出现的次数称为(B)。
A.参数B.频数C.众数D.组数
14.集中趋势最主要的测度值是(B)。
A.几何平均数B.算术平均数
C.众数D.中位数
15.下列分布中,不属于离散随机变量分布的是(D)。
A.超几何分布B.伯努利分布
C.几何分布D.正态分布
1.分布的表达方法有(ABCD)。
A.语示法B.表示法C.图示法D.函数法
2.分布图的主要形式包括(ABCD)。
3.均值的计算方式包括(AB)。
A.算术平均数B.加权平均数C.中位数D.方差
4.下列选项中,可以反映数值变量离散程度分布特征的是(BD)
A.中数B.四分位差C.偏度D.标准差
5.下列分布中,属于连续型随机变量分布的是(BD)。
A.超几何分布B.指数分布C.几何分布D正态分布
三、计算分析题
1.某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。
试求这位幸运者分别是以下几种可能的概率:
(1)女性;
(2)工程师;
(3)女工程师,(4)女性或工程师。
并说明几个计算结果之间有何关系?
序号
1
2
3
4
5
6
7
8
9
10
11
12
性别
男
女
职称
工程师
技术员
解:
设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
2.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。
试求这种零件的次品率。
求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率
。
考虑逆事件
“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:
于是
3.已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。
试求任一参考人员成绩优秀的概率。
设A表示“合格”,B表示“优秀”。
由于B=AB,于是
=0.8×
0.15=0.12
4.某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。
某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。
求该选手两发都脱靶的概率。
设A=第1发命中。
B=命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
=0.8×
1+0.2×
0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):
P(脱靶)=P(第1次脱靶)×
P(第2次脱靶)=0.2×
0.5=0.1
5.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。
试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?
设A=活到55岁,B=活到70岁。
所求概率为:
6.某班级25名学生的统计学考试成绩数据如下:
89,95,98,95,73,86,78,67,69,82
84,89,93,91,75,86,88,82,53,80
79,81,70,87,60
试计算:
(1)该班统计学成绩的均值、中位数和四分位数;
(2)该班统计学成绩的方差、标准差。
(3)根据60分以下、60-70分,70-80分,80-90分,90分仪式上的分组标准,编制考试成绩的分布表。
解:
先将考试成绩按从小到大顺序排列
53,60,67,69,70,73,75,78,79,80,81,82,82,84,86,86,87,88,89,89,91,93,95,95,98
(1)均值
中位数位置:
故中位数Me=82
下四分位数位置
6.25≈6,即位于第6位和第7位之间,第6位是73,第7位是75,两者的平均数是74,即下四分位数是74。
上四分位数位置
18.75≈19,即位于第19位和第20位之间,第19位是89,第20位是89,两者的平均数是89,即上四分位数是89。
(2)标准差
=
=10.950
方差
形成性考核三(第五章)
1.估计量的含义是指(A)。
A.用来估计总体参数的统计量的名称
B.用来估计总体参数的统计量的具体数值
C.总体参数的名称
D.总体参数的具体数值
2.根据一个具体的样本求出的总体均值的95%的置信区间(D)。
A.以95%的概率包含总体均值
B.有5%的可能性包含总体均值
C.一定包含总体均值
D.要么包含总体均值,要么不包含总体均值
3.无偏估计是指(B)
A.样本统计量的值恰好等于待估的总体参数
B.所有可能样本估计值的数学期望等于待估总体参数
C.样本估计值围绕待估总体参数使其误差最小
D.样本量扩大到和总体单元相等时与总体参数一致
4.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以(A)
A.样本均值的抽样标准差
B.样本标准差
C.样本方差
D.总体标准差
5.当样本量一定时,置信区间的宽度(B)
A.随着置信系数(置信度)的增大而减小
B.随着置信系数的增大而增大
C.与置信系数的大小无关
D.与置信系数的平方成反比
6.当置信水平一定时,置信区间的宽度(A)
A.随着样本量的增大而减小
B.随着样本量的增大而增大
C.与样本量的大小无关
D.与样本量的平方根成正比
7.一个95%的置信区间是指(C)
A.总体参数中有95%的概率落在这一区间内
B.总体参数中有5%的概率落在这一区间内
C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数
D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
8.95%的置信水平是指(B)
A.总体参数落在一个特定的样本所构造的区间内的概率为95%
B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%
C.总体参数落在一个特定的样本所构造的区间内的概率为5%
D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%
9.一个估计量的有效性是指(D)
A.该估计量的数学期望等于被估计的总体参数
B.该估计量的一个具体数值等于被估计的总体参数
C.该估计量的方差比其他估计量大
D.该估计量的方差比其他估计量小
10.一个估计量的一致性是指(C)
B.该估计量的方差比其他估计量小
C.随着样本量的增大该估计量的值越来越接近被估计的总体参数
D.该估计量的方差比其他估计量大
11.置信系数(
)表达了置信区间的(D)
A.准确性B.精确性C.显著性D.可靠性
12.在置信水平不变的条件下,要缩小置信区间,则(A)
A.需要增加样本量
B.需要减小样本量
C.需要保持样本量不变
D.需要改变统计量的抽样标准差
13.在其它条件不变的情况下,总体数据的方差越大,估计时所需的样本量(A)
A.越大B.越小C.可能大也可能小D.不变
14.在其它条件相同的情况下,95%的置信区间比90%的置信区间(A)
A.要宽B.要窄C.相同D.可能宽也可能窄
15.指出下面的说法中哪一个是正确的(A)
A.样本量越大,样本均值的抽样标准差就越小
B.样本量越大,样本均值的抽样标准差就越大
C.样本量越小,样本均值的抽样标准差就越小
D.样本均值的抽样标准差与样本量无关
16.指出下面的说法中哪一个是正确的(A)
A.置信水平越大,估计的可靠性就越大
B.置信水平越大,估计的可靠性就越小
C.置信水平越小,估计的可靠性就越大
D.置信水平的大小与估计的可靠性无关
17.指出下面的说法中哪一个是正确的(B)
A.在置信水平一定的条件下,要提高估计的可靠性,就应缩小样本量
B.在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量
C.在样本量一定的条件下,要提高估计的可靠性,就降低置信水平
D.在样本量一定的条件下,要提高估计的准确性,就提高置信水平
18.在一项对学生资助贷款的研究中,随机抽取480名学生作为样本,得到毕业前的平均欠款余额为12168元,标准差为2200元。
则贷款学生总体中平均欠款额的95%的置信区间为(A)
A.(11971,12365)B.(11971,13365)
C.(11971,14365)D.(11971,15365)
19.从一个正态总体中随机抽取n=20的一个随机样本,样本均值为17.25,样本标准差为3.3。
则总体均值的95%的置信区间为(B)
A.(15.97,18.53)B.(15.71,18.79)
C.(15.14,19.36)D.(14.89,20.45)
20.某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量为(C)
A.20B.30C.40D.50
1.在抽样推断中(ACD)
A.抽样指标的数值不是唯一的B.总体指标是一个随机变量
C.可能抽取许多个样本D.统计量是样本变量的涵数
2.从全及总体中抽取样本单位的方法有(BC)
A.简单随机抽样B.重复抽样C.不重复抽样D.概率抽样
3.在抽样推断中,样本单位数的多少取决于(BC)
A.总体标准差的大小B.允许误差的大小
C.抽样估计的把握程度D.总体参数的大小
4.区间估计和点估计的理论核心分别是(AB)
A.中心极限定理B.大数定理
C.切比雪夫大数定理D.辛钦大数定理
5.简单随机抽样(ACD)。
A.适用于总体各单位呈均匀分布的总体B.适用于总体各单位标志变异较大的总体
C.在抽样前要求对总体各单位加以编号D.最符合随机原则
三、简答题
1.简述以样本均值估计总体均值的理由?
(仅供参考)P96
(1)对于待估参数总体均值而言,样本均值作为估计量随着样本量增大可以非常接近,且需要时可以无限接近总体均值。
也就是说,以样本均值估计总体均值是完全可能的,这正是所谓大数定理的结论。
(2)样本均值几乎符合所有估计量的优良性质。
(3)区间估计能够可靠的实现样本均值估计总体均值的目标。
2.随机试验满足三个条件是什么?
P105
(1)试验是可重复的;
(2)试验的所有可能结果是已知的;
(3)一次具体试验的结果无法确知。
四、计算分析题
在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。
其中拥有该品牌电视机的家庭占23%。
求总体比率的置信区间,置信水平分别为90%和95%。
已知样本容量n=200,为大样本,拥有该品牌电视机的家庭比率p=23%,
拥有该品牌电视机的家庭比率的抽样标准误差为
=2.98%
1双侧置信水平为90%时,通过2
-1=0.90换算为单侧正态分布的置信水平
=0.95,查单侧正态分布表得
=1.64,
此时的置信区间为
=23%±
1.64×
2.98%=
可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。
⑵双侧置信水平为95%时,得
=1.96,
1.96×
可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为
;
(17.16%,28.84%)。
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
假定总体标准差为15元,求样本均值的抽样标准误差;
在95%的置信水平下,求允许误差;
如果样本均值为120元,求总体均值95%的置信区间。
(1)已假定总体标准差为
=15元,
则样本均值的抽样标准误差为
=2.1429
(2)已知置信水平1-
=95%,得
于是,允许误差是E=
=1.96×
2.1429=4.2000。
(3)已知样本均值为
=120元,置信水平1-
这时总体均值的置信区间为
=120±
4.2=
可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
形成性考核四(第六章)
1.对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为(D)
A.参数估计B.双侧检验C.单侧检验D.假设检验
2.研究者想收集证据予以支持的假设通常称为(B)
A.原假设B.备择假设C.合理假设D.正常假设
3.在假设检验中,原假设和备择假设(C)
A.都有可能成立B.都有可能不成立
C.只有一个成立而且必有一个成立D.原假设一定成立,备择假设不一定成立
4.在假设检验中,第Ⅰ类错误是指(A)
A.当原假设正确时拒绝原假设B.当原假设错误时拒绝原假设
C.当备择假设正确时未拒绝备择假设D.当备择假设不正确时拒绝备择假设
5.当备择假设为:
,此时的假设检验称为(C)
A.双侧检验B.右侧检验C.左侧检验D.显著性检验
6.某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为1.40。
某天测得25根纤维的纤度的均值为
=1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平为α=0.05,则下列正确的假设形式是(D)
A.H0:
μ=1.40,H1:
μ≠1.40
B.H0:
μ≤1.40,H1:
μ>1.40
C.H0:
μ<1.40,H1:
μ≥1.40
D.H0:
μ≥1.40,H1:
μ<1.40
7.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为(C)。
A.H0:
μ≤20%,H1:
μ>
20%B.H0:
π=20%H1:
π≠20%
C.H0:
π≤20%H1:
π>
20%D.H0:
π≥20%H1:
π<
20%
8.在假设检验中,不拒绝原假设意味着(D)。
A.原假设肯定是正确的B.原假设肯定是错误的
C.没有证据证明原假设是正确的D.没有证据证明原假设是错误的
9.若检验的假设为H0:
μ≥μ0,H1:
μ<
μ0,则拒绝域为(B)
A.z>
zαB.z<
-zαC.z>
zα/2或z<
-zα/2D.z>
zα或z<
-zα
10.若检验的假设为H0:
μ≤μ0,H1:
μ0,则拒绝域为(A)
zαB.z<
zα/2或z<
-zα/2D.z>
zα或z<
-zα
11.如果原假设H0为真,所得到的样本结果会像实际观测取值那么极端或更极端的概率称为(C)
A.临界值B.统计量C.P值D.事先给定的显著性水平
12.对于给定的显著性水平α,根据P值拒绝原假设的准则是(B)
A.P=αB.P<
αC.P>
αD.P=α=0
13.下列几个数值中,检验的p值为哪个值时拒绝原假设的理由最充分(D)
A.95%B.50%C.5%D.2%
14.若一项假设规定显著性水平为α=0.05,下面的表述哪一个是正确的(B)
A.接受H0时的可靠性为95%B.接受H1时的可靠性为95%
C.H0为假时被接受的概率为5%D.H1为真时被拒绝的概率为5%
15.进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会(B)
A.减小B