六西格玛黑带A阶段试题卷答案.docx
《六西格玛黑带A阶段试题卷答案.docx》由会员分享,可在线阅读,更多相关《六西格玛黑带A阶段试题卷答案.docx(22页珍藏版)》请在冰豆网上搜索。
六西格玛黑带A阶段试题卷答案
一.选择题【每题1分,共40分,1-30题为单选题,31-40题为多选题】
1.变量x与y之间的负相关是指(C)。
A.x数值增大时y也随之增大B.x数值减少时y也随之减少
C.x数值增大(或减少)时y随之减少(或增大)D.y的取值几乎不受x取值的影响
2.M公司生产垫片。
在生产线上,随机抽取100片垫片,发现其厚度分布均值为2.0mm,标准差为
0.2mm。
取10片叠起来,则这10片垫片叠起来后总厚度的均值和方差为:
(C)
A.均值2.0mm;方差0.2
B.均值20mm;方差0.04
C.均值20mm;方差0.4
D.均值20mm;方差4
3.某大学的一家快餐店记录了过去5年每天的营业个,每天营业额的均值为2500元,标准差为400元。
由于某些时间的营业额偏高,所以每日营业额的分布都是右偏的。
假设从这5年中随机抽取100天,并计算着100天的平均营业额,则样本均值的抽样分布是(B)
A.正态分布,均值为250元,标准差为40元
B.正态分布,均值为2500元,标准差为40元
C.右偏,均值为2500元,标准差为400元
D.正态分布,均值为2500元,标准差为400元
4.当你把一样本数据与标准值为70相对比,样本数据组的均值为68.8,标准差为3.5,样本数目为36,请据此计算t-统计量(A)
A.-2.06
B.-1.55
C.1.98
D.2.46
5.使用下面的数据计算卡方统计量(B)
A.1.245
B.0.837
C.0.564
D.2.346
6.为实验两种材料制成运动鞋的耐穿程度选10个男孩做测试,用以下哪个工具?
(C)
A.Ztest
B.2-Samplettest
C.Pairedttest
D.ANOVA
7.回归方程Y=30−X中,Y的误差的方差的估计值为9,当X=1时,Y的95%的近似均值置信区间
是(A)
A.(23,35)
B.(24,36)
C.(20,38)
D.(21,39)
8.为了判断A车间生产的垫片的变异性是否比B车间生产的垫片的变异性更小,各抽取25个垫片
后,测量并记录了其厚度的数值,发现两组数据都是正态分布。
下面应该进行的是:
(A)
A.两样本F检验
B.两样本T检验
C.两样本配对差值的T检验
D.两样本Mann-Whitney秩和检验
9.响应变量Y与两个自变量(原始数据)X1及X2建立的回归方程为:
y=2.2+30000X1+0.0003X2,由此方程可以得到结论是:
(D)
A.X1对Y的影响比X2对Y的影响要显著得多
B.X1对Y的影响比X2对Y的影响相同
C.X2对Y的影响比X1对Y的影响要显著得多
D.仅由此方程不能对X1及X2对Y影响大小作出判定
10.为了判断改革后的日产量是否比原来的200(千克)有所提高,抽取了20次日产量,发现日产
量平均值为201(千克)。
对此可以得到判断:
(D)
A.只提高1千克,产量的提高肯定是不显著的
B.日产量平均值为201(千克),确实比原来200(千克)有提高
C.因为没有提供总体标准差的信息,因而不可能作出判断
D.不必提供总体标准差的信息,只要提供样本标准差的信息就可以作出判断
11.在计算出控制图的上下控制限后,可以比较上下控制限与上下公差限的数值。
这两个限制范围的
关系是:
(D)
A.上下控制限的范围一定与上下公差限的范围相同
B.上下控制限的范围一定比上下公差限的范围宽
C.上下控制限的范围一定比上下公差限的范围窄
D.上下控制限的范围与上下公差限的范围一般不能比较
12.下列各直线回归方程中,哪一个是不正确的?
(B)。
A.
=15+7X,r=0.92B.
=20-5X,r=0.85
C.
=-10+2X,r=0.78D.
=5-3X,r=-0.69
13.对整个多元线性回归模型的显著性检验,应采用(C)。
A.z检验B.t检验C.F检验D.卡方检验
14.一个样本数量为100的测量值之平均值为50和标准差为5,请估算95%的均值置信区间(假设分布是正态的)。
(D)
A.48.22<μ<51.22B.49.01<μ<51.22
C.48.22<μ<50.99D.49.01<μ<50.99
15.某BB要评估工艺的厚度设定分别为:
A,B,C种温度.采集的厚度数据(假设为正态分布)是由计量性量具得到,以下哪一种统计分析方法最合适他(D)
A.1-SampleZ-TestB.Regressionanalysis
C.2Samplet-TestD.OneWayANOVA
16.为了判断两个变量间是否有相关关系,抽取了30对观测数据。
计算出了他们的样本相关系数为
0.65,对于两变量间是否相关的判断应该是这样的:
(D)
A.由于样本相关系数小于0.8,所以二者不相关
B.由于样本相关系数大于0.6,所以二者相关
C.由于检验两个变量间是否有相关关系的样本相关系数的临界值与样本量大小有关,所以要查样本相关系数表才能决定
D.由于相关系数并不能完全代表两个变量间是否有相关关系,本例信息量不够,不可能得出判定结果
17.某工程师想调查四种不良与三台机械之间有无关系,我们通常采用(B)分析手法。
A.ANOVAB.卡方检验(Chi-square)
C.回归分析D.相关关系
18..以下关于中心极限定理及样本均值的分布说法错误的是:
(B)
A.随着样本量的无限增长,无论原来的分布呈何种形态,样本平均的分布总会趋向于正态分布
B.我们可以利用中心极限定理原则来减少测量系统误差;如果想使测量系统的误差减小一半,我们只要把2次的测量值平均就可以了。
C.样本平均值分布的平均值和总体的平均值十分接近
D.样本平均值分布的标准偏差等于总体的标准偏差除以样本数的平方根
19.要检验改进前后合格率是否有显著性变化,团队小组分别抽取了改进前后两组数据,应采用哪种方法?
(D)
A.1-tB.2-tC.1-PD.2-P
20.在以下Minitab的回归分析结果,回归等式中的a,b取值应为:
(A)
A.a=1.7081;b=0.035579B.a=0.4037;b=0.005233
C.a=19.747;b=19.653D.a=19.747;b=0.427
Theregressionequationis
SolderJointStrength=a+b*%Aperture
PredictorCoefSECoefTP
Constant1.70810.40374.230.000
%Aperture0.0355790.0052336.800.000
S=0.6536R-Sq=50.1%R-Sq(adj)=49.0%
21.对简单回归分析的预测区间图表说明不准确的是(D)
A.平均(X,Y)在适合的回归线上B.标本数越多置信区间越小
C.X=Xbar时,置信区间为最小D.X的值离Xbar越远,置信区间越小
22.在对两个广告效果的电视评比中,每个广告在一周的时间内播放6次,然后对看过广告的人要求他们陈述广告的内容,记录资料如下:
广告
看过广告的人数
回想起主要内容的人数
A
150
63
B
200
60
显著性水平为0.05,检验对两个广告的回想比率有没有差异,结论为(A)
A.拒绝H0
B.不能拒绝H0
C.可以拒绝也可以不拒绝H0
D.可能拒绝也可能不拒绝H0
23.下面那个不是多变量分析易犯的错误(D)
A.在不影响流程自然运作的状态下所收集的“X”,其变异范围可能太狹窄
B.交互作用存在,但我们一次只观察一个“X”
C.有多元共线性(Multi-colinearity)和混淆Confounding)存在
D.使用多变量分析来分析噪音因子的影响
24.下面哪个不是中心极限定理的标准描述(D)
A.样本平均值分布的平均值非常接近于总体平均值
B.样本平均值分布的标准差是总体标准差除以样本大小的平方根
C.样本平均值的分布非常接近于正态分布
D.样本的平均值非常接近总体的平均值
25-27题数据:
某厂生产的一种合金线,长期以来其抗拉强度服从正态分布,总体均值为1035.6,今用新工艺,从中随机抽取10根进行试验,测得抗拉强度数据如下:
1030.91042.01046.01035.01056.81050.01035.31037.61046.01046.4,分析目的:
求证在显著性水平0.05时,能否认为抗拉强度的均值有显著提高。
25.请问要作出此判断应采用什么方法进行检验(A)
A.1-tB.2-tC.1-ZD.1-P
26.备择假设是什么?
(A)
A.抗拉强度均值大于1035.6B.抗拉强度均值小于1035.6
C.抗拉强度标准差大于1035.6D.抗拉强度标准差小于1035.6
27.其检验的前提条件是什么?
(C)
A.正态分布;且随机;既可是连续变量,也可是离散变量
B.正态分布;方差相等;随机数据
C.正态分布;方差可相等,也可不相等;随机数据
D.是否正态分布无所谓,但一定要连续分布
28-30题数据:
某单位研究蔗渣的硫酸盐硬浆的蒸煮,使用6%,8%,10%三种不同用碱量。
在165度,保温30分钟。
每种用碱量都进行了3次蒸煮,如下图。
并对三种不同碱量对粗浆硬度进行有无显著影响的分析表:
28.请问您作为BB将使用何种工具进行分析。
(A)
A.ANOVAB.2T
C.逻辑回归D.相关与回归
29.含碱量是否为影响粗浆硬度的显著性因子(A)
A.是显著性因子B.非显著性因子
C.不能判定D.不相关
30.不同含碱量对粗浆硬度的影响各水平之间是否有显著性影响(D)
A.6%、8%、10%三者之间都有显著性差异
B.6%与8%之间有显著性差异,其他无显著差异
C.10%与8%之间有显著性差异,其他无显著差异
D.除6%与8%之间无显著性差异外,其他都有显著性差异
31.单位产品成本对产量的一元线性回归方程为Y=85-5.6x,x单位为千件,Y单位是元.此方程通过R-square、F检验、残差判断OK。
这意味着[多选](ACE)
A.单位成本与产量之间存在着负相关B.单位成本与产量之间是正相关
C.产量为1000件时单位成本为79.4元D.产量每增加1千件单位成本平均增加5.6元
E.产量每增加1千件单位成本平均减少5.6元
32.M车间生产螺钉。
为了估计螺钉的长度,从当日成品库中随机抽取25个螺钉,测量了它们的长度,
样本均值为22.7mm。
并且求出其长度总体均值的95%置信区间为(22.5,22.9)。
下述哪些判断是不正
确的:
[多选](ABD)
A.当日生产的螺钉中,有95%的螺钉之长度落入(22.5,22.9)之内。
B.当日任取一个螺钉,其长度以95%的概率落入(22.5,22.9)之内。
C.区间(22.5,22.9)覆盖总体均值的概率为95%。
D.若再次抽取25个螺钉,样本均值以95%的概率落入(22.5,22.9)之内。
33.X-R控制图比I-MR(单值移动极差)控制图应用更为普遍的原因在于:
[多选](AB)
A.X-R图可适用于非正态的过程
B.X-R有更高的检出力
C.X-R图作图更为简便
D.X-R图需要更少的样本量
34.抽样方法有:
[多选](ABCD)
A.随机抽样B.分层抽样C.系统抽样D.集群抽样
35.以下控制图中控制限可能会出现不是直线的控制图有:
[多选](AB)
A.Xbar-R图B.Xbar-S图C.C图D.NP图
36.选出对残差说明的正确项:
[多选](ABD)
A.残差的平均是零
B.残差符合正态分布
C.残差可以不等分散性
D.残差的数据以随机形式分布
37.请选出RPN计算后所有可以采取的行动措施:
[多选](ACD)
A.收集更多的数据
B.实施实验计划法(DOE)
C.改善PROCESS
D.实施更好的管理方法
38.A阶段所介绍的各种统计工具中有哪几种可以进行残差分析:
[多选](CD)
A.T检验B.相关分析C.ANOVAD.回归分析
39.1SampletTest中关于检验能力的说法正确的是:
[多选](A,D)
A.Type1error变大,Type2error变小,检验能力变大
B.标准偏差大,检验能力变高。
C.差异(sample和目标平均)小,检验能力变高。
D.增大样本量,检验能力变高
40.请选出所有说明错误的项:
[多选](CD)
A.BoxPlot的中心不是平均而是中位值.
B.有平均和标准偏差就可以画出正态分布曲线.
C.正态检验的P-VALUE大于0.05时数据不是正态分布.
D.统计是说从总体中选择样品后,对这些样品求出代表值并推测样本的意思.
二.填空题【每空1分,共10分】
1.某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,服从正态分布,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过50元,应抽取多少个顾客作为样本(23)。
2.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表,使用Minitab求:
请保留2位小数。
来自总体1的样本
来自总体2的样本
1设
,求
95%的置信区间((0.82,3.18))
②设
,
,求
的95%的置信区间((-1.43,5.43))
③设
,
,求
的90%的置信区间((-0.78,4.78))
3.请给出单因子多水平ANOVA分析之前必须经过的主要检验步骤(稳定性检验)(正态性检验)(等方差检验)
4.请给出下面ANOVA结果中空白处的值:
单因子方差分析:
收率与反应温度
来源自由度SSMSFP
温度384.1528.05(7.96)0.002
误差1656.403.52
合计19(140.55)
S=(1.877)R-Sq=59.87%R-Sq(调整)=52.35%
三.判断题【每题1分,共5分】(对则打√,错则打×)
1.ANOVA的分析中使用Tukey、Fisher、Dunnett、MCB得到的结论相同。
——————————(Χ)
2.所有连续性数据分析工具使用之前都必须经过稳定性检验。
——————————————(Χ)
3.我们在回归分析结果R-sq和P值都满意时就可以预测出任何X所对应的Y值。
———————(Χ)
4.回归分析中决定系数R-sq永远等于Pearson相关系数r的平方。
—————————————(Χ)
5.单因子ANOVA结果中估计各水平置信区间时使用的是合并标准差。
—————————————(√)
四.计算分析题【共30分】
1.使用Minitab对下列数据
33.90
35.61
34.04
34.98
37.80
33.09
33.01
35.55
31.84
36.36
32.41
38.08
33.65
32.70
36.70
34.80
35.51
38.72
35.90
33.75
33.71
34.87
36.80
34.90
(1)计算均值在置信水平是90%的情况下的置信区间?
保留小数点后3位数字。
【2分】
答案:
(34.302,35.587)
(2)计算标准差在置信水平是99%的情况下的置信区间?
保留小数点后3位数字。
【2分】
答案:
(1.326,2.896)
2.使用Minitab对某产的2家供应商入场检验数据分析,
供应商A
14.2
13.7
14.9
15.6
15.0
14.7
14.5
15.8
15.8
16.7
14.7
15.0
15.7
14.6
15.4
13.9
15.5
14.4
16.7
14.9
供应商B
14.4
16.0
15.2
15.6
14.8
15.0
14.6
14.6
15.5
16.2
16.5
15.7
16.3
14.5
15.8
15.3
14.9
14.4
15.9
13.1
(1)以95%的置信度评价2家供应商的标准差是否有差异?
并给出Minitab路径【2分】
答案:
(无差异)(稳定性检验的路径->正态检验的路径->等方差检验的路径)
(2)以95%的置信度评价2家供应商的平均值是否有差异?
并给出Minitab路径【2分】
答案:
(无差异)(稳定性检验的路径->正态检验的路径->等方差检验的路径->2T或ANOVA)
3.某医药企业评价减肥药品的疗效,取10人进行试验,服药前后的体重如下:
服药前体重
90
79
86
88
92
79
76
87
102
96
服药后体重
83
70
80
84
87
74
79
83
96
90
(1)你将使用何种工具分析最准确?
【2分】
答案:
PairedT检验
(2)在α=0.05水平下,服用药物后体重是否有显著降低?
【2分】
答案:
有显著降低
(3)此药品的效果的95%的置信区间?
【2分】
答案:
体重降低值的均值95%置信区间:
(2.652,7.148)
4.某公司8个所属企业的产品销售资料如下:
企业编号
产品销售额(万元)
销售利润(万元)
1
2
3
4
5
6
7
8
170
220
390
430
480
650
850
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
(1)销售额与利润之间是否相关?
给出皮尔森相关系数r?
【2分】
答案:
是,r=0.987
(2)以利润为Y、销售额为X,给出回归方程。
【2分】
答案:
Y=-8.406+0.07813X
(3)在95%的概率保证下,求当销售额为800万元时利润额的置信区间和预测区间。
【2分】
答案:
95%置信区间(49.07,59.12);95%预测区间(42.92,65.27)
5.请分析如下的Y与X的关系:
X
Y
X
Y
11
2577.5
36
1208
100
3550.9
47
1019.5
22
1854
92
2824.6
31
1404.6
21
1889.9
53
1027.9
13
2426.9
72
1496.4
34
1313.5
20
1908.7
67
1388.3
19
2043.9
107
4264.9
18
2051.9
71
1496.4
35
1250.4
82
2055.2
58
1075.6
80
1993
96
3207.9
96
3166.2
(1)从残差图中您观察到什么结论?
【3分】
答案:
存在二次关系
(2)请给出最合理的方程式?
【3分】
答案:
Y=3556-100.7X+1.007X**2
6.为比较体育运动的偏好,进行随机调查1680人,样本数据如下:
体育运动
男性
女性
足球
150
130
篮球
150
110
排球
100
130
网球
100
80
羽毛球
90
110
乒乓球
140
100
游泳
120
170
(1)试分析男性和女性对体育运动的偏好是否一致?
【2分】
答案:
不一致
(2)请给出卡方检验的自由度?
【2分】
答案:
df=6
五.论述题计算【共15分】
1、某化学反应过程的输出变量Y=Yield,输入变量X1=Temperature和X2=CatalystSolution,请回答以下问题:
Yield
Catalyst
Temp
1
2
3
1
76
81
78
1
82
67
72
1
64
83
85
1
87
75
83
2
55
77
86
2
56
74
74
2
65
71
81
2
64
73
78
3
52
53
69
3
63
63
70
3
65
60
65
3
60
57
60
1)根据数据格式您将使用哪种工具分析输入变量与输出变量的关系?
并给出Minitab的路径【2分】
答案:
平衡方差分析,统计>方差分析>平衡方差分析
2)请问X1、X2及X1*X2是否显著?
并给出X1、X2、X1*X2方差分析的P值【2分】
答案:
X1、X2及X1*X2都显著,
Yield的方差分析
来源自由度SSMSFP
Catalyst2529.39264.697.580.002
Temp21620.72810.3623.200.000
Catalyst*Temp4442.44110.613.170.029
误差27943.0034.93
合计353535.56
3)计算EpsilonSquares,并回答此研究中哪个因子是最具影响力的输入变量?
【3分】
答案:
Temp
来源
SS
ES
Catalyst
529.39
14.97%
Temp
1620.72
45.84%
Catalyst*Temp
442.44
12.51%
误差
943
26.67%
2、某工厂的质量改进小组对氩弧焊接工序进行研究,右表的数据是关键输入变量—焊接电流、氢气压力、氩气压力对焊接强度的关系。
请回答以下问题:
序号
焊接电流
氢气压力
氩气压力
焊接强度
1
80.0
68