中国石油大学华东应用统计方法期末考试题1.docx
《中国石油大学华东应用统计方法期末考试题1.docx》由会员分享,可在线阅读,更多相关《中国石油大学华东应用统计方法期末考试题1.docx(11页珍藏版)》请在冰豆网上搜索。
中国石油大学华东应用统计方法期末考试题1
1•在某新产品开发试验中需要考虑四个因素A、B、C、D对产品质量的影响。
根据专业知识和实践经验知道,A与C之间存在着交互作用,D与A、B及C之间的交互作用可以忽略不计。
(1)假设每个因子只取两个水平,试选择适当的正交表安排该实验;
(2)
解:
(1)
指出第2号及第5号试验的实验条件。
根据题意,A与B、B与C之间的交互作用还不能肯定,需要通过试验考察。
这样,需要考察的因子及交互作用为A,B,C,D,AXB,AXC,BXC。
因此可以选
用L8
(2)正交表。
差矩阵、相关矩阵R的矩估计。
解:
表头设计列入表1-1。
表1-1表头设计
列号
1
2
3
4
5
6
7
因子
A
B
AB
C
AC
BC
D
试验方案列入表1-2。
表1-2实验方案表
水因
A
B
AB
C
AC
BC
D
1
2
3
4
5
6
7
1
1
1
1
1
1
1
1
2
1
1
1
2
2
2
2
3
1
2
2
1
1
2
2
4
1
2
2
2
2
1
1
5
2
1
2
1
2
1
2
6
2
1
2
2
1
2
1
7
2
2
1
1
2
2
1
8
2
2
1
2
1
1
2
(2)第2号试验的试验条件为ABC2D2,第5号试验的试验条件为A2BC1D2。
2(0
1
3.下面记录了三位操作工分别在四台不同机器上操作二天的日产量:
机器
操作工
甲
乙
丙
A
15
17
16
16
18
21
B
16
17
15
15
22
19
C
15
16
18
17
18
18
D
18
20
15
17
17
17
上表中两数之和。
将计算的有关结果列入方差分析表(表
解:
方差来源
平方和
自由度
平均平方和
F值
操作工
30.0833
2
15.0417
10.9394
机器
0.4583
3
0.1528
0.1111
交互作用
34.9167
6
5.8195
4.2323
误差
16.5
12
1.375
——
总和
81.9583
23
——
——
3-1)中。
对于给定水平0.05,由PF
表3-1方差分析表
0.05分别查(附表5)得13.89,23.49,
33.00,由表3-1可知:
(1)操作工之间的差异显著。
(2)机器之间的差异不显著。
(3)操作工与机器交互影响显著。
(1)贝叶斯判别法:
(2)
(3)
(2)距离判别法:
显然d(1.1,1)d(1.1,2),故X21.1属于
(3)结果不一致分析。
5.已知四个样品分别为(2,5),(2,3),(4,3),(6,2),试用重心法和离差平方和法进行聚类分析。
若分成两类,请您提出您的分类建议。
解:
(1)重心法:
首先将四个样品分别看做一类,计算距离矩阵D(o)0
D(o)
G
G2
G3
G4
G
0
G2
4
0
G3
8
4
0
G4
25
17
5
0
由D(0)可以看出,G2和G3之间距离最短,因此可以合并为一个新类G5G2,G3,
然后计算Gi、G4、G5之间的距离,得相应的D:
)如下
D
(2)
G1
G4
G5
G
0
G4
25
0
G5
5
25
0
由D
(1)可以看出,Gi和G5之间距离最短,因此可以合并为一个新类G6Gi,G5,
然后计算G4、G6之间的距离,得相应的D
(2)如下
D
(2)
G4
G6
G4
0
G6
16.25
0
最后将G4与G6合为一类G7G,G2,G3,G4。
上述聚类过程用聚类图表示为图5-1。
(2)离差平方和法:
由
(1)中已计算的重心法的距离平方及D2qnPQDpq(C)计算距离矩阵D(0)。
npnq
D(0)
G
G2
G3
G4
G
0
G2
2
0
G3
4
2
0
G4
12.5
8.5
2.5
0
由D(0)可以看出,G2和G3之间距离最短,因此可以合并为一个新类G5G2,G3,
然后计算Gi、G4、G5之间的距离,得相应的D2i)如下
d
(2)
G1
G4
G5
G
0
G4
12.25
0
G5
3.3333
16.6667
0
由D:
)可以看出,Gi和G5之间距离最短,因此可以合并为一个新类G6G,G5,
d
(2)
G4
G6
G4
0
G6
12.1875
0
6.在有关合成纤维的强度y与其拉伸倍数X的试验中得试验数据如下:
然后计算G4、G6之间的距离,得相应的d
(2)如下
'序变量^
Xi
yi
2
Xi
2yi
Xiyi
1
2
1.3
4
1.69
2.6
2
2.5
2.5
6.25
6.25
6.25
3
2.7
2.5
7.29
6.25
6.75
4
3.5
2.7
12.25
7.29
9.45
5
4
3.5
16
12.25
14
6
4.5
4.2
20.25
17.64
18.9
7
5.2
5
27.04
25
26
8
6.3
6.4
39.69
40.96
40.32
9
7.1
6.3
50.41
39.69
44.73
10
8
7
64
49
56
11
9
8
81
64
72
12
10
8.1
100
65.61
81
刀
64.8
57.5
428.18
335.63
378
(1)
(2)
(3)解:
试利用上述数据表建立合成纤维的强度y与其拉伸倍数X的回归方程;检验所见方程是否有意义(0.05);
预测当拉伸倍数x=6时,强度y的置信度为95%的置信区间。
最后将G4与G6合为一类G7G,G2,G3,G4。
上述聚类过程用聚类图表示为图5-2。
(1)由于
n=12,
12
lxx
i
64.8
2
x)
5.4,
12
2
x
i1
于是得
lxy
12
(Xi
i1
x)(yi
y)
12
lxy
lxx
故所求回归方程为
(2)
12
由PF
lyy
$x
(y
2
y)
12
$lxy
-57.5
y174.7917
-2
12x428.1812
xiyi12xy37812
67坯0.8625
78.26
4.79170.86255.4
0.13420.8625X
2
y12y335.63
0.862567.497858.2169
S回1.8884
0.05,查F(1,10)分布表(附表5)得
F-^-S回308.2869
S残/(122)
所以回归方程有意义。
(3)x6时,y的估计值为
$
又SJS残/(n2)0.4346,
得2.2281,故得y的置信度为
sj1
(罷
(5.4)278.26
5.44.791767.4978
0.1342
12(4.7917)260.1053
4.96,而
4.96
0.13420.862565.3092
0.05/20.025,查t(10)分布表(附表3)
95%的预测区间为
丄于^,$0S》
nlxxV
lxx
lxx
1(Xo5.4)2
(0.13420.8625X02.22810.4346/1
0V1278.26
0.13420.8625x02.22810.4346(1—(X05.4))
V1278.26
从而得X6时,y的置信度为95%的预测区间为(4.2992,6.3192)
论述题:
(任选两题)
1•解释假设检验的基本思想方法及可能会犯的两类错误。
71-73
2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比较,指出各自的优缺点。
183/189-190
3.试述费歇判别的基本思想方法及主要步骤。
216/219-220
4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。
操作工之间的差异是否显著;
机器之间的差异是否显著;
交互影响是否显著(解:
由题意知k3,r4,n2,又由题目给出数据可得: