应用统计真题.docx
《应用统计真题.docx》由会员分享,可在线阅读,更多相关《应用统计真题.docx(91页珍藏版)》请在冰豆网上搜索。
![应用统计真题.docx](https://file1.bdocx.com/fileroot1/2023-6/19/6b57ff26-12af-497e-99f8-4f6d390d421f/6b57ff26-12af-497e-99f8-4f6d390d421f1.gif)
应用统计真题
精品文档
论述题:
1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。
2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行
比较,指出各自的优缺点。
3.试述费歇判别的基本思想方法及主要步骤。
4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。
6.解释正交试验设计的特点及理论依据。
7.试论述一元线性回归的基本思想及主要方法步骤。
一、(任选两题,每题10分,共20分)
1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制
可能犯两类错误的概率。
2.解释正交试验设计的特点及理论依据。
3.试述一元线性回归的基本思想及主要方法步骤。
答案:
1.假设原理运用了小概率原理,在原假设H0正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生
了,则认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,则没有理由拒绝原假设。
第一类错误:
弃真错误即H0为真时,作出拒绝H0的判断;第二类错误:
纳伪错误即H0不真时,作出接受H0的判断。
通常限制犯第一类错误的概率,增大样本容量使犯第二类错误的概率尽可能地
小。
为了简化检验过程,更多的应用是只控制犯第一类错误的概率,而不考虑犯第二
类错误的概率。
2.正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、
省的特点。
“多”是指可以考虑多因素、多指标;“快”是指试验次数少、周期短、
见效快;“好”是指可以很快找到优秀方案和可能最优方案;“省”是指省时间、
省耗费、省资金、省劳力等。
正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比
性两个方面。
均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水
.
精品文档
平组合的方案之中。
整齐可比性是指对于每列因素,在各个水平导致的结果之和
中,其它因素的各个水平出现的次数是相同的。
3.一元线性回归是研究两个变量之间的相关关系,且两个变量有着密切的关系,它们的这种相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式。
1)先进行相关性分析,看两个变量间是否有线性关系,确定回归方程中的因变量与自变量,对线性模型进行假设;
2)从样本数据出发对线性回归方程进行参数估计,确定回归方程;
3)对回归方程进行各种统计检验:
回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差正态检验。
4)利用回归方程进行解释或预测现象。
.
精品文档
1.在某新产品开发试验中需要考虑四个因素A、B、C、D对产品质量的影响。
根据专业知识和实践经验知道,A与C之间存在着交互作用,D与A、B及C之间的交互作用可以忽略不计。
(1)假设每个因子只取两个水平,试选择适当的正交表安排该实验;
(2)指出第2号及第5号试验的实验条件。
解:
(1)根据题意,A与B、B与C之间的交互作用还不能肯定,需要通过试验考察。
这样,需要考察的因子及交互作用为A,B,C,D,A×B,A×C,B×C。
因此可以选用L8(27)正交表。
表头设计列入表1-1。
表1-1表头设计
列号
1
2
3
4
5
6
7
因子
A
B
AB
C
AC
BC
D
试验方案列入表1-2。
表1-2实验方案表
水
因
A
B
AB
C
AC
BC
D
子
平
试
验
号
1
2
3
4
5
6
7
1
1
1
1
1
1
1
1
2
1
1
1
2
2
2
2
3
1
2
2
1
1
2
2
4
1
2
2
2
2
1
1
5
2
1
2
1
2
1
2
6
2
1
2
2
1
2
1
7
2
2
1
1
2
2
1
8
2
2
1
2
1
1
2
(2)第2号试验的试验条件为
A1B1C2D2,第5号试验的试验条件为A2B1C1D2。
2.设X1
(0,1,1)',X2
(2,0,1)',X3
(1,2,4)',为来自总体X的一个样本,求X的协方
差矩阵
、相关矩阵R的矩估计。
解:
X
13
13
13
xi3)
'
1
1
(10
2),
1
4))
'
(1,1,2)
'
(
xi1,
xi2,
((0
21),
(11
3i1
3i1
3i1
3
3
3
1
3
'
1(
1
1
0
(Xi
X)(Xi
X)
0
(1,0,
1)
1
(1,1,
1)
1
(0,1,2))
31i1
2
1
1
2
.
精品文档
1
1
0
1
0
1
1
1
1
0
0
0
2
1(000
111
012)
1
1
3
2
0
1
1
1
1
0
2
4
2
2
1
0
3
3
2
1
1
0
-
2
μ
1
1
3
R
-
2
2
0
3
1
2
3.下面记录了三位操作工分别在四台不同机器上操作二天的日产量:
操作工
机器
甲
乙
丙
A
15
17
16
16
18
21
B
16
17
15
15
22
19
C
15
16
18
17
18
18
D
18
20
15
17
17
17
试用方差分析法检验:
(1)操作工之间的差异是否显著;
(2)机器之间的差异是否显著;
(3)交互影响是否显著(0.05)。
解:
由题意知k
3,r
4,n
2,又由题目给出数据可得:
T1134,T2
129,T3
150,T1
103,T2
104,T3102,T4
104,T
413,Tij见
上表中两数之和。
k
r
n
T
2
2
S总2
yijl2
7189
413
81.9583
krn
2
i1
j
1
l
1
34
S2
1
k
T
2
T2
1
57097
4132
30.0833
A
rni
1
i
krn
4
2
3
4
2
r
T
2
2
SB2
1
T2j
1
42645
413
0.4583
krn
3
knj
1
2
3
4
2
SAB21
n
k
r
T
2
2
Tij2
SA2
SB21
14345
413
30.08330.458334.9167
krn
i1
j1
2
34
2
S误2=S总2-SA2SB2SAB281.958330.08330.458334.916716.5
.
精品文档
将计算的有关结果列入方差分析表(表
3-1)中。
表3-1方差分析表
方差来源
平方和
自由度
平均平方和
F值
操作工
30.0833
2
15.0417
10.9394
机器
0.4583
3
0.1528
0.1111
交互作用
34.9167
6
5.8195
4.2323
误差
16.5
12
1.375
—
总和
81.9583
23
—
—
对于给定水平
0.05,由PF
0.05分别查(附表5)得1
3.89,23.49,
33.00,由表3-1可知:
(1)操作工之间的差异显著。
(2)机器之间的差异不显著。
(3)操作工与机器交互影响显著。
4.下面是来自两个正态总体
1
N(
1,1)、
2
N(
2,22)的样本值
1:
3,
1,0,
1,
3
2
2
2
2
2:
3
6,3
2,3,3
2,3
6
试分别用贝叶斯判别法(取
q1
2
1
3,C(1|2)C(2|1))和距离(采用马氏距离)
3,q2
判别法判别样品x1
2及x2
1.1所属的类
i。
若出现不一致结果,请提出你的判别建议。
解:
依题意,对于
1,EX
1
0,对于
2,EX
2
3。
(1)贝叶斯判别法:
p1
(2)
1
e
2
p2
(2)
1
e
2
1(20)2
2
1(23)2
2
1e
2
1
e
2
2
1
2
0.054
0.242
1
1
(1.1
0)2
1
121
p1(1.1)
e200
0.218
e2
2
2
p2(1.1)
1
e
1(1.1
3)2
1
361
0.066
2
2
2
e200
p1
(2)q1
0.054
2
0.036
p2
(2)q2
0.2421
0.081
3
3
.
精品文档
p1(1.1)q1
0.218
2
0.145p2(1.1)q2
0.0661
0.022
3
3
所以,x1
2属于2
,x2
1.1属于1。
(2)距离判别法:
d1
(2)d(2,
2
0
1)
2
1
d2
(2)
d(2,
2
3
1
2)
2
22
显然d(2,
1)
d(2,2),故x12属于2。
d1(1.1)
d(1.1,
1.1
0
1)
1
1.1
d2(1.1)
d(1.1,
1.1
3
2)
0.95
22
显然d(1.1,
1)
d(1.1,2),故x2
1.1属于2。
(3)结果不一致分析。
5.已知四个样品分别为(2,5)',(2,3)',(4,3)',(6,2)',试用重心法和离差平方和法进行聚类
分析。
若分成两类,请您提出您的分类建议。
解:
(1)重心法:
首先将四个样品分别看做一类,计算距离矩阵
D(0)2。
D(0)2
G1
G2
G3
G4
G1
0
G2
4
0
G3
8
4
0
G4
25
17
5
0
由D(0)2可以看出,G2和G3之间距离最短,因此可以合并为一个新类G5
G2,G3,
然后计算G1、G4、G5
之间的距离,得相应的D
(1)2
如下
.
精品文档
D
(1)2
G1
G4
G5
G1
0
G4
25
0
G5
5
25
0
由D
(1)2可以看出,G1和G5之间距离最短,因此可以合并为一个新类G6
G1,G5,
然后计算G4、G6之间的距离,得相应的D
(2)2如下
D
(2)2
G4
G6
G4
0
G6
16.25
0
最后将G4与G6合为一类G7
G1,G2,G3,G4。
上述聚类过程用聚类图表示为图
5-1。
(2)离差平方和法:
由
(1)中已计算的重心法的距离平方及Dpq2
npnqDpq2
(C)计算距离矩阵D(0)2
。
npnq
D(0)2
G1
G2
G3
G4
G1
0
G2
2
0
G3
4
2
0
G4
12.5
8.5
2.5
0
由D(0)2可以看出,G2和G3之间距离最短,因此可以合并为一个新类G5G2,G3
,
然后计算G1、G4、G5
之间的距离,得相应的D
(1)2
如下
D
(1)2
G1
G4
G5
G1
0
G4
12.25
0
.
精品文档
3.3333
16.6667
0
G5
由D
(1)2可以看出,G1和G5之间距离最短,因此可以合并为一个新类
G6G1,G5,
然后计算G4、G6之间的距离,得相应的D
(2)2
如下
D
(2)2
G4
G6
G4
0
G6
12.1875
0
最后将G4与G6合为一类G7G1,G2,G3,G4
。
上述聚类过程用聚类图表示为图5-2。
6.在有关合成纤维的强度
y与其拉伸倍数x的试验中得试验数据如下:
变
量
2
2
序号
xi
yi
xi
yi
xiyi
1
2
1.3
4
1.69
2.6
2
2.5
2.5
6.25
6.25
6.25
3
2.7
2.5
7.29
6.25
6.75
4
3.5
2.7
12.25
7.29
9.45
5
4
3.5
16
12.25
14
6
4.5
4.2
20.25
17.64
18.9
7
5.2
5
27.04
25
26
8
6.3
6.4
39.69
40.96
40.32
9
7.1
6.3
50.41
39.69
44.73
10
8
7
64
49
56
11
9
8
81
64
72
12
10
8.1
100
65.61
81
∑
64.8
57.5
428.18
335.63
378
(1)试利用上述数据表建立合成纤维的强度
y与其拉伸倍数x的回归方程;
(2)检验所见方程是否有意义(
0.05);
(3)预测当拉伸倍数x=6时,强度y的置信度为95%的置信区间。
解:
(1)由于
64.8
5.4
57.5
4.7917
n=12,x
12
,y
12
12
2
12
2
2
(5.4)2
lxx
(xi
x)
xi
12
78.26
12x428.18
i1
i1
12
12
lxy
(xi
x)(yi
y)
xiyi12xy
378
12
5.44.791767.4978
i
1
i1
于是得
.
精品文档
$
lxy
67.4978
b
lxx
0.8625
78.26
$
y
$
4.7917
0.86255.4
0.1342
a
bx
故所求回归方程为
$
0.1342
0.8625x
y
(2)
12
2
12
2
S总2
yi212y
(4.7917)2
lyy
(yi
y)
335.63
12
60.1053
i1
i1
2
$
0.8625
67.4978
58.2169
S回
blxy
S残2
S总2
S回2
1.8884
由PF
0.05,查F(1,10)
分布表(附表5)得
4.96,而
F
S回2
308.2869
4.96
/(122)
S残2
所以回归方程有意义。
(3)x6时,y的估计值为
$
y0.13420.862565.3092
又
2
,由PT
0.05/20.025,查
t(10)
分布表(附表3)
残
S
S/(n2)
0.4346
得2.2281,故得y的置信度为95%的预测区间为
$
S1
1
(x0x)2
$
S1
1
(x0
x)2
)
(y0
n
lxx
y0
n
lxx
(0.1342
0.8625x02.2281
0.43461
1
(x05.4)2
12
78.26
0.1342