应用统计真题.docx

资源描述

应用统计真题.docx

《应用统计真题.docx》由会员分享，可在线阅读，更多相关《应用统计真题.docx（91页珍藏版）》请在冰豆网上搜索。

应用统计真题.docx

应用统计真题

精品文档

论述题：

1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.试述均匀试验设计的特点，对均匀试验设计和正交试验设计两种方法进行

比较，指出各自的优缺点。

3.试述费歇判别的基本思想方法及主要步骤。

4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。

6.解释正交试验设计的特点及理论依据。

7.试论述一元线性回归的基本思想及主要方法步骤。

一、（任选两题，每题10分，共20分）

1．解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制

可能犯两类错误的概率。

2．解释正交试验设计的特点及理论依据。

3．试述一元线性回归的基本思想及主要方法步骤。

答案：

1.假设原理运用了小概率原理，在原假设H0正确的前提下，根据样本观察值和运用统计方法检验由此将导致什么结果，如果导致小概率事件在依次试验中发生

了，则认为原假设可能不正确，从而拒绝原假设；反之，如果未导致小概率事件发生，则没有理由拒绝原假设。

第一类错误：

弃真错误即H0为真时，作出拒绝H0的判断；第二类错误：

纳伪错误即H0不真时，作出接受H0的判断。

通常限制犯第一类错误的概率，增大样本容量使犯第二类错误的概率尽可能地

小。

为了简化检验过程，更多的应用是只控制犯第一类错误的概率，而不考虑犯第二

类错误的概率。

2.正交试验设计是研究多因素多水平的又一种设计方法，它有多、快、好、

省的特点。

“多”是指可以考虑多因素、多指标；“快”是指试验次数少、周期短、

见效快；“好”是指可以很快找到优秀方案和可能最优方案；“省”是指省时间、

省耗费、省资金、省劳力等。

正交性原理是正交实验设计的理论依据，它主要表现在均衡分散性和整齐可比

性两个方面。

均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水

精品文档

平组合的方案之中。

整齐可比性是指对于每列因素，在各个水平导致的结果之和

中，其它因素的各个水平出现的次数是相同的。

3.一元线性回归是研究两个变量之间的相关关系，且两个变量有着密切的关系，它们的这种相关关系不能用完全确切的函数形式表示，但在平均意义下有一定的定量关系表达式。

1）先进行相关性分析，看两个变量间是否有线性关系，确定回归方程中的因变量与自变量，对线性模型进行假设；

2）从样本数据出发对线性回归方程进行参数估计，确定回归方程；

3）对回归方程进行各种统计检验：

回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差正态检验。

4）利用回归方程进行解释或预测现象。

精品文档

1.在某新产品开发试验中需要考虑四个因素A、B、C、D对产品质量的影响。

根据专业知识和实践经验知道，A与C之间存在着交互作用，D与A、B及C之间的交互作用可以忽略不计。

（1）假设每个因子只取两个水平，试选择适当的正交表安排该实验；

（2）指出第2号及第5号试验的实验条件。

解：

（1）根据题意，A与B、B与C之间的交互作用还不能肯定，需要通过试验考察。

这样，需要考察的因子及交互作用为A，B，C，D，A×B，A×C，B×C。

因此可以选用L8（27）正交表。

表头设计列入表1-1。

表1-1表头设计

列号

因子

试验方案列入表1-2。

表1-2实验方案表

水

因

子

平

试

验

号

（2）第2号试验的试验条件为

A1B1C2D2，第5号试验的试验条件为A2B1C1D2。

2.设X1

（0,1,1）'，X2

（2,0,1）'，X3

（1,2,4）'，为来自总体X的一个样本，求X的协方

差矩阵

、相关矩阵R的矩估计。

解：

xi3）

（10

2）,

4））

（1,1,2）

（

xi1,

xi2,

（（0

21）,

（11

3i1

1（

（Xi

X）（Xi

X）

（1,0,

1）

（1,1,

1）

（0,1,2））

31i1

精品文档

1（000

111

012）

3.下面记录了三位操作工分别在四台不同机器上操作二天的日产量：

操作工

机器

甲

乙

丙

试用方差分析法检验：

（1）操作工之间的差异是否显著；

（2）机器之间的差异是否显著；

（3）交互影响是否显著（0.05）。

解：

由题意知k

3,r

4,n

2，又由题目给出数据可得：

T1134,T2

129,T3

150，T1

103,T2

104,T3102,T4

104，T

413，Tij见

上表中两数之和。

S总2

yijl2

7189

413

81.9583

krn

57097

4132

30.0833

rni

krn

SB2

T2j

42645

413

0.4583

krn

knj

SAB21

Tij2

SA2

SB21

14345

413

30.08330.458334.9167

krn

S误2=S总2-SA2SB2SAB281.958330.08330.458334.916716.5

精品文档

将计算的有关结果列入方差分析表（表

3-1）中。

表3-1方差分析表

方差来源

平方和

自由度

平均平方和

F值

操作工

30.0833

15.0417

10.9394

机器

0.4583

0.1528

0.1111

交互作用

34.9167

5.8195

4.2323

误差

16.5

1.375

—

总和

81.9583

—

对于给定水平

0.05，由PF

0.05分别查（附表5）得1

3.89,23.49，

33.00，由表3-1可知：

（1）操作工之间的差异显著。

（2）机器之间的差异不显著。

（3）操作工与机器交互影响显著。

4.下面是来自两个正态总体

N（

1,1）、

N（

2,22）的样本值

1,0,

6,3

2,3,3

2,3

试分别用贝叶斯判别法（取

3,C（1|2）C（2|1））和距离（采用马氏距离）

3,q2

判别法判别样品x1

2及x2

1.1所属的类

i。

若出现不一致结果，请提出你的判别建议。

解：

依题意，对于

1，EX

0，对于

2，EX

3。

（1）贝叶斯判别法：

（2）

1（20）2

1（23）2

0.054

0.242

（1.1

0）2

121

p1（1.1）

e200

0.218

p2（1.1）

1（1.1

3）2

361

0.066

e200

（2）q1

0.054

0.036

（2）q2

0.2421

0.081

精品文档

p1（1.1）q1

0.218

0.145p2（1.1）q2

0.0661

0.022

所以，x1

2属于2

，x2

1.1属于1。

（2）距离判别法：

（2）d（2,

1）

（2）

d（2,

2）

显然d（2,

1）

d（2,2），故x12属于2。

d1（1.1）

d（1.1,

1.1

1）

1.1

d2（1.1）

d（1.1,

1.1

2）

0.95

显然d（1.1,

1）

d（1.1,2），故x2

1.1属于2。

（3）结果不一致分析。

5．已知四个样品分别为（2,5）',（2,3）',（4,3）',（6,2）'，试用重心法和离差平方和法进行聚类

分析。

若分成两类，请您提出您的分类建议。

解：

（1）重心法：

首先将四个样品分别看做一类，计算距离矩阵

D（0）2。

D（0）2

由D（0）2可以看出，G2和G3之间距离最短，因此可以合并为一个新类G5

G2,G3，

然后计算G1、G4、G5

之间的距离，得相应的D

（1）2

如下

精品文档

（1）2

由D

（1）2可以看出，G1和G5之间距离最短，因此可以合并为一个新类G6

G1,G5，

然后计算G4、G6之间的距离，得相应的D

（2）2如下

（2）2

16.25

最后将G4与G6合为一类G7

G1,G2,G3,G4。

上述聚类过程用聚类图表示为图

5-1。

（2）离差平方和法：

由

（1）中已计算的重心法的距离平方及Dpq2

npnqDpq2

（C）计算距离矩阵D（0）2

。

npnq

D（0）2

12.5

8.5

2.5

由D（0）2可以看出，G2和G3之间距离最短，因此可以合并为一个新类G5G2,G3

，

然后计算G1、G4、G5

之间的距离，得相应的D

（1）2

如下

（1）2

12.25

精品文档

3.3333

16.6667

由D

（1）2可以看出，G1和G5之间距离最短，因此可以合并为一个新类

G6G1,G5，

然后计算G4、G6之间的距离，得相应的D

（2）2

如下

（2）2

12.1875

最后将G4与G6合为一类G7G1,G2,G3,G4

。

上述聚类过程用聚类图表示为图5-2。

6.在有关合成纤维的强度

y与其拉伸倍数x的试验中得试验数据如下：

变

量

序号

xiyi

1.3

1.69

2.6

2.5

6.25

2.7

2.5

7.29

6.25

6.75

3.5

2.7

12.25

7.29

9.45

3.5

12.25

4.5

4.2

20.25

17.64

18.9

5.2

27.04

6.3

6.4

39.69

40.96

40.32

7.1

6.3

50.41

39.69

44.73

8.1

100

65.61

∑

64.8

57.5

428.18

335.63

378

（1）试利用上述数据表建立合成纤维的强度

y与其拉伸倍数x的回归方程；

（2）检验所见方程是否有意义（

0.05）；

（3）预测当拉伸倍数x=6时，强度y的置信度为95%的置信区间。

解：

（1）由于

64.8

5.4

57.5

4.7917

n=12，x

，y

（5.4）2

lxx

（xi

x）

78.26

12x428.18

lxy

（xi

x）（yi

y）

xiyi12xy

378

5.44.791767.4978

于是得

精品文档

lxy

67.4978

lxx

0.8625

78.26

4.7917

0.86255.4

0.1342

故所求回归方程为

0.1342

0.8625x

（2）

S总2

yi212y

（4.7917）2

lyy

（yi

y）

335.63

60.1053

0.8625

67.4978

58.2169

S回

blxy

S残2

S总2

S回2

1.8884

由PF

0.05，查F（1,10）

分布表（附表5）得

4.96，而

S回2

308.2869

4.96

/（122）

S残2

所以回归方程有意义。

（3）x6时，y的估计值为

y0.13420.862565.3092

又

，由PT

0.05/20.025，查

t（10）

分布表（附表3）

残

S/（n2）

0.4346

得2.2281，故得y的置信度为95%的预测区间为

（x0x）2

（x0

x）2

）

（y0

lxx

（0.1342

0.8625x02.2281

0.43461

（x05.4）2

78.26

0.1342

展开阅读全文