多元统计分析期末试题及答案.docx

上传人:b****5 文档编号:7691628 上传时间:2023-01-25 格式:DOCX 页数:20 大小:153.33KB
下载 相关 举报
多元统计分析期末试题及答案.docx_第1页
第1页 / 共20页
多元统计分析期末试题及答案.docx_第2页
第2页 / 共20页
多元统计分析期末试题及答案.docx_第3页
第3页 / 共20页
多元统计分析期末试题及答案.docx_第4页
第4页 / 共20页
多元统计分析期末试题及答案.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

多元统计分析期末试题及答案.docx

《多元统计分析期末试题及答案.docx》由会员分享,可在线阅读,更多相关《多元统计分析期末试题及答案.docx(20页珍藏版)》请在冰豆网上搜索。

多元统计分析期末试题及答案.docx

多元统计分析期末试题及答案

1、设

 

X~N

(,),其中X

 

(x,x

21

),(,),,

21212

1

则Cov(x1

x2,x1

x2)=.

2、设

 

Xi~

 

N3(,),i

 

1,,10,

 

则W=

 

10

(Xi

i1

 

)(Xi)

服从。

 

3、设随机向量

 

Xx1x2

 

x3,且协方差矩阵

443

492,

3216

 

则它的相关矩阵R

4、设X=x1

x2x3

的相关系数矩阵通过因子分析分解为

112

330.93400.128

10.9340.4170.835

R100.4170.8940.027

300.8940.447

20.8350.4470.103

01

3

 

2

X的共性方差h

X,的方差,

11111

 

g

2

公因子f1对X的贡献1

 

5、设

Xi,i

1,,16是来自多元正态总体

Np(,),

X和A分别为正态总体

Np(,)

的样本均值和样本离差矩阵,则

2

T15[4(X

)]A

1

[4(X

)]~。

 

(2)试问当取多大时才能使第一主成分的贡献率达95%以上。

5、设X

(X,X

)T,Y

(Y,X

)T为标准化向量,令Z

X

Y

且其协方差阵

1212

 

100000

V(Z)

 

1112

2122

010.950

00.9510

000100

求其第一对典型相关变量和它们的典型相关系数?

 

1、设随机向量X的均值向量、协方差矩阵分别为、,

试证:

E(XX)。

 

2、设随机向量

X~NP(,),又设Y=ArpX+br1,

r

试证:

Y~

N(Ab,AA')。

 

1、02、W3(10,∑)3、

 

121

34

R211

36

111

46

 

4、0.87211.743

5、T2(15,p)或(15p/(16-p))F(p,n-p)

1、令y1

x2x3x1

 

y2

 

x12x3,则

x2x3

0

1

-1

x1

x1

1

0

0

x2

x12x3

1

0

2

x3

01

-1

1

2

10

0

0

1

1

0

2

2

3

0

1

-1

16

4

2

0

1

-1

1

0

0

4

4

1

1

0

0

1

0

2

2

1

4

1

0

2

10

6

16

6

16

20

16

20

40

y1y2

y1

y

E

2

 

y1

V

y2

 

故y1,y2的联合分布为故不独立。

210616

N3(1,61620)

3162040

2、假设检验问题:

H0:

 

8.0

0,H1:

0

经计算可得:

X

02.2,

1.5

4.310714.62108.9464

S1(23.13848)1

14.62103.17237.3760

0

8.946437.376035.5936

构造检验统计量:

T2

n(X

0)S

1(X)

由题目已知

670.0741420.445

F0.01(3,3)29.5,由是

T235F

 

(3,3)147.5

3

0.010.01

所以在显著性水平

 

0.01下,拒绝原设H0

即认为农村和城市的2周岁男婴上述三个

指标的均值有显著性差异

3、由

Bayes判别知

W(x)

f1(x)

exp[(x

)T1()]exp(4x2x4)

f2(x)

1212

其中,

1()

3,?

1

191

 

()

242

1212

2

dq2C(1|2)q1C(2|1)

3

X

5

 

e3,W(x

G2

48

3

)exp

(2)

5

11624

de3

1

4、

(1)由

 

2341

 

1

0得特征根为1

1

1

 

1x1

1x2

 

13,

解1所对应的方程

123

得1所对应的单位特征向量为故得第一主成分Z1X1X

0

1x3

1x4

1111

2222

4

1X1X

2222

(2)第一个主成分的贡献率为

1

1234

1395%

4

得0.95410.933

3

5、由题得

-1

112=

0.10-110

2

22

0100.1

11

22

T-1-

TT1112222111

0.10001000.950.1000

010.95000.01000100.9025

T02

求TT

的特征值,得

00.9025

00.9025

20.9025,200.95

121

TTT的单位正交化特征向量

00

e1

00.9025

0.9025e1,

1

e

2

1111

0.1000

0111

1

1

11

2221

1

11

0

0

0.95

0

1

0.950

0.1

0

0

1

0

V1X2,W10.54Y1

为第一典型相关变量,且(

V1,W1)

0.95为一对典型相关系数。

2、证明:

由题可知

 

Y服从正态分布,

1、证明:

=V(X)

E[(XEX)(XEX)]

E(Y)

E(AXb)

AE(X)b

E(XX

)(EX)(EX)Ab

E(XX)

V(Y)

V(AXb)

AV(X)A

故E(XX)

 

故Y~

AA'

r

N(Ab,AA')。

 

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。

通常聚类分析分为Q型聚类和R型聚类。

4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特

征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:

一部分为公共因子,另一部分为特殊因子。

6、若

x()

NP(,),

=1,2,3.n且相互独立,则样本均值向量x服从的分布为

 

_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。

设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。

对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换,使得因素A和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数

系数:

确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

将新样品的p个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设和H1;

第二,给出检验的统计量及其服从的分布;

第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;

第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。

协差阵的检验

检验ΣΣ0

 

H0:

ΣIp

 

exp

 

1trSSn/2

2

np/2

e

n

*

np/2

H0:

ΣΣ0Ip

exp

1trS*

2

n/2e

S

n

检验Σ1Σ2

ΣkH0:

Σ1Σ2Σk

kk

统计量

nnp/2

ni/2

S

n/2

S

npni/2

kii

i1i1

 

6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?

请举例说明。

设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。

(1).最短距离法

 

Dij

min

XiGi,Xj

dij

Gj

Dkr

min

XiGk,Xj

dij

Gr

min{

Dkp,Dkq}

 

(2))最长距离法

Dpq

 

max

XiGp,Xj

 

dij

Gq

 

Dkr

max

XiGk,Xj

dij

Gr

max{Dkp,Dkq}

 

(3))中间距离法

D

D

D

D

212122

krkpkqpq

22

 

其中错误!

未找到引用源。

 

(4))重心法

2

D(XX

 

)(XX)

 

1

r

p

X(nX

 

nX)

p

pqpqpq

2

nr

 

2

Dkr

np

2

q

q

Dkp

nr

nq2

Dkq

nr

npnqnr

Dpq

(5)

2

)类平均法

2

2

Dd

1

pqij

1

2

2

Dd

krij

npnq

2

2

DkpDkq

npnqXi

GpXjGj

nknr

XiGkXjGrnrnr

(6))可变类平均法

D2(1

np2

nqD2)D2

kr)(

nr

Dkpkqpq

nr

 

其中是可变的且<1

(7))可变法

D21(D2D2)D2

 

其中是可变的且<1

2

krkpkqpq

(8))离差平方和法

nt

St(Xit

 

Xt)(Xit

 

Xt)

t1

 

2

2

错误!

未找到引用源。

2

Dkr

nknp

2

nrnk

 

Dkp

nknq

nrnk

 

Dkq

nk

nrnk

 

Dpq

 

7、比较主成分分析与因子分析的异同点。

相同点:

①两种分析方法都是一种降维、简化数据的技术。

②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。

因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步

便导致因子分析。

因子分析也可以说成是主成分分析的逆问题。

如果说主成分分析是

将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

主要区别是:

主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,

突出数据变异的方向,归纳重要信息。

而因子分析是从显在变量去提炼潜在因子的过程。

此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。

9、进行相应分析时在对因素A和因素B进行相应分析之前没有必要进行独立性检验?

为什

么?

有必要,如果因素A和因素B独立,则没有必要进行相应分析;如果因素A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1