多元统计分析期末试题及答案.docx
《多元统计分析期末试题及答案.docx》由会员分享,可在线阅读,更多相关《多元统计分析期末试题及答案.docx(20页珍藏版)》请在冰豆网上搜索。
多元统计分析期末试题及答案
1、设
X~N
(,),其中X
(x,x
21
),(,),,
21212
1
则Cov(x1
x2,x1
x2)=.
2、设
Xi~
N3(,),i
1,,10,
则W=
10
(Xi
i1
)(Xi)
服从。
3、设随机向量
Xx1x2
x3,且协方差矩阵
443
492,
3216
则它的相关矩阵R
4、设X=x1
x2x3
的相关系数矩阵通过因子分析分解为
112
330.93400.128
10.9340.4170.835
R100.4170.8940.027
300.8940.447
20.8350.4470.103
01
3
2
X的共性方差h
X,的方差,
11111
g
2
公因子f1对X的贡献1
。
5、设
Xi,i
1,,16是来自多元正态总体
Np(,),
X和A分别为正态总体
Np(,)
的样本均值和样本离差矩阵,则
2
T15[4(X
)]A
1
[4(X
)]~。
(2)试问当取多大时才能使第一主成分的贡献率达95%以上。
5、设X
(X,X
)T,Y
(Y,X
)T为标准化向量,令Z
X
Y
且其协方差阵
1212
100000
V(Z)
1112
2122
010.950
,
00.9510
000100
求其第一对典型相关变量和它们的典型相关系数?
1、设随机向量X的均值向量、协方差矩阵分别为、,
试证:
E(XX)。
2、设随机向量
X~NP(,),又设Y=ArpX+br1,
r
试证:
Y~
N(Ab,AA')。
1、02、W3(10,∑)3、
121
34
R211
36
111
46
4、0.87211.743
5、T2(15,p)或(15p/(16-p))F(p,n-p)
1、令y1
x2x3x1
y2
x12x3,则
x2x3
0
1
-1
x1
x1
1
0
0
x2
x12x3
1
0
2
x3
01
-1
1
2
10
0
0
1
1
0
2
2
3
0
1
-1
16
4
2
0
1
-1
1
0
0
4
4
1
1
0
0
1
0
2
2
1
4
1
0
2
10
6
16
6
16
20
16
20
40
y1y2
y1
y
E
2
y1
V
y2
故y1,y2的联合分布为故不独立。
210616
N3(1,61620)
3162040
2、假设检验问题:
H0:
8.0
0,H1:
0
经计算可得:
X
02.2,
1.5
4.310714.62108.9464
S1(23.13848)1
14.62103.17237.3760
0
8.946437.376035.5936
构造检验统计量:
T2
n(X
0)S
1(X)
由题目已知
670.0741420.445
F0.01(3,3)29.5,由是
T235F
(3,3)147.5
3
0.010.01
所以在显著性水平
0.01下,拒绝原设H0
即认为农村和城市的2周岁男婴上述三个
指标的均值有显著性差异
3、由
Bayes判别知
W(x)
f1(x)
exp[(x
)T1()]exp(4x2x4)
f2(x)
1212
其中,
1()
3,?
1
191
()
242
1212
2
dq2C(1|2)q1C(2|1)
3
X
5
e3,W(x
G2
48
3
)exp
(2)
5
11624
de3
1
4、
(1)由
2341
1
0得特征根为1
1
1
1x1
1x2
13,
解1所对应的方程
123
得1所对应的单位特征向量为故得第一主成分Z1X1X
0
1x3
1x4
1111
2222
4
1X1X
2222
(2)第一个主成分的贡献率为
1
1234
1395%
4
得0.95410.933
3
5、由题得
-1
112=
0.10-110
=
2
22
0100.1
11
22
T-1-
TT1112222111
0.10001000.950.1000
=
010.95000.01000100.9025
T02
求TT
的特征值,得
00.9025
00.9025
20.9025,200.95
121
TTT的单位正交化特征向量
00
e1
00.9025
0.9025e1,
1
e
2
1111
0.1000
0111
1
1
11
2221
1
11
0
0
0.95
0
1
0.950
0.1
0
0
1
0
V1X2,W10.54Y1
为第一典型相关变量,且(
V1,W1)
0.95为一对典型相关系数。
2、证明:
由题可知
Y服从正态分布,
1、证明:
=V(X)
E[(XEX)(XEX)]
E(Y)
E(AXb)
AE(X)b
E(XX
)(EX)(EX)Ab
E(XX)
V(Y)
V(AXb)
AV(X)A
故E(XX)
故Y~
AA'
r
N(Ab,AA')。
一、填空题:
1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.
2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为Q型聚类和R型聚类。
4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特
征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:
一部分为公共因子,另一部分为特殊因子。
6、若
x()
NP(,),
=1,2,3.n且相互独立,则样本均值向量x服从的分布为
_x~N(μ,Σ/n)_。
二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素A和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数
系数:
确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。
协差阵的检验
检验ΣΣ0
H0:
ΣIp
exp
1trSSn/2
2
np/2
e
n
*
np/2
H0:
ΣΣ0Ip
exp
1trS*
2
n/2e
S
n
检验Σ1Σ2
ΣkH0:
Σ1Σ2Σk
kk
统计量
nnp/2
ni/2
S
n/2
S
npni/2
kii
i1i1
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?
请举例说明。
设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。
(1).最短距离法
Dij
min
XiGi,Xj
dij
Gj
Dkr
min
XiGk,Xj
dij
Gr
min{
Dkp,Dkq}
(2))最长距离法
Dpq
max
XiGp,Xj
dij
Gq
Dkr
max
XiGk,Xj
dij
Gr
max{Dkp,Dkq}
(3))中间距离法
D
D
D
D
212122
krkpkqpq
22
其中错误!
未找到引用源。
(4))重心法
2
D(XX
)(XX)
1
r
p
X(nX
nX)
p
pqpqpq
2
nr
2
Dkr
np
2
q
q
Dkp
nr
nq2
Dkq
nr
npnqnr
Dpq
(5)
2
)类平均法
2
2
Dd
1
pqij
1
2
2
Dd
krij
npnq
2
2
DkpDkq
npnqXi
GpXjGj
nknr
XiGkXjGrnrnr
(6))可变类平均法
D2(1
np2
nqD2)D2
kr)(
nr
Dkpkqpq
nr
其中是可变的且<1
(7))可变法
D21(D2D2)D2
其中是可变的且<1
2
krkpkqpq
(8))离差平方和法
nt
St(Xit
Xt)(Xit
Xt)
t1
2
2
错误!
未找到引用源。
2
Dkr
nknp
2
nrnk
Dkp
nknq
nrnk
Dkq
nk
nrnk
Dpq
7、比较主成分分析与因子分析的异同点。
相同点:
①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步
便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是
将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
主要区别是:
主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,
突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
9、进行相应分析时在对因素A和因素B进行相应分析之前没有必要进行独立性检验?
为什
么?
有必要,如果因素A和因素B独立,则没有必要进行相应分析;如果因素A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。