应用多元统计分析课后答案朱建平版Word文件下载.doc
《应用多元统计分析课后答案朱建平版Word文件下载.doc》由会员分享,可在线阅读,更多相关《应用多元统计分析课后答案朱建平版Word文件下载.doc(68页珍藏版)》请在冰豆网上搜索。
![应用多元统计分析课后答案朱建平版Word文件下载.doc](https://file1.bdocx.com/fileroot1/2022-10/3/880ee2b1-059f-4c89-a1fc-99b314968b1e/880ee2b1-059f-4c89-a1fc-99b314968b1e1.gif)
判断和是否相互独立。
和由于,所以不独立。
2.4设服从正态分布,已知其协方差矩阵S为对角阵,证明其分量是相互独立的随机变量。
因为的密度函数为
又由于
则
则其分量是相互独立。
2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为
注:
利用,S其中
在SPSS中求样本均值向量的操作步骤如下:
1.选择菜单项Analyze→DescriptiveStatistics→Descriptives,打开Descriptives对话框。
将待估计的四个变量移入右边的Variables列表框中,如图2.1。
图2.1Descriptives对话框
2.单击Options按钮,打开Options子对话框。
在对话框中选择Mean复选框,即计算样本均值向量,如图2.2所示。
单击Continue按钮返回主对话框。
图2.2Options子对话框
3.单击OK按钮,执行操作。
则在结果输出窗口中给出样本均值向量,如表2.1,即样本均值向量为(35.3333,12.3333,17.1667,1.5250E2)。
表2.1样本均值向量
在SPSS中计算样本协差阵的步骤如下:
1.选择菜单项Analyze→Correlate→Bivariate,打开BivariateCorrelations对话框。
将三个变量移入右边的Variables列表框中,如图2.3。
图2.3BivariateCorrelations对话框
选择Cross-productdeviationsandcovariances复选框,即计算样本离差阵和样本协差阵,如图2.4。
单击Continue按钮,返回主对话框。
图2.4Options子对话框
则在结果输出窗口中给出相关分析表,见表2.2。
表中Covariance给出样本协差阵。
(另外,PearsonCorrelation为皮尔逊相关系数矩阵,SumofSquaresandCross-products为样本离差阵。
)
2.6渐近无偏性、有效性和一致性;
2.7设总体服从正态分布,,有样本。
由于是相互独立的正态分布随机向量之和,所以也服从正态分布。
又
所以。
2.8方法1:
。
方法2:
。
故为的无偏估计。
2.9.设是从多元正态分布抽出的一个简单随机样本,试求的分布。
证明:
设
为一正交矩阵,即。
令,
且有
,,。
所以独立同分布。
又因为
因为
所以原式
故,由于独立同正态分布,所以
2.10.设是来自的简单随机样本,,
(1)已知且,求和的估计。
(2)已知求和的估计。
(1),
(2)
解之,得
,
第三章
3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。
其基本思想和步骤均可归纳为:
答:
第一,提出待检验的假设和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界
值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。
均值向量的检验:
统计量拒绝域
在单一变量中
当已知
当未知
(作为的估计量)
一个正态总体
协差阵已知
协差阵未知
()
两个正态总体
有共同已知协差阵
有共同未知协差阵
(其中)
协差阵不等
多个正态总体
单因素方差
多因素方差
协差阵的检验
检验
检验
统计量
3.2试述多元统计中霍特林分布和威尔克斯分布分别与一元统计中t分布和F分布的关系。
(!
)霍特林分布是t分布对于多元变量的推广。
而若设,且与相互独立,,则称统计量的分布为非中心霍特林T2分布。
若,且与相互独立,令,则。
(2)威尔克斯分布在实际应用中经常把统计量化为统计量进而化为统计量,利用统计量来解决多元统计分析中有关检验问题。
与统计量的关系
统计量及分别
任意
1
2
3.3试述威尔克斯统计量在多元方差分析中的重要意义。
威尔克斯统计量在多元方差分析中是用于检验均值的统计量。
用似然比原则构成的检验统计量为给定检验水平,查Wilks分布表,确定临界值,然后作出统计判断。
第四章
4.1简述欧几里得距离与马氏距离的区别和联系。
设p维欧几里得空间中的两点X=和Y=。
则欧几里得距离为。
欧几里得距离的局限有①在多元数据分析中,其度量不合理。
②会受到实际问题中量纲的影响。
设X,Y是来自均值向量为,协方差为的总体G中的p维样本。
则马氏距离为D(X,Y)=。
当即单位阵时,D(X,Y)==即欧几里得距离。
因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。
4.2试述判别分析的实质。
判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设R1,R2,…,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对p维空间构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3简述距离判别法的基本思想和方法。
距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
①两个总体的距离判别问题
设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是m1和m2,对于一个新的样品X,要判断它来自哪个总体。
计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则
X,D2(X,G1)D2(X,G2)
X,D2(X,G1)>
D2(X,G2,
具体分析,
记则判别规则为
X,W(X)
X,W(X)<
②多个总体的判别问题。
设有个总体,其均值和协方差矩阵分别是和,且。
计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。
取,,。
可以取线性判别函数为
,
相应的判别规则为若
4.4简述贝叶斯判别法的基本思想和方法。
基本思想:
设k个总体,其各自的分布密度函数,假设k个总体各自出现的概率分别为,,。
设将本来属于总体的样品错判到总体时造成的损失为,。
设个总体相应的维样本空间为。
在规则下,将属于的样品错判为的概率为
则这种判别规则下样品错判后所造成的平均损失为
则用规则来进行判别所造成的总平均损失为
贝叶斯判别法则,就是要选择一种划分,使总平均损失达到极小。
基本方法:
令,则
若有另一划分,
则在两种划分下的总平均损失之差为
因为在上对一切成立,故上式小于或等于零,是贝叶斯判别的解。
从而得到的划分为
4.5简述费希尔判别法的基本思想和方法。
从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数
系数可使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
①费希尔判别与距离判别对判别变量的分布类型无要求。
二者只是要求有各类母体的两阶矩存在。
而贝叶斯判别必须知道判别变量的分布类型。
因此前两者相对来说较为简单。
②当k=2时,若则费希尔判别与距离判别等价。
当判别变量服从正态分布时,二者与贝叶斯判别也等价。
③当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。
④距离判别可以看为贝叶斯判别的特殊情形。
贝叶斯判别的判别规则是X,W(X)
lnd
距离判别的判别规则是
二者的区别在于阈值点。
当,时,,。
二者完全相同。
4.7设有两个二元总体和,从中分别抽取样本计算得到,,假设,试用距离判别法建立判别函数和判别规则。
样品X=(6,0)’应属于哪个总体?
=,=,==
即样品X属于总体
4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。
下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
销售情况
产品序号
销售价格
口味评分
信任度评分
畅销
2.2
5
8
2.5
6
7
3
3.0
9
4
3.2
平销
2.8
3.5
4.8
滞销
1.7
10