完整word版多元统计分析期末考试考点整理Word文档格式.docx

资源描述

完整word版多元统计分析期末考试考点整理Word文档格式.docx

《完整word版多元统计分析期末考试考点整理Word文档格式.docx》由会员分享，可在线阅读，更多相关《完整word版多元统计分析期末考试考点整理Word文档格式.docx（13页珍藏版）》请在冰豆网上搜索。

完整word版多元统计分析期末考试考点整理Word文档格式.docx

2、聚类分析:

是根据“物以类聚”的道理，对样品或指标进行分类的一种多元统计分析方法。

将个体或对象分类，使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。

使类内对象的同质性最大化和类间对象的异质性最大化

3、随机变量：

是指变量的值无法预先确定仅以一定的可能性（概率）取值的量。

它是由于随机而获得的非确定值，是概率中的一个基本概念。

即每个分量都是随机变量的向量为随机向量。

类似地，所有元素都是随机变量的矩阵称为随机矩阵。

4、统计量：

多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量

3、计算题

解：

2、

答：

1、简述多元统计分析中协差阵检验的步骤

第一，提出待检验的假设和H1；

第二，给出检验的统计量及其服从的分布；

第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；

第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。

2、简述一下聚类分析的思想

聚类分析的基本思想，是根据一批样品的多个观测指标，具体地找出一些能够度量样品或指标之间相似程度的统计量，然后利用统计量将样品或指标进行归类。

把相似的样品或指标归为一类，把不相似的归为其他类。

直到把所有的样品（或指标）聚合完毕.

3、多元统计分析的内容和方法

1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量，使研究问题得到简化但损失的信息又不太多。

（1）主成分分析

（2）因子分析（3）对应分析等

2、分类与判别,对所考察的变量按相似程度进行分类。

（1）聚类分析：

根据分析样本的各研究变量，将性质相似的样本归为一类的方法。

（2）判别分析：

判别样本应属何种类型的统计方法。

4、系统聚类法基本原理和步骤

1）先计算n个样本两两间的距离

2）构造n个类，每个类只包含一个样本

3）合并距离最近的两类为一新类

4）计算新类与当前各类的距离

5）类的个数是否等于1，如果不等于回到3在做

6）画出聚类图

7）决定分类个数和类

5、聚类分析的类型有：

（1）对样本分类，称为Q型聚类分析

（2）对变量分类，称为R型聚类分析#Q型聚类是对样本进行聚类，它使具有相似性特征的样本聚集在一起，使差异性大的样本分离开来。

#R型聚类是对变量进行聚类，它使具有相似性的变量聚集在一起，差异性大的变量分离开来，可在相似变量中选择少数具有代表性的变量参与其他分析，实现减少变量个数，达到变量降维的目的。

6、

简述欧氏距离与马氏距离的区别和联系。

7、

试述系统聚类的基本思想。

系统聚类的基本思想是：

距离相近的样品（或变量）先聚成类，距离相远的后聚成类，过程一直进行下去，每个样品（或变量）总能聚到合适的类中。

8对样品和变量进行聚类分析时所构造的统计量分别是什么？

简要说明为什么这样构造？

对样品进行聚类分析时，用距离来测定样品之间的相似程度。

因为我们把n个样本看作p维空间的n个点。

点之间的距离即可代表样品间的相似度。

常用的距离为

9、在进行系统聚类时，选择距离公式应遵循哪些原则？

（1）要考虑所选择的距离公式在实际应用中有明确的意义。

如欧氏距离就有非常明确的空间距离概念。

马氏距离有消除量纲影响的作用。

（2）要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。

如在进行聚类分析之前已经对变量作了标准化处理，则通常就可采用欧氏距离。

（3）要考虑研究对象的特点和计算量的大小。

样品间距离公式的选择是一个比较复杂且带有一定主观性的问题，我们应根据研究对象的特点不同做出具体分折。

实际中，聚类分析前不妨试探性地多选择几个距离公式分别进行聚类，然后对聚类分析的结果进行对比分析，以确定最合适的距离测度方法。

10、欧式距离的优点缺点

优点：

几何意义明确，简单，容易掌握，由于中学数学就已初步接触，数学知识不多的人也可以把握它的基本含义。

缺点：

从统计学的角度看，使用欧式距离要求一个向量的n个分量不相关，且具有相当的方差，或者说各个坐标对欧式距离的贡献同等且变差大小相同，此时使用欧式距离才合适，且效果良好，否则就不能如实反映情况且容易导致错误的结论。

因此需要对坐标加权，化为统计距离

11、模糊聚类分析的实质和基本原理

模糊聚类分析的实质就是根据研究对象本身的属性而构造模糊矩阵，在此基础上根据一定的隶属度来确定其分类关系

基本原理：

如果水平满足，则按水平分出的每一类必是按水平分出的每一类的子类。

（p62页）

12、模糊聚类分析计算步骤：

（1）对原始数据进行变换。

变换方法通常有标准化变换、极差变换、对数变换等。

（2）计算模糊相似矩阵

（3）建立模糊等价矩阵

（4）进行聚类

展开阅读全文