完整word版多元统计分析期末考试考点整理.docx

上传人:b****6 文档编号:3880219 上传时间:2022-11-26 格式:DOCX 页数:13 大小:1.39MB
下载 相关 举报
完整word版多元统计分析期末考试考点整理.docx_第1页
第1页 / 共13页
完整word版多元统计分析期末考试考点整理.docx_第2页
第2页 / 共13页
完整word版多元统计分析期末考试考点整理.docx_第3页
第3页 / 共13页
完整word版多元统计分析期末考试考点整理.docx_第4页
第4页 / 共13页
完整word版多元统计分析期末考试考点整理.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

完整word版多元统计分析期末考试考点整理.docx

《完整word版多元统计分析期末考试考点整理.docx》由会员分享,可在线阅读,更多相关《完整word版多元统计分析期末考试考点整理.docx(13页珍藏版)》请在冰豆网上搜索。

完整word版多元统计分析期末考试考点整理.docx

完整word版多元统计分析期末考试考点整理

多元统计分析

题型一定义、名词解释

题型二计算(协方差阵、模糊矩阵)

题型三解答题

一、定义

二名词解释

1、多元统计分析:

多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广

2、聚类分析:

是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。

将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。

使类内对象的同质性最大化和类间对象的异质性最大化

3、随机变量:

是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。

它是由于随机而获得的非确定值,是概率中的一个基本概念。

即每个分量都是随机变量的向量为随机向量。

类似地,所有元素都是随机变量的矩阵称为随机矩阵。

4、统计量:

多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量

3、计算题

解:

 

2、

答:

 

答:

 

题型三解答题

1、简述多元统计分析中协差阵检验的步骤

答:

第一,提出待检验的假设和H1;

第二,给出检验的统计量及其服从的分布;

第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;

第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。

2、简述一下聚类分析的思想

答:

聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。

把相似的样品或指标归为一类,把不相似的归为其他类。

直到把所有的样品(或指标)聚合完毕.

3、多元统计分析的内容和方法

答:

1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。

(1)主成分分析

(2)因子分析(3)对应分析等

2、分类与判别,对所考察的变量按相似程度进行分类。

(1)聚类分析:

根据分析样本的各研究变量,将性质相似的样本归为一类的方法。

(2)判别分析:

判别样本应属何种类型的统计方法。

4、系统聚类法基本原理和步骤

答:

1)先计算n个样本两两间的距离

2)构造n个类,每个类只包含一个样本

3)合并距离最近的两类为一新类

4)计算新类与当前各类的距离

5)类的个数是否等于1,如果不等于回到3在做

6)画出聚类图

7)决定分类个数和类

5、聚类分析的类型有:

答:

(1)对样本分类,称为Q型聚类分析

(2)对变量分类,称为R型聚类分析#Q型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的样本分离开来。

#R型聚类是对变量进行聚类,它使具有相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,达到变量降维的目的。

 

6、 简述欧氏距离与马氏距离的区别和联系。

 

7、  试述系统聚类的基本思想。

 

答:

系统聚类的基本思想是:

距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。

 

8对样品和变量进行聚类分析时所构造的统计量分别是什么?

简要说明为什么这样构造?

 

答:

对样品进行聚类分析时,用距离来测定样品之间的相似程度。

因为我们把n个样本看作p维空间的n个点。

点之间的距离即可代表样品间的相似度。

常用的距离为

 9、在进行系统聚类时,选择距离公式应遵循哪些原则?

 

答:

(1)要考虑所选择的距离公式在实际应用中有明确的意义。

如欧氏距离就有非常明确的空间距离概念。

马氏距离有消除量纲影响的作用。

 

(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。

如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。

 

(3)要考虑研究对象的特点和计算量的大小。

样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。

实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。

10、欧式距离的优点缺点

答:

优点:

几何意义明确,简单,容易掌握,由于中学数学就已初步接触,数学知识不多的人也可以把握它的基本含义。

 

缺点:

从统计学的角度看,使用欧式距离要求一个向量的n个分量不相关,且具有相当的方差,或者说各个坐标对欧式距离的贡献同等且变差大小相同,此时使用欧式距离才合适,且效果良好,否则就不能如实反映情况且容易导致错误的结论。

因此需要对坐标加权,化为统计距离

11、模糊聚类分析的实质和基本原理

答:

模糊聚类分析的实质就是根据研究对象本身的属性而构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系

基本原理:

如果水平满足,则按水平分出的每一类必是按水平分出的每一类的子类。

(p62页)

12、模糊聚类分析计算步骤:

答:

(1)对原始数据进行变换。

变换方法通常有标准化变换、极差变换、对数变换等。

(2)计算模糊相似矩阵

(3)建立模糊等价矩阵

(4)进行聚类

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1