多元统计分析第五章课后习题Word格式文档下载.doc
《多元统计分析第五章课后习题Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《多元统计分析第五章课后习题Word格式文档下载.doc(3页珍藏版)》请在冰豆网上搜索。
具体分析如下:
对总产值(农林牧渔的加和)进行聚类分析:
相似矩阵(截取)
部分说明:
表中对角线处的值全部为0,由于计算的值表示的是距离,故,自身与自身之间的距离理应为0。
其余的两两配对,计算两地区之间的点的距离,如上表示。
利用Ward法计算利差平方和,各个地区先自成一类,然后将2和9先聚为一类,他们的系数为6.150,而后2或者9会在第六阶段重复出现。
然后在第二阶段将地区7和25再聚为一类,系数为15.300,两个地区之一会在第十三阶段重复出现,如表中第十三阶段重复出现7.
谱系图如下:
可以通过做直线,找与图中线的交点确定所分的类,类所包括的内容以及分类的数目。
较详细接直观的展现。
如下图所示的直线以及分类。
对农业进行聚类:
利用的是皮尔逊相关系数,中位数法,说明不同省市的农业收入是不相关的。
相关系数矩阵(截取)
此处用的是相关系数得到的相似矩阵,故对角线处的元素全部为1。
相同的解释类似于对总产值聚类,故不具体说明。
同时也类似的做出下列谱系图:
从图中可以观察到农业产值在数值之间的差异并不是特别大,同样通过做垂线的办法将其分为
读者预想的类别。
略