1、表是年中国省自治区的城市规模结构特征的一些数据试通过聚类我国各省、自治区的城市规模结构分析问题分析:城市规模结构主要由城市规模、城市首位度、基尼系数构成,所以从这三个方面入手,进行聚类分析。符号说明:1. 城市规模(万人)2. 城市首位度3. 城市指数4. 基尼指数5. 城市规模中位(万人)模型建立及求解聚类分析:验证城市规模、城市首位度、城市指数、基尼系数、城市规模中位数之间的相关系数,看是否存在相关性。利用spss软件可以得到这五者的相关系数矩阵。Correlations 城市规模城市首位度城市指数基尼系数城市规模中位值城市规模Pearson Correlation1.278.477(*)
2、.295Sig. (2-tailed).868.152.010.127N2828282828城市首位度Pearson Correlation1.705(*).335Sig. (2-tailed).868.000.081.317N2828282828城市指数Pearson Correlation.278.705(*)1.161Sig. (2-tailed).152.000.413.754N2828282828基尼系数Pearson Correlation.477(*).335.1611(*)Sig. (2-tailed).010.081.413.039N2828282828城市规模中位值Pear
3、son Correlation.295(*)1Sig. (2-tailed).127.317.754.039N2828282828* Correlation is significant at the level (2-tailed).* Correlation is significant at the level (2-tailed).从上表可以看出某些指标之间确实有较强的相关性,可以选取其中的有代表性的几个指标进行聚类分析。将这些指标进行标准化:Descriptive Statistics NMinimumMaximumMeanStd. Deviation城市规模28城市首位度28城市指
4、数28.34.56023基尼系数28.38.81.5410.11046城市规模中位值28Valid N (listwise)28可以画出以下聚类树型图:从聚类图中可以看出,如果将5个指标分为3类,城市首位度、城市指数两个指标之间相关性比较大,所以聚到一起,城市规模(万人)与城市规模中位(万人)也有相关性,也可以聚成一类,基尼指数单独为一类。所以就可以将五个指标简化成三个指标进行分析。下图为27个地区的聚类分析图。运行结果:(1)第1类的有1 7第2类的有2 3 4 5 6 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 26 27第3类的有25
5、*划分成4类的结果如下:第1类的有2 3 4 5 6 8 9 10 11 12 13 15 16 17 18 19 21 26 27第2类的有14 20 22 23 24第3类的有1 7第4类的有25*划分成5类的结果如下:第1类的有1第2类的有7第3类的有2 3 4 5 6 8 9 10 11 12 13 15 16 17 18 19 21 26 27第4类的有14 20 22 23 24第5类的有25运行结果:(2)第1类的有1 7第2类的有2 3 4 5 6 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 26 27第3类的有25*划分成
6、4类的结果如下:第1类的有14第2类的有2 3 4 5 6 8 9 10 11 12 13 15 16 17 18 19 20 21 22 23 24 26 27第3类的有1 7第4类的有25*划分成5类的结果如下:第1类的有1第2类的有7第3类的有14第4类的有2 3 4 5 6 8 9 10 11 12 13 15 16 17 18 19 20 21 22 23 24 26 27第5类的有25利用matlab进行求解。按分五类:第一类:京津冀;第二类:苏沪;第三类:湖北;第四类:青海;第五类:其他地区。按四类分:第一类:京津冀、苏沪;第二类:湖北;第三类:青海;第四类:其他地区。按三类分:
7、第一类:京津冀、苏沪;第二类:青海;第三类:其他地区。 附件程序一load r=corrcoef(test) %计算相关系数矩阵d=1-r; d=tril(d); d=nonzeros(d);d=d; z=linkage(d,average); %按类平均法聚类dendrogram(z); %画聚类图T=cluster(z,maxclust,3) %把变量划分成3类for i=1:3tm=find(T=i); tm=reshape(tm,1,length(tm); fprintf(第%d 类的有%sn,i,int2str(tm);end程序2clc,clearload %把原始数据保存在纯文本
8、文件中gj(:,5:5)=;gj(:,3:3)=; gj=zscore(test); %数据标准化y=pdist(test); %求对象间的欧氏距离,每行是一个对象z=linkage(y,average); %按类平均法聚类dendrogram(z); %画聚类图for k=3:5fprintf(划分成%d类的结果如下:n,k)T=cluster(z,maxclust,k); %把样本点划分成k类for i=1:ktm=find(T=i); %求第i类的对象tm=reshape(tm,1,length(tm); %变成行向量fprintf(第%d类的有%sn,i,int2str(tm); %显示分类结果endif k=5breakendfprintf(*n);end
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1