kmeans算法(算法+数据+代码).ppt

上传人:b****2 文档编号:2644573 上传时间:2022-11-04 格式:PPT 页数:17 大小:1.93MB
下载 相关 举报
kmeans算法(算法+数据+代码).ppt_第1页
第1页 / 共17页
kmeans算法(算法+数据+代码).ppt_第2页
第2页 / 共17页
kmeans算法(算法+数据+代码).ppt_第3页
第3页 / 共17页
kmeans算法(算法+数据+代码).ppt_第4页
第4页 / 共17页
kmeans算法(算法+数据+代码).ppt_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

kmeans算法(算法+数据+代码).ppt

《kmeans算法(算法+数据+代码).ppt》由会员分享,可在线阅读,更多相关《kmeans算法(算法+数据+代码).ppt(17页珍藏版)》请在冰豆网上搜索。

kmeans算法(算法+数据+代码).ppt

K-means聚类算法聚类分析概念1K-means算法2K-means实验-国民健康3K-means实验-图像分割4K-means实验-商户评级5目录1.聚类分析概念聚类与分类的不同在于:

分类简单来说,就是根据文本的特征或属性,划分到已有类别中。

也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。

聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。

聚类不需要对数据进行训练和学习。

2.K-means算法Q1Q1:

KK是什么?

是什么?

A1A1:

kk是聚类算法当中类的个数。

是聚类算法当中类的个数。

Summary:

Kmeans是用均值算法把数据分成K个类的算法!

Q2Q2:

meansmeans是什么?

是什么?

A2A2:

meansmeans是均值算法。

是均值算法。

2.K-means算法距离的定义距离的定义欧式距离:

N维空间点或向量的距离曼哈顿距离:

城市街区距离夹角余弦:

向量方向的差异相关系数:

信息熵:

2.K-means算法K-means算法详算法详解解步骤一:

取得步骤一:

取得k个初始中心点个初始中心点从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类2.K-means算法K-means算法详算法详解解MinofthreeduetotheEuclidDistance步骤二:

把每个点划分进相应的簇步骤二:

把每个点划分进相应的簇根据欧氏距离最小原则,把每个点划分进相应的簇2.K-means算法K-means算法详算法详解解MinofthreeduetotheEuclidDistance步骤三:

重新计算中心点步骤三:

重新计算中心点根据均值等方法,重新计算每个类的中心点2.K-means算法K-means算法详算法详解解步骤四:

迭代计算中心点步骤四:

迭代计算中心点重复第二步和第三步2.K-means算法K-means算法详算法详解解步骤五:

收敛步骤五:

收敛聚类中心不再发生移动3.K-means实验-国民健康数据示意图数据示意图国家和地区婴儿死亡率()出生时平均预期寿命/岁1990年2000年2006年1990年2000年2006年中国36.329.920.168.970.372中国香港77.480.981.6孟加拉国1006651.654.86163.7文莱108874.276.277.1柬埔寨84.57864.854.956.558.9印度806857.459.162.964.5印度尼西亚603626.461.765.868.2伊朗54363064.868.970.7以色列105.64.276.67980日本4.63.22.678.881.182.3哈萨克斯坦50.537.125.868.365.566.2朝鲜42424269.966.867韩国854.571.375.978.5老挝120775954.660.963.9马来西亚16119.870.372.674蒙古78.547.634.262.765.167.2缅甸917874.45960.161.6巴基斯坦1008577.859.16365.2菲律宾41302465.669.671.4新加坡6.72.92.374.378.179.9斯里兰卡25.616.111.271.273.675泰国25.711.77.26768.370.2越南382314.664.869.170.8埃及66.74028.962.268.871尼日利亚12010798.647.246.946.8南非45505661.948.550.7加拿大6.84.977.479.280.4墨西哥41.531.629.170.97474.5美国9.46.96.575.27777.8X,textdata=xlsread(examp09_04.xls);row=any(isnan(X),2);X=X(row,:

);countryname=textdata(3:

end,1);countryname=countryname(row);X=zscore(X);startdata=X(8,27,42,:

);idx=kmeans(X,3,Start,startdata);S,H=silhouette(X,idx);代码代码轮廓图轮廓图聚类结果聚类结果3.K-means实验-国民健康4.K-means实验-图像分割灰度图灰度图代码代码分割后二值图像分割后二值图像4.K-means实验-图像分割真彩图真彩图4.K-means实验-商户评价数据示意图数据示意图代码代码大众点评网上1000家商户的评分4.K-means实验-商户评价聚类结果聚类结果MINMAX67.4666677.96666756.3666676.945.36.33333336.8333337.43333327.9666678.46666718.4333339.333333谢谢

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电力水利

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1