1、(1) 任意选择k个对象作为初始的簇中心;(2) repeat;(3) 根据簇中对象的平均值,将每个对象(重新)赋予最类似的簇;(4) 更新簇的平均值,即计算每个簇中对象的平均值;(5) 直到不再发生变化。2. 主要代码主程序:clc;clear;close all;% 聚类算法测试nSample = 500, 500, 500; % 3维情况dim = 3;coeff = -2 0.8; -1 0.9; 2 0.7;, . 1 0.9; -2 0.7; -2 0.8; , . -2 0.7; 2 0.8; , ;data = createSample(nSample, dim , coeff
2、);% 得到训练数据nClass = length(nSample);tlabel = ;tdata = ;for i = 1 : nClass tlabel = tlabel; i * ones(nSample(i), 1); tdata = tdata; datai;end% 调用k-means聚类算法 label = stpKMeans( tdata, nClass);% 绘图result = cell(1, nClass);index = 0; index = find(label(:,1) = i); resulti = tdata(index, :);figure;subplot(
3、1, 2, 1);plot3(data1(:, 1), data1(:, 2), data1(:, 3), *, . data2(:, 1), data2(:, 2), data2(:o data3(:, 1), data3(:, 2), data3(:xtitle(初始数据subplot(1, 2, 2);plot3(result1(:, 1), result1(:, 2), result1(: result2(:, 1), result2(:, 2), result2(: result3(:, 1), result3(:, 2), result3(:K-Means聚类结果K-Means核心
4、算法:function label = stpKMeans( data, k)% KMeans 聚类算法,参考% % 输入% data 原始数据% k 聚多少个簇% 输出% label 按照data数据的顺序,每个样本的簇号的列表 n, dim = size(data); label = zeros(n, 1);% 任选k个对象作为初始的簇中心 seq = stpRandN_K(n, k); nowMeans = data(seq, : k label(seq(i) = i; dist = zeros(n, k);while(true)% 计算数据到每个簇的欧几里得距离 temp = data
5、;for j = 1 : dim% 先让数据减去第j个特征 temp(:, j) = data(:, j) - nowMeans(i, j);% 点乘后再相加球的距离的平方 temp = temp .* temp; dist(:, i) = sum(temp, 2);% 从k种距离中找出最小的,并计算修改次数(label跟上一次不一样) , label2 = min(dist, , 2); editElem = sum(label(:, 1) = label2(:, 1); label = label2;% for i = 1 : n% % 根据均值将当前的每个元素重新分簇% minDist
6、= inf;% index = -1;% % 从当前的k个均值中找到离元素i最近的一个,将其划分到该簇% for j = 1 :% dist = data(i,:) - nowMeans(j, :% dist = dot(dist, dist);% if(dist minDist)% % 修改最近的距离,并记录测试的簇号% minDist = dist;% index = j;% end% % 判断是该元素是否重新划分了簇% if(index = label(i) )% editElem = editElem + 1;% label(i) = index;if editElem = 0% 表示
7、本次没有修改,那么跳出循环break;% 重新分簇后,重新计算均值% 计算第k簇的均值 index = find(label(:, 1) = i ); nowMeans(i, :) = mean(data(index, :);从n个元素中随机抽取K个元素的代码:function out = stpRandN_K(n, k)% 从1-n中随机选中k个不同的元素 data = 1 : n; index = floor( (n-i+1)*rand() ) + i;% 交换i和index上的数据 temp = data(index); data(index) = data(i); data(i) =
8、temp; out = data(1:k);图片聚类测试代码:rgbdata = imread(datag-1.jpglabdata = stpRgb2Lab(rgbdata);sm, sn, = size(labdata);sN = sm * sn;nClass = 4;labdata = reshape(labdata, sN, 3); label = stpKMeans( labdata, nClass);label = reshape(label, sm, sn);imshow(rgbdata);hold on;TX = 1 : sn;TY = 1 : sm;imagesc(TX, T
9、Y, label);3. 结果分析针对给定的参数K-Means算法三类聚类结果:图1 初始数据和K-Means聚类结果当初始数据给为如下时:图2 初始数据和K-Means聚类结果由此可以看到,K-Means算法会把一些偏离中心较远的点分到其它簇内。4. 用于图片的结果以图片的在Lab颜色空间的三通道作为三个特征,每个像素为一个样本点,进行图片聚类,此时,如果类数为8,则得到:图3a 图片聚类(8类)结果图3b 图片聚类(8类)结果聚类数量变为15时结果如下:图4a 图片聚类(15类)结果图4b 图片聚类(15类)结果当聚类为4的时候,结果为:图5a 图片聚类(4类)结果图5b 图片聚类(4类)结果
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1