吉林大学学报(理学版) ›› 2023, Vol. 61 ›› Issue (5): 1131-1138.
曲福恒1, 宋剑飞1, 杨勇1,2, 胡雅婷3, 潘曰涛1
QU Fuheng1, SONG Jianfei1, YANG Yong1,2, HU Yating3, PAN Yuetao1
摘要: 针对I-k-means-+算法聚类结果不稳定、求解精度较低的问题, 提出一种基于min-max准则与区域划分的I-k-means-+聚类算法. 首先, 提出min-max准则, 计算每个数据点到最近中心的距离, 优先选择距离最大的数据点作为新的聚类中心, 避免多个初始中心聚集在同一个簇中的情况; 其次, 将分裂簇中的数据点分割到不同区域, 在每个区域中选取一个数据点作为候选中心, 以增加候选中心的多样性; 最后, 对于配对失败的簇, 通过增益重新选择新的分裂簇与原删除簇再次配对, 以提高配对成功率, 进一步降低目标函数值. 实验结果表明, 与I-k-means-+算法相比, 本文算法在运行效率基本相当的前提下, 求解精度平均提高6.47%, 且聚类结果更稳定;与k-means、k-means++算法相比, 本文算法的求解精度更高.
中图分类号: