吉林大学学报(信息科学版) ›› 2023, Vol. 41 ›› Issue (5): 930-937.
吴晓勇, 侯秋丰, 罗 勇
WU Xiaoyong, HOU Qiufeng, LUO Yong
摘要: 针对 K-means 算法需要人为确定聚类个数和随机选取初始聚类中心导致结果陷入局部最优的问题, 结合 基于密度峰值的聚类算法 CFSFDP(Clustering by Fast Search and Find of Density Peaks), 提出一种改进的无参数 K-means 算法。 首先, 计算样本点的局部密度和离散度。 然后, 建立决策图, 将两个参数组成向量, 计算每个 点到周围 5 个点的距离, 筛选出距离大于 2 倍均方差且密度大于平均密度的点作为算法的初始聚类中心, 统计 聚类中心个数 k 作为聚类个数, 将初始聚类个数 k 以及初始聚类中心作为 K-means 算法的初始参数对数据进行 聚类。 最后, 对 UCI(University of California, Irvine)数据集、 人工建立的高斯数据集以及真实刀具振动数据集 3 种不同类型的数据集进行聚类。 结果表明, 所提算法保持传统算法全局最优性, 并验证了提出算法的有效 性。 由于 K-means 是一种无监督聚类方法, 在获得较优刀具状态识别结果的同时, 可减少人工数据标定、 有监督训练等工作量及运算成本, 这对于准确实时提取数控机床刀具运行状态具有较高的实际意义。
中图分类号: