吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (6): 1673-1684.
李向利1,2,3, 谢腾翅1, 韦嘉逢1
LI Xiangli1,2,3, XIE Tengchi1, WEI Jiafeng1
摘要: 针对传统基于谱聚类的子空间聚类方法在高维数据存在离群点时, 易受离群点干扰而导致聚类性能下降的问题, 提出一种基于自动权重的主动块对角子空间聚类方法. 该方法先为每个数据点赋予相应权重, 通过权重差异识别数据中的离群点. 在确定离群点后, 主动降低其在表示矩阵中的贡献度, 进而构建更优的表示矩阵以提升模型的聚类性能. 在10个数据集上与8种对比算法的实验结果表明: 在含10%,20%离群点的数据集上, 该方法的平均聚类准确率、 归一化互信息、 调整Rand指数等指标普遍优于对比算法; 在一般聚类任务中, 其在超过半数数据集上性能最优或位居前三. 因此该方法既能高效处理含离群点的高维数据聚类, 又能在通用聚类任务中保持竞争力, 为提高高维数据聚类的鲁棒性提供了有效方案, 有较高的实际应用价值.
中图分类号: