吉林大学学报(理学版) ›› 2026, Vol. 64 ›› Issue (2): 359-0369.
杜睿山1,2, 芦博瑞1, 孟令东2, 江南3, 张云柏4
DU Ruishan1,2, LU Borui1, MENG Lingdong2, JIANG Nan3, ZHANG Yunbai4
摘要: 针对传统密度峰值聚类算法未考虑类簇间密度差异、 需预先设定类簇数量以及单一分配策略方面的不足, 提出一种基于自适应分层共享近邻的密度峰值聚类算法. 首先, 通过自适应共享近邻与分层次增加权重的方式计算样本间相似度, 重新定义局部密度和相对距离;其次, 引入二阶导数识别拐点, 并基于拐点信息计算加权三角形面积以自动选取聚类中心; 最后, 结合相似度矩阵与相对距离进行二次分配以降低链式反应的影响. 在9个人工数据集和9个UCI真实数据集上的实验结果表明, 该算法在聚类性能上普遍优于密度峰值聚类算法及其改进算法, 展现出更高的准确性和鲁棒性, 适用于复杂分布数据的聚类分析.
中图分类号: