摘要:
针对不确定数据规模较大, 类簇划分精准度受限, 导致数据聚类效率较低的问题, 提出基于密度峰值的不确定性数据聚类算法。 利用马氏距离法, 剔除相关性较小的干扰性样本数据, 通过熵值计算不确定数据样本缺失值, 逐步进行反向还原; 利用密度峰值计算法确定类簇中心的分布情况, 引入决策图, 进行数据类簇划分;利用 K 近邻思想得到非类中心数据样本信任值, 二次识别及划分类簇内信任值差距较大的数据点以及噪点,完成密度峰聚类法的优化。 实验结果表明, 面对大规模数据时, 依然实现了类簇精准划分, 聚类耗时较少。所提方法具有较高的运算效率, 对不确定性数据挖掘与分析具有重大意义。
中图分类号:
郎加云, 丁晓梅.
基于密度峰值的不确定性数据聚类算法
[J]. 吉林大学学报(信息科学版), 2026, 44(2): 392-398.
LANG Jiayun, DING Xiaomei.
Clustering Algorithm for Uncertain Data Based on Peak Density
[J]. Journal of Jilin University (Information Science Edition), 2026, 44(2): 392-398.