吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (6): 1723-1730.
王守佳1, 郭东伟2, 石泽男3, 默锦杨3, 刘恒斌2
WANG Shoujia1, GUO Dongwei2, SHI Zenan3, MO Jinyang3, LIU Hengbin2
摘要: 针对传统BIRCH算法在应对特征强相关、 分布不均的指标数据时, 易出现簇内差异过大或过度合并的问题, 提出一种融合自编码器和动态阈值策略的改进BIRCH算法. 首先, 该算法利用自编码器进行非线性特征映射与降维, 削弱特征间相关性对距离度量的影响, 提高数据表示的紧凑性和判别性; 其次, 设计动态阈值调整策略, 根据局部样本密度与簇规模自适应调整聚类半径, 增强算法对非均匀分布数据的适应性; 最后, 在改进后的特征空间与自适应阈值策略下构建聚类特征树, 实现高效且稳定的层次聚类, 并应用于高校教师多维数据的智能聚类分析中. 实验结果表明, 在多个聚类评价指标上, 改进算法均取得了更优性能, 能显著提升聚类的稳定性和准确性.
中图分类号: