吉林大学学报(理学版) ›› 2023, Vol. 61 ›› Issue (4): 899-908.
闫晨, 杨有龙, 刘原园
YAN Chen, YANG Youlong, LIU Yuanyuan
摘要: 针对现有的集成聚类算法通常默认使用K-means算法作为基聚类生成器, 虽能确保聚类成员的多样性, 却忽视了差的基聚类可能会对最终聚类结果造成极大干扰的问题, 提出一种基于聚类质量的两阶段集成算法. 鉴于K-means算法运行高效但聚类质量较粗糙, 提出首先在生成阶段采用K-means算法生成基聚类成员, 然后通过群体一致性度量筛选出兼具高质量和强多样性的聚类成员, 形成候选集; 其次, 进一步在集成阶段应用信息熵知识构建基聚类加权的共协矩阵; 最后应用一致函数得到最终聚类结果. 采用3个指标在10个真实数据集上进行对比实验, 实验结果表明, 该算法在有效提升聚类结果准确度的同时, 能保持较好的鲁棒性.
中图分类号: