陈志雨1, 王慧君1, 胡明2, 刘 钢1
CHEN Zhiyu1, WANG Huijun1, HU Ming2, LIU Gang1
摘要: 针对半监督聚类算法中监督信息使用不充分, 监督信息中信息含有量低的问题, 提出一种结合主动学习的半监督聚类算法. 首先结合使用数据的类别标记和成对约束信息, 指导Kmeans聚类过程, 设计出一种基于Seeds集和成对约束的半监督聚类算法SC\|Kmeans; 其次将主动学习算法引入到SC\|Kmeans中, 以尽量小的代价选取信息含有量更高的监督信息, 提高SC\|Kmeans算法的聚类精度; 最后在UCI标准数据集上进行仿真实验. 实验结果表明, 该算法取得了较好的聚类效果, 有效提高了聚类准确率.
中图分类号: