摘要:
基于本体的文本聚类方法, 在文本表示上引入WordNet, 并定义了关键概念集, 使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数, 提高聚类效果. 聚类过程中, 算法使用文本的关键概念集和概念特征向量计算文本相似度, 利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释. 实验结果表明, 该方法有效地减少了文本特征向量的维数, 提高了文本聚类效果以及聚类结果的可解释性.
中图分类号:
朱会峰, 左万利, 赫枫龄, 彭涛, 纪文彦. 一种基于本体的文本聚类方法[J]. J4, 2010, 48(02): 277-283.
SHU Hui-Feng, ZUO Mo-Li, HE Feng-Ling, BANG Chao, JI Wen-Pan. A Novel Text Clustering Method Based on Ontology[J]. J4, 2010, 48(02): 277-283.