摘要:
提出一种新的基于WordNet和文本集语义参数IC的计算方法, 通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息, 即概念的自信息, 同时利用新的参数考虑概念对在WordNet中的共享信息, 设计了一种通用的概念语义相似性计算方法, 该方法简化了传统语义相似性算法, 并解决了语义相似性计算领域的相关问题, 可以应用在信息抽取、 信息检索、 文档分类及本体学习中. 领域通用的数据集R&B数据实验结果表明, 该方法在计算语义相似度问题上有效.
中图分类号:
张东娜, 周春光, 刘彦斌, 郭东伟. 一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. J4, 2010, 48(05): 811-816.
ZHANG Dong-Na, ZHOU Chun-Guang, LIU Pan-Bin, GUO Dong-Wei. A Semantic Similarity Computing Approach Based onWordNet and Corpus Statistics[J]. J4, 2010, 48(05): 811-816.