吉林大学学报(信息科学版) ›› 2014, Vol. 32 ›› Issue (1): 76-81.
贺海涛a, 郑山红a, 侯丽鑫a, 王国春b, 王璐b
HE Hai-taoa, ZHENG Shan-honga, HOU Li-xina, WANG Guo-chunb,WANG Lub
摘要:
为提高领域本体概念及概念之间关系提取效率和准确率, 提出基于中文文本的领域本体学习模型。在提取候选概念的过程中, 采用修改后的关联规则频繁项计算方法对合 成词进行处理, 并结合位图存储分词处理后术语间的物理相邻关系, 再通过计算领域相关度和领域一致度对候选概念进行筛选, 最后利用关联规则可信度和层次聚类的方法分别提取概念间的非分类关系和分类关系。实验结果表明, 该模型对领域本体学习具有合理性, 提出的算法与基于互信息的本体学习相比较, 在概念和关系的提取 上具有较高的准确性。
中图分类号: