摘要: 提出一种启发式的信息抽取算法, 并利用该算法建立一个信息抽取系统. 该系统基于文本分块, 利用文本的语义特征和结构特征, 抽取具有特征的状态, 在此基础上, 利用反向动态规划和正向A*算法, 抽取剩余的无特征状态. 通过对100篇论文头部进行测试的结果表明, 精确度和召回率比基于单词和传统Viterbi算法的方法均有所提高, 启发式算法的性能优于Viterbi算法.
中图分类号:
吴芬芬,, 刘磊, 肖宪. 一种启发式的信息抽取算法[J]. J4, 2007, 45(01): 73-76.
WU Fenfen,, LIU Lei, XIAO Xian. A Heuristic Information Extraction Algorithm[J]. J4, 2007, 45(01): 73-76.