摘要: 中文分词是中文信息处理的基础, 歧义问题是中文分词的一个难点, 而交集型歧义问题占歧义问题的90%以上, 因此对交集型歧义问题的研究是中文分词研究的一个重点. 通过反复的实验和对实验结果的分析, 提出了5条规则, 并根据这5条规则给出了一种针对交集型歧义字段切分的算法, 实验结果表明, 基于该算法实现的分词系统DSfenci, 对于交集型歧义消解的准确率高于95.22%.
中图分类号:
翟凤文, 赫枫龄, 左万利. 基于统计规则的交集型歧义处理方法[J]. J4, 2006, 44(02): 223-228.
ZHAI Feng-wen, HE Feng-ling, ZUO Wan-li. Crossing Ambiguity Segmentation Based on Statistical Rules[J]. J4, 2006, 44(02): 223-228.