摘要:
针对目前中文分词技术主要依赖于常用词词典, 而词典对未登录词识别率较低的问题, 提出一种用双词典识别未登录词的方法, 即构建一个常用词词典和一个单字词词典, 二者相互结合进行分词, 有效解决了对未登录词识别效率偏低的问题. 实验表明, 采用构建单字词表法对未登录词的识别准确率可达90%以上.
中图分类号:
于童, 刘淑芬. 构建单字词表识别未登录词的方法[J]. 吉林大学学报(理学版), 2015, 53(02): 307-310.
YU Tong, LIU Shufen. Method of Recognizing Unknown Words by Building SingleWord Dictionary[J]. Journal of Jilin University Science Edition, 2015, 53(02): 307-310.