摘要:
为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率, 在现有中文分词算法的基础上, 提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射, 对词库进行改造, 使之更好地与相关词进行映射, 以便于实现中文分词。实验证明, 改进的中文分词算法能降低检索耗时, 是已有的分词算法的1/2和1/5, 有效提高中文全文检索的速率。
中图分类号:
刘畅, 张猛. 中文全文检索系统中基于分词技术的研究[J]. 吉林大学学报(信息科学版), 2013, 31(3): 320-323.
LIU Chang, ZHANG Meng. Chinese Full-Text Retrieval System Based on Segmentation Techniques[J]. Journal of Jilin University(Information Science Ed, 2013, 31(3): 320-323.