摘要:
提出一种基于规则的无监督词性标注方法, 利用200多条英语语法规则, 创建26个规则函数, 先将输入的待标注英语句子进行预处理后得到初始标记, 再对每个单词调用规则函数, 最终得到标注后的英语句子. 通过对Brown语料库的实验, 词性标注的正确率达到9395%. 实验结果表明, 本文方法可行、 有效, 能很好地提高英语词性标注的准确率.
中图分类号:
彭涛, 戴耀康, 朱枫彤, 张邦佐, 刘露, 闫昭, 钱锋. 一种基于规则的无监督词性标注方法[J]. 吉林大学学报(理学版), 2015, 53(05): 956-962.
PENG Tao, DAI Yaokang, ZHU Fengtong, ZHANG Bangzuo, LIU Lu, YAN Zhao, QIAN Feng. RuleBased Method for Unsupervised PartofSpeech Tagging[J]. Journal of Jilin University Science Edition, 2015, 53(05): 956-962.