摘要: 提出一种基于多重假设检验的特征加权朴素贝叶斯分类算法, 该算法通过特征选择方法得到多个特征词集合, 再按多重假设检验错误率为每个特征词集合配以不同的权重系数并参与到分类器的构建中. 该方法已经应用到市长公开电话的文本分类中, 通过构建的3个特征加权朴素贝叶斯分类器实现了投诉文本的计算机自动分类, 且相对传统方法提高了分类器的效率和精度.
中图分类号:
郝立柱, 赵世舜, 郝立丽. 基于多重假设检验市长公开电话文本的自动分类[J]. J4, 2008, 46(06): 1101-1104.
HAO Lizhu, ZHAO Shishun, HAO Lili. Text Automatic Classification Based on Multiple HypothesisTesting in the Mayor’s Public Access Line Project[J]. J4, 2008, 46(06): 1101-1104.