摘要: 基于传统信息增益特征选择算法, 通过提出类内分散度与类间集中度的概念, 结合传统信息增益算法, 解决了信息增益算法因忽略特征项的分布而导致的性能下降问题, 提高了信息增益算法的效率. 使用改进的特征选择算法进行垃圾邮件过滤实验, 在不同的分类器下, 与传统的特征选择算法进行对比, 实验结果表明, 改进的特征选择算法性能较优.
中图分类号:
李猛, 刘元宁. 一种基于信息增益的新垃圾邮件特征选择算法[J]. 吉林大学学报(理学版), 2017, 55(02): 379-382.
LI Meng, LIU Yuanning. A New Spam Feature Selection Algorithm Based on Information Gain[J]. Journal of Jilin University Science Edition, 2017, 55(02): 379-382.