摘要: 针对单一变量选择算法中模型分类精度和泛化能力较低的问题, 提出一种混合变量选择算法. 该算法分为两个阶段: 过滤阶段, 利用互信息快速排除一部分无关变量, 降低样本空间的维数; 封装阶段, 在置换理论框架下, 利用随机森林精选剩余变量. 实验结果表明, 该算法与对比算法相比具有更高的分类精度和泛化能力.
中图分类号:
赵伟卫, 李艳颖, 赵风芹, 魏洒洒. 基于互信息和随机森林的混合变量选择算法[J]. 吉林大学学报(理学版), 2017, 55(04): 933-939.
ZHAO Weiwei, LI Yanying, ZHAO Fengqin, WEI Sasa. Hybrid Variable Selection Algorithm Based onMutual Information and Random Forest[J]. Journal of Jilin University Science Edition, 2017, 55(04): 933-939.