吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (2): 472-0478.
王海燕, 焦增晨, 赵剑, 安天博, 鞠熠
WANG Haiyan, JIAO Zengchen, ZHAO Jian, AN Tianbo, JU Yi
摘要: 针对传统机器学习算法在数据集Cleveland和Hungary上预测准确率低的问题, 提出一种基于Bayes超参数优化梯度提升树的心脏病预测方法. 首先, 采用K-最近邻算法对数据集中的缺失值进行填补, 用Min-Max标准化、One-Hot编码处理数据, 并基于梯度提升树算法进行心脏病预测; 其次, 采用Bayes优化和十倍交叉验证的方式搜寻算法的最佳超参数组合. 实验结果表明, 优化后的梯度提升树算法在心脏病数据集Cleveland上预测准确率可达90.2%, 在心脏病数据集Hungary上预测准确率可达81.4%, 优于决策树、 支持向量机、 K-最近邻等传统机器学习方法, 可辅助医生进行心脏病诊断.
中图分类号: