吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (5): 930-936.
钱亮宏1, 王福德2,3, 宋海龙2
QIAN Lianghong1, WANG Fude2, SONG Hailong2
摘要: 为解决金融交易反欺诈和维护金融安全,针对金融交易数据不平衡、类别离散的特点,提出一套端到端 的建模流程、方法和模型结构。 该流程涵盖数据预处理、模型训练和预测。 同时比较了不同模型在不同特征 数量情况下的效果和效率,并基于真实数据集进行验证,从而为金融机构根据自身的优化目标和资源限制选用 不同类别和特征数量的模型提供参考。 特征数较大(200以上)的基于树的模型适用于资源较充裕切追求极致 模型效果的场景,中等规模(特征数100~200)的神经网络模型适用于资源一般的场景, 而特征数较小的决策 树模型或逻辑回归模型适用于资源有限且模型效果要求不高的长尾场景。
中图分类号: