吉林大学学报(地球科学版) ›› 2025, Vol. 55 ›› Issue (4): 1372-1386.doi: 10.13278/j.cnki.jjuese.20240116
曹志民1, 2,张丽1, 2,郑兵3,韩建1, 2
1. 东北石油大学三亚海洋油气研究院,海南 三亚 572000
2. 东北石油大学物理与电子工程学院,黑龙江 大庆 163318
3. 海南科技职业大学虚拟现实技术与系统海南省工程研究中心,海口 571126
Lithology Identification Using Extra Trees Based on SMOTE for Data Balancing
Cao Zhimin1, 2, Zhang Li1, 2, Zheng Bing3, Han Jian1, 2
1. Sanya Offshore Oil and Gas Research Institute, Northeast Petroleum University, Sanya 572000, Hainan, China
2. School of Physics and Electronic Engineering, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
3. Hainan Engineering Research Center for Virtual Reality Technology and Systems,Hainan Vocational University of Science and Technology, Haikou 571126, China
摘要:
在油气勘探和地质工程中,精确的岩性识别对于资源评估和开采具有重要意义。由于地质数据的固有复杂性及岩性样本的不平衡问题,传统方法在岩性识别中面临诸多挑战。本文提出一种合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)结合极端随机树进行岩性识别的方法。首先,通过SMOTE增强少数类样本的表征,提高训练数据的平衡性;其次,利用极端随机树的高效性和强泛化能力构建岩性分类模型。实验结果表明:极端随机树的识别准确率为85.54%,相比其他机器学习方法梯度提升决策树(gradient boosting decision tree, GBDT)、极端梯度提升(extreme gradient boosting, XGBoost)、轻量级梯度提升机(light gradient boosting machine, LightGBM)和随机森林分别提高了5.58%、2.55%、2.35%和2.08%;SMOTE采样后,降低了样本不平衡引起的预测偏差,各模型中少数岩性类别的整体识别精度显著提高,提升了各模型的整体性能,极端随机树性能最优,识别准确率提升到86.62%,相比GBDT、XGBoost、LightGBM和随机森林分别提高了4.71%、2.56%、1.55%和2.02%,验证了SMOTE结合极端随机树的有效性。
中图分类号:
| [1] | 杨兰, 王运, 邹勇军, 胡宝群, 李满根, 张安, 朱满怀. 基于机器学习的富硒土壤预测模型的构建与比较——以江西省信丰县油山地区为例[J]. 吉林大学学报(地球科学版), 2025, 55(5): 1629-1643. |
| [2] | 张晟瑀, 申文超, 苏小四. 基于随机森林法的区域地下水硝酸盐污染风险评价[J]. 吉林大学学报(地球科学版), 2025, 55(3): 943-956. |
| [3] | 王明常, 于海滨, 曾昭发, 王典, 韩复兴, 张剑, 罗修杰, 冷亮, 刘子维. 基于多源遥感数据的城市道路坍塌易发性预测[J]. 吉林大学学报(地球科学版), 2025, 55(3): 1028-1038. |
| [4] | 曹志民, 丁璐, 韩建, 郝乐川, . 基于集成机器学习的测井曲线大尺度差异超分辨 [J]. 吉林大学学报(地球科学版), 2025, 55(2): 670-685. |
| [5] | 吕华星, 陈兆明, 张振波, 姜大朋, 李克成, 郭伟. 机器学习高分辨融合反演在地层对比中的应用——以珠江口盆地开平凹陷开平A构造带为例[J]. 吉林大学学报(地球科学版), 2025, 55(1): 289-297. |
| [6] | 安雪莲, 密长林, 孙德亮, 文海家, 李晓琴, 辜庆渝, 丁悦凯. 基于不同评价单元的三峡库区滑坡易发性对比——以重庆市云阳县为例[J]. 吉林大学学报(地球科学版), 2024, 54(5): 1629-1644. |
| [7] | 王新领, 祝新益, 张宏兵, 孙博, 许可欣. 基于随机树嵌入的随钻测井岩性识别方法 [J]. 吉林大学学报(地球科学版), 2024, 54(2): 701-708. |
| [8] | 于子望, 郑天琪, 程钰翔. 基于PSO-XGB混合优化技术的浅层地下温度预测:以长春市为例[J]. 吉林大学学报(地球科学版), 2023, 53(6): 1907-1916. |
| [9] | 王明常, 丁文, 赵竞争, 吴琳琳, 王凤艳, 纪雪. 基于知识图谱与随机森林的落叶松毛虫害遥感识别[J]. 吉林大学学报(地球科学版), 2023, 53(6): 2006-2017. |
| [10] | 王雪冬, 张超彪, 王翠, 朱永东, 王海鹏. 基于Logistic回归与随机森林的和龙市地质灾害易发性评价[J]. 吉林大学学报(地球科学版), 2022, 52(6): 1957-1970. |
| [11] | 杨国华, 李婉露, 孟博. 基于机器学习方法的地下水氨氮时空分布规律[J]. 吉林大学学报(地球科学版), 2022, 52(6): 1982-1995. |
| [12] | 杨丽萍, 苏志强, 侯成磊, 白宇兴, 王彤, 孔金玲. 基于随机森林的干旱区全极化SAR土壤含水量反演[J]. 吉林大学学报(地球科学版), 2022, 52(4): 1255-. |
| [13] | 侯贤沐, 王付勇, 宰芸, 廉培庆. 基于机器学习和测井数据的碳酸盐岩孔隙度与渗透率预测[J]. 吉林大学学报(地球科学版), 2022, 52(2): 644-653. |
| [14] | 王明常, 刘鹏, 陈学业, 王凤艳, 宋玉莲, 刘瀚元. 基于GEE的东北三省城市建设用地扩张研究[J]. 吉林大学学报(地球科学版), 2022, 52(1): 292-. |
|