吉林大学学报(地球科学版) ›› 2026, Vol. 56 ›› Issue (3): 1062-1075.doi: 10.13278/j.cnki.jjuese.20240222

• 地球探测与信息技术 • 上一篇    下一篇

 基于机器学习的TOC测井预测方法:以松辽盆地南部青山口组一段为例

张恩威1, 2,孟庆涛1, 2,唐佰强1, 2,胡菲1, 2,党微3   

  1. 1.吉林大学地球科学学院,长春130061
    2.吉林省油页岩与共生能源矿产重点实验室,长春130061
    3.中国石油吉林油田公司勘探开发研究院,吉林松原138000
  • 出版日期:2026-05-26 发布日期:2026-06-03
  • 通讯作者: 孟庆涛(1984—),女,教授,博士生导师,主要从事沉积学、石油地质学、非常规油气勘探与开发方面的研究,E-mail: mengqt@jlu.edu.cn
  • 作者简介:张恩威(2001—),男,硕士研究生,主要从事测井评价、非常规油气勘探方面的研究,E-mail:1723452724@ qq.com
  • 基金资助:
    吉林省自然科学基金项目(20230101081JC);吉林大学科技创新团队项目(2021TD-05)

Machine Learning-Based TOC Logging Prediction Method: A Case Study of the First Member of Qingshankou Formation in the Southern Part of Songliao Basin

Zhang Enwei1, 2, Meng Qingtao1, 2, Tang Baiqiang1, 2, Hu Fei1,2, Dang Wei3   

  1. 1. College of Earth Sciences, Jilin University, Changchun 130061, China
    2. Key Laboratory for Oil Shale and Coexistent Energy  Minerals of Jilin Province, Jilin University, Changchun 130061, China
    3. Exploration and Development Research Institute of Jilin Oilfield Company, PetroChina, Songyuan 138000, Jilin, China
  • Online:2026-05-26 Published:2026-06-03
  • Supported by:
    Supported by the Natural Science Foundation of Jilin Province(20230101081JC) and the Program for Jilin University Science and Technology Innovative Research Team (2021TD-05)

摘要: 总有机碳质量分数(w(TOC))作为评价页岩储层地球化学特征的重要参数,是衡量页岩储层有机质质量分数和生烃潜力的重要指标。测井数据具有高纵向分辨率的特点,可以弥补取样数量不足、测试成本高等缺陷。因此,在页岩油勘探中利用测井数据预测w(TOC)已成为一项重要技术。本文提出一种结合高斯混合模型(GMM)和轻量级梯度提升机(LightGBM)算法的组合模型,实现w(TOC)的测井预测。以松辽盆地南部长岭凹陷青山口组一段页岩为研究对象,收集了声波时差、密度、补偿中子、自然伽马和电阻率测井数据,通过箱型图方法进行异常点检测和处理,利用交叉验证和网格搜索方法调节最优参数,建立w(TOC)预测模型。将提出方法与改进 Δlg R、K-近邻、决策树、极端梯度提升和LightGBM模型进行对比,结果表明,GMM-LightGBM模型的预测效果最佳,模型评价指标均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)分别为0.254、0.211、0.766。将该模型应用在另一口实例取心井中也取得了不错的效果,RMSE、MAE和R2分别为0.547、0.462、0.647。


关键词: 机器学习, GMM-LightGBM模型, TOC, 页岩, 储层, 松辽盆地

Abstract:  Total organic carbon (TOC) content is an important parameter for evaluating the geochemical characteristics of shale reservoirs, serving as a key indicator of organic matter content and hydrocarbon generation potential. Logging data, with its high vertical resolution, can compensate for the limitations of insufficient sampling and high testing costs. As a result, using logging data to predict TOC content has become a crucial technology in shale oil exploration.This paper proposes a combined model integrating the Gaussian mixture model (GMM) and the light gradient boosting machine (LightGBM) to achieve well-logging-based TOC content  prediction. Taking the first section of  Qingshankou Formation in  Changling depression, southern Songliao basin, as the study area, we collected acoustic time difference, neutron porosity, natural gamma, resistivity, and density logging data. Outlier detection and processing were conducted using the boxplot method. Cross-validation and grid search methods were employed to optimize the parameters and establish the TOC content prediction model. The proposed method was compared with five models: The improved Δlg R, K-nearest neighbors, decision tree, extreme gradient boosting, and LightGBM. The results indicate that the GMM-LightGBM model achieved the best prediction performance, with evaluation metrics of root mean square error (RMSE), mean absolute error (MAE), and the coefficient of determination (R2) being 0.254, 0.211, and 0.766, respectively. Furthermore, the model was applied to another core well, demonstrating satisfactory performance with RMSE, MAE, and R2 values of 0.547, 0.462, and 0.647, respectively.


Key words: machine learning, GMM-LightGBM model, TOC, shale, reservoirs, Songliao basin

中图分类号: 

  • P618.13
[1] 夏英杰, 陈华斌, 陈健, 姚明宇, 杨海. 不同施工参数下深层页岩水力压裂数值模拟[J]. 吉林大学学报(地球科学版), 2026, 56(3): 924-936.
[2] 唐华风, 张亚东, 邹明倬, 陆国超, 户景松, 张津铭, 卞海越. 渤海湾盆地莱州湾凹陷K油田中生界火山岩储层定量评价[J]. 吉林大学学报(地球科学版), 2026, 56(3): 739-753.
[3] 李冠, 何文祥, 文志刚, 胡勇, 高小洋, 肖娜. 鄂尔多斯盆地陇东地区长71-2亚段不同源储组合的页岩油富集机理及富集模式[J]. 吉林大学学报(地球科学版), 2026, 56(3): 768-787.
[4] 王蓓东, 杨胜来 , 赵帅 , 邓惠 , 张钰祥 , 白浩言, 李沁怡, 姜艺. 高磨地区震旦系灯影组四段台内储层储集空间类型及其孔喉结构特征[J]. 吉林大学学报(地球科学版), 2026, 56(3): 804-817.
[5] 陈泽熙, 徐志明, 李斌, 钟笠, 彭军, 张昆, 魏祥峰, 郝景宇. 基质型页岩甜点特征及评价方法:以四川盆地涪陵地区中侏罗统凉高山组陆相页岩为例[J]. 吉林大学学报(地球科学版), 2026, 56(3): 788-803.
[6] 丁梦颜, 冯晅, 刘财. 裂缝对岩石非线性弹性特征的影响[J]. 吉林大学学报(地球科学版), 2026, 56(3): 1051-1061.
[7] 王健, 张媛瑗, 吴楠, 徐清海, 崔子岳, 刘显凤, 付清萌. 鄂尔多斯盆地志靖—安塞地区长7段夹层型页岩油储层特征及分类评价[J]. 吉林大学学报(地球科学版), 2026, 56(2): 453-468.
[8] 周三栋, 张伟鑫, 成巧耘, 魏佳成, 周国栋, . 深部煤储层中煤层水可动性评价方法及动力学机制研究进展[J]. 吉林大学学报(地球科学版), 2026, 56(2): 397-412.
[9] 黄玉龙, 张皓, 郭强, 陈昌.

低阻玄武岩的矿物学特征及其油气地质意义——以辽河坳陷古近系为例 [J]. 吉林大学学报(地球科学版), 2026, 56(2): 511-521.

[10] 王振军. 油气储层裂缝预测进展[J]. 吉林大学学报(地球科学版), 2026, 56(2): 469-482.
[11] 刘涛, 刘宗堡, 张可佳, 张岩, 张瑞雪, 刘晓文, 徐翠云.

基于深度学习的致密砂岩储层薄片图像生成与识别方法 [J]. 吉林大学学报(地球科学版), 2026, 56(2): 724-738.

[12] 王菲, 龙欣雨, 唐杰, 郭鹏, 许文良. 古亚洲洋东段的剪刀式闭合历史——来自华北克拉通北缘东段及邻区三叠纪地壳厚度空间变异的制约[J]. 吉林大学学报(地球科学版), 2026, 56(1): 101-117.
[13] 唐华风, 付琦, 尹永康, 高有峰, 户景松, 武海超, 田志文. 花岗岩潜山储层地质研究回顾[J]. 吉林大学学报(地球科学版), 2025, 55(6): 1806-1836.
[14] 冯波, 谢一平, 田海龙, 封官宏, 杨金钢. 基于GIS-MCDA的松辽盆地南部中央坳陷区咸水层CO2地质封存适宜性评价[J]. 吉林大学学报(地球科学版), 2025, 55(6): 1981-2000.
[15] 韩复兴, 刘水源, 高正辉, 韩江涛, 张涛, 尚浩. 基于机器学习的微动HVSR数据干扰信号压制方法[J]. 吉林大学学报(地球科学版), 2025, 55(6): 2153-2163.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!