吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (3): 489-498.
• • 下一篇
肖 红1, 颜高鹏1, 曹茂俊1, 舒 琰2
XIAO Hong1, YAN Gaopeng1, CAO Maojun1, SHU Yan2
摘要: 针对现有测井图像解释工作高度依赖人工经验和专家意见, 无法快速理解和给出图像主旨含义, 严重影响测井图像蕴含信息的深度挖掘和利用率问题, 提出了一种基于 ConvNex t网络编码-解码架构的测井图像描述方法。 首先, 在编码器部分采用 ConvNext 网络配合混合空洞卷积, 以增强模型对低分辨率图像细节信息的提取能力。 然后, 通过将原始模型的加性注意力机制替换为多头注意力机制, 配合具有时序信息记忆能力的 LSTM(Long Short Term Memory), 有效提升模型对长距离依赖信息的捕捉能力, 从而可生成对测井图像更准确、 更自然的描述。 实验结果表明, 与基线模型方法比较, BLEU-4(Bilingual Evaluation Understudy-4)、 METROR (Metric for Evaluation of Translation with Explicit ORdering) 以及 CIDEr ( Consensus-based Image Description Evaluation)评价指标分别提升了 3. 8、4. 0 和 5. 3, 表明采用 ConvNext 架构描述测井图像信息的研究方案是可行的。
中图分类号: