吉林大学学报(信息科学版) ›› 2022, Vol. 40 ›› Issue (2): 188-197.
张 岩1a , 王 斌1a , 杨庆川2 , 李 玮1b
ZHANG Yan 1a , WANG Bin 1a , YANG Qingchuan 2 , LI Wei 1b
摘要: 针对传统方法在石油钻井领域由于检索词不标准、 语义模糊导致检索结果偏差较大的问题, 提出一种 基于BERT(Bidirectional Encoder Representation from Transformers)孪生网络模型的注意力池化方法以提高文献 相似度评估的准确率。 首先使用爬虫技术采集石油钻井文献并清洗整理, 然后利用 5 类石油钻井文献数据集 评估指标对样本进行打分标注, 最后结合钻井文献数据集特征, 提出基于孪生BERT网络的注意力池化方法, 对多特征样本进行整体语义表达。 实验结果表明, 相较于常规的池化方法, 该模型能提升石油钻井文献相似度 度量的效果, 并具有一定的泛化性能。
中图分类号: