en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

徐鹏晔(1988—),男,山东东营人,工程师,硕士,从事开发地震和大数据方面的研究工作。E-mail:xupengye.slyt@sinopec.com。

中图分类号:TE319

文献标识码:A

文章编号:1009-9603(2022)01-0113-08

DOI:10.13673/j.cnki.cn37-1359/te.2022.01.014

参考文献 1
肖波,韩学辉,周开金,等.测井曲线自动分层方法回顾与展望 [J].地球物理学进展,2010,25(5):1 802-1 810. XIAO Bo,HAN Xuehui,ZHOU Kaijin,et al.A review and outlook of automatic zonation methods of well log[J].Progress in Geophys⁃ ics,2010,25(5):1 802-1 810.
参考文献 2
赵丽莎,史永彬,金玮,等.基于梦想云的测井智能化解释应用研究[J].中国石油勘探,2020,25(5):97-103.ZHAO Lisha,SHI Yongbin,JIN Wei,et al.Application research on intelligent logging interpretation based on E & P Dream Cloud [J].China Petroleum Exploration,2020,25(5):97-103.
参考文献 3
李宗宇,任宏,刘芳,等.雅克拉气藏白垩系旋回结构法小层划分对比[J].新疆石油地质,2017,38(6):637-642.LI Zongyu,REN Hong,LIU Fang,et al.Stratigraphic classifica⁃ tion and correlation with Cretaceous cycle structure method in Yakela gas reservoirs,Tarim basin[J].Xinjiang Petroleum Geolo⁃ gy,2017,38(6):637-642.
参考文献 4
朱强,毕彩芹.陆相地层精细对比方法及应注意的问题[J].油气地质与采收率,2002,9(3):27-30.ZHU Qiang,BI Caiqin.Methods of fine correlation and its matters needing attention in terrestrial formation[J].Petroleum Geology and Recovery Efficiency,2002,9(3):27-30.
参考文献 5
李昌,沈安江,常少英,等.机器学习法在碳酸盐岩岩相测井识别中应用及对比——以四川盆地MX地区龙王庙组地层为例 [J].油气藏评价与开发,2021,11(4):586-596.LI Chang,SHEN Anjiang,CHANG Shaoying,et al.Application and contrast of machine learning in carbonate lithofacies log iden⁃ tification:A case study of Longwangmiao Formation of MX area in Sichuan Basin[J].Reservoir Evaluation and Development,2021,11(4):586-596.
参考文献 6
徐朝晖,刘钰铭,周新茂,等.基于卷积神经网络算法的自动地层对比实验[J].石油科学通报,2019,4(1):1-10. XU Zhaohui,LIU Yuming,ZHOU Xinmao,et al.An experiment in automatic stratigraphic correlation using convolutional neural net⁃ works[J].Petroleum Science Bulletin,2019,4(1):1-10.
参考文献 7
WU Xinming,LIANG Luming,SHI Yunzhi,et al.Fault Seg 3D:us⁃ ing synthetic data sets to train an end-to-end convolutional neu⁃ ral network for 3D seismic fault segmentation[J].Geophysics,2019,84(3):35-45.
参考文献 8
NAM Pham,SERGEY Fomel,DALLAS Dunlap.Automatic chan⁃ nel detection using deep learning[J].Interpretation,2019,7(3):43-50.
参考文献 9
张国印,王志章,林承焰,等.基于小波变换和卷积神经网络的地震储层预测方法及应用[J].中国石油大学学报:自然科学版,2020,44(4):83-93.ZHANG Guoyin,WANG Zhizhang,LIN Chengyan,et al.Seismic reservoir prediction method based on wavelet transform and con⁃ volutional neural network and its application[J].Journal of China University of Petroleum:Edition of Natural Science,2020,44(4):83-93.
参考文献 10
宋辉,陈伟,李谋杰,等.基于卷积门控循环单元网络的储层参数预测方法[J].油气地质与采收率,2019,26(5):73-78.SONG Hui,CHEN Wei,LI Moujie,et al.A method to predict res⁃ ervoir parameters based on convolutional neural network-gated recurrent unit(CNN-GRU)[J].Petroleum Geology and Recovery Efficiency,2019,26(5):73-78.
参考文献 11
石创,朱俊章,龙祖烈,等.基于概率神经网络的烃源岩TOC预测——以珠江口盆地陆丰南区为例[J].断块油气田,2019,26(5):561-565.SHI Chuang,ZHU Junzhang,LONG Zulie,et al.Prediction of total organic carbon in source rocks by probabilistic neural network:a case study of southern Lufeng area in Pearl River Mouth Basin[J].Fault-Block Oil and Gas Field,2019,26(5):561-565.
参考文献 12
马文礼,李治平,孙玉平,等.基于机器学习的页岩气产能非确定性预测方法研究[J].特种油气藏,2019,26(2):101-105.MA Wenli,LI Zhiping,SUN Yuping,et al.Non-deterministic shale gas productivity forecast based on machine learning[J].Spe⁃ cial Oil & Gas Reservoirs,2019,26(2):101-105.
参考文献 13
许少华,张宇航,宋美玲,等.基于特征识别与PSO结合的地层对比算法[J].计算机技术与发展,2015,25(5):37-40.XU Shaohua,ZHANG Yuhang,SONG Meiling,et al.A stratigraph⁃ ic correlation algorithm based on characteristics identification and PSO[J].Computer Technology and Development,2015,25(5):37-40.
参考文献 14
赵娅,王伟,李盼池.基于量子神经网络的水淹层识别方法[J].地球物理学进展,2019,34(5):1 971-1 979.ZHAO Ya,WANG Wei,LI Panchi.Recognition of water-flooded layer based on quantum neural networks[J].Progress in Geophys⁃ ics,2019,34(5):1 971-1 979.
参考文献 15
曹茂俊,薛诚,赵静,等.量子衍生布谷鸟算法及在地层对比中的应用[J].计算机与现代化,2017,(12):43-48. CAO Maojun,XUE Cheng,ZHAO Jing,et al.Quantum-inspired cuckoo search algorithm with application to stratigraphic correla⁃ tion[J].Computer and Modernization,2017,(12):43-48.
参考文献 16
钱峰,胡光岷.基于滑动时窗的小波变换实时算法[J].信号处理,2007,23(3):361-364.QIAN Feng,HU Guangmin.A realtime wavelet algorithm based on sliding window technology[J].Signal Processing,2007,23(3):361-364.
参考文献 17
曹惠玲,王冉.基于滑动时窗策略自适应优化支持向量机的航空发动机性能参数在线预测[J].推进技术,2020,41(8):1 887-1 894.CAO Huiling,WANG Ran.Adaptively optimized support vector machine online prediction of aeroengine performance parameters based on sliding time window strategy[J].Journal of Propulsion Technology,2020,41(8):1 887-1 894.
参考文献 18
强文渊,韦家富,刘友波,等.基于滑动时窗 K-Means 聚类的CVT早期故障诊断[J].电力电容器与无功补偿,2019,40(3):89-95.QIANG Wenyuan,WEI Jiafu,LIU Youbo,et al.Early fault diagno⁃ sis for capacitor voltage transformer using sliding K-Means clus⁃ tering[J].Power Capacitor & Reactive Power Compensation,2019,40(3):89-95.
参考文献 19
史金余,杨泽宇,谢兄.基于模糊决策的随机森林算法[J].计算机工程与设计,2020,41(8):2 207-2 212.SHI Jinyu,YANG Zeyu,XIE Xiong.Algorithm of random forest based on fuzzy decision[J].Computer Engineering and Design,2020,41(8):2 207-2 212.
参考文献 20
刘玲,郑建国.一种基于随机森林的组合分类算法设计与应用 [J].电子设计工程,2020,28(16):54-57.LIU Ling,ZHENG Jianguo.Design and application of a combinato⁃ rial classification algorithm based on random forest[J].Electronic Design Engineering,2020,28(16):54-57.
参考文献 21
纪磊,李菊花,肖佳林.随机森林算法在页岩气田多段压裂改造中的应用[J].大庆石油地质与开发,2020,39(6):168-174.JI Lei,LI Juhua,XIAO Jialin.Application of random forest algo⁃ rithm in the multistage fracturing stimulation of shale gas field[J].Petroleum Geology & Oilfield Development in Daqing,2020,39(6):168-174.
参考文献 22
钟仪华,李榕.基于主成分分析的最小二乘支持向量机岩性识别方法[J].测井技术,2009,33(5):425-429.ZHONG Yihua,LI Rong.Application of principal component anal⁃ ysis and least square support vector machine to lithology identifi⁃ cation[J].Well Logging Technology,2009,33(5):425-429.
参考文献 23
朱怡翔,石广仁.火山岩岩性的支持向量机识别[J].石油学报,2013,34(2):312-322.ZHU Yixiang,SHI Guangren.Identification of lithologic character⁃ istics of volcanic rocks by support vector machine[J].Acta Petro⁃ lei Sinica,2013,34(2):312-322.
参考文献 24
苟博,黄贤武.支持向量机多类分类方法[J].数据采集与处理,2006,21(3):334-339.GOU Bo,HUANG Xianwu.SVM multi-class classification[J].Journal of Data Acquisition & Processing,2006,21(3):334-339.
参考文献 25
孙予舒,黄芸,梁婷,等.基于XGBoost算法的复杂碳酸盐岩岩性测井识别[J].岩性油气藏,2020,32(4):98-106.SUN Yushu,HUANG Yun,LIANG Ting,et al.Identification of complex carbonate lithology by logging based on XGBoost algo⁃ rithm[J].Lithologic Reserviors,2020,32(4):98-106.
参考文献 26
谷宇峰,张道勇,鲍志东.测井资料 PSO-XGBoost 渗透率预测 [J].石油地球物理勘探,2021,56(1):26-37.GU Yufeng,ZHANG Daoyong,BAO Zhidong.Permeability predic⁃ tion using PSO-XGBoost based on logging data[J].Oil Geophysi⁃ cal Prospecting,2021,56(1):26-37.
目录contents

    摘要

    老油田开发井数多、纵向上多套层系发育、油水关系复杂,地层对比人工解释工作量大、多解性强。常规大数据研究思路将多条测井曲线和分层样本标签通过选定的一种机器学习方法一次性建立样本预测模型,该方法预测模型精度低、收敛困难。针对性地提出了一种基于数据驱动和循环滑动时窗的小层智能划分方法,优选对地质分层敏感的测井曲线作为特征参数,为丰富样本库采取“窗口对点”的循环滑动时窗方法多次进行样本数据采集,通过优化不同机器学习方法的超参数,得到最佳训练模型,使用该模型对小层智能划分结果进行预测。分析结果表明,滑动时窗长度为 20、步长为 2 时进行样本采集,基于随机森林方法构建的小层智能划分模型预测准确率达 88.4%,优于常规一次性建模预测方法,取得最优的测试效果。

    Abstract

    There are many development wells in mature oilfields with multiple series of strata in the vertical direction and complex oil–water relationships. Thus,the manual interpretation of stratigraphic correlation has heavy workload and multi- ple solutions. In conventional research based on big data,a sample prediction model is established at one time with multi- ple logging curves and layered sample labels by a selected machine learning algorithm. However,this method has low accu- racy and difficult convergence. To tackle the problems,this paper proposes a small layer intelligent division method based on data-driven and cyclic sliding time window. The logging curves sensitive to geological stratification are selected as the characteristic parameters. To enrich the sample database,the paper collects sample data many times with the“window-topoint”circular sliding time window method. The optimal traimodel is obtained by optimizing the hyper-parameters of differ- ent machine learning algorithms. The model is used to predict the results of small layer partitioning. Analysis results show that when the length of the sliding time window is 20 ning and the step size is 2,the small layer intelligent division model based on the random forest method has a prediction accuracy of 88.4%,which is better than the conventional prediction method based on modeling at one time and achieves the best test effect.

  • 小层精细对比是油气田储层表征的基础条件,常规地层对比方法在沉积规律约束下,通过取心井的岩电特征识别全区标志层,基于测井曲线组合的旋回性、相似性和地层等高程法进行划分[1-4]。随着东部老油田进入开发中后期,油水井数逐渐增多,地层对比工作量显著增加,同时由于河流相储层河道迁移迅速,横向上砂体变化快,纵向上多期砂体叠置发育,储层非均质性明显,专家经验解释地层对比多解性强,制约了小层对比的效率和精度[5-6]

  • 近年来人工智能大数据方法飞速发展,不断应用于各行各业,在油田勘探开发领域也取得了一定进展。WU等运用正演模拟技术得到大量三维地震样本数据,通过优选改进三维卷积神经网络模型,地震断点智能识别效果明显[7]。NAM 等研发了一种基于改进编解码器卷积神经网络的三维河道自动识别方法[8]。张国印等结合卷积神经网络和小波变换技术,有效智能预测地震储层类型[9]。另外,储层参数预测、烃源岩有机碳含量预测、产能预测等研究在深度学习领域也取得了一定进展[10-12];但在小层智能对比方面,往往是将测井曲线的一整段数据作为样本进行一次训练建立模型[13-15],而样本数据分布不均匀,地质分层界限的多解性和测井曲线组合的多样性,极大程度地降低了预测模型的精度和泛化能力。

  • 针对小层智能划分存在的问题,笔者提出一种基于循环滑动时窗[16-18] (“窗口对点”)提取样本的方法,沿深度加深方向以一定窗口长度和步长滑动进行样本学习,对测井曲线进行重要性评价分选出敏感曲线,最终通过优选不同机器学习算法,实现数据驱动的小层智能划分。

  • 1 机器学习方法

  • 小层划分属于分类问题,筛选随机森林、支持向量机、XGBoost等机器学习方法分别建立模型,进行对比分析。

  • 1.1 随机森林方法

  • 随机森林(Random Forest)方法是一种灵活度高、准确率高、操作性强、可有效运算大数据集、支持高维样本输入的集成学习(Ensemble Learning)方法,属于 Bagging(Booststrap Aggregating)的一种类型,具有较好解决分类问题的能力[19-21]。随机森林方法将多棵决策树集成在一起,每棵决策树分别判断分类,从原始样本库中有放回地随机抽取部分特征样本进行分割,对每个样本递归重复训练直至模型预测值不再增加,通过统计分析分类结果最高的类别为最终输出结果,同时各决策树无相关性,可最大程度地降低过拟合干扰,保持较好抗噪能力。

  • 随机森林方法包括以下 4 个步骤:①样本随机取样。在一个数量为 A 的样本中,有放回的随机抽取 A 个样本,重新组合成一个新的样本数据作为训练集。由于是有放回取样,因此会获得重复样本数据,未被抽取的样本构成袋外数据集(OOB,Out ofBand),用于测试模型。②随机特征选择。从数量为 N 的特征数据中任意选取 n 个数据子集,且 nN。③特征参数优选。决策树由节点和分支构成,根部结点代表属性特征,分支表示不同的输出过程,对应的叶子节点为输出结果,通常使用基于基尼系数的 CART 算法进行分类研究,数值最小的特征和其对应切分点表示最优特征和最佳切分点。 ④构建随机森林。重复上述步骤,得到多棵决策树,每棵树都对样本数据分类,最终统计票数最多的输出结果。

  • 随机森林优化参数有森林中决策树的数量(n_estimators)和最佳切分点处的最大特征参数(max_features)。首先 n_estimators 值不断增大以提高模型拟合能力,当整个模型拟合能力不随决策树的数量增加而增大时,再调试最大特征参数,逐渐提高子模型的拟合能力,最终相应提高整体模型的泛化能力。

  • 1.2 支持向量机方法

  • 支持向量机(SVM,Support Vector Machine)方法是VAPNIK提出的一种可有效解决样本间存在非线性映射关系、高维度特征参数及样本数量少等问题的机器学习方法,其最大特点是可以根据实际训练数据的分布关系,搜寻所有线性组合关系中能准确划分数据集的最优分类边界,并保证这个边界的几何距离最大化[22-24]。对于线性可分样本集,运用间隔最大化原则求取分离超平面:

  • wTx+b=0
    (1)
  • wb分别决定超平面的方向和到原点之间的距离。对于非线性分类问题,需要加入一个惩罚系数(C),并引入拉格朗日因子作为约束,将大间隔划分超平面问题转化为对偶问题:

  • f(x)=i=1n αiyihxi,xj+d
    (2)
  • 核函数是将空间中2个无法线性区分的变量以非线性关系映射至高维空间进行表征的函数,常见的有多项式(poly)核函数、径向基(rbf)核函数、Sig⁃ moid核函数等。优化参数有 C 和核函数系数(gam⁃ ma)。其中,C 表示对于误差的容忍度,其数值越大,越不能容忍误差,数值越小越易欠拟合;gamma 表示支持向量的多少,对训练预测模型的速度有较大影响。

  • 1.3 XGBoost方法

  • XGBoost(Extreme Gradient Boosting)方法,即极端梯度提升方法,是基于 GBDT(Gradient Boosting Decision Tree)的一种高效实现的集成方法。XG⁃Boost 方法中,在前 1 次树训练残差减小方向,会分裂成 1 棵新树,并在所有样本训练完成后将所有树的累加结果作为输出结果[25-26]。XGBoost 方法的目标是在保证预测误差最小的条件下,最大程度保持模型的泛化能力。XGBoost 方法具有三方面优势: ①通过加入正则化项控制模型的复杂程度,不断提高模型的泛化能力。②在处理分类问题时,对目标函数进行一阶和二阶泰勒求导,限制树过深生长,使模型更精确。③可并行优化迭代生成更新学习器,大幅提高方法效率,防止过拟合现象。

  • 优化参数有树的最大深度(max_depth)、最小叶子节点样本权重(min_child_weight)。这2个参数均用于避免过拟合,其中 max_depth 值越大越容易学到更局部具体的样本;min_child_weight为建立各个模型需要的最小样本,其数值越大越可避免局部特殊样本的学习,但过高会造成欠拟合。

  • 2 小层智能划分方法

  • 2.1 方法流程建立

  • 通过对不同机器学习方法进行分析,提出了一种基于数据驱动的小层智能划分方法,利用循环滑动时窗技术,建立如下方法流程(图1):①统计研究区每口井的测井曲线,选择测井曲线齐全的井开展层位智能划分重要性分析,通过对重要性排序,优选相关系数高的敏感测井曲线作为特征参数。② 实际测井过程中,异常值对地质研究干扰明显,各种测井曲线的测量量纲差异较大,需对原始数据预处理,主要包括测井曲线异常值剔除、曲线标准化和归一化及地质分层数据方波化等。③根据地层划分实际需要,设置不同尺度的滑动时窗长度和步长,运用“窗口对点”的方法采集样本,同时为了消除标签分布不均匀影响,最大概率的获取样本信息,创新循环滑动时窗方法提取样本数据。④选择多种二分类的机器学习方法训练模型,对其进行超参数自动化寻优,评估测试模型效果好、精度高的机器学习方法,用于构建小层智能划分模型。⑤运用测试效果好的训练模型进行验证井的小层智能划分,并对预测结果分析,预测结果最多的层位为输出结果,最终完成单井小层智能划分。

  • 图1 小层智能划分方法流程

  • Fig.1 Flow chart of smalllayer intelligent partitioning

  • 2.2 分层样本构建

  • 2.2.1 数据预处理

  • 岩性变化对应测井曲线响应特征也具有明显差异,不同测井曲线组合对地质分层存在选择性和敏感性差异,造成地质分层多解性强,无法有效划分层位,因此需要优选敏感曲线以降低测井曲线数据维度。为避免不同测井曲线量纲间干扰,对敏感测井曲线进行标准化、归一化处理,保证岩电特征一致性,作为模型的特征参数。

  • 地质分层数据是不连续离散值,采用方波化方法将实际地质分层进行二分类处理,转化成曲线作为模型的标签,地层划分界面位置为1,非地层划分界面位置为0。

  • 2.2.2 循环滑动时窗采样

  • 在地层智能划分过程中,以分层点和非分层点作为标签,将特征曲线与标签数据进行“点对点”模式的训练预测,这种仅依靠一个深度点对应的各条测井曲线数值无法进行样本准确取样。实际地层信息与一定时窗范围内相邻测井数据有关,因此选择“窗口对点”的采样方式。根据地层划分级别(砂层组、小层)需要设定滑动时窗参数(图2)。实际模型建立过程中,样本数据随着固定时窗长度移动,每个窗口在补进新的样本的同时会去掉一个老的样本。

  • 图2 滑动时窗示意

  • Fig.2 Schematic diagram of sliding time window

  • 若进行砂层组划分,考虑砂层组厚度较大,滑动时窗长度可适当增大,若进行小层划分,滑动时窗长度适当减小。步长设定过大,采样时易错过实际地质分层界线,同时造成样本数据不连续;步长设定过小,计算量增大的同时,由于测井曲线特征多解性,造成实际分层结果的不确定性增加。

  • 为减少各种外界因素干扰,最大程度划分地层界限,采用循环滑动时窗采样的方法(图3),即根据划分地层级别选定合适的滑动时窗长度、制定合理的滑动步长,起始深度从L 0开始;第2次起始深度从 L 1开始,滑动时窗长度和步长不变进行采样;第3次起始深度从 L 2开始,在相同的滑动时窗长度和步长条件下采样;直至起始深度从 Lm开始,在相同的滑动时窗长度和步长条件下继续采样。经过 m +1 次循环采样,选择出现次数最多的为分层结果;若多个连续最高值,则取最早出现最高值的位置作为划分结果(L 0L 1L 2,···,Lm根据实际需求设定)。

  • 图3 循环滑动时窗示意

  • Fig.3 Schematic diagram of cyclic sliding time window

  • 2.3 模型评估优选

  • 2.3.1 超参数优化

  • 超参数直接影响着模型性能,因此超参数调优对于最大程度优化机器学习方法起着重要作用。常规情况下主要依靠人工试错调参的方式进行不同方法的超参数测试,但该方法运算周期长,结果更加依赖于专家经验,往往无法得到最优效果。随机网络搜索技术是在大规模超参数网格基础上,通过随机组合的方式寻找最佳优化模型的方法,具有节约时间和计算资源、有效凸出最优结果的特点。

  • 2.3.2 评估指标

  • 对于二分类任务的模型评估通常采用准确率 (Acc,Accuracy)、精确率(P,Precision_score)、召回率 (R,Recall_score)等指标。以地层界限为正类,非地层界限为负类。准确率指根据实际正类的样本数量占据总样本数量的比例。精确率指实际结果为正类同时预测结果也为正类的样本数量占预测结果为正类的样本数量的比例。召回率指实际结果为正类同时预测结果也为正类的样本数量占实际结果为正类的样本数量的比例。准确率、精确率和召回率的计算公式分别为:

  • Acc=TP+TNTP+FP+FN+TN
    (3)
  • P=TPTP+FP
    (4)
  • R=TPTP+FN
    (5)
  • 3 应用效果分析

  • 3.1 工区概况

  • 孤东油田位于济阳坳陷沾化凹陷东北方向,是以新近系馆陶组河流相砂岩为主要储层的大型整装油田,整体构造平缓,断层不发育。孤东七区西位于孤东油田东翼,其馆陶组为辫状河-曲流河沉积,储层以高孔高渗透细粉砂岩为主,结构疏松,胶结物含量低,非均质性明显。研究区馆上段根据沉积旋回特征可分为 6 个砂组,主力含油层系主要为馆上段5和6砂组;其中6砂组(Ng 6)砂体厚度大、储层发育,为典型的辫状河沉积,纵向上可以细分为8 个小层(Ng61 —Ng68),是研究的主要目的层。

  • 孤东七区西进入开发后期,统计分析全区具有声波时差(AC)、自然电位(SP)、电阻率(ML1,ML2)、感应电导率(COND)、井径(CAL)和补偿中子(CNL) 共 7条测井曲线的 515口井的数据进行地层智能划分研究。其中,405口井为训练样本井,60口井为测试样本井,利用训练模型对剩余50口井验证。

  • 3.2 小层智能划分效果分析

  • 3.2.1 样本数据准备

  • 通过对研究区所有测井曲线进行重要性分析,得到敏感测井曲线重要性排列结果(图4)。SPCONDACML1 和 ML2 共 5 条测井曲线是对地层划分重要性排序较高的曲线,其中SP和COND曲线重要性最高,因此本次优选SPCONDACML1和ML2 共5条敏感测井曲线作为样本特征参数。

  • 图4 测井曲线重要性分析直方图

  • Fig.4 Histogram for importance analysis of logging curves

  • 以 31-326井为例,该井馆上段 6砂组小层划分标志为:1小层敏感测井曲线特征为高 COND 值、低 ML1 和 ML2 值、高 AC 值;4 小层敏感测井曲线特征为全区发育一套较为稳定的厚层砂岩,SP值为负异常,低 COND 值;5 小层泥岩特征为高 COND 值、低 ML1和ML2值(图5)。

  • 图5 31-326井馆上段6砂组敏感测井曲线特征

  • Fig.5 Logging curve characteristics of Ngs6 of Well31-326

  • 本次研究目的层为馆上段 6 砂组,单层平均厚度约为 10 m。测井曲线采样间隔 1 m 对应 8 个点,为充分利用测井数据信息,滑动时窗长度不宜过大,设定滑动时窗长度为 15,20,25,分别进行样本取样。同时对应不同滑动步长取样,滑动步长取值为1,2和3。

  • 3.2.2 机器学习方法优选及参数优化

  • 运用随机网格搜索库中的 Randomized⁃ SearchCV 函数调参工具,对随机森林、SVM 和 XG⁃ Boost 等 3 种常用的二分类机器学习方法进行超参数自动化寻优(表1)。

  • 分别将不同参数循环滑动时窗提取的相同样本数据在随机森林、SVM 和 XGBoost 等 3 种方法中构建模型,测试数据分别代入3种模型进行验证,得到不同模型评估效果(表2)。通过对比分析,对于研究区小层智能划分场景,在滑动时窗长度为 20、步长为 2 的滑动时窗参数下,随机森林方法训练的模型具有最好的模型评估效果,XGBoost方法次之, SVM 方法的分类结果最差。随机森林方法模型的准确率达到 88.4%、精确率达到 93.1%、召回率达到 90.7%。因此本文采用随机森林方法进行模型训练,并在此基础上对小层智能划分结果进行分析。

  • 表1 3种机器学习方法的最优超参数确定

  • Table1 Determination of optimal hyper-parameters of three machine learning algorithms

  • 表2 3种机器学习模型评估效果

  • Table2 Evaluation of three machine learning models

  • 3.3 小层智能划分结果评估

  • 利用随机森林方法训练的模型对全区 50 口验证井开展单井小层划分,统计分析馆上段 6 砂组小层划分精度超过 89%。以研究区验证井中的 26-295 井和 24-355 井为例。26-295 井小层智能划分的界面与人工分层界面基本吻合,在识别 Ng 62 时出现误差,主要原因为 Ng 62 底部和 Ng 63 顶部发育一套泥岩,敏感测井曲线在识别泥岩特征时存在多解性;专家在进行层位对比过程中,对于厚泥岩层段的地层划分也同样存在多解性,往往需要综合考虑多种地质因素,因此为提高地层划分精度,需要适当增加约束条件,从而扩充特征参数的维度 (图6a)。24-355 井整体小层智能划分结果与人工分层的解释结论吻合度较好,可有效划分出馆上段 6砂组各小层(图6b)。

  • 图6 26-295井和24-355井人工分层与随机森林方法分层结果对比

  • Fig.6 Stratification results comparison between artificial method and random forest method for Well26-295 and Well24-355

  • 4 结论

  • 多维测井曲线组合具有较强的干扰性,为了有效提高小层智能划分的准确性和效率,需对测井曲线进行重要性分析,确定研究区小层智能划分模型的敏感测井曲线。地层信息与对应深度相邻测井数据相关,提出了一种循环滑动时窗提取样本数据的方法,有效解决样本分布不均和取样多解性的问题。通过优选滑动时窗参数,相比 SVM 和 XGBoost 方法,随机森林方法构建的模型在滑动时窗长度为 20、步长为2时表现出最优的测试效果,对孤东七区西 50 口井馆上段 6 砂组小层智能划分的准确率达 88.4%,具有较高的精度和较强的适应性。对于大套厚泥岩发育的地层,小层智能划分结果与专家经验分层结果存在一定差异,下步考虑增加相应地质因素,有效扩充特征维度,以提高预测精度。

  • 符号解释

  • A ——随机森林中的样本数量,个;

  • Acc ——准确率,%;

  • b ——位移项;

  • C ——惩罚系数;

  • d ——阈值;

  • FN ——false negative,实际结果为正类但预测结果为负类的数量;

  • FP ——false positive,实际结果为负类但预测结果为正类的数量;

  • gamma ——核函数系数;

  • h ——SVM数目,个;

  • ij ——特征向量的序号,取值为1,2,3,···,n

  • k ——滑动时窗长度;

  • L ——深度,m;

  • L 0——初次采样的起始深度,m;

  • Lm ——第m次采样的起始深度,m;

  • m ——循环滑动采样次数,次;

  • n ——随机森林中的数据子集数量,个;

  • N ——随机森林中的特征数据数量,个;

  • P ——精确率,%;

  • r ——时窗滑动的步长;

  • R ——召回率,%;

  • TN ——true negative,实际结果为负类且预测结果为负类的数量;

  • TP ——true positive,实际结果为正类且预测结果为正类的数量;

  • w ——法向量;

  • x ——特征向量;

  • xi ——第i个特征向量;

  • xj ——第j个特征向量;

  • yi ——第i个特征向量对应的类标记;

  • αi ——拉格朗日因子。

  • 参考文献

    • [1] 肖波,韩学辉,周开金,等.测井曲线自动分层方法回顾与展望 [J].地球物理学进展,2010,25(5):1 802-1 810. XIAO Bo,HAN Xuehui,ZHOU Kaijin,et al.A review and outlook of automatic zonation methods of well log[J].Progress in Geophys⁃ ics,2010,25(5):1 802-1 810.

    • [2] 赵丽莎,史永彬,金玮,等.基于梦想云的测井智能化解释应用研究[J].中国石油勘探,2020,25(5):97-103.ZHAO Lisha,SHI Yongbin,JIN Wei,et al.Application research on intelligent logging interpretation based on E & P Dream Cloud [J].China Petroleum Exploration,2020,25(5):97-103.

    • [3] 李宗宇,任宏,刘芳,等.雅克拉气藏白垩系旋回结构法小层划分对比[J].新疆石油地质,2017,38(6):637-642.LI Zongyu,REN Hong,LIU Fang,et al.Stratigraphic classifica⁃ tion and correlation with Cretaceous cycle structure method in Yakela gas reservoirs,Tarim basin[J].Xinjiang Petroleum Geolo⁃ gy,2017,38(6):637-642.

    • [4] 朱强,毕彩芹.陆相地层精细对比方法及应注意的问题[J].油气地质与采收率,2002,9(3):27-30.ZHU Qiang,BI Caiqin.Methods of fine correlation and its matters needing attention in terrestrial formation[J].Petroleum Geology and Recovery Efficiency,2002,9(3):27-30.

    • [5] 李昌,沈安江,常少英,等.机器学习法在碳酸盐岩岩相测井识别中应用及对比——以四川盆地MX地区龙王庙组地层为例 [J].油气藏评价与开发,2021,11(4):586-596.LI Chang,SHEN Anjiang,CHANG Shaoying,et al.Application and contrast of machine learning in carbonate lithofacies log iden⁃ tification:A case study of Longwangmiao Formation of MX area in Sichuan Basin[J].Reservoir Evaluation and Development,2021,11(4):586-596.

    • [6] 徐朝晖,刘钰铭,周新茂,等.基于卷积神经网络算法的自动地层对比实验[J].石油科学通报,2019,4(1):1-10. XU Zhaohui,LIU Yuming,ZHOU Xinmao,et al.An experiment in automatic stratigraphic correlation using convolutional neural net⁃ works[J].Petroleum Science Bulletin,2019,4(1):1-10.

    • [7] WU Xinming,LIANG Luming,SHI Yunzhi,et al.Fault Seg 3D:us⁃ ing synthetic data sets to train an end-to-end convolutional neu⁃ ral network for 3D seismic fault segmentation[J].Geophysics,2019,84(3):35-45.

    • [8] NAM Pham,SERGEY Fomel,DALLAS Dunlap.Automatic chan⁃ nel detection using deep learning[J].Interpretation,2019,7(3):43-50.

    • [9] 张国印,王志章,林承焰,等.基于小波变换和卷积神经网络的地震储层预测方法及应用[J].中国石油大学学报:自然科学版,2020,44(4):83-93.ZHANG Guoyin,WANG Zhizhang,LIN Chengyan,et al.Seismic reservoir prediction method based on wavelet transform and con⁃ volutional neural network and its application[J].Journal of China University of Petroleum:Edition of Natural Science,2020,44(4):83-93.

    • [10] 宋辉,陈伟,李谋杰,等.基于卷积门控循环单元网络的储层参数预测方法[J].油气地质与采收率,2019,26(5):73-78.SONG Hui,CHEN Wei,LI Moujie,et al.A method to predict res⁃ ervoir parameters based on convolutional neural network-gated recurrent unit(CNN-GRU)[J].Petroleum Geology and Recovery Efficiency,2019,26(5):73-78.

    • [11] 石创,朱俊章,龙祖烈,等.基于概率神经网络的烃源岩TOC预测——以珠江口盆地陆丰南区为例[J].断块油气田,2019,26(5):561-565.SHI Chuang,ZHU Junzhang,LONG Zulie,et al.Prediction of total organic carbon in source rocks by probabilistic neural network:a case study of southern Lufeng area in Pearl River Mouth Basin[J].Fault-Block Oil and Gas Field,2019,26(5):561-565.

    • [12] 马文礼,李治平,孙玉平,等.基于机器学习的页岩气产能非确定性预测方法研究[J].特种油气藏,2019,26(2):101-105.MA Wenli,LI Zhiping,SUN Yuping,et al.Non-deterministic shale gas productivity forecast based on machine learning[J].Spe⁃ cial Oil & Gas Reservoirs,2019,26(2):101-105.

    • [13] 许少华,张宇航,宋美玲,等.基于特征识别与PSO结合的地层对比算法[J].计算机技术与发展,2015,25(5):37-40.XU Shaohua,ZHANG Yuhang,SONG Meiling,et al.A stratigraph⁃ ic correlation algorithm based on characteristics identification and PSO[J].Computer Technology and Development,2015,25(5):37-40.

    • [14] 赵娅,王伟,李盼池.基于量子神经网络的水淹层识别方法[J].地球物理学进展,2019,34(5):1 971-1 979.ZHAO Ya,WANG Wei,LI Panchi.Recognition of water-flooded layer based on quantum neural networks[J].Progress in Geophys⁃ ics,2019,34(5):1 971-1 979.

    • [15] 曹茂俊,薛诚,赵静,等.量子衍生布谷鸟算法及在地层对比中的应用[J].计算机与现代化,2017,(12):43-48. CAO Maojun,XUE Cheng,ZHAO Jing,et al.Quantum-inspired cuckoo search algorithm with application to stratigraphic correla⁃ tion[J].Computer and Modernization,2017,(12):43-48.

    • [16] 钱峰,胡光岷.基于滑动时窗的小波变换实时算法[J].信号处理,2007,23(3):361-364.QIAN Feng,HU Guangmin.A realtime wavelet algorithm based on sliding window technology[J].Signal Processing,2007,23(3):361-364.

    • [17] 曹惠玲,王冉.基于滑动时窗策略自适应优化支持向量机的航空发动机性能参数在线预测[J].推进技术,2020,41(8):1 887-1 894.CAO Huiling,WANG Ran.Adaptively optimized support vector machine online prediction of aeroengine performance parameters based on sliding time window strategy[J].Journal of Propulsion Technology,2020,41(8):1 887-1 894.

    • [18] 强文渊,韦家富,刘友波,等.基于滑动时窗 K-Means 聚类的CVT早期故障诊断[J].电力电容器与无功补偿,2019,40(3):89-95.QIANG Wenyuan,WEI Jiafu,LIU Youbo,et al.Early fault diagno⁃ sis for capacitor voltage transformer using sliding K-Means clus⁃ tering[J].Power Capacitor & Reactive Power Compensation,2019,40(3):89-95.

    • [19] 史金余,杨泽宇,谢兄.基于模糊决策的随机森林算法[J].计算机工程与设计,2020,41(8):2 207-2 212.SHI Jinyu,YANG Zeyu,XIE Xiong.Algorithm of random forest based on fuzzy decision[J].Computer Engineering and Design,2020,41(8):2 207-2 212.

    • [20] 刘玲,郑建国.一种基于随机森林的组合分类算法设计与应用 [J].电子设计工程,2020,28(16):54-57.LIU Ling,ZHENG Jianguo.Design and application of a combinato⁃ rial classification algorithm based on random forest[J].Electronic Design Engineering,2020,28(16):54-57.

    • [21] 纪磊,李菊花,肖佳林.随机森林算法在页岩气田多段压裂改造中的应用[J].大庆石油地质与开发,2020,39(6):168-174.JI Lei,LI Juhua,XIAO Jialin.Application of random forest algo⁃ rithm in the multistage fracturing stimulation of shale gas field[J].Petroleum Geology & Oilfield Development in Daqing,2020,39(6):168-174.

    • [22] 钟仪华,李榕.基于主成分分析的最小二乘支持向量机岩性识别方法[J].测井技术,2009,33(5):425-429.ZHONG Yihua,LI Rong.Application of principal component anal⁃ ysis and least square support vector machine to lithology identifi⁃ cation[J].Well Logging Technology,2009,33(5):425-429.

    • [23] 朱怡翔,石广仁.火山岩岩性的支持向量机识别[J].石油学报,2013,34(2):312-322.ZHU Yixiang,SHI Guangren.Identification of lithologic character⁃ istics of volcanic rocks by support vector machine[J].Acta Petro⁃ lei Sinica,2013,34(2):312-322.

    • [24] 苟博,黄贤武.支持向量机多类分类方法[J].数据采集与处理,2006,21(3):334-339.GOU Bo,HUANG Xianwu.SVM multi-class classification[J].Journal of Data Acquisition & Processing,2006,21(3):334-339.

    • [25] 孙予舒,黄芸,梁婷,等.基于XGBoost算法的复杂碳酸盐岩岩性测井识别[J].岩性油气藏,2020,32(4):98-106.SUN Yushu,HUANG Yun,LIANG Ting,et al.Identification of complex carbonate lithology by logging based on XGBoost algo⁃ rithm[J].Lithologic Reserviors,2020,32(4):98-106.

    • [26] 谷宇峰,张道勇,鲍志东.测井资料 PSO-XGBoost 渗透率预测 [J].石油地球物理勘探,2021,56(1):26-37.GU Yufeng,ZHANG Daoyong,BAO Zhidong.Permeability predic⁃ tion using PSO-XGBoost based on logging data[J].Oil Geophysi⁃ cal Prospecting,2021,56(1):26-37.

  • 参考文献

    • [1] 肖波,韩学辉,周开金,等.测井曲线自动分层方法回顾与展望 [J].地球物理学进展,2010,25(5):1 802-1 810. XIAO Bo,HAN Xuehui,ZHOU Kaijin,et al.A review and outlook of automatic zonation methods of well log[J].Progress in Geophys⁃ ics,2010,25(5):1 802-1 810.

    • [2] 赵丽莎,史永彬,金玮,等.基于梦想云的测井智能化解释应用研究[J].中国石油勘探,2020,25(5):97-103.ZHAO Lisha,SHI Yongbin,JIN Wei,et al.Application research on intelligent logging interpretation based on E & P Dream Cloud [J].China Petroleum Exploration,2020,25(5):97-103.

    • [3] 李宗宇,任宏,刘芳,等.雅克拉气藏白垩系旋回结构法小层划分对比[J].新疆石油地质,2017,38(6):637-642.LI Zongyu,REN Hong,LIU Fang,et al.Stratigraphic classifica⁃ tion and correlation with Cretaceous cycle structure method in Yakela gas reservoirs,Tarim basin[J].Xinjiang Petroleum Geolo⁃ gy,2017,38(6):637-642.

    • [4] 朱强,毕彩芹.陆相地层精细对比方法及应注意的问题[J].油气地质与采收率,2002,9(3):27-30.ZHU Qiang,BI Caiqin.Methods of fine correlation and its matters needing attention in terrestrial formation[J].Petroleum Geology and Recovery Efficiency,2002,9(3):27-30.

    • [5] 李昌,沈安江,常少英,等.机器学习法在碳酸盐岩岩相测井识别中应用及对比——以四川盆地MX地区龙王庙组地层为例 [J].油气藏评价与开发,2021,11(4):586-596.LI Chang,SHEN Anjiang,CHANG Shaoying,et al.Application and contrast of machine learning in carbonate lithofacies log iden⁃ tification:A case study of Longwangmiao Formation of MX area in Sichuan Basin[J].Reservoir Evaluation and Development,2021,11(4):586-596.

    • [6] 徐朝晖,刘钰铭,周新茂,等.基于卷积神经网络算法的自动地层对比实验[J].石油科学通报,2019,4(1):1-10. XU Zhaohui,LIU Yuming,ZHOU Xinmao,et al.An experiment in automatic stratigraphic correlation using convolutional neural net⁃ works[J].Petroleum Science Bulletin,2019,4(1):1-10.

    • [7] WU Xinming,LIANG Luming,SHI Yunzhi,et al.Fault Seg 3D:us⁃ ing synthetic data sets to train an end-to-end convolutional neu⁃ ral network for 3D seismic fault segmentation[J].Geophysics,2019,84(3):35-45.

    • [8] NAM Pham,SERGEY Fomel,DALLAS Dunlap.Automatic chan⁃ nel detection using deep learning[J].Interpretation,2019,7(3):43-50.

    • [9] 张国印,王志章,林承焰,等.基于小波变换和卷积神经网络的地震储层预测方法及应用[J].中国石油大学学报:自然科学版,2020,44(4):83-93.ZHANG Guoyin,WANG Zhizhang,LIN Chengyan,et al.Seismic reservoir prediction method based on wavelet transform and con⁃ volutional neural network and its application[J].Journal of China University of Petroleum:Edition of Natural Science,2020,44(4):83-93.

    • [10] 宋辉,陈伟,李谋杰,等.基于卷积门控循环单元网络的储层参数预测方法[J].油气地质与采收率,2019,26(5):73-78.SONG Hui,CHEN Wei,LI Moujie,et al.A method to predict res⁃ ervoir parameters based on convolutional neural network-gated recurrent unit(CNN-GRU)[J].Petroleum Geology and Recovery Efficiency,2019,26(5):73-78.

    • [11] 石创,朱俊章,龙祖烈,等.基于概率神经网络的烃源岩TOC预测——以珠江口盆地陆丰南区为例[J].断块油气田,2019,26(5):561-565.SHI Chuang,ZHU Junzhang,LONG Zulie,et al.Prediction of total organic carbon in source rocks by probabilistic neural network:a case study of southern Lufeng area in Pearl River Mouth Basin[J].Fault-Block Oil and Gas Field,2019,26(5):561-565.

    • [12] 马文礼,李治平,孙玉平,等.基于机器学习的页岩气产能非确定性预测方法研究[J].特种油气藏,2019,26(2):101-105.MA Wenli,LI Zhiping,SUN Yuping,et al.Non-deterministic shale gas productivity forecast based on machine learning[J].Spe⁃ cial Oil & Gas Reservoirs,2019,26(2):101-105.

    • [13] 许少华,张宇航,宋美玲,等.基于特征识别与PSO结合的地层对比算法[J].计算机技术与发展,2015,25(5):37-40.XU Shaohua,ZHANG Yuhang,SONG Meiling,et al.A stratigraph⁃ ic correlation algorithm based on characteristics identification and PSO[J].Computer Technology and Development,2015,25(5):37-40.

    • [14] 赵娅,王伟,李盼池.基于量子神经网络的水淹层识别方法[J].地球物理学进展,2019,34(5):1 971-1 979.ZHAO Ya,WANG Wei,LI Panchi.Recognition of water-flooded layer based on quantum neural networks[J].Progress in Geophys⁃ ics,2019,34(5):1 971-1 979.

    • [15] 曹茂俊,薛诚,赵静,等.量子衍生布谷鸟算法及在地层对比中的应用[J].计算机与现代化,2017,(12):43-48. CAO Maojun,XUE Cheng,ZHAO Jing,et al.Quantum-inspired cuckoo search algorithm with application to stratigraphic correla⁃ tion[J].Computer and Modernization,2017,(12):43-48.

    • [16] 钱峰,胡光岷.基于滑动时窗的小波变换实时算法[J].信号处理,2007,23(3):361-364.QIAN Feng,HU Guangmin.A realtime wavelet algorithm based on sliding window technology[J].Signal Processing,2007,23(3):361-364.

    • [17] 曹惠玲,王冉.基于滑动时窗策略自适应优化支持向量机的航空发动机性能参数在线预测[J].推进技术,2020,41(8):1 887-1 894.CAO Huiling,WANG Ran.Adaptively optimized support vector machine online prediction of aeroengine performance parameters based on sliding time window strategy[J].Journal of Propulsion Technology,2020,41(8):1 887-1 894.

    • [18] 强文渊,韦家富,刘友波,等.基于滑动时窗 K-Means 聚类的CVT早期故障诊断[J].电力电容器与无功补偿,2019,40(3):89-95.QIANG Wenyuan,WEI Jiafu,LIU Youbo,et al.Early fault diagno⁃ sis for capacitor voltage transformer using sliding K-Means clus⁃ tering[J].Power Capacitor & Reactive Power Compensation,2019,40(3):89-95.

    • [19] 史金余,杨泽宇,谢兄.基于模糊决策的随机森林算法[J].计算机工程与设计,2020,41(8):2 207-2 212.SHI Jinyu,YANG Zeyu,XIE Xiong.Algorithm of random forest based on fuzzy decision[J].Computer Engineering and Design,2020,41(8):2 207-2 212.

    • [20] 刘玲,郑建国.一种基于随机森林的组合分类算法设计与应用 [J].电子设计工程,2020,28(16):54-57.LIU Ling,ZHENG Jianguo.Design and application of a combinato⁃ rial classification algorithm based on random forest[J].Electronic Design Engineering,2020,28(16):54-57.

    • [21] 纪磊,李菊花,肖佳林.随机森林算法在页岩气田多段压裂改造中的应用[J].大庆石油地质与开发,2020,39(6):168-174.JI Lei,LI Juhua,XIAO Jialin.Application of random forest algo⁃ rithm in the multistage fracturing stimulation of shale gas field[J].Petroleum Geology & Oilfield Development in Daqing,2020,39(6):168-174.

    • [22] 钟仪华,李榕.基于主成分分析的最小二乘支持向量机岩性识别方法[J].测井技术,2009,33(5):425-429.ZHONG Yihua,LI Rong.Application of principal component anal⁃ ysis and least square support vector machine to lithology identifi⁃ cation[J].Well Logging Technology,2009,33(5):425-429.

    • [23] 朱怡翔,石广仁.火山岩岩性的支持向量机识别[J].石油学报,2013,34(2):312-322.ZHU Yixiang,SHI Guangren.Identification of lithologic character⁃ istics of volcanic rocks by support vector machine[J].Acta Petro⁃ lei Sinica,2013,34(2):312-322.

    • [24] 苟博,黄贤武.支持向量机多类分类方法[J].数据采集与处理,2006,21(3):334-339.GOU Bo,HUANG Xianwu.SVM multi-class classification[J].Journal of Data Acquisition & Processing,2006,21(3):334-339.

    • [25] 孙予舒,黄芸,梁婷,等.基于XGBoost算法的复杂碳酸盐岩岩性测井识别[J].岩性油气藏,2020,32(4):98-106.SUN Yushu,HUANG Yun,LIANG Ting,et al.Identification of complex carbonate lithology by logging based on XGBoost algo⁃ rithm[J].Lithologic Reserviors,2020,32(4):98-106.

    • [26] 谷宇峰,张道勇,鲍志东.测井资料 PSO-XGBoost 渗透率预测 [J].石油地球物理勘探,2021,56(1):26-37.GU Yufeng,ZHANG Daoyong,BAO Zhidong.Permeability predic⁃ tion using PSO-XGBoost based on logging data[J].Oil Geophysi⁃ cal Prospecting,2021,56(1):26-37.