-
近年来,中国各油田经过长期的注水开发已经进入中后期阶段,复杂的地质条件及过高的注水开发比例导致水淹问题日益严峻。由于油田的地质特征、水驱开发及资源条件不同,尚未有一套通用且有效的水淹层测井识别方法[1]。用于水淹层识别的自然电位基线偏移法、径向电阻率对比法、传统的交会图技术等受到仪器精度、测井环境等因素的影响效果不佳[2],同时水淹机理研究不透彻,测井响应特征复杂多变,多解性较强。对于核磁共振测井等方法虽然对水淹层识别精度较高,但成本过高未能广泛应用。
-
近年来机器学习方法快速发展,在科学和工程领域应用广泛并获得突破性的成果,为提高水淹层的识别精度提供了新的思路和方法。诸多专家对此进行了深入研究,已将常规的机器学习方法应用于水淹层识别,如支持向量机(SVM)[3-4]、模糊逻辑模型(FLM)[5-6] 等算法,在一定条件下取得了较好的预测效果。马陇飞等利用决策树方法有效解决了交会图版法存在的多解性问题,且能快速高效地处理大量数据并自动分类[7-10]。王振伟对碳酸盐岩储层进行了分类,针对不同储层类型分别建立了水淹层测井评价方法,取得了较好效果[11],但也存在决策树算法在分类较多时精度会下降,支持向量机算法无法训练大规模样本,难以解决多分类等相关问题。由HINTON等提出的深度学习方法是当前机器学习领域最热门的方向之一,其网络结构复杂且具有多个隐含层,不仅能通过提取每层特征将样本的原始空间特征转换成新的高维空间特征来表示,还能为数据建立更加抽象的特征描述,从而将回归预测或分类问题简单化且提高准确性[12-14]。概率神经网络(PNN)作为深度学习的研究热点之一,其实质是基于贝叶斯最小风险准则发展而来的一种并行算法,同时不像传统的多层前向网络需要用BP算法进行反向误差传播的计算,而是完全前向的计算,其训练时间短、不易产生局部最优,且分类正确率较高,可保证获得贝叶斯准则下的最优解。相比之下,Adaboost 算法作为当前深度学习分类效果较好的网络模型之一,具有分类速度快,可应用多个弱分类器经过线性组合成强分类器。
-
胜利油区埕岛油田注入水主要是以海水、污水混注为主,水淹类型主要是盐水水淹,地层电阻率随水淹程度增强呈单调递减的特征,但地层电阻率递减量与水淹程度关系极其复杂,至今无有效识别水淹层及其水淹程度的方法。为此,笔者提出一种基于概率神经网络的盐水水淹层识别方法,并利用 Adaboost 算法进行对比分析,在分析测井特征参数与水淹程度相关性基础上,选取井径(CAL)、自然电位(SP)、密度(DEN)、深侧向电阻率(R t)和浅侧向电阻率(RS)等5条敏感曲线的平均值作为输入参数来预测靶区的水淹级别,预测结果表明,利用深度学习方法中的概率神经网络算法能有效提高盐水水淹层识别精度。
-
1 方法原理
-
1.1 Adaboost算法
-
FREUND 等在 1999 年提出 Boosting 算法[15],该算法在Probably Approximately Correct学习问题框架模型下能提高任意给定弱分类器分类精度,为了解决实际应用中的问题,在 2003年又提出了 Adaboost (自适应增强)算法[16],该算法是一种迭代算法,其预测准确、分类快、几乎不出现过拟合现象,核心是对每个训练样本赋予相同的初始权重,每一轮弱分类器训练过后均会根据其表现对每个错误分类样本的权重作出相应调整,增加错误分类样本的权重,这样之前出错的训练样本在下一轮学习训练中即可得到更多关注,按这样的迭代过程重复训练出 M 个弱分类器,最后进行线性加权组合成一个强分类器[17] (图1)。
-
图1 Adaboost算法原理示意
-
Fig.1 Principle of Adaboost algorithm
-
输入过程 假设给定一个二类分类的训练样本为:
-
其中,每个样本点由实例和标记组成。实例为 xi ∈X∈Rn,标记为yi ∈ Y ∈{-1,1},弱分类器为Gm (x)。
-
输出过程 假设给定一个强分类器为G(x)。
-
①训练样本上的权值分布为:
-
其中:
-
②训练样本各项参数的计算与更新
-
将具有权值分布Dm的训练样本用于学习训练,得到弱分类器表达式为:
-
计算弱分类器分类目标为最小化在权值分布下训练样本的分类误差率:
-
弱分类器系数的计算公式为:
-
新的训练样本权值分布的计算公式为:
-
其中:
-
③建立弱分类器的线性组合方程式为:
-
由(1)—(10)式得到的强分类器表达式为:
-
1.2 概率神经网络
-
概率神经网络(Probabilistic Neural Network,简称 PNN)最早于 1990 年由数学家 SPECHT[18]提出。 PNN 是一种基于概率密度函数且泛化能力很强的神经网络,结合了径向基函数和概率密度函数的优点,具有结构简单、复杂度低等特性,多用于模式分类,也可用于插值[19]。概率神经网络由输入层、模式层、求和层、输出层等组成(图2)。
-
图2 概率神经网络结构
-
Fig.2 Structure of probabilistic neural network
-
输入层 输入层的每个神经元均为单输入、单输出,将输入单元 X 用分布的方式表示并传递给模式层的所有神经元,其传递函数是线性的。其中X= [X1,X2,⋯,Xn ]。
-
模式层 模式层与输入层之间通过权重 Wij连接,该层第j个神经元的实际输入为:
-
其中:
-
模式层的传递函数用径向基函数表示,其表达式为:
-
这是 PNN 与全连接神经网络的不同之处,若 X 和Wij均为统一量纲的单位长度,则(14)式相当于:
-
由于模式层采用的是径向基非线性函数映射,可避免反向传播神经网络的局部最小值问题[20]。
-
求和层 求和层具有线性求和功能,有选择地对模式层的输出进行求和,计算属于未水淹、弱水淹、中水淹、强水淹和特强水淹的概率,计算公式为:
-
输出层 该层具有判决功能,取求和层中最大的一个作为输出的类别,计算公式为:
-
根据上述理论研制开发了概率神经网络预测水淹层处理软件,为水淹层测井PNN自动识别奠定了理论基础。
-
2 运用概率神经网络进行水淹层识别
-
2.1 测井特征参数优选
-
对埕岛油田盐水水淹层进行测井曲线响应特征分析发现,每 1 条测井曲线对水淹层均有或多或少的响应特征,但是因为每种测井方法均是基于一种物理原理基础上提取的地球物理测井信息,所以测井曲线均不可避免地存在较严重的多解性。为此,根据埕岛油田实际测井资料和生产测试结论进行测井特征参数与水淹层产水率的相关性分析。由于每条测井曲线在不同水淹级别的测井响应特征不同,应用偏最小二乘法进行所有测井特征参数与产水率的相关性分析(图3)可以看出,水淹层测井特征参数相关性频率为正值,则表明提取的特征参数与产水率呈正相关,否则呈负相关,且水淹层测井特征参数相关性频率的绝对值越大表明提取的特征参数与产水率相关性越好;自然电位、密度、浅侧向电阻率与产水率的正相关性最好,而井径、深侧向电阻率与产水率的负相关性最好。由此择优选取上述最能有效反映埕岛油田盐水水淹层测井响应特征的5个特征参数对靶区盐水水淹层进行识别。
-
图3 测井特征参数与产水率相关性频率直方图
-
Fig.3 Correlation frequency between logging characteristic parameters and water cut
-
2.2 测井曲线归一化处理
-
测井曲线归一化处理将确保各测井参数处于规范的分布范围内,使网络模型更易学习到各参数之间的关联性。由于各曲线数据量纲不一致,在进入概率神经网络和Adaboost算法之前训练样本和测试样本必须进行归一化处理,将其刻度在统一的数值量纲范围内。对于近似线性特征的输入数据,可采用线性归一化公式为:
-
而对于电阻率曲线等非线性对数特征的曲线,可采用对数归一化公式为:
-
2.3 PNN模型训练
-
按照埕岛油田盐水水淹级别标准划分的5个水淹级别(表1),选取靶区具有代表性的实际测井数据作为训练样本数组,具体选取了63个样本数据作为训练样本,以未水淹、弱水淹、中水淹、强水淹和特强水淹等5个水淹级别作为期望输出向量。在训练过程中将井径、自然电位、密度、深侧向电阻率和浅侧向电阻率等5条敏感测井曲线的均值作为输入参数输入到概率神经网络和Adaboost算法中进行水淹层识别,PNN 网络模型的权值是迭代更新的,不断优化平滑因子是训练网络模型的核心,尽可能降低训练样本的误差,并使用多层感知器优化。训练时使用求和层神经元返回的所有训练样本的所有值来评价不同组平滑因子的误差标准[21]。在神经网络结构方面,建立一个输入层节点数为5、模式层节点数为15、求和层节点数为10、输出层节点数为5 的概率神经网络拓扑结构,训练网络从而得到水淹层识别的 PNN 网络模型[22]。Adaboost 算法也采用相同的模型参数和算法结构以保证训练与预测结果的可靠性与可对比性。
-
在网络训练完成后进行网络性能测试,将每层神经元间的连接权重代回到网络中,重新对训练样本进行水淹层预测。从表2 中可以看出,训练样本的水淹级别与概率神经网络的预测结果完全相同,证明完善的概率神经网络和Adaboost算法已训练完成,可以用于测试样本的水淹层识别[23]。
-
2.4 概率神经网络预测水淹层及其效果分析
-
通过对网络模型泛化后,将训练成功的概率神经网络和 Adaboost 算法用于识别盐水水淹层。为此,在靶区随机选取30个测试样本进行水淹层实际预测(表3,表4)。从预测结果发现,PNN 模型在靶区水淹级别样本分类正确的有27个样本,预测准确率达到 90%;Adaboost 算法在靶区水淹级别样本分类正确的有 24 个样本,预测准确率达到 80%;PNN 模型的水淹层识别精度提高了 10%,错误分类样本都集中在中水淹、强水淹和特强水淹级别,并且预测误差没有出现水淹级别跨级别的现象,取得了理想效果。在水淹层测井PNN模型预测时,若能选取更具有区域代表性的学习样本,则将取得更好的水淹层测井识别效果[24]。
-
3 实例应用
-
从靶区 A85井水淹层测井解释成果(图4)可以看出,测试井段为 1 916.0~1 923.5 m,日产油量为 15.2 t/d,日产液量为17.2 t/d,综合含水率为11.63%,自然伽马曲线显示低值且有明显的正韵律沉积特征,自然电位曲线呈正异常和微弱的基线偏移现象,声波时差值呈局部极大,深浅侧向电阻率底部呈低值且有显著的泥浆低侵特征,呈现典型的弱水淹层特征。依据变倍数物质平衡法定量计算的产水率平均为 19.15%,测井定量解释结论为弱水淹层,而应用 PNN 模型和 Adaboost 算法对 A85 井测试井段预测水淹级别均为2,即为弱水淹层,与定量解释和生产测试结论完全一致。
-
综上所述,概率神经网络PNN模型在埕岛油田盐水水淹层识别中具有适用性强、应用方便、易于实现、精确度高等特点。
-
4 结论
-
盐水水淹层电阻率随水淹程度增强呈现单调递减的特征,但地层电阻率递减量与水淹程度关系极其复杂,是盐水水淹层定量评价的关键,至今还没有有效识别水淹层及其水淹程度的方法。为此提出的概率神经网络与当前深度学习分类效果较好的 Adaboost 算法和其他机器学习的分类模型相比,具有训练速度快、结构简单、分类精度高等特点,便于实现和推广应用。结合测井特征参数和测试结论对判识样本进行水淹层预测,结果表明深度学习方法中的概率神经网络的水淹层预测精度提升了 10%,可以有效地提高盐水水淹层识别精度,为研究区块水淹层评价提供参考和借鉴;概率神经网络不仅可以应用到水淹层识别上,还可以应用在岩性、裂缝、产能等不同储层特征参数的预测上,具有较高的理论参考和推广应用价值。
-
图4 埕岛油田A85井盐水水淹层测井预测及定量解释成果
-
Fig.4 Well logging prediction and quantitative interpretation of saline water flooded layers in Well A85 of Chengdao Oilfield
-
符号解释
-
D1——权值集合;
-
Dm+1——权值分布;
-
Dm——权值集合;
-
em——分类误差率;
-
f(x)——线性函数;
-
g——径向基函数;
-
g(X,W j)——模式层的输出;
-
G(x)——强分类器;
-
Gm (x)——弱分类器;
-
Gm (xi)——第i个弱分类器;
-
i——序号;
-
I——分类错误的样本;
-
j——模式层神经元个数;
-
m,M——弱分类器个数;
-
n——第i类的神经元个数;
-
N——样本个数;
-
P——分类错误的样本概率;
-
Rn——实数;
-
T——测井数据的训练样本;
-
Vi ——第i类别的输出;
-
W——权值矩阵;
-
W1i ——第i个样本点的权值;
-
Wj,Wij——模式层与输入层之间的权值;
-
Wmi,Wni——每个样本的权值;
-
Wm+1,i ——第i个训练样本的权值;
-
Wnj ——第n个标记点第j个神经元的权值;
-
x——向量集合;
-
xi ——第i个实物样本;
-
xn——第n个向量;
-
Xn——第n个实例样本;
-
Xi ——实例样本,i=1,2,···,n;
-
X——输入矩阵,样本集合(测井数据);
-
X* ——经过归一化后的测井数据;
-
Xmax——测井曲线的最大值;
-
Xmin——测井曲线的最小值;
-
y——输出层中的输出,即为最终预测结果;
-
yn——第n个标记样本;
-
yi ——标记样本,i=1,2,···,n;
-
Y——输出矩阵,标记集合;
-
Ym——预测数据值;
-
Zm——规范化因子;
-
Zj ——模式层第j个神经元和实际输入值;
-
αm——弱分类器的系数;
-
σ——平滑参数。
-
参考文献
-
[1] 黄亚,段迎利,李萌.浅谈对水淹层识别的一点认识[J].科技视界,2014,24(32):182,364.HUANG Ya,DUAN Yingli,LI Meng.A brief discussion on the recognition of water-flooded layer[J].Science and Technology Vi⁃ sion,2014,24(32):182,364.
-
[2] 苗清,刘江,齐向东,等.薄差层水淹模式分析与定性判别[J].大庆石油地质与开发,2015,34(2):154-158.MIAO Qing,LIU Jiang,QI Xiangdong,et al.Model analysis and qualitative discrimination for the watered-out thin and poor reser⁃ voirs[J].Petroleum Geology and Oilfield Development in Daqing,2015,34(2):154-158.
-
[3] AL-ANAZI A F,GATES I D.Support vector regression to predict porosity and permeability:Effect of sample size[J].Computers & Geosciences,2012,39(1):64-76.
-
[4] 袁伟,张占松,张泽宇,等.基于储层分类的支持向量机渗透率预测[J].测井技术,2015,39(4):450-454.YUAN Wei,ZHANG Zhansong,ZHANG Zeyu,et al.Permeability prediction using support vector machine based on reservoir classi⁃ fication[J].Well Logging Technology,2015,39(4):450-454.
-
[5] 赵楚楚,王子微,丁冠华,等.基于模糊逻辑的改进自适应IMM跟踪算法[J].信号处理,2021,37(5):724-734.ZHAO Chuchu,WANG Ziwei,DING Guanhua,et al.Fuzzy-logic IMM algorithm for target tracking[J].Journal of Signal Process⁃ ing,2021,37(5):724-734.
-
[6] 冯国庆,潘丽燕,孔冰,等.基于模糊聚类分析方法的层系优化研究[J].油气藏评价与开发,2018,8(3):30-34,39.FENG Guoqing,PAN Liyan,KONG Bing,et al.Hierarchical opti⁃ mization research based on fuzzy clustering analysis[J].Reservoir Evaluation and Development,2018,8(3):30-34,39.
-
[7] 马陇飞,萧汉敏,陶敬伟,等.基于梯度提升决策树算法的岩性智能分类方法[J].油气地质与采收率,2022,29(1):21-29.MA Longfei,XIAO Hanmin,TAO Jingwei,et al.Intelligent litholo⁃ gy classification method based on GBDT algorithm[J].Petroleum Geology and Recovery Efficiency,2022,29(1):21-29.
-
[8] 王伟,康胜松,高峰,等.基于模糊C均值聚类与Bayes判别的致密油储层分类评价[J].特种油气藏,2020,27(5):118-124.WANG Wei,KANG Shengsong,GAO Feng,et al.Classification and evaluation of tight oil reservoirs based on fuzzy C-means clus⁃ tering and Bayes discrimination[J].Special Oil & Gas Reservoirs,2020,27(5):118-124.
-
[9] 苏婷,潘志坚,李楠.低渗透油藏分类评价方法及其应用[J].大庆石油地质与开发,2019,38(2):87-92.SU Ting,PAN Zhijian,LI Nan.Classifying and evaluating method for the low-permeability oil reservoir and its application[J].Petro⁃ leum Geology & Oilfield Development in Daqing,2019,38(2):87-92.
-
[10] 高颖,高楚桥,赵彬,等.基于储层分类计算东海低渗致密储层渗透率[J].断块油气田,2019,26(3):309-313.GAO Ying,GAO Chuqiao,ZHAO Bin,et al.Permeability calcula⁃ tion based on reservoir classification for low permeability tight res⁃ ervoirs in East China Sea[J].Fault-Block Oil and Gas Field,2019,26(3):309-313.
-
[11] 王振伟.复杂碳酸盐岩油藏水淹层解释与评价[D].大庆:东北石油大学,2016.WANG Zhenwei.Research on interpretation and evaluation of wa⁃ ter-flooded layer in complex carbonate reservoirs[D].Daqing:Northeast Petroleum University,2016.
-
[12] HINTON G E,SALAKHUTDINOV R R.Reducing the dimension⁃ality of data with neural networks[J].Science,2006,313(5786):504-507.
-
[13] 宋辉,陈伟,李谋杰,等.基于卷积门控循环单元网络的储层参数预测方法[J].油气地质与采收率,2019,26(5):73-78.SONG Hui,CHEN Wei,LI Moujie,et al.A method to predict res⁃ ervoir parameters based on convolutional neural network-gated recurrent unit(CNN-GRU)[J].Petroleum Geology and Recovery Efficiency,2019,26(5):73-78.
-
[14] 余晓露,叶恺,杜崇娇,等.基于卷积神经网络的碳酸盐岩生物化石显微图像识别[J].石油实验地质,2021,43(5):880-885,895.YU Xiaolu,YE Kai,DU Chongjiao,et al.Microscopic recognition of micro fossils in carbonate rocks based on convolutional neural network[J].Petroleum Geology & Experiment,2021,43(5):880-885,895.
-
[15] FREUND Y,SCHAPIRE R E.A short introduction to boosting[J].Artificial Intelligence,1999,14(5):771-780.
-
[16] FREUND Y,IYER R D,SCHAPIRE R E,et al.An efficient boost⁃ ing algorithm for combining preferences[J].Journal of Machine Learning Research,2003,4(6):933-969.
-
[17] 杨明任,申辉林,曲萨,等.AdaBoost算法在致密砂岩水淹层识别中的应用[J].中国海上油气,2021,33(4):62-69.YANG Mingren,SHEN Huilin,QU Sa,et al.Application of Ada⁃ Boost algorithm in recognition of water flooded tight sandstone lay⁃ er[J].China Offshore Oil and Gas,2021,33(4):62-69.
-
[18] SPECHT D F.Probabilistic neural networks and the polynomial Adaline as complementary techniques for classification[J].IEEE Transactions On Neural Networks,1990,1(1):111-121.
-
[19] 刘丽红,彭真明,黄东山,等.基于概率神经网络信息融合的拟声波构建方法[J].石油地球物理勘探,2012,47(5):803-807.LIU Lihong,PENG Zhenming,HUANG Dongshan,et al.Pseudoacoustic wave construction method based on information fusion from probabilistic neural networks[J].Oil Geophysical Prospect⁃ ing,2012,47(5):803-807.
-
[20] 邓聪颖,叶波,苗建国,等.基于K-means++聚类与概率神经网络的数控机床变位姿动态特性模糊评估[J].仪器仪表学报,2020,41(12):227-235.DENG Congying,YE Bo,MIAO Jianguo,et al.Fuzzy evaluation of machine tool dynamic characteristics for changing machining po⁃ sition based on K-means ++ clustering and probabilistic neural network[J].Chinese Journal of Scientific Instrument,2020,41(12):227-235.
-
[21] 庞国印,田兵,王琪,等.概率神经网络在丽水—椒江凹陷月桂峰组沉积微相识别中的应用[J].地球科学与环境学报,2013,35(3):75-82.PANG Guoyin,TIAN Bing,WANG Qi,et al.Application of proba⁃ bilistic neural network to sedimentary microfacies recognition of Yuegifeng Formation in Lishui-Jiaojiang Sag[J].Journal of Earth Sciences and Environment,2013,35(3):75-82.
-
[22] 程国建,周冠武,王潇潇.概率神经网络方法在岩性识别中的应用[J].微计算机信息,2007,23(16):288-289,257,290-292.CHENG Guojian,ZHOU Guanwu,WANG Xiaoxiao.The probabil⁃ ity neural networks for lithology identification[J].Microcomputer Information,2007,23(16):288-289,257,290-292.
-
[23] 王书.概率神经网络识别岩性方法在沙子岭地区的应用[J].江汉石油职工大学学报,2017,30(2):13-15.WANG Shu.Application of probabilistic neural network-aided li⁃ thology identification method in Shaziling Area[J].Journal of Ji⁃ anghan Petroleum University of Staff and Workers,2017,30(2):13-15.
-
[24] 石玉江,刘国强,钟吉彬,等.基于大数据的测井智能解释系统开发与应用[J].中国石油勘探,2021,26(2):113-126.SHI Yujiang,LIU Guoqiang,ZHONG Jibin,et al.Development and application of intelligent logging interpretation system based on big data[J].China Petroleum Exploration,2021,26(2):113-126.
-
摘要
埕岛油田油层的水淹类型主要是盐水水淹,地层电阻率随水淹程度增强呈现单调递减的特征,但地层电阻率递减量与水淹程度关系极其复杂,至今还没有有效识别水淹层及其水淹程度的方法。为此,提出了基于概率神经网络的水淹层预测模型,首先结合埕岛油田实际测井和测试结论将水淹程度划分为未水淹、弱水淹、中水淹、强水淹和特强水淹5个水淹级别,并进行测井特征参数与水淹程度相关性分析,依此优选能更好反映水淹程度的测井特征参数;其次,利用提取的测井特征参数与测试结论建立靶区概率神经网络模型学习样本库;最后,利用概率神经网络对判识样本进行水淹层预测,并用当前深度学习分类效果较好的 Adaboost算法作对比分析。结果显示:概率神经网络水淹层预测精度提升了10%,有效地提高了盐水水淹层的识别精度。
Abstract
Most of the flooded layers in Chengdao oilfield are saline water flooded. Although the formation resistivity de- creases monotonically with the increasing flooded degree,the relationship between the decline in formation resistivity and the flooding degree is extremely complex,and there is no effective method to identify the flooded layers and their flooding degree. Therefore,a prediction model of the flooded layer based on probabilistic neural network was proposed in this paper. Firstly,given the actual logging and test results of Chengdao Oilfield,the flooded degree was classified into five levels:un- flooded,weak flooded,moderate flooded,strong flooded,and extra-strong flooded. The correlation analysis between logging characteristic parameters and flooding degree was carried out to select the characteristic parameters which could better re- flect the flooding degree. Secondly,the extracted logging characteristic parameters and test results were employed to con- struct a learning sample library of the target probabilistic neural network model. Finally,the probabilistic neural network model was utilized to predict the flooded layers of the identified samples,and comparative analysis was conducted through the Adaboost algorithm that has good deep learning classification effects. The results show that the prediction accuracy of the water flooded layers is improved by10%,which improves the identification accuracy of the saline water flooded layers.
关键词
盐水水淹层 ; 测井特征参数 ; 概率神经网络 ; Adaboost算法 ; 水淹层测井评价