-
随着非常规油气勘探的深入,页岩油气已成为勘探研究的重点,而总有机碳含量(TOC)是影响页岩储层品质的主要因素。总有机碳是单位质量岩石中有机碳的质量,是评价有机质含量的指标之一,因此准确求取页岩储层 TOC,对页岩储层评价具有重要意义[1]。济阳坳陷发育富有机质页岩,页岩层系中砂岩、碳酸盐岩等夹层油气规模仅占 20%,资源规模最大的油气部分赋存在纯页岩中,所以对烃源岩的 TOC 进行精准评价是亟待解决的关键问题之一。
-
目前,获得TOC的方法主要有2大类,一是通过实验测得岩石样品中的 TOC,但费用高昂,且实测数据有限,难以推广;二是利用测井资料计算页岩储层的 TOC。中外学者提出了很多利用测井曲线计算TOC的方法。刘超等总结前人研究成果,提出改进的 ΔlogR 法,ΔlogR 法主观因素较多,不宜推广[2];SCHOMKER 在冀中坳陷廊固凹陷发现密度和自然伽马测井值对TOC敏感,利用密度和自然伽马测井资料,可回归计算页岩储层 TOC,但适用性不强[3]。目前人工智能方法在处理大数据和预测TOC 方面表现出优越性。王惠君等利用CNN,GA-BP等大数据模型预测 TOC[4]。张佳佳等采用 Voigt 平均模型和 Gassmann 方程进行建模,利用速度反演 TOC[5]。LIU 等采用 HS模型、SCA 自洽模型、Backus 平均模型以及 Schoenberg 线性滑动模型进行建模,对页岩储层 TOC 等参数进行反演[6],这些人工智能方法在评价 TOC 的精度和对复杂页岩储层的适用性上需要进一步提升。
-
以东营凹陷牛庄洼陷页岩油取心井沙四段上亚段纯上次亚段(Es4 上纯上)实验分析TOC数据为基础,采用常规陆相页岩储层 TOC 计算模型预测 TOC,但效果不佳。为此,利用主成分分析(PCA)模型,对数据进行降维,再利用卷积神经(CNN)模型进行TOC预测,形成PCA-CNN模型,改进后的模型使样本数据质量和预测精度进一步提高。
-
1 区域地质概况
-
牛庄洼陷位于东营凹陷南坡东段,呈西薄东厚的不对称箕状洼陷,新生界古近系半深湖-深湖沉积环境,构造相对简单,南部发育一条大的北倾断层,派生多条反向调节断层。牛庄洼陷的内混积带是油页岩夹碳酸盐岩条带,外混积带是油页岩夹砂岩条带[7]。
-
以东营凹陷牛庄洼陷页岩油取心井Es4 上纯上为研究对象,该段泥页岩较发育,且气测显示活跃,为基质型油藏类型。发育岩相划分为12种类型,以块状/层状泥岩、纹层状灰质泥岩、纹层状泥质灰岩、层状泥质灰岩、灰质油泥岩等为主,综合分析认为沙四段泥页岩储层形成构造-岩性油气藏,其中有利岩相为富有机质纹层状泥质灰岩/灰质泥岩和富有机质层状泥质灰岩/灰质泥岩。
-
2 TOC敏感参数分析
-
一般富有机质烃源岩具有高自然伽马、高声波时差和低密度等测井响应特征。自然伽马偏高是因为地层中存在大量的放射性元素,包括铀、钍等,其中铀元素对有机质有很好的指示作用;有机质密度偏低,导致烃源岩整体为低密度;有机质会使声速降低且成熟的烃源岩存在不易导电的液态烃类,导致声波时差和电阻率变高[8]。
-
分析实测 TOC 与页岩油取心井敏感测井曲线自然伽马(GR)、电阻率(Rt)、声波时差(AC)、密度 (DEN)、中子(CNL)和孔隙度(POR)之间的相关性。由图1 可知,TOC 与 AC,DEN,GR 的相关性较好,相关系数分别为 0.455,0.501 和 0.531;其次是 Rt,R2 为 0.189;而POR,CNL与TOC无明显相关性。
-
3 TOC预测常规模型
-
近年来,基于测井资料计算 TOC的常规模型有很多,较为成熟的方法包括ΔlogR法、多元回归分析法、密度单因素计算模型等。笔者采用常规的 ΔlogR法和多元回归分析法预测研究区页岩油取心井牛页1井TOC,建立相关TOC的测井公式。
-
3.1 ΔlogR法
-
ΔlogR法将电阻率曲线和声波曲线进行重叠,是目前广泛使用的方法之一[9]。首先对岩心进行深度归位,然后标准化声波曲线与电阻率曲线并计算幅度差,其表达式为:
-
利用(1)—(2)式计算 TOC,通过实测 TOC 与 ΔlogR法预测TOC之间拟合得到线性关系(图2)。
-
利用ΔlogR法预测TOC,与实测TOC相比,相关性不高,原因主要有2点:①由于成熟度参数借用国外实验参数,对研究区的实验缺少参考依据。② ΔlogR法计算过程中需要人为确定页岩基线等多个参数,误差较大。
-
3.2 多元回归分析法
-
多元回归分析法是利用测井敏感参数,建立与 TOC 相关的多元线性回归方程[10]。根据研究区测井资料单参数数据拟合,TOC 与中子、密度和声波时差相关系数较高,与其余测井曲线相关系数较低。因此,选取中子、密度和声波时差作为敏感参数,进行多元回归分析,建立多因素计算模型。其表达式为:
-
图1 牛庄洼陷实测TOC与测井参数的相关性分析
-
Fig.1 Analysis of correlation between measured TOC and logging parameters in Niuzhuang Depression
-
图2 实测TOC与ΔlogR法预测TOC的相关性分析
-
Fig.2 Analysis of correlation between measured TOC and predicted TOC by ΔlogR method
-
根据最小二乘法拟合获得a,b,c和d值,分别为 0.038,0.032,-4.912和14.651,得到多元回归方程:
-
多元回归分析法 R2 不高,为 0.668(图3,图4)。该方法所建立的模型为非理论模型,仅能确定测井响应值与TOC的正负相关性,这种线性或非线性约束存在其不合理性,且在研究区的页岩油井中,与 TOC 的相关系数不高,因此利用敏感曲线所建立的多元回归模型并不可靠。
-
图3 实测TOC与多元回归分析法预测TOC的相关性分析
-
Fig.3 Analysis of correlation between measured TOC and predicted TOC by multiple regression analysis method
-
4 基于 PCA-CNN 模型的 TOC 预测方法
-
页岩储层测井曲线数据里包含冗余信息和噪声信息,会在实际应用中产生误差,影响准确率,而降维可以提取数据内部的本质结构,减少冗余信息和噪声信息造成的误差,提高精度[11]。页岩储层测井曲线数据之间存在多重共线性,即各个测井数据属性之间存在着相互关联关系,具有多重解的可能性,从而导致模型的泛化能力弱;而东营凹陷页岩储层测井数据样本具有稀疏性,导致模型比较难找到数据特征。通过主成分分析法可以减少测井数据中特征属性的个数,确保特征属性之间是相互独立的,同时减少了计算量,缩短训练时长。
-
4.1 PCA模型
-
PCA 是一种使用最广泛的数据降维算法[12]。 PCA的主要思想是将n维特征映射到k维上,在原有 n 维特征的基础上重新构造出来 k 维特征。通过计算数据的协方差矩阵,得到协方差矩阵的特征值和特征向量,选择特征值最大的 k 个特征所对应的特征向量组成的矩阵,从而实现数据特征的降维[13]。
-
4.2 PCA-CNN模型
-
PCA-CNN 是一种深度前馈人工神经网络,是深度学习技术领域中具有代表性的神经网络之一[14]。一个完整的 CNN 包括输入层、卷积层、池化层、全连接层和输出层。CNN与神经(BP)最大的不同在于其增加了卷积层和池化层[15]。卷积层用于提取数据特征,层级之间的神经元为局部链接和权值共享,这样的设计减少了训练的数据量,而池化层用于压缩数据特征,对卷积层输出的特征图进一步抽样[16]。
-
PCA-CNN 模型即利用主成分分析法计算样本数据的均值向量、协方差矩阵以及特征值、特征向量等,对样本数据进行降维,将新的数据集代入卷积神经网络模型中。具体步骤包括:
-
①将归一化后的测井数据代入输入层,计算样本数据的平均值、协方差矩阵、相关系数矩阵,以及相关矩阵的特征根和特征向量,表达式为:
-
②在特征向量中选取 m 个主分量,当主分量 m1,m2,···,mn(m<n)的方差和占全部总方差的比例接近于 1 时,即当 m 个主分量的方差和占全部总方差的90%以上,说明筛出的样本既可保留主要信息又能充分反映原指标的信息[17],计算公式为:
-
③将利用主成分分析降维后的样本数据代入卷积神经网络的输入层,设置好训练的最大迭代次数,将输入层的数据送入神经网络的输入端[17]。
-
④设置3个卷积层,利用卷积层提取多个特征,经过Sigmoid激活函数得到输出结果,计算公式为:
-
⑤利用平均池化降低特征的维度,简化模型复杂度,将卷积层中的数据代入池化层中[18],预测 TOC,计算公式为:
-
⑥将输出的结果,通过变异系数法对其进行评估,其表达式为:
-
变异系数越小,表示卷积神经网络的应用效果越好[19]。
-
PCA-CNN 模型在输出层中选用变异系数法输出结果,能够消除平均数不同时对多个样本变异程度比较的影响,可使 PCA-CNN 模型的准确率更高。
-
图4 利用多元回归分析法计算牛页1井Es4 上纯上TOC与岩心实验数据对比
-
Fig.4 Comparison of experimental data of core and TOC calculated by multiple regression analysis method in Upper Chun Submember of Upper Es4 Member of Well Niuye1
-
5 实例应用
-
5.1 数据的选取及预处理
-
由于操作不精准或受到地层因素的影响以及测量环境、条件、研究对象存在偏差,从而造成不同井位的岩心深度与测井曲线深度不重合,需要进行岩心归位。通过把岩心深度校正到测井深度上,保证样品数据分析值与地层测井响应特征值一致,确保岩心取样深度与实际深度一致,减少误差,提升数据质量。
-
对研究区的页岩油井进行测井曲线标准化,选取稳定的泥岩层段作为标准层,利用直方图法对比出误差值,通过统计数据减去误差值,获得标准化数据,消除非地层因素对测井数据的影响,做去趋势化校正,保证测井数据质量。在剔除异常实测值的情况下,利用段对段的方法,将具有 TOC 的实测值所对应的其他测井曲线在深度上下范围 0.5 m 内求取平均值,进一步提高测井数据质量。
-
5.2 对比及分析
-
分别用ΔlogR法、多元回归分析法、CNN模型以及PCA-CNN模型预测计算TOC,分析4种方法的适用性和精确性。与传统的ΔlogR法和多元回归分析法相比,CNN 和 PCA-CNN 模型所预测 TOC 的精度更高,其中,PCA-CNN 模型的精度最高(表1)。由图5 可知,常规的 ΔlogR 法在计算 TOC 时未考虑到研究区岩性的复杂程度,尤其是在黏土矿物和碳酸盐岩含量高的层段预测的TOC值会偏大;多元回归分析法在面对老井测井曲线资料不齐全时无法使用,且针对不同洼陷不同地质构造的页岩油井时,模型并不适用。CNN 模型精度不够的主要原因是前期测井数据处理不够,而 PCA-CNN 模型既考虑了研究区岩性复杂导致的测井响应特征不一致的问题,也通过利用 PCA 主成分分析法处理测井数据,解决了 CNN 模型精度不高的问题,使模型在精度上有了较大提升。
-
图5 牛庄洼陷Es4 上纯上不同预测方法结果对比
-
Fig.5 Comparison of results by different prediction methods in Upper Chun Submember of Upper Es4 Member in Niuzhuang Depression
-
选取牛庄洼陷具有代表性的6口页岩油取心井进行 TOC 预测和验证,统计 232 块岩心实测 TOC 数据,对测井数据进行主成分分析,减少因测井曲线质量导致的精度降低的问题,然后利用CNN模型对 TOC 进行预测,得到牛庄洼陷 6 口页岩油井纵向分布的TOC值。如图6,由牛876和官17-斜11两口取心井做对比,牛 876 井在牛庄洼陷中心,中间低,四周高,多发育灰质泥岩,而官17-斜11井在牛庄洼陷东北部,处于边缘地带,多发育泥质灰岩,两口井的构造位置和发育的岩相差别很大,但是利用 PCA-CNN 模型计算 TOC 匹配度较好,精度较高,符合率最高达 96%,可见 PCA-CNN 模型预测 TOC 具有一定的推广性。
-
图6 PCA-CNN模型预测TOC与实测TOC对比结果
-
Fig.6 Comparison of predicted TOC by PCA-CNN model and measured TOC
-
6 结论
-
页岩储层具有高自然伽马、高声波时差、低密度的测井响应特征。牛庄洼陷页岩储层 TOC 与测井曲线敏感参数具有一定的相关性,陆相页岩储层 TOC常规计算模型中ΔlogR法和多元回归分析法预测效果不好,采用机器学习模型和 PCA-CNN模型,通过PCA模型对数据进行降维,再利用CNN模型进行页岩储层TOC预测,通过PCA改进后的CNN模型使样本数据质量和预测精度进一步提高。对比4种预测 TOC模型相关系数,结果表明,PCA-CNN 模型精度最高,稳定性好,应用于东营凹陷6口页岩油取心井,效果好,具有一定的推广性。
-
符号解释
-
a,b,c,d——最小二乘法拟合的系数;
-
aj ——经Sigmiod激活函数的输出值;
-
Averpool——平均池化;
-
bc——附加偏置;
-
bj——卷积中的偏置;
-
Conv——反卷积过程;
-
E——单位矩阵;
-
f——卷积函数;
-
f′——激活函数;
-
i——输入特征图的总通道数;
-
j——输出特征图的总通道数;
-
k——深度点编号;
-
K——卷积核;
-
Kij ——大小为i×j的卷积核;
-
l——卷积神经网络结构的层数(本文设置为3);
-
LOM——有机质成熟度(热变指数);
-
m——主成分的个数;
-
n——样本总个数;
-
N——测井数据的列数,即深度点数;
-
Nj ——输入特征图的选择集合;
-
R——相关系数矩阵;
-
R基线——非生油的黏土岩中基线对应于基线值的电阻率,Ω·m;
-
Sii ——协方差矩阵;
-
TOCi ——通过 PCA-CNN 预测出的总有机碳含量的样本数据集;
-
——通过 PCA-CNN 预测出的总有机碳含量的样本数据集的平均值;
-
Vi ——第i项数据的变异系数;
-
wj——第j个池化权值;
-
Xki ——样本数据;
-
——平均值;
-
X′ki ——中间计算系数;
-
yik——时频域参数;
-
和 ——对应时频域参数的平均数;
-
λ——特征值;
-
λi ——第i个主分量的方差,即特征值;
-
δj ——输出层的参数;
-
ΔlgR——实测曲线间距在对数坐标上的读数;
-
Δt——实测的传播时间,μs/ft;
-
Δt基线——非生油的黏土岩中基线对应于基线值的声波时差,μs/ft。
-
参考文献
-
[1] 杨涛涛,范国章,吕福亮,等.烃源岩测井响应特征及识别评价方法[J].天然气地球科学,2013,24(2):414-422.YANG Taotao,FAN Guozhang,LÜ Fuliang,et al.The logging fea⁃ tures and identification methods of source rock[J].Natural Gas Geoscience,2013,24(2):414-422.
-
[2] 刘超,卢双舫,黄文彪,等.ΔlogR 技术改进及其在烃源岩评价中的应用[J].大庆石油地质与开发,2011,30(3):27-31. LIU Chao,LU Shuangfang,HUANG Wenbiao,et al.Improvement of ΔlogR and its application in source rocks evaluation[J].Petro⁃ leum Geology & Oilfield Development in Daqing,2011,30(3):27-31.
-
[3] SCHOMKER J W.Determination of organic-matter content of Ap⁃ palachian Devonian shales from gamma-ray logs[J].AAPG Bulle⁃ tin,1981,65(7):1 285-1 298.
-
[4] 王惠君,赵桂萍,李良,等.基于卷积神经网络(CNN)的泥质烃源岩TOC预测模型——以鄂尔多斯盆地杭锦旗地区为例[J].中国科学院大学学报,2020,37(1):103-112.WANG Huijun,ZHAO Guiping,LI Liang,et al.TOC prediction model for muddy source rocks based on convolutional neural net⁃ work(CNN):a case study of the Hangjinqi area of the Ordos Basin [J].Journal of University of Chinese Academy of Sciences,2020,37(1):103-112.
-
[5] 张佳佳,李宏兵,姚逢昌,等.油页岩的地球物理识别和评价方法[J].石油学报,2012,33(4):625-632.ZHANG Jiajia,LI Hongbing,YAO Fengchang,et al.A Geophysi⁃ cal method for the identification and evaluation of oil shale[J].Ac⁃ ta Petrolei Sinica,2012,33(4):625-632.
-
[6] LIU X W,GUO Z Q,LIU C,et al.Anisotropy rock physics model for the Longmaxi shale gas reservoir,Sichuan Basin,China[J].Ap⁃ plied Geophysics,2017,14(1):21-30.
-
[7] 鲍晓欢,郝芳,方勇.东营凹陷牛庄洼陷地层压力演化及其成藏意义[J].地球科学——中国地质大学学报,2007,32(2):241-246.BAO Xiaohuan,HAO Fang,FANG Yong.Stratigraphic pressure evolution and reservoir significance of Niuzhuang Depression in Dongying Sag[J].Earth Science-Journal of China University of Geosciences,2007,32(2):241-246.
-
[8] 张海桥.海拉尔盆地红旗凹陷烃源岩评价及有利区预测[J].大庆石油地质与开发,2020,39(2):21-27.ZHANG Haiqiao.Evaluation of the hydrocarbon source rock and prediction of the favorable zone in Hongqi Sag of Hailar Basin[J].Petroleum Geology & Oilfield Development in Daqing,2020,39(2):21-27.
-
[9] 王健,石万忠,舒志国,等.富有机质页岩TOC含量的地球物理定量化预测[J].石油地球物理勘探,2016,51(3):596-604.WANG Jian,SHI Wanzhong,SHU Zhiguo,et al.Geophysical quantitative prediction of TOC content in organic-rich shale[J].Oil Geophysical Prospecting,2016,51(3):596-604.
-
[10] 王春燕,史鹏宇,李晶,等.松辽盆地古中央隆起带基底浅变质岩岩性测井解释及其应用[J].大庆石油地质与开发,2020,39(2):125-132.WANG Chunyan,SHI Pengyu,LI Jing,et al.Lithology logging in⁃ terpretation and application of the shallow metamorphic rock in the basement of the ancient central uplift belt of Songliao Basin [J].Petroleum Geology & Oilfield Development in Daqing,2020,39(2):125-132.
-
[11] 刘巍,刘威,谷建伟,等.利用卡尔曼滤波和人工神经网络相结合的油藏井间连通性研究[J].油气地质与采收率,2020,27(2):118-124.LIU Wei,LIU Wei,GU Jianwei,et al.Research on interwell con⁃ nectivity of oil reservoirs based on Kalman filter and artificial neu⁃ ral network[J].Petroleum Geology and Recovery Efficiency,2020,27(2):118-124.
-
[12] 李槟槟,何广军,尤晓亮,等.基于 GA-WPA 优化的BP神经网络目标威胁估计[J].计算机测量与控制,2015,23(12):4 187-4 190.LI Binbin,HE Guangjun,YOU Xiaoliang,et al.Targets threat as⁃ sessment based on BP neural network optimized based on GAWPA algorithm[J].Computer Measurement and Control,2015,23(12):4 187-4 190.
-
[13] 严鸿,管燕萍.BP神经网络隐层单元数的确定方法及实例[J].控制工程,2009,16(S2):100-102.YAN Hong,GUAN Yanping.Method to determine the quantity of internal nodes of back propagation neural networks and its demon⁃ stration[J].Control Engineering of China,2009,16(S2):100-102.
-
[14] 刘雨灵,侯进,张笑语,等.基于卷积神经网络的无线电广播同频干扰检测[J].计算机工程,2019,45(10):301-307.LIU Yuling,HOU Jin,ZHANG Xiaoyu,et al.Same frequency in⁃ terference detection in radio broadcast based on convolutional neural network[J].Computer Engineering,2019,45(10):301-307.
-
[15] 胡慧婷,卢双舫,刘超,等.测井资料计算源岩有机碳含量模型对比及分析[J].沉积学报,2011,29(6):1 199-1 205.HU Huiting,LU Shuangfang,LIU Chao,et al.Models for calculat⁃ ing organic carbon content from logging information:Comparison and analysis[J].Acta Sedimentologica Sinica,2011,29(6):1 199-1 205.
-
[16] 陈磊,田景春,文怀军,等.柴达木盆地北缘鱼卡煤田侏罗系煤层气特征及含气性评价[J].石油实验地质,2019,41(2):215-221.CHEN Lei,TIAN Jingchun,WEN Huaijun,et al.Jurassic coal bed methane characteristics and gas-bearing property evaluation in Iqe Coalfield,northern Qaidam Basin[J].Petroleum Geology & Experiment,2019,41(2):215-221.
-
[17] TAN M J,SONG X D,YANG X,et al.Support-vector-regression machine technology for total organic carbon content prediction from wireline logs in organic shale:a comparative study[J].Jour⁃ nal of Natural Gas Science & Engineering,2015,26(1):792-802.
-
[18] 殷瑞,苏松志,李绍滋.一种卷积神经网络的图像矩正则化策略[J].智能系统学报,2016,11(1):43-48.YIN Rui,SU Songzhi,LI Shaozi.A convolutional neural network’s image moment regularizing strategy[J].CAAI Transactions on In⁃ telligent Systems,2016,11(1):43-48.
-
[19] 王永诗,金强,朱光有,等.济阳坳陷沙河街组有效烃源岩特征与评价[J].石油勘探与开发,2003,30(3):53-55.WANG Yongshi,JIN Qiang,ZHU Guangyou,et al.Characteriza⁃ tion of the effective source rocks in the Shahejie Formation of the Jiyang Depression[J].Petroleum Exploration and Development,2003,30(3):53-55.
-
摘要
总有机碳含量(TOC)是评价烃源岩有机质丰度和生烃潜力的指标之一。以东营凹陷牛庄洼陷页岩油取心井为例,以实验分析岩心TOC和测录井资料为基础,应用交会图获取TOC相关敏感参数。通过采用常规陆相页岩储层TOC计算模型即ΔlogR法和多元回归分析法预测研究区湖相页岩储层TOC,相关性不高,效果不佳。因此提出选用机器学习模型即利用主成分分析(PCA)模型与改进的卷积神经(CNN)模型组合,形成PCA-CNN模型,通过PCA 模型对数据降维,去除冗余信息和噪声信息,再利用CNN模型进行页岩储层TOC预测,使样本数据质量和TOC预测精度得以提高。将PCA-CNN模型应用到牛庄洼陷的6口页岩油取心井进行TOC预测,结果表明,对于陆相页岩储层,PCA-CNN模型TOC预测精度较高,符合率最高达96%。
Abstract
Total organic carbon(TOC)is one of the indicators for evaluating the organic matter abundance and hydrocarbon generation potential of hydrocarbon source rock. In this paper,taking the cored well of shale oil reservoir in Niuzhuang De- pression,Dongying Sag as an example,the TOC-related sensitive parameters were obtained through cross plots based on the experimental analysis of TOC from core and logging data. The conventional TOC calculation models for continental shale oil reservoir,namely the ΔlogR method and the multiple regression analysis method,were used to predict the TOC of well and lake facies shale oil reservoir in the study area,but the correlation and performance were not good. Therefore,this paper proposed combining machine learning models,i.e.,the principal component analysis(PCA)model and an improved convolutional neural network(CNN)model,to form the PCA-CNN model. In this model,the PCA model was employed to re- duce the dimensions of data and remove redundant information and noise information,and then,the CNN model was used to predict the TOC of shale oil reservoir,which could improve sample data quality and prediction accuracy of TOC. The PCA-CNN model was applied to predict the TOC of six cored wells shale oil reservoir in Niuzhuang Depression,and the results reveal that for continental shale oil reservoir,the proposed model can accurately predict TOC,and the compliance rate is up to 96%.
关键词
页岩储层 ; 常规TOC计算模型 ; 敏感参数 ; 主成分分析(PCA)模型 ; 卷积神经(CNN)模型
Keywords
shale reservoir ; conventional TOC calculation model ; sensitive parameters ; PCA ; CNN