en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

刘合(1961-),男,中国工程院院士,博士,中国石油勘探开发研究院副总工程师,研究方向为低渗透油气藏增产改造、机采系统提高系统效率、分层注水和井筒工程控制技术等。E-mail:liuhe@petrochina.com.cn。

通信作者:

李艳春(1994-),女,博士研究生,研究方向为人工智能在油藏开发中的应用。E-mail:Yachne_Li@163.com。

中图分类号:TE 355

文献标识码:A

文章编号:1673-5005(2023)05-0103-12

DOI:10.3969/j.issn.1673-5005.2023.05.010

参考文献 1
孙彦达,王永卓.大庆外围低渗透油田产能预测影响因素[J].石油勘探与开发,2001,28(6):73-76.SUN Yanda,WANG Yongzhuo.The influence factors on predicting production capacity of peripheral low-perme ability oil fields of Daqing[J].Petroleum Exploration and Development,2001,28(6):73-76.
参考文献 2
刘合,裴晓含,罗凯,等.中国油气田开发分层注水工艺技术现状与发展趋势[J].石油勘探与开发,2013,40(6):733-737.LIU He,PEI Xiaohan,LUO Kai,et al.Current status and trend of separated layer water flooding in China[J].Petroleum Exploration and Development,2013,40(6):733-737.
参考文献 3
袁庆峰.油田开发实践与认识[M].北京:石油工业出版社,2014:83.
参考文献 4
袁士义,王强.中国油田开发主体技术新进展与展望 [J].石油勘探与开发,2018,45(4):657-668.YUAN Shiyi,WANG Qiang,New progress and prospect of oilfields development technologies in China[J].Petroleum Exploration and Development,2018,45(4):657-668.
参考文献 5
刘合,郑立臣,杨清海,等.分层采油技术的发展历程和展望[J].石油勘探与开发,2020,47(5):1027-1038.LIU He,ZHENG Lichen,YANG Qinghai,et al.Development and prospect of separated zone oil production technology[J].Petroleum Exploration and Development,2020,47(5):1027-1038.
参考文献 6
郭曜豪,张磊,姚军,等.高含水期水驱特征曲线上翘机理及其影响因素 [J].科学通报,2019,64(26):2751-2760.GUO Yaohao,ZHANG Lei,YAO Jun,et al.Mechanisms of water flooding characteristic curve upwarping at high water-cut stage and influencing factors[J].Chinese Science Bulletin,2019,64(26):2751-2760.
参考文献 7
孙红霞.高含水期水驱特征曲线上翘新认识[J].特种油气藏,2016,23(1):92-95.SUN Hongxia.New understanding of upward waterflooding characteristic curve in high water-cut stage[J].Special Oil & Gas Reservoirs,2016,23(1):92-95.
参考文献 8
黄广庆.特高含水期产量递减分析及递减率表征式 [J].科学技术与工程,2019,19(15):99-104.HUANG Guangqing.Production decline analysis and characterization formula of decline rate at the ultra-high water cut stage [J].Science Technology and Engineering,2019,19(15):99-104.
参考文献 9
王继强,石成方,纪淑红,等.特高含水期新型水驱特征曲线[J].石油勘探与开发,2017,44(6):955-960.WANG Jiqiang,SHI Chengfang,JI Shuhong,et al.New water drive characteristic curves at ultra-high water cut stage [J].Petroleum Exploration and Development,2017,44(6):955-960.
参考文献 10
陈元千,陶自强.高含水期水驱曲线的推导及上翘问题的分[J].断块油气田,1997,4(3):19-24.CHEN Yuanqian,TAO Ziqiang,Derivation of water drive curve at high water-cut stage and its analysis of upwarding problem [J].Fault-block Oil & Gas Field,1997,4(3):19-24.
参考文献 11
刘晓华,邹春梅,姜艳东,等.现代产量递减分析基本原理与应用[J].天然气工业,2010,30(5):50-54.LIU Xiaohua,ZOU Chunmei,JIANG Yandong,et al.Theory and application of modern production decline analysis[J].Natural Gas Industry,2010,30(5):50-54.
参考文献 12
张倩倩.产量递减分析方法简评[J].油气地球物理,2013,11(3):41-44.ZHANG Qianqian.Analysis method of production decline[J].Petroleum Geophysics,2013,11(3):41-44.
参考文献 13
LUO J,JI Y,LU W.Comparison of surrogate models based on different sampling methods for groundwater remediation[J].Journal of Water Resources Planning and Management,2019,145(5):04019015.
参考文献 14
CRNKOVIC-F L,ERLANDSON M.Geology driven EUR prediction using deep learning [ R ].SPE D031S030R002,2015.
参考文献 15
GU M,GOKARAJU D,CHEN D,et al.Shale fracturing characterization and optimization by using anisotropic acoustic interpretation,3D fracture modeling,and supervised machine learning[J].Petrophysics,2016,57(6):573-587.
参考文献 16
MOHAMED S,ROY A,SAYED A.Streamline rock facies classification with deep learning cognitive process [R].SPE D031S030R002,2017.
参考文献 17
WU P Y,JAIN V,KULKARNI M S,et al.Machine learning-based method for automated well-log processing and interpretation[R].SEG 2996973,2018.
参考文献 18
NOSHI C I,ASSEM A I,SCHUBERT J J.The role of big data analytics in exploration and production:a review of benefits and applications[R].SPE D012S021R001,2018.
参考文献 19
PHAM N,FOMEL S,DUNLAP D.Automatic channel detection using deep learning[J].Interpretation,2019,7(3):SE43-SE50.
参考文献 20
LI W.Classifying geological structure elements from seismic images using deep learning[R].SEG 2998036,2018.
参考文献 21
柴艳军.基于灰色关联法的页岩气水平井产量主控因素分析[J].重庆科技学院学报(自然科学版),2018,20(2):32-34.CHAI Yanjun.Study on the main controlling factors of shale gas production based on grey correlation method [J].Journal of Chongqing University of Science and Technology(Natural Sciences Edition),2018,20(2):32-34.
参考文献 22
王忠东,王业博,董红,等.页岩气水平井产量主控因素分析及产能预测 [J].测井技术,2017,41(5):577-582.WANG Zhongdong,WANG Yebo,DONG Hong,et al.Production main control factors analysis and productivity prediction for shale gas of horizontal well[J].Well Logging Technology,2017,41(5):577-582.
参考文献 23
张蕾,窦宏恩,王天智,等.基于集成时域卷积神经网络模型的水驱油田单井产量预测方法[J].石油勘探与开发,2022,49(5):996-1004.ZHANG Lei,DOU Hongen,WANG Tianzhi,et al.A production prediction method of single well in water flooding oilfield based on integrated temporal convolutional network model [J].Petroleum Exploration and Development,2022,49(5):996-1004.
参考文献 24
李春生,谭民浠,张可佳.基于改进型BP神经网络的油井产量预测研究[J].科学技术与工程,2011,11(31):7766-7769.LI Chunsheng,TAN Minxi,ZHANG Kejia.Research on single well production prediction based on improved BP neural networks[J].Science Technology and Engineering,2011,11(31):7766-7769.
参考文献 25
田亚鹏,鞠斌山.基于遗传算法改进BP神经网络的页岩气产量递减预测模型[J].中国科技论文,2016,11(15):1710-1715.TIAN Yapeng,JU Binshan.A model for predicting shale gas production decline based on the BP neural network improved by the genetic algorithm [J].Chinese Scientific Papers,2016,11(15):1710-1715.
参考文献 26
马林茂,李德富,郭海湘,等.基于遗传算法优化BP神经网络在原油产量预测中的应用:以大庆油田BED试验区为例[J].数学的实践与认识,2015,45(24):117-128.MA Linmao,LI Defu,GUO Haixiang,et al.BP Neural network based on genetic algorithm applied in crude oil production forecast:taking the BED test area of the Daqing oilfield as an example[J].Mathematics in Practice and Theory,2015,45(24):117-128.
参考文献 27
樊灵,赵孟孟,殷川,等.基于BP神经网络的油田生产动态分析方法 [J].断块油气田,2013,20(2):204-206.FAN Ling,ZHAO Mengmeng,YIN Chuan,et al.Analysis method of oilfield production performance based on BP neural network[J].Fault-Block Oil & Gas Field,2013,20(2):204-206.
参考文献 28
HOLDAWAY K R.Data mining methodologies enhance probabilistic well forecasting[R].SPE D031S014R004,2013.
参考文献 29
张方舟,严胡勇,杨立全,等.改进型灰色神经网络模型在油田产量中的应用[J].计算机技术与发展,2013,23(6):241-244.ZHANG Fangzhou,YAN Huyong,YANG Liquan,et al.Application of improved grey neural network model to oil yields[J].Computer Technology and Development,2013,23(6):241-244.
参考文献 30
NOSHI C I,EISSA M R,ABDALLA R M.An intelligent data driven approach for production prediction[R].OTC D041S048R007,2019.
参考文献 31
韩益东,尹洪军,徐国涵,等.基于机器学习的高含水期油井产量预测方法[J].河南科学,2022,40(10):1569-1575.HAN Yidong,YIN Hongjun,XU Guohan,et al.Prediction method of oil well production in high water cut period based on machine learning[J].Henan Science,2022,40(10):1569-1575.
参考文献 32
CAO Q,BANERJEE R,GUPTA S,et al.Data driven production forecasting using machine learning[R].SPE D021S006R001,2016.
参考文献 33
谷建伟,隋顾磊,李志涛,等.基于 ARIMA-Kalman 滤波器数据挖掘模型的油井产量预测[J].深圳大学学报(理工版),2018,35(6):575-581.GU Jianwei,SUI Gulei,LI Zhitao,et al.Oil well production forecasting method based on ARIMA-Kalman filter data mining model[J].Journal of Shenzhen University(Science and Engineering),2018,35(6):575-581.
参考文献 34
张瑞,贾虎.基于多变量时间序列及向量自回归机器学习模型的水驱油藏产量预测方法[J].石油勘探与开发,2021,48(1):175-184.ZHANG Rui,JIA Hu.Production performance forecasting method based on multivariate time series and vector autoregressive machine learning model for waterflooding reservoirs[J].Petroleum Exploration and Development,2021,48(1):175-184.
参考文献 35
GUPTA S,FUEHRER F,JEYACHANDRA B C.Production forecasting in unconventional resources using data mining and timeseries analysis [ R ].SPE/CSUR D011S004R008,2014.
参考文献 36
王洪亮,穆龙新,时付更,等.基于循环神经网络的油田特高含水期产量预测方法[J].石油勘探与开发,2020,47(5):1009-1015.WANG Hongliang,MU Longxin,SHI Fugeng,et al.Production prediction at ultra-high water cut stage via recurrent neural network[J].Petroleum Exploration and Development,2020,47(5):1009-1015.
参考文献 37
刘巍,刘威,谷建伟.基于机器学习方法的油井日产油量预测[J].石油钻采工艺,2020,42(1):70-75.LIU Wei,LIU Wei,GU Jianwei.Oil production prediction based on amachine learning method[J].Oil Drilling & Production Technology,2020,42(1):70-75.
参考文献 38
刘庆珍,黄昌硕.基于FCBF特征选择和XGBoost原则的油纸绝缘介电响应特征量优选研究[J].电力系统保护与控制,2022,50(15):50-59.LIU Qingzhen,HUANG Changshuo.Optimization of dielectric response characteristics of oil paper insulation based on FCBF feature selection and the XGBoost principle[J].Power System Protection and Control,2022,50(15):50-59.
目录contents

    摘要

    针对油田高含水期地质条件复杂、地层物性变化多样导致产量预测正确率低的问题,提出一种基于多变量时间序列模型即多变量长短期记忆神经网络(LSTM)的产量预测方法。在基于极限梯度提升算法(XGBoost)筛选产量主控因素的基础上,建立综合考虑产量与地质、开发等影响因素之间相关性特征,并兼顾产量自身的时序性变化特征的产量预测模型;实验选取中国某中高渗透砂岩区块油田生产历史数据进行高含水期产量预测模型的训练和测试,并与单变量长短时记忆模型以及其他全连接网络模型结果进行比较。结果表明:该方法具有较好的预测性能, 新模型克服了传统全连接神经网络无法描述产量时序数据相关性,以及单变量 LSTM 无法表征高含水期产量变化受多因素影响的问题,有效地提高了油田高含水期产量预测的准确性。

    Abstract

    In response to the low accuracy in production forecasting during the high water-cut period of an oilfield, which is attributed to the complex geological conditions and diverse reservoir properties, a multivariate time series production prediction model was proposed. Specifically, the method utilizes a multivariate long short-term memory neural network (LSTM) for the production forecasting. Based on the foundation of using eXtreme gradient boosting(XGBoost) to identify the primary controlling factors for production, we develop a production prediction model that incorporates the correlation features between the production and various influencing factors, such as the geological and development factors. Moreover, the model also captures the temporal variations inherent in production. The experimental study utilizes historical data of production from a domestic oil field located in a medium-tohigh permeability sandstone reservoir to train and test the high water period production forecasting model. The results were compared with those of a single-variable LSTM model and other fully connected neural network models. The results show that the proposed method exhibits superior predictive performances. The proposed model overcomes the limitations of traditional fully connect-ed neural networks in capturing the temporal correlation of production time series data and addresses the issue of single-variable LSTM’s inability to represent the impact of multiple factors on the production variation during the high-water period. The model effectively improves the accuracy of production forecasting in high-water periods of oil fields.

  • 油田开发中产量指标是评价油田开采状况、进行油田开发方案、增储上产和产能建设的基础和依据,产量预测的精度是影响油田开发效果至关重要的因素[1]。由于中国油田储集层 92%为陆相碎屑岩沉积,天然能量弱,水驱开发一直是中国油田主体开发方式之一[2-3],随着水驱开发不断深入,目前进入了高采出程度、高含水阶段[4-5]。高含水期油藏纵向和平面非均质性严重,层间矛盾加剧,剩余油赋存状态发生改变[6-7]。油相由连续相变为分散相,油相流动能力显著下降,水油比快速上升,这导致产量预测面临巨大的挑战。具体表现为利用传统的经验模型法预测高含水期产量,水驱特征曲线发生上翘,预测结果误差较大,已不适于描述高含水期产量递减规律[7-10]。此外常规油藏工程方法考虑的影响因素较少,计算精准度难以保证[11-12],而数值模拟方法对高含水期进行产量预测的时效较低,模拟计算负荷随高含水期非线性特征增强而增大,严重时甚至会无法收敛[13]。因此进入特高含水期,随着油藏渗流规律日益复杂,储层时变特征凸显,需要充分利用地震、地质、油藏等资料表征油藏属性的时变特征,推动常规油藏描述向动态油藏描述技术升级,受限于现有流动模拟方法和进一步研究的时间成本,亟需一种能够提高产量预测精度的智能方法。笔者针对油田高含水期地质条件复杂、地层物性变化多样导致产量预测正确率低的问题,提出一种基于多变量时间序列模型即多变量长短期记忆神经网络(LSTM)的产量预测方法。

  • 1 高含水期产量预测方法存在的瓶颈

  • 随着油田开发的深入进行,多油田陆续进入高含水期的开采阶段。在这个阶段,油田面临着严峻的生产形势,产量预测的难度也相应增加,同时层间矛盾变得更加突出,水淹规律的复杂性进一步凸显。造成这种情况的主要原因可以归结为 3 个方面:①受储层物性差异影响,导致储层在纵向上呈现出强烈的非均质性; 层间出现高渗透层,从而形成了水窜现象,阻碍了低渗透层的产能释放,严重干扰了层间的产油情况; ②受开发井网变化和井网完善程度的影响,油田开发过程中,井网的布置和改变会对流体的分布产生影响,导致产液结构的不均匀性增加,进而增加了油水渗流规律的复杂性; ③为兼顾开发成本与开采效果,注水开发初期一般采用多层合采的开发模式,造成层间注水不均衡现象加剧,渗流规律的定量表征难度加大。受以上因素影响,导致注水初期多层合采产量线性回归关系模型在高含水期适用性差。

  • 近年来,随着人工智能在科学和工程领域的广泛应用,数字化转型、大数据和人工智能逐渐成为石油和天然气工业的研究热点[14-20]。很多学者探索利用人工智能方法解决油田高含水期产能预测存在的难点,主要针对油井产量主控因素分析[21-23] 以及油井产量预测[24-27] 进行研究。例如基于聚类模型和数据挖掘概率模型,结合神经网络与灰色关联分析的产量预测模型,以及多机器学习算法综合预测模型应用于产量预测[28-30]。利用随机森林和 BP 神经网络算法进行单一模型的拟合和预测,不仅成为一种新的组合产量预测模型[31],而且在非常规油气储集层中的老井和新井的生产现状预测方面,逐渐开始探索机器学习算法与地质模型、生产历史数据和生产制度等信息的结合,以发现其潜在应用[32]。但传统的全连接神经网络无法有效利用产量时序性特征,因此一些学者通过循环神经网络( recurrent neural network,简称 RNN)建立考虑时间因素且更加符合实际生产情况的油井产量预测模型[33-34]。 Gupta 等[35]提出分别采用基于数据挖掘技术和时间序列分析方法进行产量预测。例如,王洪亮等[36] 在油田产量预测方面采用了循环神经网络(RNN)构建的模型。该模型不仅能够捕捉到产量与主控因素之间的关联,而且能够捕捉产量数据中的时序信息,从而更准确地预测未来产量变化。刘巍等[37] 通过筛选与日产油数据相关的特征参数并基于 LSTM 模型通过学习历史数据的长期依赖关系,使模型能够更好地预测未来的产量趋势。

  • 这些机器学习模型虽然在技术方法上取得了进步,但大多数产量预测方法或采用多变量预测模型忽略了生产中油井产量时序性特征,或采用单变量时序预测模型未能充分考虑油田产量受储层性质和生产制度等多因素影响。因此本文旨在基于油田产量历史数据的多因素相关性和时序相关性,使用多变量 LSTM 预测油田高含水期的产量。首先,基于 XGBoost 进行产量主控因素筛选,降低产量预测模型复杂度,提高模型精度; 其次,阐述 LSTM 模型原理及其与高含水产量预测问题的适配性,并基于多变量 LSTM 建立产量预测模型; 最后,与其他 3 种同类神经网络模型对比,通过对多变量 LSTM 模型在高含水产量预测中的应用效果进行分析,可以有效指导智能产量预测在高含水油田的实际应用和实施。

  • 2 基于 XGBoost 的产量主控因素挖掘

  • 选择中国东部某中高渗透砂岩区块作为研究对象,该区块具备优良的油气储藏条件。目前该区块正处于高含水期的开发阶段,尽管原油产量相对保持稳定,但产液量和平均含水量逐年增加,如图1 所示开发效果逐年恶化。

  • 图1 区块产油、产液量和含水情况

  • Fig.1 Oil production, liquid production and water content of block

  • 为了深入研究该问题,收集了研究区内 100 多口油井近 10 a 的生产数据,并结合静态数据和流体物性数据形成了初始的产量分析样本数据集,共计 27 个维度,其中 1 个为标签特征。分析样本数据集包括每口井的地质参数和工程参数,地质参数反映了油藏的地质属性,包括孔隙度、渗透率、含油饱和度和射开有效厚度等指标,这些地质参数对于油藏的储量和产能具有重要影响。同时考虑到油井投产后能量的变化和生产状况对产油量的直接影响,还考虑了生产天数、流压、静压、冲程、冲次、动液面、连通有效厚度和连通井注水量等工程参数。这些工程参数能够反映油井的生产情况和工艺特征,将有助于深入理解地质参数和工程参数对产量的影响,并为进一步的分析和预测提供基础。

  • 目前样本数据中地质和工程各类参数多达 20余种,如果同时对样本库中的指标进行使用,一方面掩盖了数据有效性,另一方面会使计算量骤增,极大地影响计算效率,需要通过指标筛选去掉一些无意义数据,保留有用指标。因此使用 Pearson 相关系数、互信息结合通过极限梯度提升算法( eXtreme gradient boosting,XGBoost)进行产量主控因素挖掘,具体算法流程如图2 所示。

  • 图2 产量主控因素挖掘流程

  • Fig.2 Production control factor mining process

  • 首先,通过计算样本数据集中每个特征变量与产量的互信息值,获得各特征变量与产量之间的关联程度。其次,计算各个特征之间的 Pearson 相关系数来判断特征变量之间的相关程度; 对于强相关的特征,删除其中与产量之间互信息值较低的特征参数,以避免特征冗余或共线性带来的影响。最后,使用 XGBoost 算法计算每个特征的重要性程度,依据特征的全局重要度进行特征筛选,逐次减少 1~2 个重要度最低的特征,以此减少特征空间的维度,直至达到预设的最小阈值,从而迭代得出最优特征子集。

  • 2.1 数据描述性分析和预处理

  • 由于样本数据来自于不同类型的数据源,出现数据异常的可能性较为常见。在数据分析之前,需要对数据进行描述性分析和预处理,数据预处理对于产量主控因素挖掘起着至关重要的作用,主要包括异常值处理、缺失值处理和数据标准化等。首先,对每个缺失值的特征建模,并使用该估计值进行估算,以迭代循环方式执行,比如有孔隙度数据缺少渗透率时可以根据渗透率与孔隙度的关系进行估算,采用均值插补法或中位数插补进行数据的填充。其次,利用 3σ 准则对各类数据分别进行异常值的筛除,设测量值为x1x2x3,···,xn,算出其算术平均值 x 及剩余误差 vi = xi-xi = 1,2,···,n),依据贝塞尔式算出标准偏差 σ,当某数据 xt 的剩余误差 vt(1≤tn)满足

  • vi=xi-x>2δ
    (1)
  • 则认为 xt 应予以剔除。最后,因为数据来源多样,不同数据之间量级存在较大差异。因此采用

  • x=x-xminxmax-xmin
    (2)
  • 进行数据标准化,消除变量间的量纲差异,避免影响数据分析、数据建模及优化的结果。

  • 2.2 基于 Pearson 相关性和互信息的特征筛选

  • 对预处理后的样本数据进行特征初步选择。首先,计算各个特征之间的 Pearson 相关系数,用于衡量特征之间的线性相关性。得到如图2 所示的 Pearson 相关系数图谱,这里展示其中的 10 个特征。然后,计算每个特征与产量之间的互信息值,并按照从大到小的顺序进行排序。互信息值越大,表示特征与产量之间的关联度越高,重要性也越高。将对应于 Pearson 相关系数图谱的 10 个特征进行展示,并将它们的互信息值列在表1 中。对于两个随机变量 X =( x1x2,···,xn),Y =( y1y2,···,yn)的 Pearson 相关系数表示为

  • P(X,Y)=i=1n xi-x-yi-y-i=1n xi-x-2i=1n yi-y-2.
    (3)
  • 式中,PXY)为 Pearson 相关系数; xy 分别为两个变量的样本值; x-y-分别为两个变量的样本均值。

  • PXY)的绝对值越大,表示两个变量之间的相关程度越高。当 PXY)的值接近 1 或-1 时,表示两个变量之间存在强烈的线性相关性; 当 PXY)的值接近 0 时,表示两个变量之间不存在线性相关性。

  • pxy)、px)和 py)分别为(XY)的联合分布函数、X 的边缘分布函数和 Y 的边缘分布函数,则 XY 的互信息 IXY)定义为

  • I(X,Y)=yY xX p(x,y)logp(x,y)p(x)p(y)
    (4)
  • 从式(4)可以看出,IXY)的意义是 XY 共享信息的一个度量。它表示当知道一个变量的取值时,对另一个变量的不确定度减少的程度。互信息的计算可以用来衡量两个变量之间的关联性和信息传递程度。如果两个变量是相互独立的,即一个变量的取值无法提供任何关于另一个变量的信息,那么它们的互信息值将为 0。

  • 由图3( a)中的 Pearson 相关系数图谱,根据 Pearson 相关系数的绝对值评估可知部分特征之间的相存在较强相关程度,这表示特征之间存在冗余性。为了去除这些冗余特征,筛选出所有具有强相关性的特征,即 Pearson 相关系数绝对值大于 0.6 的特征对,对比冗余特征的互信息值。互信息值可以判断特征的重要性与产量之间的关联程度。对于具有较低互信息值的特征,可以将其删除,以减少冗余特征的影响。

  • 图3 特征筛选前后 Pearson 相关系数图谱对比

  • Fig.3 Comparison of Pearson correlation heatmaps before and after feature selection

  • 表1 特征与产量的互信息值

  • Table1 Mutual information between features and production

  • 经过去冗余操作后,特征的 Pearson 相关系数图谱(取其中 10 个特征展示)如图3(b)所示。可以观察到,在保留的特征中不再存在强冗余的特征对。这意味着成功地去除了原始特征中的冗余信息,保留了与产量预测相关且互信息值较高的特征。

  • 2.3 基于 XGBoost 的特征重要度评估

  • 为了降低产量预测特征维度并优化特征空间,通过 XGBoost 得到每个特征的重要性评估值,该评估值直观地反映各特征量对产量的贡献度,以便合理地保留重要特征并舍弃不重要的特征,实现特征空间的优化。 XGBoost 集成了多个回归树,因此根据数据预处理后的分析样本构建决策树回归模型为

  • y^i=k=1K fkxi.
    (5)
  • 式中,f k 为一棵回归树。

  • 该模型为融合多特征量的综合产量主控因素分析模型,为防止过拟合,引入正则化损失函数,表示为

  • Ωfk=γT+12λj=1T wj2
    (6)
  • 式中,Ωf k)为损失函数的正则化项; γλ 为损失函数的惩罚系数; Tw 分别为第 k 棵树的叶子数目及叶子权重。

  • 损失函数的最小化是为了获得更优的模型分类结果,表示模型能更准确地评估各特征量对产量的贡献度,通过对损失函数进行二阶泰勒展开,可以计算出每个叶子 j 的最优权重,并相应地计算得到最优的目标值。最优值计算为

  • wobj=-12λj=1T Gj2Hj+λ+λT.
    (7)
  • 式中,wobj 为最优目标值; Gj为叶子节点 j 的梯度之和,即节点 j 一阶导数累加之和; Hj 为叶子节点 j 所包含的样本的二阶导数累加之和。

  • 对于所有叶子节点,采用贪心算法对子树划分,每次对一个节点进行分裂,分裂前后的信息增益为

  • Gain =12GL2HL+λ+GR2HR+λ-GL+GR2HL+HR+λ-λ
    (8)
  • 式中,GLGR 分别为当前节点左子树和右子树的梯度之和; HLHR 分别为当前节点左子树和右子树的二阶导数之和。

  • 在每次分裂过程中,计算每个特征的信息增益值,即衡量分裂前后数据纯度改善的程度。选择信息增益最大的特征进行分裂,而忽略其他信息增益较低的特征。通过不断迭代这个过程,可以构建出一棵回归树,其中每个节点都是根据特征的信息增益进行分裂。这样的分裂过程会考虑特征的重要性和关联性,从而构建出更准确的回归树模型,并将特征列向量作为树的分支节点。这种方法可以通过最大化信息增益来选择具有较高预测能力的特征进行分裂,从而提高模型的性能和准确性。为了衡量特征在单棵树中的重要性,用计算式表示为

  • J^j2(T)=k=1K-1 Ik2
    (9)
  • 式中,KK-1 分别为叶子和非叶子的节点数; Ik 为节点 k 分裂后平方损失的减少值。

  • 在 XGBoost 中,通过集成多个回归树并进行特征分裂,可以将选中特征的分裂次数作为该特征的重要度衡量指标[38]。为了分析特征的重要性,将特征样本输入 XGBoost 模型进行特征训练,并计算特征的分裂次数。

  • 基于分析结果,进行了 4 次特征重要度筛选过程。在每次筛选过程中,剔除 1~2 个重要度最低的特征,并生成新的特征空间。通过这种方式不断缩减特征空间的维度,直到达到预设的最小阈值。特征重要度的筛选过程如图4 所示。通过观察图4,可以了解产量影响因素的重要度筛选过程。这个过程有助于理解哪些特征对产量的影响最为关键,以及在模型中起到重要作用的特征。

  • 为了确保所选择的产量主控因素具有最优性能,采用主成分分析法对上述待选特征进行分析。主成分分析法通过计算方差贡献率来选取主成分,以保留最具代表性的特征。

  • 根据表2 结果,可以进一步观察前 6 个主成分的方差累计贡献率已经达到 81%。这意味着这 6 个主成分能够代表所有特征的方差。因此可以将原始的 26 个特征降维为 6 个主成分,这样可以更好地综合特征信息,减少特征间的冗余性。

  • 如表3 所示,筛选得到的 6 个特征涵盖了地质和工程两个类别的特征参数,具有广泛的信息覆盖范围。地质参数方面包括孔隙度、渗透率和含油饱和度等指标,反映了油藏的物理性质和储集条件。工程参数方面包括生产天数、流压和静压等指标,关注了油井的生产过程和工程操作。同时这 6 个特征完全符合图4 中 XGBoost 第 4 轮的选择结果,通过这些特征的综合应用,可以更准确地预测产量,并全面了解地质和工程因素对产量的影响。这将为智能产量预测在高含水油田的实施提供有效指导。

  • 图4 产量影响因素重要度筛选

  • Fig.4 Selection of importance factors affecting production

  • 表2 产量主控因素方差及方差贡献率

  • Table2 Variance and variance contribution rate of production control factors

  • 表3 产量主控因素分布

  • Table3 Distribution of production control factors

  • 3 基于多变量 LSTM 的产量预测

  • 3.1 多变量 LSTM 产量预测模型

  • 油井产量预测是基于油水井生产历史的典型时间序列预测问题,水驱开发油藏在长期的注水生产过程中,油藏的埋藏条件会逐渐发生变化,包括储层性质、流体性质和地层压力等的变化。这些变化对注水增产效果产生重要影响。因此油井产量预测在考虑产量时序性变化特征的基础上,兼顾产量指标与油藏动态分布特征的内在关联,利用大数据分析水驱开发产量历史数据变换规律,结合多变量 LSTM 建立产量预测模型,多变量 LSTM 产量预测模型架构如图5 所示。

  • 提出的基于多变量 LSTM 的产量预测模型充分考虑了产油量与地质因素和工程因素之间的多变量相关性特征。该模型的网络结构包括输入层、隐藏层和输出层,共 3 层。在输入层中,通过图5 可知,对产量主控因素进行适当的转换,使其能够用于监督学习。为了考虑时间相关性,通过时间窗口分割的方式将数据划分为输入集和相应的输出集。采用以时间步长 t 为间隔的方式,将每个时刻的前 t 个时间步的数据作为输入,而该时刻对应的样本值作为目标输出,得到了一系列的输入-输出样本对。并且为了使输入数据能够包含多变量特征,将 6 个产量主控因素和 t-1 个时间步的历史产量整合作为模型输入,这些特征将作为时间步的唯一索引,输入到隐藏层中,隐藏层通过使用损失函数计算得到的梯度反向传播调整式中的权重来进行学习。

  • 通过使用 Adam 算法来更新模型参数,不断迭代优化,直到损失函数达到收敛状态。模型训练完成后,通过输出层对结果进行反归一化等处理,将经过归一化处理的预测值还原为与实际产量数据相匹配的原始时序数据格式,从而完成产量预测。通过这种基于多变量 LSTM 的产量预测模型,能够考虑到产油量与地质因素和工程因素之间的多变量相关性特征,从而提高了产量预测的准确性和可靠性。

  • 图5 多变量 LSTM 产量预测模型

  • Fig.5 Multivariate LSTM production prediction model

  • 3.2 LSTM 模型节点结构

  • 长短期记忆网络( long short-term memory,LSTM)作为循环神经网络 RNN 的一种变体,解决了传统 RNN 在长期依赖性和梯度消失方面的致命缺点。 LSTM 隐藏层是包含了若干 LSTM 节点的结构,通过反复迭代可以有效地捕捉到产量与其主控因素的内在关系及相邻节点的前后联系。 LSTM 节点的设计核心是门限机制,包括输入门、遗忘门、记忆单元和输出门。

  • 输入门用来筛选新信息,通过输入门可以决定输入到记忆单元状态的信息并更新当前时刻的记忆单元状态,它决定上一时刻的记忆信息与哪些信息应该被保留,并将其与当前输入进行相乘。输入门的数学模型为

  • it=σWiht-1,xt+bi,c~t=tanhWcht-1,xt+bc.
    (10)
  • 式中,i tt 时刻输入门的输入; σ 为 sigmoid 激活函数; Wibi 分别为输入门网络权重和偏置; ht-1t-1 时刻被保留的状态信息; c~tt 时刻候选记忆单元状态; Wcbc 分别为记忆单元网络权重和偏置。

  • 遗忘门用于控制前一时间步的记忆对当前时间步的影响,它决定哪些信息应该是被丢弃信息,其数学模型为

  • ft=σWfht-1,xt+bf
    (11)
  • 式中,f tt 时刻遗忘门门限输入; Wfbf 分别为遗忘门网络权重和偏置。

  • 记忆单元状态类似于传送带,贯穿于整个 LSTM 网络,作用是储存当前时刻 LSTM 的网络信息并将其向下传递,记忆单元状态的计算式为

  • ct=ftct-1+itc~t.
    (12)
  • 式中,ct-1t-1 时刻的记忆单元状态; ctt 时刻经过输入门和遗忘门后更新的记忆单元状态。

  • 输出门决定了 LSTM 模型的最终输出和保留的信息。它利用 Sigmoid 函数将当前时刻的输入信息和上一时刻的输出信息进行加权相加,得到一个初始输出。然后,通过 tanh 激活函数对之前学习到的记忆信息进行缩放,再将其与初始输出相乘,最终得到 LSTM 模型的输出。

  • 输出门的数学模型为

  • ot=σWoht-1,xt+bo,ht=ottanhct.
    (13)
  • 式中,htt 时刻被保留的状态信息; Wobo 分别为输出门网络权重和偏置。

  • t 时刻的输出值为当前时刻网络单元的输入值与 t-1 时刻单元输出数据共同作用的结果,这表明 LSTM 模型可以保存上一个时间步长的信息,并将其作用于当前时刻,说明了 LSTM 在时序性数据上的学习能力。

  • 为了评估多变量 LSTM 模型在产量预测中的准确度和泛化能力。使用了两个评价指标,即均方误差(root mean square error,RMSE)和决定系数(R 2),来衡量模型的预测效果。其中,RMSE 是评估预测值与实际观测值之间差异的指标,R 2 是衡量预测值与目标值之间相关性的指标,其数学表达式分别为

  • RMSE=1Ni=1N yi-fxi2,
    (14)
  • R2=1-i=1N yi-f^xi2i=1N yi-y-2.
    (15)
  • 式中,yi 为第 i 个样本; N 为样本个数; fxi)为 BP 神经网络模型第 i 个样本处月产量预测值; y-为实测月产量平均值。

  • 当测试数据得到的 RMSE 越低且 R 2 接近 1,表明当前模型预测结果越准确。根据同样的训练集数据,分别利用单变量 LSTM、KNN 和 SVR 这 3 种机器学习方法建立了油藏产量预测模型,并利用同样未经过训练的测试集数据,各个模型的预测结果比较见表4。

  • 通过比较不同模型的结果,发现多变量 LSTM 模型在测试结果中表现出最低的 RMSE,并且 R 2 更接近 1,预测误差最小。这表明多变量 LSTM 模型相比其他模型具有更好的预测性能和泛化能力。通过引入多个相关变量作为输入,该模型能够更好地捕捉特征之间的关系和相互影响,从而提高了预测的准确性。

  • 表4 不同模型预测结果对比

  • Table4 Comparison of predictive results from different models

  • 如图6 所示,通过不同模型单井产量预测值与实际值拟合对比,可以更直观地展示不同模型对油田单井产量的预测精度。由图6 可以看出,多变量 LSTM 模型的产量预测结果与实际数据的拟合度最高,能够更准确地捕捉到实际产量数据的变化趋势和波动性。

  • 图6 不同模型单井产量预测值与实际值拟合对比

  • Fig.6 Comparison of fitting between predicted single well production values and actual values for different models

  • 如图6(a)和(b)所示 KNN 和 SVM 的单井产量预测结果尽管大部分符合率良好,但针对极大值点的预测存在较大误差。单变量 LSTM 方法可以一定程度上保证产量极大值点的连续性,但如图6(c)所示单井产量实际数据与单井产量预测结果的整体拟合度仍不能令人满意。相比之下,如图6(d)所示多变量 LSTM 方法能够更好地捕捉数据的突发性变化,预测结果的整体符合程度较其他 3 种模型有明显提高,也再次验证了多变量 LSTM 模型在产量预测方面的优越性。

  • 为验证产量主控因素挖掘的有效性,利用十倍交叉验证方法对产量预测样本形成 3 组平衡的数据集进行训练、测试,根据测试集的预测结果对比特征删选前后的预测精度。用这 3 种机器学习方法和本文提出的多变量 LSTM 方法建立的产量预测模型,针对产量主控因素挖掘前后的特征子集,分别进行 4 个模型的性能测试实验,测试结果见表5。

  • 表5 主控因素筛选前后不同方法下的模型性能对比

  • Table5 Model performance comparison before and after control factor selection using different methods

  • 进行产量主控因素删选前后,分别采用 KNN、 SVR 以及多变量 LSTM 方法对产量进行训练预测,因单变量 LSTM 模型输入不包含其他特征变量,因此该方法不参与比较。从表5 中可以看出,特征筛选后数据集相较原数据集,各种机器学习方法的预测效果均有明显提升,在 KNN 和 SVR 方法下准确率分别提高了 1.16%和 2.42%,在多变量 LSTM 方法下准确率提升了 5.54%,说明了去除完冗余特征和无效特征基础上,通过产量主控因素建立产量预测模型可以大幅提升预测效果。

  • 为更为直观地验证主控因素筛选对产量预测的影响,将主控因素筛选前后多变量 LSTM 模型产量预测值和实际值拟合对比,见图7,可以更清晰地展示产量主控因素筛选对预测效果的提升。由图7 可以看出,产量主控因素筛选前产量预测值和实际值的数据点离散于拟合线 y = x 两侧,产量主控因素筛选后产量预测值和实际值的数据点集中于拟合线 y =x 附近,拟合效果较好,进一步印证产量主控因素筛选使产量预测模型精度提升且稳定。

  • 图7 主控因素筛选前后产量预测值和实际值拟合对比

  • Fig.7 Comparison of fitting between predicted production values and actual values before and after control factor selection

  • 4 结束语

  • 提出了一种基于多变量分析的长短期记忆网络(LSTM)方法,用于预测高含水期的油井产量。这种方法克服了传统机器学习方法无法描述产量时序性依赖的问题,并利用实际产量对油藏和工程数据的依赖和相关性进行建模,从而有效提高了高含水期产量的预测精度。在方法的实施过程中,首先对数据样本进行清洗和预处理,以保证数据的准确性和一致性; 然后对数据进行标准化,使得不同特征之间具有可比性,从而更好地捕捉特征之间的关系,最终构建了完整的油井产量预测样本数据集,其中包括油藏和工程数据的多个变量。采用 XGBoost 算法对模型进行特征重要度分析,筛选对单井产量影响最大的主控因素。这些主控因素包括孔隙度、渗透率、含油饱和度、流压、连通井注水量以及生产天数。基于产量主控因素建立多变量 LSTM 网络产量预测模型,有效利用不同产量的主控因素之间的信息,并分别考虑了产量与油藏、工程参数在时间维度上的联系,使预测误差均低于 SVR 回归、KNN 回归及单变量分析的 LSTM 模型,同时预测精度达到工程精度要求,对高含水期产量预测具有更加精确的指导意义,可以有效指导高含水期油藏复杂生产状况下的油井产量预测。

  • 致谢 感谢大庆油田有限责任公司勘探开发研究院提供的实验数据,以及东北石油大学机械采油实验室提供的实验环境。

  • 参考文献

    • [1] 孙彦达,王永卓.大庆外围低渗透油田产能预测影响因素[J].石油勘探与开发,2001,28(6):73-76.SUN Yanda,WANG Yongzhuo.The influence factors on predicting production capacity of peripheral low-perme ability oil fields of Daqing[J].Petroleum Exploration and Development,2001,28(6):73-76.

    • [2] 刘合,裴晓含,罗凯,等.中国油气田开发分层注水工艺技术现状与发展趋势[J].石油勘探与开发,2013,40(6):733-737.LIU He,PEI Xiaohan,LUO Kai,et al.Current status and trend of separated layer water flooding in China[J].Petroleum Exploration and Development,2013,40(6):733-737.

    • [3] 袁庆峰.油田开发实践与认识[M].北京:石油工业出版社,2014:83.

    • [4] 袁士义,王强.中国油田开发主体技术新进展与展望 [J].石油勘探与开发,2018,45(4):657-668.YUAN Shiyi,WANG Qiang,New progress and prospect of oilfields development technologies in China[J].Petroleum Exploration and Development,2018,45(4):657-668.

    • [5] 刘合,郑立臣,杨清海,等.分层采油技术的发展历程和展望[J].石油勘探与开发,2020,47(5):1027-1038.LIU He,ZHENG Lichen,YANG Qinghai,et al.Development and prospect of separated zone oil production technology[J].Petroleum Exploration and Development,2020,47(5):1027-1038.

    • [6] 郭曜豪,张磊,姚军,等.高含水期水驱特征曲线上翘机理及其影响因素 [J].科学通报,2019,64(26):2751-2760.GUO Yaohao,ZHANG Lei,YAO Jun,et al.Mechanisms of water flooding characteristic curve upwarping at high water-cut stage and influencing factors[J].Chinese Science Bulletin,2019,64(26):2751-2760.

    • [7] 孙红霞.高含水期水驱特征曲线上翘新认识[J].特种油气藏,2016,23(1):92-95.SUN Hongxia.New understanding of upward waterflooding characteristic curve in high water-cut stage[J].Special Oil & Gas Reservoirs,2016,23(1):92-95.

    • [8] 黄广庆.特高含水期产量递减分析及递减率表征式 [J].科学技术与工程,2019,19(15):99-104.HUANG Guangqing.Production decline analysis and characterization formula of decline rate at the ultra-high water cut stage [J].Science Technology and Engineering,2019,19(15):99-104.

    • [9] 王继强,石成方,纪淑红,等.特高含水期新型水驱特征曲线[J].石油勘探与开发,2017,44(6):955-960.WANG Jiqiang,SHI Chengfang,JI Shuhong,et al.New water drive characteristic curves at ultra-high water cut stage [J].Petroleum Exploration and Development,2017,44(6):955-960.

    • [10] 陈元千,陶自强.高含水期水驱曲线的推导及上翘问题的分[J].断块油气田,1997,4(3):19-24.CHEN Yuanqian,TAO Ziqiang,Derivation of water drive curve at high water-cut stage and its analysis of upwarding problem [J].Fault-block Oil & Gas Field,1997,4(3):19-24.

    • [11] 刘晓华,邹春梅,姜艳东,等.现代产量递减分析基本原理与应用[J].天然气工业,2010,30(5):50-54.LIU Xiaohua,ZOU Chunmei,JIANG Yandong,et al.Theory and application of modern production decline analysis[J].Natural Gas Industry,2010,30(5):50-54.

    • [12] 张倩倩.产量递减分析方法简评[J].油气地球物理,2013,11(3):41-44.ZHANG Qianqian.Analysis method of production decline[J].Petroleum Geophysics,2013,11(3):41-44.

    • [13] LUO J,JI Y,LU W.Comparison of surrogate models based on different sampling methods for groundwater remediation[J].Journal of Water Resources Planning and Management,2019,145(5):04019015.

    • [14] CRNKOVIC-F L,ERLANDSON M.Geology driven EUR prediction using deep learning [ R ].SPE D031S030R002,2015.

    • [15] GU M,GOKARAJU D,CHEN D,et al.Shale fracturing characterization and optimization by using anisotropic acoustic interpretation,3D fracture modeling,and supervised machine learning[J].Petrophysics,2016,57(6):573-587.

    • [16] MOHAMED S,ROY A,SAYED A.Streamline rock facies classification with deep learning cognitive process [R].SPE D031S030R002,2017.

    • [17] WU P Y,JAIN V,KULKARNI M S,et al.Machine learning-based method for automated well-log processing and interpretation[R].SEG 2996973,2018.

    • [18] NOSHI C I,ASSEM A I,SCHUBERT J J.The role of big data analytics in exploration and production:a review of benefits and applications[R].SPE D012S021R001,2018.

    • [19] PHAM N,FOMEL S,DUNLAP D.Automatic channel detection using deep learning[J].Interpretation,2019,7(3):SE43-SE50.

    • [20] LI W.Classifying geological structure elements from seismic images using deep learning[R].SEG 2998036,2018.

    • [21] 柴艳军.基于灰色关联法的页岩气水平井产量主控因素分析[J].重庆科技学院学报(自然科学版),2018,20(2):32-34.CHAI Yanjun.Study on the main controlling factors of shale gas production based on grey correlation method [J].Journal of Chongqing University of Science and Technology(Natural Sciences Edition),2018,20(2):32-34.

    • [22] 王忠东,王业博,董红,等.页岩气水平井产量主控因素分析及产能预测 [J].测井技术,2017,41(5):577-582.WANG Zhongdong,WANG Yebo,DONG Hong,et al.Production main control factors analysis and productivity prediction for shale gas of horizontal well[J].Well Logging Technology,2017,41(5):577-582.

    • [23] 张蕾,窦宏恩,王天智,等.基于集成时域卷积神经网络模型的水驱油田单井产量预测方法[J].石油勘探与开发,2022,49(5):996-1004.ZHANG Lei,DOU Hongen,WANG Tianzhi,et al.A production prediction method of single well in water flooding oilfield based on integrated temporal convolutional network model [J].Petroleum Exploration and Development,2022,49(5):996-1004.

    • [24] 李春生,谭民浠,张可佳.基于改进型BP神经网络的油井产量预测研究[J].科学技术与工程,2011,11(31):7766-7769.LI Chunsheng,TAN Minxi,ZHANG Kejia.Research on single well production prediction based on improved BP neural networks[J].Science Technology and Engineering,2011,11(31):7766-7769.

    • [25] 田亚鹏,鞠斌山.基于遗传算法改进BP神经网络的页岩气产量递减预测模型[J].中国科技论文,2016,11(15):1710-1715.TIAN Yapeng,JU Binshan.A model for predicting shale gas production decline based on the BP neural network improved by the genetic algorithm [J].Chinese Scientific Papers,2016,11(15):1710-1715.

    • [26] 马林茂,李德富,郭海湘,等.基于遗传算法优化BP神经网络在原油产量预测中的应用:以大庆油田BED试验区为例[J].数学的实践与认识,2015,45(24):117-128.MA Linmao,LI Defu,GUO Haixiang,et al.BP Neural network based on genetic algorithm applied in crude oil production forecast:taking the BED test area of the Daqing oilfield as an example[J].Mathematics in Practice and Theory,2015,45(24):117-128.

    • [27] 樊灵,赵孟孟,殷川,等.基于BP神经网络的油田生产动态分析方法 [J].断块油气田,2013,20(2):204-206.FAN Ling,ZHAO Mengmeng,YIN Chuan,et al.Analysis method of oilfield production performance based on BP neural network[J].Fault-Block Oil & Gas Field,2013,20(2):204-206.

    • [28] HOLDAWAY K R.Data mining methodologies enhance probabilistic well forecasting[R].SPE D031S014R004,2013.

    • [29] 张方舟,严胡勇,杨立全,等.改进型灰色神经网络模型在油田产量中的应用[J].计算机技术与发展,2013,23(6):241-244.ZHANG Fangzhou,YAN Huyong,YANG Liquan,et al.Application of improved grey neural network model to oil yields[J].Computer Technology and Development,2013,23(6):241-244.

    • [30] NOSHI C I,EISSA M R,ABDALLA R M.An intelligent data driven approach for production prediction[R].OTC D041S048R007,2019.

    • [31] 韩益东,尹洪军,徐国涵,等.基于机器学习的高含水期油井产量预测方法[J].河南科学,2022,40(10):1569-1575.HAN Yidong,YIN Hongjun,XU Guohan,et al.Prediction method of oil well production in high water cut period based on machine learning[J].Henan Science,2022,40(10):1569-1575.

    • [32] CAO Q,BANERJEE R,GUPTA S,et al.Data driven production forecasting using machine learning[R].SPE D021S006R001,2016.

    • [33] 谷建伟,隋顾磊,李志涛,等.基于 ARIMA-Kalman 滤波器数据挖掘模型的油井产量预测[J].深圳大学学报(理工版),2018,35(6):575-581.GU Jianwei,SUI Gulei,LI Zhitao,et al.Oil well production forecasting method based on ARIMA-Kalman filter data mining model[J].Journal of Shenzhen University(Science and Engineering),2018,35(6):575-581.

    • [34] 张瑞,贾虎.基于多变量时间序列及向量自回归机器学习模型的水驱油藏产量预测方法[J].石油勘探与开发,2021,48(1):175-184.ZHANG Rui,JIA Hu.Production performance forecasting method based on multivariate time series and vector autoregressive machine learning model for waterflooding reservoirs[J].Petroleum Exploration and Development,2021,48(1):175-184.

    • [35] GUPTA S,FUEHRER F,JEYACHANDRA B C.Production forecasting in unconventional resources using data mining and timeseries analysis [ R ].SPE/CSUR D011S004R008,2014.

    • [36] 王洪亮,穆龙新,时付更,等.基于循环神经网络的油田特高含水期产量预测方法[J].石油勘探与开发,2020,47(5):1009-1015.WANG Hongliang,MU Longxin,SHI Fugeng,et al.Production prediction at ultra-high water cut stage via recurrent neural network[J].Petroleum Exploration and Development,2020,47(5):1009-1015.

    • [37] 刘巍,刘威,谷建伟.基于机器学习方法的油井日产油量预测[J].石油钻采工艺,2020,42(1):70-75.LIU Wei,LIU Wei,GU Jianwei.Oil production prediction based on amachine learning method[J].Oil Drilling & Production Technology,2020,42(1):70-75.

    • [38] 刘庆珍,黄昌硕.基于FCBF特征选择和XGBoost原则的油纸绝缘介电响应特征量优选研究[J].电力系统保护与控制,2022,50(15):50-59.LIU Qingzhen,HUANG Changshuo.Optimization of dielectric response characteristics of oil paper insulation based on FCBF feature selection and the XGBoost principle[J].Power System Protection and Control,2022,50(15):50-59.

  • 参考文献

    • [1] 孙彦达,王永卓.大庆外围低渗透油田产能预测影响因素[J].石油勘探与开发,2001,28(6):73-76.SUN Yanda,WANG Yongzhuo.The influence factors on predicting production capacity of peripheral low-perme ability oil fields of Daqing[J].Petroleum Exploration and Development,2001,28(6):73-76.

    • [2] 刘合,裴晓含,罗凯,等.中国油气田开发分层注水工艺技术现状与发展趋势[J].石油勘探与开发,2013,40(6):733-737.LIU He,PEI Xiaohan,LUO Kai,et al.Current status and trend of separated layer water flooding in China[J].Petroleum Exploration and Development,2013,40(6):733-737.

    • [3] 袁庆峰.油田开发实践与认识[M].北京:石油工业出版社,2014:83.

    • [4] 袁士义,王强.中国油田开发主体技术新进展与展望 [J].石油勘探与开发,2018,45(4):657-668.YUAN Shiyi,WANG Qiang,New progress and prospect of oilfields development technologies in China[J].Petroleum Exploration and Development,2018,45(4):657-668.

    • [5] 刘合,郑立臣,杨清海,等.分层采油技术的发展历程和展望[J].石油勘探与开发,2020,47(5):1027-1038.LIU He,ZHENG Lichen,YANG Qinghai,et al.Development and prospect of separated zone oil production technology[J].Petroleum Exploration and Development,2020,47(5):1027-1038.

    • [6] 郭曜豪,张磊,姚军,等.高含水期水驱特征曲线上翘机理及其影响因素 [J].科学通报,2019,64(26):2751-2760.GUO Yaohao,ZHANG Lei,YAO Jun,et al.Mechanisms of water flooding characteristic curve upwarping at high water-cut stage and influencing factors[J].Chinese Science Bulletin,2019,64(26):2751-2760.

    • [7] 孙红霞.高含水期水驱特征曲线上翘新认识[J].特种油气藏,2016,23(1):92-95.SUN Hongxia.New understanding of upward waterflooding characteristic curve in high water-cut stage[J].Special Oil & Gas Reservoirs,2016,23(1):92-95.

    • [8] 黄广庆.特高含水期产量递减分析及递减率表征式 [J].科学技术与工程,2019,19(15):99-104.HUANG Guangqing.Production decline analysis and characterization formula of decline rate at the ultra-high water cut stage [J].Science Technology and Engineering,2019,19(15):99-104.

    • [9] 王继强,石成方,纪淑红,等.特高含水期新型水驱特征曲线[J].石油勘探与开发,2017,44(6):955-960.WANG Jiqiang,SHI Chengfang,JI Shuhong,et al.New water drive characteristic curves at ultra-high water cut stage [J].Petroleum Exploration and Development,2017,44(6):955-960.

    • [10] 陈元千,陶自强.高含水期水驱曲线的推导及上翘问题的分[J].断块油气田,1997,4(3):19-24.CHEN Yuanqian,TAO Ziqiang,Derivation of water drive curve at high water-cut stage and its analysis of upwarding problem [J].Fault-block Oil & Gas Field,1997,4(3):19-24.

    • [11] 刘晓华,邹春梅,姜艳东,等.现代产量递减分析基本原理与应用[J].天然气工业,2010,30(5):50-54.LIU Xiaohua,ZOU Chunmei,JIANG Yandong,et al.Theory and application of modern production decline analysis[J].Natural Gas Industry,2010,30(5):50-54.

    • [12] 张倩倩.产量递减分析方法简评[J].油气地球物理,2013,11(3):41-44.ZHANG Qianqian.Analysis method of production decline[J].Petroleum Geophysics,2013,11(3):41-44.

    • [13] LUO J,JI Y,LU W.Comparison of surrogate models based on different sampling methods for groundwater remediation[J].Journal of Water Resources Planning and Management,2019,145(5):04019015.

    • [14] CRNKOVIC-F L,ERLANDSON M.Geology driven EUR prediction using deep learning [ R ].SPE D031S030R002,2015.

    • [15] GU M,GOKARAJU D,CHEN D,et al.Shale fracturing characterization and optimization by using anisotropic acoustic interpretation,3D fracture modeling,and supervised machine learning[J].Petrophysics,2016,57(6):573-587.

    • [16] MOHAMED S,ROY A,SAYED A.Streamline rock facies classification with deep learning cognitive process [R].SPE D031S030R002,2017.

    • [17] WU P Y,JAIN V,KULKARNI M S,et al.Machine learning-based method for automated well-log processing and interpretation[R].SEG 2996973,2018.

    • [18] NOSHI C I,ASSEM A I,SCHUBERT J J.The role of big data analytics in exploration and production:a review of benefits and applications[R].SPE D012S021R001,2018.

    • [19] PHAM N,FOMEL S,DUNLAP D.Automatic channel detection using deep learning[J].Interpretation,2019,7(3):SE43-SE50.

    • [20] LI W.Classifying geological structure elements from seismic images using deep learning[R].SEG 2998036,2018.

    • [21] 柴艳军.基于灰色关联法的页岩气水平井产量主控因素分析[J].重庆科技学院学报(自然科学版),2018,20(2):32-34.CHAI Yanjun.Study on the main controlling factors of shale gas production based on grey correlation method [J].Journal of Chongqing University of Science and Technology(Natural Sciences Edition),2018,20(2):32-34.

    • [22] 王忠东,王业博,董红,等.页岩气水平井产量主控因素分析及产能预测 [J].测井技术,2017,41(5):577-582.WANG Zhongdong,WANG Yebo,DONG Hong,et al.Production main control factors analysis and productivity prediction for shale gas of horizontal well[J].Well Logging Technology,2017,41(5):577-582.

    • [23] 张蕾,窦宏恩,王天智,等.基于集成时域卷积神经网络模型的水驱油田单井产量预测方法[J].石油勘探与开发,2022,49(5):996-1004.ZHANG Lei,DOU Hongen,WANG Tianzhi,et al.A production prediction method of single well in water flooding oilfield based on integrated temporal convolutional network model [J].Petroleum Exploration and Development,2022,49(5):996-1004.

    • [24] 李春生,谭民浠,张可佳.基于改进型BP神经网络的油井产量预测研究[J].科学技术与工程,2011,11(31):7766-7769.LI Chunsheng,TAN Minxi,ZHANG Kejia.Research on single well production prediction based on improved BP neural networks[J].Science Technology and Engineering,2011,11(31):7766-7769.

    • [25] 田亚鹏,鞠斌山.基于遗传算法改进BP神经网络的页岩气产量递减预测模型[J].中国科技论文,2016,11(15):1710-1715.TIAN Yapeng,JU Binshan.A model for predicting shale gas production decline based on the BP neural network improved by the genetic algorithm [J].Chinese Scientific Papers,2016,11(15):1710-1715.

    • [26] 马林茂,李德富,郭海湘,等.基于遗传算法优化BP神经网络在原油产量预测中的应用:以大庆油田BED试验区为例[J].数学的实践与认识,2015,45(24):117-128.MA Linmao,LI Defu,GUO Haixiang,et al.BP Neural network based on genetic algorithm applied in crude oil production forecast:taking the BED test area of the Daqing oilfield as an example[J].Mathematics in Practice and Theory,2015,45(24):117-128.

    • [27] 樊灵,赵孟孟,殷川,等.基于BP神经网络的油田生产动态分析方法 [J].断块油气田,2013,20(2):204-206.FAN Ling,ZHAO Mengmeng,YIN Chuan,et al.Analysis method of oilfield production performance based on BP neural network[J].Fault-Block Oil & Gas Field,2013,20(2):204-206.

    • [28] HOLDAWAY K R.Data mining methodologies enhance probabilistic well forecasting[R].SPE D031S014R004,2013.

    • [29] 张方舟,严胡勇,杨立全,等.改进型灰色神经网络模型在油田产量中的应用[J].计算机技术与发展,2013,23(6):241-244.ZHANG Fangzhou,YAN Huyong,YANG Liquan,et al.Application of improved grey neural network model to oil yields[J].Computer Technology and Development,2013,23(6):241-244.

    • [30] NOSHI C I,EISSA M R,ABDALLA R M.An intelligent data driven approach for production prediction[R].OTC D041S048R007,2019.

    • [31] 韩益东,尹洪军,徐国涵,等.基于机器学习的高含水期油井产量预测方法[J].河南科学,2022,40(10):1569-1575.HAN Yidong,YIN Hongjun,XU Guohan,et al.Prediction method of oil well production in high water cut period based on machine learning[J].Henan Science,2022,40(10):1569-1575.

    • [32] CAO Q,BANERJEE R,GUPTA S,et al.Data driven production forecasting using machine learning[R].SPE D021S006R001,2016.

    • [33] 谷建伟,隋顾磊,李志涛,等.基于 ARIMA-Kalman 滤波器数据挖掘模型的油井产量预测[J].深圳大学学报(理工版),2018,35(6):575-581.GU Jianwei,SUI Gulei,LI Zhitao,et al.Oil well production forecasting method based on ARIMA-Kalman filter data mining model[J].Journal of Shenzhen University(Science and Engineering),2018,35(6):575-581.

    • [34] 张瑞,贾虎.基于多变量时间序列及向量自回归机器学习模型的水驱油藏产量预测方法[J].石油勘探与开发,2021,48(1):175-184.ZHANG Rui,JIA Hu.Production performance forecasting method based on multivariate time series and vector autoregressive machine learning model for waterflooding reservoirs[J].Petroleum Exploration and Development,2021,48(1):175-184.

    • [35] GUPTA S,FUEHRER F,JEYACHANDRA B C.Production forecasting in unconventional resources using data mining and timeseries analysis [ R ].SPE/CSUR D011S004R008,2014.

    • [36] 王洪亮,穆龙新,时付更,等.基于循环神经网络的油田特高含水期产量预测方法[J].石油勘探与开发,2020,47(5):1009-1015.WANG Hongliang,MU Longxin,SHI Fugeng,et al.Production prediction at ultra-high water cut stage via recurrent neural network[J].Petroleum Exploration and Development,2020,47(5):1009-1015.

    • [37] 刘巍,刘威,谷建伟.基于机器学习方法的油井日产油量预测[J].石油钻采工艺,2020,42(1):70-75.LIU Wei,LIU Wei,GU Jianwei.Oil production prediction based on amachine learning method[J].Oil Drilling & Production Technology,2020,42(1):70-75.

    • [38] 刘庆珍,黄昌硕.基于FCBF特征选择和XGBoost原则的油纸绝缘介电响应特征量优选研究[J].电力系统保护与控制,2022,50(15):50-59.LIU Qingzhen,HUANG Changshuo.Optimization of dielectric response characteristics of oil paper insulation based on FCBF feature selection and the XGBoost principle[J].Power System Protection and Control,2022,50(15):50-59.

  • Baidu
    map