-
页岩油作为重要的非常规油气资源,在能源安全与结构转型中具有战略意义。精准的产量预测对开发规划、决策优化、风险管控和成本控制至关重要[1-3]。东营凹陷作为渤海湾盆地的重要油气富集区,蕴藏着巨大的页岩油资源潜力,但其复杂的地质构造和开采条件为产量预测带来了诸多挑战[4-5]。近年来,为解决页岩油气产量预测误差较大的问题,研究者们提出了多种基于机器学习的创新方法以提升预测精度和优化开发方案[6-13]。但页岩油产量预测涉及大量复杂数据,如何科学筛选关键特征并考虑时间动态关联性是现有研究的薄弱环节。多数研究侧重静态相关性,忽视动态因果关系,可能导致冗余输入影响模型精度。有效捕捉动态关联性的特征选择方法对提升预测模型的科学性和实用性至关重要。笔者以东营凹陷页岩油产量预测为研究对象,系统搜集并整理现场多维动态数据,提出一种基于Granger因果分析和长短期记忆神经网络(LSTM)的产量预测方法。
-
1 数据与特征相关性分析
-
1.1 数据特征
-
对位于东营凹陷的两口页岩油井X1和X2的生产数据进行分析,旨在探讨不同生产参数对日产油量的影响及其背后的规律性。选取的特征包括日产油量(m3)、日产气量(m3)、日产水量(m3)、最大油压(MPa)、最小油压(MPa)、井口最高温度(℃)、井口最低温度(℃)、油嘴直径(mm)以及生产时间(h)。这些特征涵盖了生产过程中可能影响产量的多个方面,旨在全面评估不同因素对油井生产性能的影响。
-
两口页岩油井均处于试采阶段,井X1的生产时间为61 d,井X2为58 d,整体生产时间相对较短,但能够提供一定的生产动态信息。从生产动态(图1)来看,井X1逐渐趋于稳定,显示出产量波动逐渐减小的趋势,而井X2则处于持续上升阶段,产量呈现增长趋势。
-
图1 页岩油井生产动态资料
-
Fig.1 Profiles of shale well production dynamics
-
1.2 Spearman相关性分析
-
Spearman分析是一种基于秩相关性的统计方法,用于评估两个变量之间的单调关系[14]。首先,对生产数据与日产油量进行了Spearman相关性分析,结果如图2所示。油嘴直径作为控制井口流量的重要参数,直接影响产量调节。对于井X1,油嘴直径与日产油量之间呈显著正相关,相关系数为0.86;在井X2中,油嘴直径与日产油量的相关性不明显,这可能与井X2当前处于产量上升阶段有关,其他因素可能在驱动产量增加的过程中起到了更为关键的作用。
-
图2 Spearman相关性分析
-
Fig.2 Spearman correlation analysis
-
此外,两口井的日产气量均与日产油量表现出良好的正相关性,表明两口井的储层具有较强的驱动力,这种驱动力有助于油气共同产出。而对于日产水量与日产油量的关系,井X1中二者呈正相关,表明在井X1的生产初期,水的产出有助于维持地层压力,从而提高日产油量。相反,井X2中日产水量与日产油量呈负相关,这可能是因为井X2处于产量上升阶段,油相逐渐占据主导地位,水相的流动被抑制,导致日产水量下降。
-
井口压力对产量的影响主要体现在其对原油流动驱动力的调节上。较高的井口压力会增加流体流动的阻力,从而降低原油的流动性和日产量;而较低的井口压力则可能促进油藏内流体的外流,提高产量。然而,过低的井口压力也可能对地层造成损害,影响长期生产能力。本文中井X1和井X2的井口压力均与日产油量呈负相关关系,但井X2中的相关性较弱,这可能是由于井X2的地质条件较为复杂,压力对产量的影响不如井X1显著。
-
井口温度的变化也对原油的流动性产生重要影响。通常情况下,温度升高会降低原油的黏度,增强流动性,从而提高产量。然而,在井X2中,井口温度与日产油量呈现负相关关系,这可能是因为井X2的温度下降与油藏流体性质的改善相关。温度降低可能减少了挥发性成分的逸出,从而使原油的油气比得到优化,增加了原油的有效产出。
-
1.3 Granger因果检验
-
然而,生产动态数据是随时间变化的,过去的历史生产数据对于当前的产量预测具有重要影响。因此,仅依靠相关性分析来选择机器学习模型的输入是不够全面的。在此基础上,引入格兰杰因果关系(Granger causality)分析方法对生产动态数据进行进一步分析。
-
格兰杰因果关系分析是一种用于检测时间序列之间因果关系的统计方法,最早由经济学家Clive Granger提出并因此得名[15]。需要注意的是,格兰杰因果关系并不意味着变量之间存在实际的因果联系(即一个变量的变化直接导致另一个变量的变化),而是基于预测能力的定义。具体而言,如果一个变量的历史信息能够显著提高对另一个变量的预测能力,则可以认为前者对后者具有格兰杰因果效应。具体而言,如图3所示,假设变量 X的A点和B点分别对变量Y的C点和D点产生影响,那么认为X对Y通过检验不同时间序列之间的格兰杰因果关系,可以有效揭示变量间的动态联系及其潜在的相互影响,为生产动态的全面分析和预测提供更为科学的依据。在时间序列分析中,Granger 因果关系检验要求变量平稳,否则可能导致伪回归,影响推断准确性。因此,需先进行平稳性检验,若变量非平稳,可通过差分使其平稳,以确保因果关系分析的可靠性,并提升模型预测的准确性。
-
图3 格兰杰时序关系原理示意图
-
Fig.3 Schematic diagram of Granger’s timing relationship principle
-
对于时间序列Yt和Xt,通常使用自回归模型(AR模型)来进行分析。基本的回归模型可以表示为
-
式中,Yt为因变量,即目标序列;Xt为自变量,用来预测Yt的时间序列;α0为常数项;βi、γi为回归系数,表示自变量的影响程度,若γi=0,意味着过去的Xt不能提供关于Yt的额外信息;p为滞后期,表示使用过去多少期的历史数据来进行预测;εt为误差项,代表模型无法解释的部分。
-
在回归分析中,通过比较加入自变量滞后项前后模型的拟合优度,计算F统计量:
-
式中,Sr为在不包括滞后期的情况下的残差平方和;Su为在包含滞后期的情况下的残差平方和;q为滞后期数;n为样本数量;k为模型的参数个数。如果F统计量对应的p值小于设定的显著性水平(设为0.05),则X与Y之间存在格兰杰因果关系。
-
(1)平稳性分析。对两口井的原始时间序列数据进行 ADF 平稳性检验[15],发现针对井1而言,最高温度、最低温度和最小压力3个变量为平稳序列,油嘴大小、生产时间、最大压力、日产水量和日产气量采用一阶差分后平稳;对于井2而言,油嘴大小、最高温度、最低温度和日产水量4个变量为平稳序列,而生产时间、最大压力、最小压力和日产气量采用一阶差分后平稳。
-
(2)检验结果。图4展示了两口页岩油井生产动态数据在不同滞后期下的Granger因果关系显著性水平(p值)。红色虚线表示显著性水平为0.05的临界值,当p值小于0.05时,说明该变量与日产油量之间存在显著的Granger因果关系。对于井X1,最小压力与日产油量之间的Granger因果关系最为显著,除了滞后期为1 d时未能显著外,其他滞后期均表现出显著性,最佳滞后期为7 d。最大压力的最佳滞后期为8 d,反映出压力变化对日产油量的影响较为持久,需要较长时间才能显现其完整效应。
-
图4 格兰杰时序关系分析
-
Fig.4 Analysis of Granger temporal relations
-
其次,日产气量与日产油量的Granger因果关系也表现显著,最佳滞后期为1 d,表明气量的短期波动对日产油量的变化具有较强的预测作用。油嘴尺寸的最佳滞后期为2 d,表明油嘴直径对日产油量的影响主要体现在较短时间内,这与其在井口流量调节中的作用一致。生产时间的最佳滞后期为5 d,说明生产时长对日产油量的影响具有滞后效应,可能与油藏开发进程和流体流动特性相关。
-
在温度因素方面,井X1的最高温度和最低温度分别表现出7 d和8 d的最佳滞后期,表明温度变化对油藏流体流动性产生了较长时间的影响,尤其较高的温度有助于降低原油黏度,促进流动性,进而提高日产油量。需要指出的是,日产水量与日产油量之间未表现出显著的Granger因果关系,可能表明水产出对日产油量的影响较为复杂,尤其是在井X1的生产阶段,水相产出与油相流动之间可能存在非线性关系,或者受到其他因素如地层压力和油气比变化的影响,从而导致两者之间的因果关系不明显。
-
图4(b)展示了井X2的生产动态数据在不同滞后期下的Granger因果关系分析。与井X1相比,井X2的所有特征均表现出显著的Granger因果关系,可能与其处于不同的开发阶段有关。井X2的最大压力与日产油量之间的因果关系最为显著,且所有滞后期均表现为显著,最佳滞后期为4 d。与井X1相比,井X2的压力变化对日产油量的短期调节作用更为显著,且反应较为迅速。
-
此外,井X2中,日产气量与日产油量的最佳滞后期为2 d,表明气量波动对日产油量的直接影响较为强烈;生产时间的最佳滞后期为1 d,可能反映出井X2处于较敏感的开发阶段,生产动态对产量的影响具有较强的即时性。
-
1.4 机器学习模型输入选择
-
对于井X1,Spearman相关性分析显示,所有选定的输入特征均与日产油量存在一定程度的相关性,可作为模型输入。然而,通过进一步的Granger因果关系分析发现,日产水量与日产油量之间并不存在显著的因果关系。这表明,尽管日产水量与日产油量在统计上可能具有相关性,但其对日产油量的直接预测能力较弱,甚至可能引入不必要的噪声。因此,在井X1的预测模型中,建议根据Granger因果关系的结果,剔除日产水量特征,保留其他特征,以提升模型的预测性能。
-
对于井X2,Spearman相关性分析表明,最小压力、最大压力和油嘴尺寸与日产油量之间的相关性较弱,这表明这些特征的单一线性相关性不足以显著反映其对日产油量的影响。然而,Granger因果关系分析进一步揭示,所有选定特征与日产油量之间均存在显著的因果关系。这表明,即使某些特征的相关性较低,它们可能通过非线性机制或滞后效应对日产油量产生重要影响。因此,在井X2的预测模型中,建议依据Granger分析结果,保留所有特征作为输入,以全面捕捉不同特征对日产油量的潜在影响(表1)。
-
注:√代表已选择,×代表没选择。
-
2 页岩油产量预测机器学习方法构建
-
2.1 时间序列数据处理
-
时间序列数据的预测通常通过将历史数据作为输入特征来推断未来结果。为了建立输入与输出之间的有效关系,需将该问题转化为监督学习问题。在这一过程中,选定的自变量的过去值被用作输入特征,并依据特定的时间步长进行处理。为此,常采用滑动窗口技术,将生产动态数据划分为一组重叠的窗口或时间段。具体而言,固定大小的窗口沿时间序列以一步的步长移动,如图5所示。通过这种方式,可以将时间序列数据转化为一系列特征-标签对,从而为监督学习模型提供所需的训练数据。
-
对于时间点t的时间序列样本集,记为,其中m表示特征的数量。为了构建监督学习模型,使用一个固定值的窗口k来提取时间序列数据,其中k是一个超参数,根据数据的特性和预测任务的需求进行调整。k确定了输入特征的时间步长,用于构建输入和输出之间的映射关系。
-
图5 时序数据处理示意图
-
Fig.5 Schematic diagram of time series data processing
-
在将时间序列数据转换为监督学习问题后,为了避免激活函数饱和、变量偏差等潜在问题,对数据进行归一化处理显得尤为重要。因此,本研究采用MinMaxScaler对数据进行归一化,并仅在训练集上进行拟合。具体而言,MinMaxScaler在训练集上计算归一化所需的参数,并利用这些参数对训练集和测试集的数据进行转换,确保其特征值被映射到统一的范围[0,1]内。这一处理方法能够有效解决不同特征尺度之间的不一致性,提升模型的训练稳定性和预测能力。归一化的具体数学表达式为
-
式中,xn为归一化后的特征值;xi为原始特征值的第i个观测值;xmax、xmin分别为该特征的最大值和最小值;x′max和x′min分别为新特征范围的最大值和最小值。
-
2.2 长短期记忆网络
-
长短期记忆网络(long short-term memory,LSTM)旨在有效解决长期依赖问题,同时通过相对较少的参数调整实现优异的性能[16]。图6展示了LSTM单元中各个细胞之间的循环关系[16]。由于LSTM单元的特殊结构及其“门控”机制,在每一时刻,某些信息通过门控结构选择性地影响循环神经网络的状态。因此,LSTM并非简单地将输入数据与循环单元进行线性变换后,应用逐元素的非线性激活函数,而是通过一系列门控结构来调节信息流动。
-
图6 LSTM模型原理图
-
Fig.6 Schematic of principle of LSTM model
-
“门控”结构利用Sigmoid激活函数来控制输入信息的传递。当门控完全打开(即Sigmoid层的输出为1)时,所有信息都可以通过;当门控完全关闭(即Sigmoid层的输出为0)时,信息则被阻止通过。
-
忘记门根据当前输入、前一时刻的输出和偏置决定哪些记忆需要遗忘。fi,t用来表示当前时刻第i个LSTM单元的忘记门输出值,可通过以下公式计算:
-
式中,S为Sigmoid激活函数; xt为当前时刻的输入向量;ot-1包含上一时刻LSTM单元的所有输出,可以看作是当前的隐层向量;bf、Uf和Wf分别为LSTM单元忘记门的输入偏置、输入权重和循环权重。
-
输入门的更新方式与忘记门类似,它根据xt和bg(输入门的输入偏置)以及ot-1确定哪些部分将进入当前时刻的状态si,t。如果Ug和Wg分别作为LSTM单元输入门的输入权重和循环权重,并且 gi,t是当前时刻输入门的值,输入门的更新方式与忘记门类似,它根据xt和bg(输入门的输入偏置)以及ot-1确定哪些部分将进入当前时刻的状态si,t。如果Ug和Wg分别作为LSTM单元输入门的输入权重和循环权重,并且gi,t是当前时刻输入门的值,它可以通过以下公式计算:
-
输出门根据当前时刻的最新状态si,t和上一时刻的输出ot-1以及当前输入xt来决定当前时刻的输出ot。qt表示输出门的值,它可以通过以下公式计算:
-
式中,bq和Uq分别作为偏置和输入权重,而Wq用作输出门的循环权重。
-
2.3 粒子群算法(PSO)
-
PSO是基于鸟群运动的两个主要特征(位置和速度)发展而来的[17]。作为一种广泛应用的元启发式算法,PSO已成功解决诸如网络训练和函数优化等多种优化问题。其优化过程中的第l次迭代公式可以简化为
-
式中,粒子位置Pl是粒子当前的状态,速度Vl表示粒子在当前位置的移动量,二者相加能够计算出粒子在下一步的准确位置Pl+1。
-
根据个体最优值(Pb)和最优位置(Pg),更新后的速度值为
-
式中,a为惯性权重;c1和c2为加速度系数;r1和r2为每次迭代产生的两个随机系数。
-
2.4 PSO-LSTM页岩油产量预测模型
-
2.4.1 模型构建流程
-
使用粒子群优化(PSO)算法来优化LSTM模型的超参数(图7)。具体流程如下:
-
(1)数据准备阶段。选取两口页岩油井的数据,并按照每口井数据的前70%作为训练集,后30%作为测试集进行划分。
-
(2)LSTM模型配置。LSTM模型的关键超参数包括隐藏层数量(nhl)、每个隐藏层的神经元数量(nu)、批次大小(b)以及滑动窗口大小(w)。为避免模型过拟合,采用了早停机制:损失函数采用均方误差,当验证集上的损失在连续20个训练周期内没有改善时,训练将自动停止。
-
(3)PSO优化LSTM模型配置。利用粒子群优化算法搜索上述超参数的最优组合(表2),粒子群规模设定为100,搜索空间范围为:{nhl∈[1,2],nu∈[20,160],b∈[2,8],w∈[2,12]}。PSO的最大迭代次数设定为100,惯性权重a=0.5,加速度系数c1=2,c =2。
-
图7 PSO-LSTM流程
-
Fig.7 PSO-LSTM flowchart
-
2.4.2 评价指标
-
采用均方根误差ERMS和Pearson相关系数(R)来反映页岩油产量预测模型的性能:
-
式中,yi和pi分别为日产油量实际值和预测值;N为样本点数;D为方差;Cov(Y,P)为协方差函数,表示变量Y与变量P之间相互关系的特征。ERMS越小,R值越高,模型性能越好。
-
2.4.3 预测结果分析
-
为了验证Granger-LSTM模型的预测性能,选择了RNN(循环神经网络)、GRU(门控循环单元)以及TCN(时空卷积网络)模型作为对比。这些模型都是广泛用于处理时序数据的先进算法。
-
循环神经网络是一种专为处理序列数据而设计的神经网络结构[18]。它通过引入隐藏层状态来记忆时间序列中的历史信息,从而能够捕捉数据中的时间依赖性。然而,RNN在处理较长时间序列时常常面临梯度消失和梯度爆炸的问题,导致网络难以学习长期依赖关系,这也限制了其在复杂时序任务中的性能表现。
-
为了解决RNN在长时间依赖问题上的局限,GRU应运而生[19]。GRU是一种改进型的RNN,其通过引入门控机制来控制信息的流动,从而有效地保留重要的历史信息并忽略无关的数据。
-
时空卷积网络也是一种近年来在时序数据建模中获得广泛关注的模型[20]。与传统的循环结构不同,TCN采用一维卷积操作来处理时序信息,其通过因果卷积和空洞卷积的结合,实现对长序列的有效建模。TCN具有并行计算能力,可以避免循环网络中序列依赖带来的训练效率问题,尤其在捕捉长时间范围的特征时表现出色。其卷积结构使得TCN在处理长时间依赖时更加高效,并且能够灵活调节感受野的大小,以适应不同任务需求。
-
这几种算法的输入与LSTM模型相同,均通过粒子群优化算法来选择最佳参数,具体的最优参数如表2所示。
-
从两口井的测试集结果(图8和表3)可以看出,LSTM、RNN、GRU和TCN模型均能够较为准确地预测产量,尤其是LSTM模型,凭借其强大的时间序列建模能力和对长期依赖特征的捕捉能力,整体效果最为优异。此外,使用Granger因果分析筛选输入特征的模型,其预测性能优于基于Spearman相关性分析筛选特征的模型。这种优势表现为更低的均方根误差和更高的相关系数。Spearman分析仅考虑特征与目标变量之间的静态相关性,忽略了时间因果关系,从而限制了特征对目标变量的解释力,导致预测性能不如基于Granger分析的模型。
-
图8 生产动态预测
-
Fig.8 Forecasting of production dynamics
-
进一步地,从图8中可以清晰地看出,对于井X1的生产情况,基于Granger分析的Granger-LSTM模型(红色线)在预测性能上显著优于基于Spearman分析的Spearman-LSTM模型(蓝色线)。在训练集阶段,该阶段包含钻塞和生产调整过程,日产油量波动剧烈,实际产量(黑色线)呈现出显著的非平稳特性。此时,Granger-LSTM模型凭借对时间序列特征的精准建模,能够更准确地捕捉剧烈波动趋势,其预测值与实际值的拟合度较高;相较之下,Spearman-LSTM模型虽然能够捕捉总体趋势,但在部分区域表现出预测滞后或偏差,表明其对复杂波动的适应性较弱。在测试集阶段,尽管日产油量整体趋于平稳,但局部仍存在细微波动。Granger-LSTM模型在这一阶段的表现更为出色,其预测值能够敏锐地响应实际产量的动态变化。
-
对于井X2的生产情况,产量整体处于逐渐上升阶段。然而,第47天日产油量出现了突增现象,这是由于前一天进行了关井24 h的操作,导致生产中断时间较长,使得关闭期间累积的产量集中释放,从而造成了日产油量的异常增大。尽管该异常点已被剔除,但其影响仍然传递到后续的生产数据(即第47天)中。因此,为了更合理地评估产量预测模型的性能,第47天的预测结果被排除在评估之外。从剩余数据的预测结果来看,Granger-LSTM和Spearman-LSTM两类模型均能够较好地贴合实际页岩油产量变化趋势。然而,Spearman-LSTM模型在处理产量波动和动态变化方面表现略逊于Granger-LSTM。
-
3 结论
-
(1)页岩油产量受多种复杂因素的影响,特征数据的选择在预测模型构建中具有关键作用。Granger因果分析能够全面考虑时间动态因素对产量的影响,其筛选出的特征变量显著提升了后续机器学习建模的准确性和效率。
-
(2)粒子群优化算法(PSO)以其高效的全局搜索能力,能够快速优选出机器学习模型的最优超参数,从而提高模型的预测性能与鲁棒性,为复杂时序数据的建模提供了有效的优化手段。
-
(3)LSTM、RNN、GRU和TCN等时序建模方法均能够较好地实现页岩油产量预测。然而,从整体性能来看,LSTM模型在捕捉时间序列的长期依赖和非线性特征方面表现最佳,预测精度和稳定性均优于其他方法。
-
参考文献
-
[1] 雷群,翁定为,熊生春,等.中国石油页岩油储集层改造技术进展及发展方向[J].石油勘探与开发,2021,48(5):1035-1042.LEI Qun,WENG Dingwei,XIONG Shengchun,et al.Progress and development directions of shale oil reservoir stimulation technology of China National Petroleum Corporation[J].Petroleum Exploration and Development,2021,48(5):1035-1042.
-
[2] 周济民,张海晨,王沫然.基于物理经验模型约束的机器学习方法在页岩油产量预测中的应用[J].应用数学和力学,2021,42(9):881-890.ZHOU Jimin,ZHANG Haichen,WANG Moran.Machine learning with physical empirical model constraints for prediction of shale oil production[J].Applied Mathematics and Mechanics,2021,42(9):881-890.
-
[3] 刘巍,曹小朋,徐耀东,等.页岩油井生产数据分析与产能评价方法[J].断块油气田,2023,30(4):572-578.LIU Wei,CAO Xiaopeng,XU Yaodong,et al.Production data analysis and productivity evaluation method for shale oil wells[J].Fault-Block Oil & Gas Field,2023,30(4):572-578.
-
[4] 王伟庆,李朋波,李博,等.渤海湾盆地东营凹陷古近系富碳酸盐页岩沉积微相组合及沉积环境分析[J].石油实验地质,2024,46(3):522-531.WANG Weiqing,LI Pengbo,LI Bo,et al.Sedimentary microfacies and environment of Paleogene carbonate-rich shale in Dongying Sag,Bohai Bay Basin[J].Petroleum Geology & Experiment,2024,46(3):522-531.
-
[5] 孙鑫,刘礼军,侯树刚,等.基于页岩油水两相渗流特性的油井产能模拟研究[J].石油钻探技术,2023,51(5):167-172.SUN Xin,LIU Lijun,HOU Shugang,et al.Numerical simulation of shale oil well productivity based on shale oil-water two-phase flow characteristics[J].Petroleum Drilling Techniques,2023,51(5):167-172.
-
[6] 陈雪莲,程凤,韩旺,等.套管中弯曲型Lamb波频散特征的理论和实验分析[J].开云电竞投注学报(自然科学版),2024,48(5):70-76.CHEN Xuelian,CHENG Feng,HAN Wang,et al.Theoretical and experimental study on flexural-wave dispersion characteristics in cased wells[J].Journal of China University of Petroleum(Edition of Natural Science),2024,48(5):70-76.
-
[7] 冯震,任宗孝,徐建平,等.基于大数据的非常规油气藏产能预测模型研究[J].石油化工应用,2021,40(7):35-38,68.FENG Zhen,REN Zongxiao,XU Jianping,et al.Research on unconventional reservoir productivity prediction model based on big data[J].Petrochemical Industry Application,2021,40(7):35-38,68.
-
[8] 韩珊,车明光,苏旺,等.四川盆地威远区块页岩气单井产量预测方法及应用[J].特种油气藏,2022,29(6):141-149.HAN Shan,CHE Mingguang,SU Wang,et al.Prediction method and application of single shale gas well production in Weiyuan Block,Sichuan Basin[J].Special Oil & Gas Reservoirs,2022,29(6):141-149.
-
[9] 张凤姣,邓少贵,陈琰,等.基于可解释神经网络的非常规储层参数建模范式[J].开云电竞投注学报(自然科学版),2023,47(3):62-69.ZHANG Fengjiao,DENG Shaogui,CHEN Yan,et al.A modeling paradigm for unconventional reservoir parameters based on an interpretable neural network[J].Journal of China University of Petroleum(Edition of Natural Science),2023,47(3):62-69.
-
[10] 马文礼,李治平,孙玉平,等.基于机器学习的页岩气产能非确定性预测方法研究[J].特种油气藏,2019,26(2):101-105.MA Wenli,LI Zhiping,SUN Yuping,et al.Non-deterministic shale gas productivity forecast based on machine learning[J].Special Oil & Gas Reservoirs,2019,26(2):101-105.
-
[11] 周玉辉,龚杰,盛广龙,等.基于人工神经网络的页岩油藏产量预测定量表征模型[J].大庆石油地质与开发,2023,42(5):147-153.ZHOU Yuhui,GONG Jie,SHENG Guanglong,et al.Quantitative characterization model of shale reservoir production prediction based on artificial neural network[J].Petroleum Geology & Oilfield Development in Daqing,2023,42(5):147-153.
-
[12] 郑红霞,李凌昊,盛辉,等.基于无人机贴近摄影测量的剖面数字露头系统研发及岩层面重构方法[J].开云电竞投注学报(自然科学版),2023,47(2):53-63.ZHENG Hongxia,LI Linghao,SHENG Hui,et al.Research of digital outcrop profile system and reconstruction method of rock surface based on unmanned aerial vehicle close photogrammetry[J].Journal of China University of Petroleum(Edition of Natural Science),2023,47(2):53-63.
-
[13] MISRA S,ELKADY M,KUMAR V,et al.Use of transfer learning in shale production forecasting[C/OL].International Petroleum Technology Conference held in Dhahran,Saudi Arabia,12-14 February 2024.[2024-12-01]https://doi.org/10.2523/IPTC-23438-MS.
-
[14] CROUX C,DEHON C.Influence functions of the Spearman and Kendall correlation measures[J].Statistical Methods & Applications,2010,19(4):497-515.
-
[15] SHOJAIE A,FOX E B.Granger causality:a review and recent advances[J].Annual Review of Statistics and Its Application,2022,9(1):289-319.
-
[16] ZHANG F,DENG S,WANG S,et al.Convolutional neural network long short-term memory deep learning model for sonic well log generation for brittleness evaluation[J].Interpretation,2022,10(2):T367-T378.
-
[17] KENNEDY J,EBERHART R.Particle swarm optimization[C]//Proceedings of ICNN95-International Conference on Neural Networks,Perth,WA,Australia,Perth,WA:IEEE,c1995:1942-1948.
-
[18] MEDSKER L,JAIN L C.Recurrent neural networks:design and applications[M].Boca Raton:CRC Press,1999:2-16.
-
[19] SHEN G,TAN Q,ZHANG H,et al.Deep learning with gated recurrent unit networks for financial sequence predictions[J].Procedia Computer Science,2018,131:895-903.
-
[20] LEA C,VIDAL R,REITER A,et al.Temporal convolutional networks:a unified approach to action segmentation[C]//Computer Vision-ECCV 2016 Workshops.Cham:Springer,2016:47-54.
-
摘要
页岩油水平井生产动态变化复杂,现有预测技术难以达到理想精度。以东营凹陷为研究区域,基于X1和X2两口井的生产数据,首先采用 Granger 因果分析筛选与页岩油产量高度相关的时间动态因子,优化模型输入特征;随后,利用长短期记忆网络(LSTM)构建产量预测模型,并通过粒子群算法优化超参数,同时对比循环神经网络(RNN)、门控循环单元(GRU)和时空卷积网络(TCN)的预测性能。结果表明,特征选择对产量预测至关重要,以井X1的 LSTM 模型为例,基于 Granger 分析的特征筛选方法使均方根误差较基于 Spearman 分析的方法降低了 3.41 m3,显著提升了预测精度。尽管多种时序模型均展现出良好的预测性能,但相比之下LSTM 在捕捉时间序列动态特征方面表现最佳,为复杂页岩油产量预测提供了可靠的理论依据与技术支持。
Abstract
The production dynamics of shale oil horizontal wells are highly complex, and existing prediction techniques often fail to achieve satisfactory accuracy. In this study, production data from wells X1 and X2 in Dongying Depression were analyzed. Granger causality analysis was first employed to identify time-varying factors strongly correlated with shale oil production, thereby optimizing the model input features. Subsequently, a long short-term memory(LSTM) network was developed to construct the production prediction model, with its hyperparameters optimized using the particle swarm optimization(PSO) algorithm. The predictive performance of the LSTM model was compared with recurrent nural ntworks(RNN), gted rcurrent uits(GRU), and temporal cnvolutional ntworks(TCN). The results highlight the critical role of feature selection in production forecasting. For example, for well X1, the LSTM model incorporating Granger-based features reduced the root mean square error by 3.41 m3 compared with the model using features selected via Spearman analysis, significantly enhancing prediction accuracy. Although various time-series models exhibit strong predictive capabilities, the LSTM model outperforms others in capturing dynamic temporal characteristics, providing a solid theoretical basis and technical support for complex shale oil production forecasting.