基于LSTM神经网络的地热井回灌压力预测方法研究

时间:2023-10-04 11:15:06 来源:网友投稿

*赵磊 张海雄,3 贺婷婷

(1.中国石化集团新星石油有限责任公司新能源研究院 河南 450000 2.国家地热能源开发利用研究及应用技术推广中心 北京 100083 3.中国地质大学(武汉) 湖北 430000)

地热资源作为一种清洁能源,被广泛应用于供暖、发电、烘干、种植、养殖、旅游、医疗保健等诸多方面,在有效缓解能源短缺、解决化石能源所引起的环境问题等方面起着重要作用。在以往的地热开发过程中,长期的地热水采出导致地下水位下降过快、地面下沉等问题,甚至导致资源枯竭,严重制约了地热能的可持续、安全开发和利用,地热井回灌是解决上述问题的重要手段,是资源可持续发展的重要途径[1-2]。

地热井回灌过程中,常因悬浮物超标、微生物繁殖、化学反应沉淀、气泡堵塞、黏土膨胀等原因产生储层堵塞[3-6],导致回灌压力上升、回灌压力下降,严重影响回灌效果。冯超臣和黄文峰[7]通过对菏泽市岩溶地热井尾水回灌实验结果的分析,发现回灌压力、回灌水水质、回灌水温度、回灌工艺以及储层岩性特征等均会影响回灌效果。贺淼等[8]通过回灌实验研究发现,回灌量与回灌压力之间呈线性正比例关系、与回灌温度之间呈反比例关系。张平平和王秀芹[9]通过对德州市某地热井组开展高温尾水和低温尾水回灌实验,发现低温尾水回灌效果并非完全优于高温尾水,而是存在一个水位界限值,水位升幅低于该值时,低温尾水表现出更好的回灌性能,水位升幅高于该值时,高温尾水回灌性能更好。张春志等[10]对鲁东构造型地热田回灌数据进行分析发现,无论用地热尾水回灌还是用常温地下水回灌,单位时间回灌量随回灌压力的增大都呈二次曲线变化,在一定的压力范围内,单位回灌量随压力的加大逐渐增加,在达到最大值后随压力的增大而减小。冯守涛等[11]以鲁西北坳陷区开展的馆陶组热储回灌试验为基础,建立了以单位涌水量变化率、渗透系数的比值和单位回灌量比值评价回灌堵塞程度的评价指标体系。高新智[12]选择天津市新近系孔隙型砂岩作为研究对象,通过收集分析现有的大量回灌试验数据,建立了孔隙型砂岩热储评价模型,并利用该模型对天津市新近系孔隙型砂岩热储进行了回灌能力评价。上述方法多从单因素角度考察回灌压力,由于回灌压力受多因素共同影响并且各个因素与回灌压力之间表现出高度非线性关系,采用现有手段准确预测地热井回灌能力十分困难,预测结果与实际结果误差大、实时性差,不能满足现场地热生产管理的需要。

近年来,机器学习方法被大量用于油田生产预测,取得了良好的预测效果[13-14]。2018年,谷建伟等[15]以单井产油量为时间序列,建立基于自动回归移动平均—卡尔曼滤波器的产油量预测模型,其预测误差小于2%。2019年,谷建伟等[16]采用长短期记忆神经网络(LSTM)模型预测油井产量,平均误差约为1.46%。2020年,杨洋等[17]建立了自动回归移动平均模型与支持向量机时序模型相结合的油井产量组合预测方法,平均预测误差在10%以内。同年,刘巍等[18]在利用平均不纯度减少(MDI)方法对影响油井产量的因素进行筛选的基础上,建立了利用LSTM模型快速预测油井日产油量的方法,平均相对误差4%。LSTM模型在油井产量预测中的成功应用为预测地热井回灌压力的变化提供了重要借鉴。

地热井回灌压力预测是基于地热井生产历史的典型的时间序列预测问题。长短期记忆神经网络预测模型是一种具有自循环结构的时间递归神经网络,前一个时间的输入会影响到当前时间的输出,同时通过“门”的作用将对当前时间不重要的信息选择性遗忘,而将重要的信息保留下来,从而具有长时间的记忆能力。LSTM可以综合考虑多因素影响,能保留以前的回灌信息并传递给后续过程,也即能将过去和将来的回灌数据进行关联,挖掘其潜在规律,更加准确、可靠地预测地热回灌井生产动态。地热井回灌压力具有时变特征,因此LSTM模型能可靠地用于预测地热井回灌压力的变化趋势。

(1)长短期记忆神经网络理论

长短期记忆神经网络是一种改进的递归神经网络。相比于递归神经网络,LSTM在其基础上引入了输入门、输出门以及遗忘门三个结构(图1)。

图1 LSTM结构示意图[15]

工作时,LSTM单元将时刻t的输入状态xt以及包含上一个时刻 (t− 1)关信息的短期隐藏状态ht−1和包含时刻t之前所有时刻的长期隐藏状态ct−1进行计算处理,得到时刻t的输出状态yt。

遗忘门的作用是将ft和ct−1之间的数组元素相乘来决定ct−1中所含信息在时刻t将被遗忘的内容,遗忘原则是ct−1元素与0相乘则全部遗忘、与1相乘则全部保留;
输入门的作用是将gt和it之间的数组元素相乘来决定gt中所包含信息在时刻t被保留的内容。遗忘门信息(ft⊗ct−1)和输入门信息(gt⊗it)相结合得到时刻的长期隐藏状态(ct),如式(1)所示[1]。

其中,⊗符号指数组元素之间依次相乘。

输出门将新的ct和输出向量ot进行计算得到时刻的短期隐藏状态ht,如式(2)所示。

通过全连接层FC将xt和ht−1进行计算处理,得到ft、gt、it和ot,如式(3)~式(6)所示。

其中,f(x)函数通常为式(7)式(8)所示的tanh或ReLU非线性激活函数;
σ(x)通常为式(9)所示的Sigmoid激活函数,决定分别控制遗忘门、输入门和输出门的ft、it、ot取值(0到1之间);
gt由f(x)决定,与it共同控制输入门的取值(0到1之间);
Wxg、Wxf、Wxi、Wxo为处理的权重矩阵,Whg、Whf、Whi、Who为处理ht−1的权重矩阵,bg、bf、bi、bo为偏置项,权重矩阵和偏置项由程序在自我学习过程中自动调整。

LSTM通过遗忘门、输入门和输出门的控制,保留了对重要信息的长期记忆和非重要信息的遗弃,从而提高了对长时间序列数据的分析处理能力,能更好地适应具有前后关联和依赖性的时序预测问题。受到储层性质、水质、回灌量等因素的影响,产生的储层堵塞是一个逐渐积累和演化的过程,与之直接相关的表现就是地热井回灌压力的逐渐变化,因此利用LSTM模型预测地热井回灌压力具有很好的优势。

(2)地热井回灌压力预测步骤

基于LSTM神经网络的地热井回灌压力预测过程如下:

①收集地热井数据,将数据按照一定比例划分为训练集和测试集。

②将井口回灌压力、井口回灌温度、日回灌量和累计回灌量等数据集分别采用最大最小归一化方法进行归一化处理。

③利用归一化的训练集数据训练LSTM模型,建立地热井回灌压力预测模型。

④利用归一化的测试集数据对LSTM模型预测效果进行测试,验证模型的可靠性。

⑤利用设计的未来的井口回灌温度、日回灌量和累计回灌量预测未来的回灌压力。

(1)数据收集

兰考县具有丰富的中低温地热资源,潜力大,是未来地热开发利用的重点发展区域。目前该区域已生产的个别地热井中存在回灌难的问题,在一定程度上制约了地热井的可持续高效生产。以兰考县一口地热回灌井作为研究对象,考虑到现场每日获取回灌水质数据的难度较大,认为在回灌期间水质基本保持不变,收集和整理该回灌井一个取暖季(自2019年11月15日至2020年3月20日)的井口回灌温度、日回灌量、累计回灌量和井口回灌压力数据开展回灌压力预测方法研究。

(2)数据归一化

由于各类数据的取值范围不同,数值大小上可能存在数量级差异(如井口回灌压力数值通常在小于10的范围,而日回灌量数值可能在大于1000的范围),并且存在不同的变化幅度,为了让不同类型的数据具有一定可比性,同时为了提高计算精度,有必要进行归一化处理。研究中采用了常用的最大最小归一化方法,其计算方法如式(10)所示。

式中,x表示某特征(如井口回灌压力、井口回灌温度、日回灌量、累计回灌量)待进行归一化处理的数据;
xmin和xmax分别表示该特征的最小值和最大值。

(3)样本集构造

用Xt表示第t天影响井口回灌压力的特征向量,研究中取井口回灌温度、日回灌量和累计回灌量3个特征,编号分别为xt1~xt3。

LSTM的特殊结构要求输入的参数是由连续的M个特征向量组成的序列(M为时间序列步长)。研究中构造的输入序列形式为 {Xt−M+1,Xt−M+2,…,Xt}。第1个 序列形式为 {X1,X2,……1,…XM},第2个 序列形式为{X2,X3,…,XM+1},第n个序列形式为 {Xn,X n+1,…1,…XM+n−1}。

样本由输入序列和输出序列构成,以获取了T天生产数据为例,假设时间步长为M,yt为第t天的井口回灌压力,输入序列包括I1={X1,X2,……2,…XM},I2={X2,X3,……2,XM+1},…,In={X n,Xn+1,…,XM+n−1};
输出序列包括O1={yM+1},O2={yM+2},…,On={yM+n},组成n个学习样本,则n=T−M+1。

选取2019年11月15日至2020年3月20日共计127天的生产数据。由于所采集数据量少,属于小规模数据集,因此按照传统机器学习中常用的8:2比例划分训练集和测试集。

(4)评价指标

LSTM模型训练的质量采用采用平均相对误差δr、决定系数R2进行评价,计算公式如式(11)和式(12)所示。

其中,N是数据的个数;
x,是经过长短期记忆神经网络学习后预测的数据;
x是真实的数据;
是真实数据的平均值。平均相对误差越小、决定系数越接近1,则模型训练的质量越好。

(5)模型训练与自动调优

地热井回灌压力预测模型的工作原理是输入前M天的井口回灌温度、日回灌量、累计回灌量,预测第M+1天的井口回灌压力;
接着取一定步长Tstep来移动这个M天时间步,来预测Tstep+M+1天的井口回灌压力,从而实现整个训练数据集的计算。为了防止在训练过程中出现过度拟合问题,LSTM模型训练过程中需要添加忽略层,通过随机方式在每次训练时忽略一些神经元(通常为20%~40%)。研究中取的最优网络结构参数如下:第一层内神经元数目为64、第二层内神经元数目为128、训练次数为500、时间步长为3天、批次大小为64、忽略层的比例为20%。

为了寻找模型的最优解,本文采用了一种可以让学习率随训练过程自动修改的Adaptive Moment Estimation(Adam)优化器。Adam优化器的算法策略可以表示为:

式中,mt和vt分别为模型第t次迭代的一阶动量项和二阶动量项;
β1和β2通常取值0.9和0.999;
和分别表示mt和vt的修正值;
Wt表示模型第t次迭代的参数;
ε 通常取-810 。

损失函数使用均方误差(Mean Square Error,MSE),公式为:

其中,N是数据的个数;
,x是经过长短期记忆神经网络学习后预测的数据;
x是真实的数据。

在训练地热井回灌压力预测模型过程中,随训练次数的增加,训练集和测试集的损失函数逐渐减小并趋于稳定(图2),说明不存在过拟合或欠拟合现象。模型的训练结果如图3所示,训练集的决定系数为0.99、平均相对误差为5.86%,说明模型具有较高精度。

图2 训练集和测试集的均方误差

图3 训练结果

根据建立的LSTM模型,所选地热回灌井井口压力预测结果如图4所示,决定系数为0.87、总体平均相对误差为2.63%。从预测结果可以看出,基于地热井回灌历史数据建立的LSTM模型能准确地预测井口回灌压力的变化趋势。表1统计了部分日期的预测结果。

图4 井口回灌压力预测结果

表1 井口回灌压力预测值与实际值统计

续表

考虑地热回灌井生产的前后关联性,利用现场容易采集的井口回灌压力、井口回灌温度、日回灌量和累计回灌量,建立了一种地热井回灌压力LSTM预测方法,得到结论如下:

(1)基于现场生产数据的LSTM模型可以很好地预测地热井井口回灌压力,总体平均相对误差为1.63%,预测精度能满足现场工程应用要求,为地热回灌井生产状况诊断和措施决策提供了一种快速、简便方法。

(2)本文建立的LSTM神经网络模型具有良好的预测性。所建立的LSTM模型的最优网络结构参数为:第一层内神经元数目为64、第二层内神经元数目为128、训练次数为500、时间步长为3天、批次大小为64、忽略层的比例为20%。

(3)基于目前的研究成果,可以进一步将采出井的相关参数引入LSTM模型中,以考虑采灌井之间的干扰影响进行生产预测;
利用LSTM建立地热井回灌压力预测模型,较长时间段的生产数据样本会进一步提高预测精度;
对于生产时间较短的地热井,建议采用迁移学习方法来解决小样本问题。

(4)本研究成果对地热生产制度优化、储层污染性评价、储层解堵等方面具有指导意义。

猜你喜欢尾水井口神经网络工厂化循环水尾水治理系统技术当代水产(2022年2期)2022-04-26140MPa井口压裂四通管道冲蚀分析装备制造技术(2021年4期)2021-08-05水产养殖尾水处理技术研究进展云南化工(2020年11期)2021-01-14城镇污水处理厂尾水排放对水环境影响及对策湖北农机化(2020年4期)2020-07-24复合人工湿地处理污水处理厂尾水的设计供水技术(2020年6期)2020-03-17神经网络抑制无线通信干扰探究电子制作(2019年19期)2019-11-23CO2驱油系统的井口预警系统设计现代工业经济和信息化(2016年22期)2016-08-23基于神经网络的拉矫机控制模型建立重型机械(2016年1期)2016-03-01复数神经网络在基于WiFi的室内LBS应用大连工业大学学报(2015年4期)2015-12-11基于支持向量机回归和RBF神经网络的PID整定海军航空大学学报(2015年4期)2015-02-27

推荐访问:地热 神经网络 压力