储层表征与建模Word格式.docx
《储层表征与建模Word格式.docx》由会员分享,可在线阅读,更多相关《储层表征与建模Word格式.docx(15页珍藏版)》请在冰豆网上搜索。
注意事项
1.所有答案必须写在答题纸上,做在试题或草稿纸上一律无效。
2.答题时必须写清题号。
3.字迹要清楚、保持卷面清洁。
一律使用兰色或黑色钢笔或签字笔。
4.答完试题后,在“共页”处填写答卷的总共页数(包括第1页)。
多点地质统计学研究进展
课程名称:
储层表征与建模
专业年级:
地质工程07级
姓名:
徐斌
学号:
S0*******7
任课教师:
吴胜和
分数:
摘要:
本文系统的介绍了多点地质统计学的基本原理及建模方法。
在详细解释了多点地质统计学相关基本概念的基础上,阐明了Snesim算法及Simpat算法的原理及建模流程。
该类方法综合了基于象元的方法易忠实条件数据以及基于目标的方法易再现目标几何形态的优点,同时克服了传统的基于变差函数的二点统计学不能表达复杂空间结构和再现目标几何形态的不足。
通过理论研究及结合应用实例,分析了多点地质统计学目前存在的问题及未来发展方向。
关键词:
多点地质统计学随机建模Snesim算法Simpat算法
多点地质统计学是相对于两点地质统计学而言的。
地质统计学最初是以变差函数为工具来研究空间上既有随机性又有相关性的变量(即区域化变量)分布的一门学科,它是由法国巴黎国立高等矿业学院马特隆教授(G.Matheron)于1962年创立的,最初应用于采矿业中,主要解决矿床普查勘探、矿山设计到矿山开采整个过程中各种储量计算和误差估计问题。
近半个世纪以来,地质统计学获得了巨大的发展,其应用范围早已超出了采矿领域,气象学、生物学等学科中有可以看到它成功应用的案例,尤其是在石油工业中的应用,使它获得了进一步发展的动力。
和其它成熟的学科一样,地质统计学吸纳了其它相关学科(如人工智能、专家系统、分形系统等)的概念、理论和方法,早已超越了它最初的定义范畴。
现在的地质统计学产生了许多分支,其应用的广度和深度都有了很大的提高。
1传统地质统计学在储层表征中的不足
传统的地质统计学在储层建模中主要应用于两大方面:
其一,应用各种克里金方法建立确定性的模型,这类方法主要有简单克里金、普通克里金、泛克里金、协同克里金、贝叶斯克里金、指示克里金等;
其二,应用各种随机建模方法建立可选的、等可能的地质模型,这类方法主要有高斯模拟(如序贯高斯模拟)、截断高斯模拟、指示模拟(如序贯指示模拟)等。
上述方法的共同特点是空间赋值单元为象元(即网格),故在储层建模领域将其归属为基于象元的方法。
同时,这些方法均以变差函数为工具,亦可将其归属为基于变差函数的方法。
这种方法应用某一种随机模拟算法(如序贯模拟算法)以变差函数为工具求取未取样点模拟值的条件分布函数。
这种方法很灵活,易于条件化任何数据。
然而,变差函数作为传统地质统计学中研究地质变量空间相关性的重要工具,它的最大不足之处在于只能把握空间上两点之间的相关性,亦即在二阶平稳或本征假设的前提下空间上任意两点之间的相关性,对于表征复杂的空间结构和再现复杂目标的几何形态(如弯曲河道)比较困难。
如图1-1所示,三种不同的空间结构(黑色图元和白色图元的空间分布,图1-1a至图1-1c)在横向上(东西方向,图1-1d)和纵向上(南北方向,图1-1e)的变差函数十分相似,这说明应用变差函数不能区分这三种不同的空间结构及几何形态。
(a)(b)(c)
(d)三种结构东西方向的变差函数(e)三种结构南北方向的变差函数
图1-1变差函数不能充分反映空间各向异性(CaersJ,2002)
变差函数是从已有数据中推算得出,但是在实际情况中,井数据的数量通常很少,不足以获得一个可靠的三维变差函数模型,在横向上尤其如此。
即便井数据足够多,因为井通常被部署在有利于油气聚集的地方,因而并不能代表整个储层。
因此,以变差函数为工具来捕获所要研究对象的空间变化性,无论从质和量的角度来说都是不合适的。
以它为基础的传统地质统计学的插值和模拟方法因而难于精确表征具有复杂空间结构和几何形态的地质体。
而基于目标的方法虽然可以很好地再现目标体的几何形态,但是它是一种迭代算法,存在收敛性的问题,同时在条件化数据等方面也有不足。
为了建立更加合理的地质模型,多点地质统计学方法应运而生。
多点地质统计学是相对于传统的两点地质统计学而言的。
在多点地质统计学中,应用“训练图像”代替变差函数表达地质变量的空间结构性,因为可以考虑到多个点的相关性,可以克服传统地质统计学不能再现目标体几何形态的不足。
2多点地质统计学基本概念
多点地质统计学从上世纪90年代开始发展,是从传统的两点地质统计学中引申出来。
传统的地质统计学以变差函数为工具研究空间两点的相关性,但随着研究深入,逐渐发现两点之间的变化性不足以体现储层非均质的复杂性。
因而要求研究多于两点的变化性。
为此,多点地质统计学应运而生。
在多点地质统计学中使用训练图像来描述先验地质概念,可以用多个训练图像来反映不同规模的储层非均质性。
为了解多点地质统计学的思想,首先要了解几个相关概念:
(1)数据事件
鉴于两点统计学只能考虑空间两点之间的相关性这一不足,多点统计学着重表达多点之间的相关性。
“多点”的集合用一个新的概念,即数据事件(dataevent)来表述(StrebelleandJournel,2001)。
考虑一种属性S(如沉积相),可取K个状态(如不同相类型),即{Sk,k=1,2,…K},则一个以u为中心,大小为n的“数据事件”dn由以下两部分组成:
①由n个向量{hα,α=1,2,…n}确定的几何形态(数据构形),亦称为数据样板(datatemplate),记为n;
②n个向量终点处的n个数据值。
如图2-2(a)为一个五点构形的数据事件,由一个中心点和四个向量及数值组成。
多点统计可表述为一个数据事件
出现的概率,即数据事件中n个数据点s(u1)…s(un)分别处于sk1…skn状态时的概率,也可表述为n个数据指示值乘积的数学期望,即:
(1)
(2)训练图像
在实际建模过程中,上述多点统计或概率难于通过稀疏的井资料来获取,而需要借助于训练图像。
训练图像(既可以是二维也可以是三维)是一个先验地质模式,能够表述实际储层结构、几何形态及其分布模式。
对于沉积相建模而言,训练图像相当于定量的相模式,它不必忠实于实际储层内的井信息,而只反映一种先验的地质概念,它和传统地质统计学中的变差函数所起的作用是类似的:
产生目标储层的地质模式,然后应用到实际储层数据上去(测井数据、地震数据及生产数据)。
尽管从数学角度上讲,变差函数也是一种存贮地质模式的统计工具,但它的不足之处在于:
①只考虑两个点的相关性,所能表示的地质模式的复杂性受到了限制;
②由于它的计算方法不简洁、不直观,很难为一般地质人员所使用。
在多点地质统计学中用训练图像代替变差函数作为度量储层非均质性的工具,能够再现地质体的曲线型特征,对储层预测有重要的作用。
更为重要的是,它在进行模拟之前,就已经对将要产生什么样的模拟结果心中有数了,对于一个普通地质人员来说,判定一个训练图像是否正确比判定一个变差函数是否正确容易得多,因而更直观、更方便。
训练图像可以由以下几种方法产生:
①由基于目标的算法产生的非条件实现;
②储层原型的模拟实现;
③露头或现代沉积照片的数字化结果。
④地质家的手绘草图。
如图1-2(b)为一个反映河道(黑色)与河道间(白色)分布的训练图像。
(3)数据事件概率的求取
一个给定的数据事件的概率可以通过应用该数据事件对训练图像进行扫描来获取。
对于任一给定的数据样板n和一个训练图像T,定义“侵蚀的训练图像”Tn为诸点的集合,使得以u为中心的数据样板n中的所有n个结点都在训练图像T内。
“侵蚀的训练图像”Tn的大小用Nn表示。
而在应用任一给定的数据样板n对一个训练图像T进行扫描的过程中,当训练图像中一个数据事件与数据样板的数据事件dn相同时,称为一个重复。
这样,在平稳假设的前提下,数据事件dn在侵蚀的训练图像中的重复数c(dn)与侵蚀的训练图像大小Nn的比值,就相当于该数据事件dn出现的概率,即多点统计。
(2)
(4)条件概率分布函数(cpdf)的求取
任何基于象元的随机模拟算法均要求获取待模拟点的条件概率分布函数(cpdf),即对于任一未取样点,需要确定在给定n个条件数据(记为
)情况下,属性S(u)取K个状态中任一个状态的概率。
在多点统计模拟中,该概率可记为Prob{s(u)=sk|dn},其中,dn为由n个条件数据联合构成的数据事件。
根据贝叶斯条件概率公式,该概率可表达为:
(3)
上式中,分母为条件数据事件(
)出现的概率,可从公式
(2)获取;
分子为条件数据事件及未取样点u取sk状态的情况下同时出现的概率,相当于在已有的c(dn)个重复中s(u)=sk的重复的个数与侵蚀的训练图像大小Nn的比值,记为
。
因此,局部条件概率分布函数可表达为:
(4)
因此,通过扫描训练图像,可获取未取样点处的条件概率分布函数。
如图1-2所示,图1-2(a)为模拟目标区内一个由未取样点及其邻近的四个井数据(u2和u4代表河道,u1和u3代表河道间)组成的数据事件,当应用该数据事件对图1-2(b)的训练图像进行扫描时,可得到4个重复,即c(dn)=4,其中,中心点为河道(黑色)的重复为3个,即c1(dn)=3,而中心点为河道间(白色)的重复为1个,即c2(dn)=1,因此,该未取样点为河道的概率可定为3/4,而为河道间的概率为1/4。
(a)(b)
图1-2数据事件与训练图像示意图
(a)数据事件:
由中心点u和邻近四个向量构成的五点数据事件,
其中u2和u4代表河道,u1和u3代表河道间;
(b)训练图像:
反映河道(黑色)与河道间(白色)的平面分布。
图内四个圆环表示数据事件对训练图像扫描的四个可能的重复(据Strebell,2001)
3多点地质统计学随机建模方法
多点地质统计学应用于随机建模始于1992年。
括两大类方法,即迭代的和非迭代的方法。
迭代的方法主要有:
1)模拟退火方法(Deutsch,1992):
从训练图像中得到多点统计参数,据此建立标函数,并应用模拟退火方法进行随机模拟;
2)基于Gibbs取样的后处理迭代方法(Srivastava,1992):
首先基于传统变差函数进行随机模拟,然后根据从训练图像中得到的各待模拟点的局部条件概率,应用基于Gibbs取样的迭代方法,对已有的模拟实现进行迭代修改(后处理),以恢复多点统计特征;
3)基于神经网络的马尔可夫蒙特卡洛方法(CaersandJournel,1998):
首先对从训练图像得到的多点统计参数进行神经网络训练,然后应用马尔柯夫链蒙特卡罗模拟(MCMC)产生模拟图像。
以上方法均为迭代算法,主要受到迭代收敛的局限,因而其应用也受到了限制。
GuardianoandSrivastava(1993)提出了一种直接的(非迭代)算法,从训练图像中直接提取局部条件概率,并应用序贯指示模拟方法产生模拟实现。
由于该算法为非迭代算法,不存在收敛的问题,因而算法简单。
但由于在每模拟一个网格节点时均需重新扫描训练图像,以获取特定网格的局部条件概率,因此严重影响计算速度,难于进行实际应用。
StrebelleandJournel(2001)将算法加以改进,应用一种动态数据结构即“搜索树”一次性存储训练图像的条件概率分布,并保证在模拟过程中快速提取条件概率分布函数,从而大大减少了机时。
基于此,提出了多点统计随机模拟的Snesim算法(StrebelleandJournel,2001;
Strebelle,2002)。
3.1Snesim算法原理与流程
Snesim算法仍然以象元为模拟单元,而且采用序贯算法(非迭代算法),因而很容易忠实硬数据,并具有计算快速的特点。
该方法在模拟沉积微相方面,具有以下明显的优点:
①容易条件化,易于实现;
②使用的参数较少,计算量小、速度快;
③可以在模拟中考虑地质因素,也可包含其它外部信息;
④不但可以考虑同一微相内部的相关性,而且还可以考虑不同微相之间的相关性,这是地质事件的主要特征。
3.1.1搜索树的构成
搜索树(如图3-1)是Sensim算法中的核心,这是一种用来存贮条件概率值的数据结构,将用数据模板扫描训练图像的结果保存在其中,以利于求取ccdf时快速地存取。
较好地避免了每模拟一个点就要扫描一次训练图像的计算量的问题。
图3-1 搜索树示意图
搜索树是一个动态数据结构,用来存贮数据事件的发生数目。
Snesim算法对训练图像的内容不做任何修改,将其中反映的信息原样地记录在搜索树中。
因为大的数据事件中包含小的数据事件,所以可以充分利用树这种数据结构来存贮这样的套合信息。
数据模板与搜索树在尺寸和构形上是对应的。
在一次模拟过程中,如果有N个不同数据模板,就会有N个不同的搜索树。
如果要进行K种相的模拟,搜索树就从根开始有K个分支,而数据模板中第n个节点就占据了第n层子树的位置。
在搜索树每个节点中记录的是训练图像中数据事件的发生数目。
搜索树对于内存的要求与训练图像的大小无关,只与所采用的数据模板中节点的个数T和所划分的相的数目K有关。
搜索树的中节点的个数最多为KT,由此可见相的个数对内存的影响很大,因为它的微小变化,便会使搜索树中节点的个数变化许多。
3.1.2Snesim算法的流程
多点统计随机模拟的Snesim算法的基本步骤如下:
(1)建立训练图像。
(2)准备建模数据,将实测的井数据标注在最近的网格节点上。
(3)应用用户定义的与数据搜索邻域相联系的数据样板n扫描训练图像,以构建搜索树。
(4)确定一个访问未取样节点的随机路径。
在每一个未取样点u处,使得条件数据置于一个以u为中心的数据样板n中。
令n´
表示条件数据的个数,dn’为条件数据事件。
从搜索树中检索c(dn’)和ck(dn’)并求取u处的条件概率分布函数。
(5)从u处的条件概率分布中提取一个值作为u处的随机模拟值。
该模拟值加入到原来的条件数据集中,作为后续模拟的条件数据。
(6)沿随机路径访问下一个节点,并重复(3)、(4)步骤。
如此循环下去,直到所有节点都被模拟到为止,从而产生一个随机模拟实现。
(7)改变随机路径,产生另一随机模拟实现。
多点地质统计学随机模拟方法(如Snesim算法)与传统的地质统计学随机模拟方法(如序贯指示模拟SIS)的本质差别在于未取样点处条件概率分布函数的求取方法不同。
前者应用多点数据模板扫描训练图像以构建搜索树并从搜索树中求取条件概率分布函数(上述第1步和第3步),而后者通过变差函数分析并应用克里金方法求取参数条件概率分布函数。
正是这一差别,使多点地质统计学克服了传统二点统计学难于表达复杂空间结构性和再现目标几何形态的不足。
3.2Simpat的原理与流程
3.2.1Simpat的原理
Simpat是Arpat在2005年设计的多点地质统计学随机建模方法。
Arpat认为地下储层可以被看成是地质模式集合构成的一幅图像,因而储层预测过程就是地下储层图像重建的过程。
地质模式由多个空间点构成的数据事件或者数据模式来表征,可以利用相似性方法比较待估点处数据事件与训练图像中的数据模式之间的相似性,并用最相似的数据模式整体替换掉待估点处数据事件,从而模拟和再现储层地质模式,建立地下储层空间结构特征。
根据计算机视觉及图像处理方面的理论,模式之间的相似性可以通过距离函数d(x,y)来度量。
在Simpat中,采用曼哈顿距离函数来计算相似性,数据事件与模式之间的距离函数为:
(4)
式中,devT(u+hα)——待估点u处的数据事件
patTk(hα)——训练图像内的数据模式。
一旦完成相似性计算,就可以根据相似程度决定模拟节点处存在的数据模式,并用数据模式替换模拟节点处数据事件。
当所有节点模拟完成后,就建立起储层地质模型。
3.2.2Simpat的流程
Simpat遵循序贯模拟思路,其建模步骤如下:
(1)图像预处理,对训练图像进行倒角变换;
(2)利用数据样板扫描变换后的训练图像,提取数据模式;
(3)定义一条顺序随机访问路径;
(4)在每一个未取样位置,计算周围数据构成的数据事件与训练图像内的数据模拟的相似性,选择最相似的数据事件作为模拟结果;
(5)模拟转入下一个节点,直到所有的节点都被访问,完成一次模拟实现。
4多点地质统计学存在问题与展望
多点地质统计学的发展迄今只有十多年的研究历史,而真正作为一种可实用的随机建模方法则是StrebelleandJournel(2001)提出训练树的概念及Snesim算法之后。
因此,该方法远未成熟,尚需进一步加以完善。
综合国际上多点统计学的研究现状及已有实例分析,多点统计学随机建模方法尚需在以下几方面进行深入的研究。
(1)训练图像平稳性问题
任何空间统计预测均要求平稳假设。
在二点统计学中,要求二阶平稳或内蕴假设,即协方差或变差函数与空间具体位置无关而与矢量距离有关。
同样,在多点统计学中,要求训练图像平稳,即训练图像内目标体的几何构型及目标形态在全区基本不变,不存在明显趋势或局部的明显变异性。
Zhang(2002)提出了一个几何变换的方法,即通过旋转和比例压缩将非平稳训练图像变为平稳训练图像,并建立多个训练图像以获取未取样点条件概率分布函数。
但是,这一方法仍是一种简单化的解决途径,可以解决具有明显趋势而且用少量定量指标如方向和压缩比例能够表达的非平稳性,而对于无规律的局部明显变异性,尚需要更为有效的解决方案。
(2)目标体连续性问题
目前的Snesim算法为一序贯模拟算法,每个未取样点仅访问一次,已模拟值则“冻结”为硬数据。
这一方法虽然保证快速且易忠实硬数据,但可能导致目标体的非连续性。
ApartandCaers(2003)最近提出了一个型式(pattern)模拟的算法,称为Simpat算法,通过对训练图像数据事件进行分类、多重网格模拟时不“传递”硬数据而“传递”概率值、同时模拟一个数据样板内的所有节点等措施,在一定程度上改进了目标体不连续的问题。
(3)综合地震信息的问题
目前多点地质统计学综合地震信息的方法主要包括三大类:
其一,对地震信息进行地质解释,将其转换为一种训练图像,同时应用硬信息和原型模型得到一个训练图像,然后应用一个联合数据事件对两个训练图像进行扫描,以获取未取样点的综合条件概率。
这一方法目前存在的主要问题是,当软数据类型较多时,扫描训练图像所得的重复数太少,从而影响条件概率的推导。
其二,分别应用井信息和地震信息计算条件概率,然后将两个概率综合为一个条件概率(Journel,2002)。
这一方法的前提条件是两类数据是独立的,或即使不要求独立但须求取它们对综合条件概率贡献的权重(Liu,2003)。
其三,应用类似于同位协同克里金的方式求取综合条件概率,将多点统计方法求取的基于硬信息的概率替换克里金方法求取的概率(Journel,1999)。
这一方法要求地震信息的承载小(与模拟网格相同),而且硬信息和软信息对综合概率的权重仍取决于克里金方差。
多点地质统计学为一个新的学科分支,诸多方面需进一步深入研究,其发展可谓任重而道远。
参考文献
[1]吴胜和,李文克.多点地质统计学——理论、应用与展望[J].古地理学报,2005,7
(1):
137-144.
[2]王家华,张团峰,编著.油气储层随机建模[M].北京:
石油工业出版社,2001.
[3]吴胜和,金振奎,黄沧钿,陈崇河.1999.储层建模.北京:
石油工业出版社,83-111.
[4]尹艳树,吴胜和.储层随机建模研究进展[J].天然气地球科学,2006,17
(2):
210-216.
[5]裘怿楠,贾爱林.储层地质模型10年[J].石油学报,2000,21(4):
101-104.
[6]宋海渤,黄旭日.油气储层建模方法综述[J].天然气勘探与开发,2008,31(3):
53-57.
[7]尹艳树,吴胜和.利用Smipat模拟河流相储层分布[J].西南石油大学学报,2008,30
(2):
20-22.
[8]ArpatBG.Sequentialsimulationwithpatterns[C].Ph.Dthesis,2005.
[9]StrebelleS,JournelA.Reservoirmodelingusingmultiplepointstatis-
tics[C].SPE71324,2001:
1-11.
[10]StrebelleS.SequentialSimulationdrawingstructuresfromtrainingimages[D].Stanford:
StanfordUniversity,2000:
187.
[11]骆杨,赵彦超.多点地质统计学在河流相储层建模中的应用[J].地质科技情报,2008,27(3):
68-72.