数学建模夏令营C题论文.docx
《数学建模夏令营C题论文.docx》由会员分享,可在线阅读,更多相关《数学建模夏令营C题论文.docx(23页珍藏版)》请在冰豆网上搜索。
![数学建模夏令营C题论文.docx](https://file1.bdocx.com/fileroot1/2023-4/17/76486cac-4771-4eec-afbf-9e0fba2cbba9/76486cac-4771-4eec-afbf-9e0fba2cbba91.gif)
数学建模夏令营C题论文
摘要
在地球资源物理勘探过程中,人工分层耗时耗力,而且带有较强的主观性,利用测井曲线进行自动分层,快速客观,精度较高,能够便于资源的开采利用和价值评估。
针对于测井曲线的自动分层问题,本文首先对数据进行归一化处理,采用成分分析法确定影响地质分层的主要成分,再通过因子分析将主要的各个因素进行筛选归类,通过权重分析用累计贡献率和主方差来确定综合指标与个主要因素之间关系系数,二者的关系可以表述为:
Z=-0.1015*X1+0.2766*X2+(-0.0317)*X3+0.2609*X4+0.2306*X5+(-0.0222)*X6+(-0.3170)*X7+0.3166*X8
上述八个因子具体指代:
密度(DEN)、自然电位(SP)、DEVI(井斜)、自然伽玛(GR)、声波(AC)、PORT(总孔隙度)、电阻率(RT)、CIL8
以一号井的手动分层数据为标准,根据模型计算出各个地质层的综合指标,进而得到分层标准。
对2至7号井的原始数据进行分析处理并计算,经由与以一号井作为的分层标准比较,可以自动确定各层地质层的分层结果。
将各层模型的自动分层结果与其手动分层结果比较,二者数据较为相近,说明模型建立较为准确合理。
通过一号井与四号井综合指标—深度曲线的对比可以发现:
每个地质层面中各个指标的综合作用影响是分布不均的。
因此本文参考最优分割法分层的基本思想,最大可能的降低因素的不均匀性所带来的影响。
在用模型一大致确定层界面位置后,保证层内方差最小的前提下选出地质层的分层面位置。
关键词:
测井曲线主成分分析因子分析权重分析最优分割法
一、问题重述
在地质勘测过程中,地质人员通过综合分析由最早开发的参考井得到的各种测井数据,对油井进行井层划分和命名。
这种分层方法,由于井的位置不同可能会导致这口井的每一个层位的深度范围也不同,甚至有可能会出现缺失中间某层的现象,而且分层取值过程中受测井分析人员的经验知识和熟练程度影响较大,主观性较强,也会因为不同的解释人员的个人标准有误差,而造成不同的人员有不同的分层结果。
随着一个区域开发井的数量增加,人工分层耗时耗力,而且受解释人员的主观因素影响较强,相对于人工分层,自动分层可以避免人为分层的随意性,并可在很大程度上提高工作效率。
由人工分层到自动分层,除了计算机工具的引入,各种数据处理技术也被应用于自动分层。
利用已有分层井点数据与变化特点作为控制点,结合每口井丰富的测井曲线数据,建立合理的数学模型,实现井位分层人工智能处理,也就是实现自动分层。
本文需要完成的工作有:
(1)以1号井为标准井,根据此井的各种测井曲线数据,建立数学模型,对第2号至7号井进行自动分层,并且通过分析,与人工分层结果进行比较分析。
考虑是否需要利用所建立的数学模型,对1号井的分层结果进行说明。
(2)通过前面人工分层与自动分层的比较结果,以及已给的各种测井曲线数据,确定合适的数学模型对第8号井至13号井进行自动分层,并分析得出的结论。
二、模型假设
1、分析题目给出的井位高斯地理坐标,发现13个井其坐标都近似在一方格区域内,假设忽略地理坐标位置对分层的影响。
2、测井数据真实可靠,不考虑由测量仪器引起的系统误差。
3、在局部范围内不考虑地层变化引起的分层波动。
4、假设在短时期内地表特征不发生巨大改变。
3、符号说明
X:
影响因子
Z:
综合指标
:
关系系数
R:
相关系数矩阵
:
第i个指标与第j个指标的相关系数
F:
主成分
:
主成分与各因子的关系系数
Load:
主成分载荷
Total:
主成分方差
:
综合指标与成分因子的关系系数
:
相应各主成分的贡献率所占的总贡献率的权重
S:
层内方差
四、问题分析
对于问题一,题目要求通过已给的各种测井曲线数据,以1号井为参考标准建立自动分层模型,并以此根据模型对第2号至7号井进行分层。
由于题目给出了1至7号井的有关测井曲线和地层特性的66组数据,但数据比较庞杂,这就要通过筛选分析选取其中对分层影响较大的数据作为主要指标,采用主成分分析法提取对目标分层贡献较大的指标作为进一步分析的基础。
通过主成分分析以及因子分析可以确定出对于测井分层的主要8个指标,之后就可以根据累计贡献率和主方差最终得到一个能够尽可能反映原始指标信息的综合指标作为分层标准。
确定分层后,将所得结果与人工分层结果进行比较,对模型的优劣进行评估和改进。
对于问题二,要求在第一问得出的模型基础上,将自动分层与人工分层结果进行比较,结合给出的各种测井曲线数据,对数学模型评估改进并对第8号井至13号井进行自动分层。
通过2—7号井自动分层与人工分层的结果比较,以及一号井与四号井综合指标—深度曲线的对比分析,再对数学模型进行适当的调整,将数学模型进行优化处理,然后根据8号——13号井的各类曲线数据,运用所建立的数学模型将其自动分层后再分析结果。
五、模型的建立与求解
5.1数据因子的筛选
通过观察数据,分析所给指标数据间的联系,可以发现有些因素数据波动不大或由于仪器测量因素不能确定其具体的数值,可将这些因素主动剔除,这样根据数据特征首先初步筛选出有效数据,最终得到45个有效指标,筛选后的结果如下:
DEN
RILD
RILL
RLL8
SP1
R4.0
SP
DEVi
AZIm
GR
AC
RML
RMN
CAL
CNL
R4.0%
CN1%
GR%
AC%
RILD%
RILM%
RLL8%
SP1%
SP%
DEN%
CAL%
RML%
RMN%
PORW
PORT
PORR
PORF
PERM
SW
SH
SX0
POR
SPC
RT
PW
YW
FW
CID
CIM
CIL8
5.2模型的建立
(一)主成分分析确定主要影响因素
5.2.1基本思想及方法
为了将研究对象的多个相关变量综合为少数几个不相关的变量,反映原变量提供的主要信息,用主成分分析法确定影响测井分层的主要影响因子(X1,X2····X8),以Z表示测井分层的综合指标,那么综合指标与影响因子的关系可以表示为:
其中
为关系系数
5.2.2主成分分析法的具体步骤
(1)对原始数据进行标准化处理
将对经过初步分析得出的45个因子标号深度对应的数据构成一矩阵(15*45的一个矩阵,L=45,K=15)
再对该矩阵进行标准化,其计算公式如下:
(2)计算指标的相关系数矩阵R
将得出的标准化矩阵用MATLAB计算出样本的相关系数矩阵(以一号井的测井数据表为例)。
再从相关系数矩阵可求出特征值,特征向量。
其中相关系数矩阵的计算方法如下:
式中
=
=1,
是第i个指标与第j个指标的相关系数
特征值的排序结果为:
19.26029.196485.660993.076671.98861.68858
1.317260.8167950.728380.4704080.4376430.182692
0.1071390.0681137
(后面的特征值由于数值较小,这里省略不写)
(3)主成分数目的确定
在用MATLAB计算出原始标准化数据的贡献率后,我们以主成分的累计贡献率大于85%为门限,以此确定主成分的数目。
贡献率及累计贡献率结果如下:
贡献率及累计贡献率:
贡献率
0.4280
0.2044
0.1258
0.0684
0.0442
0.0375
0.0293
0.0182
累计贡献率
0.4280
0.6324
0.7582
0.8266
0.8708
0.9083
0.9376
0.9558
由上表可以看出,当累积到第五个主成分时,其累计贡献率已达到87.08%>85%,所以主成分数是5.
(4)主成分载荷系数及因素分类:
通过MATLAB软件编程可以求算出主成分载荷系数,以F1,F2···F5代表五个主成分,根据每个因子每行系数的绝对值的大小可以把因子划归到五个主成分中,载荷系数及划分结果具体如下:
(负号仅表示负相关)
F1
F2
F3
F4
F5
划归结果
DEN
-0.3669
-0.4583
-0.3380
0.6425
0.2132
F4
RILD
-0.9573
0.1556
0.0985
0.0350
0.0472
-F1
RILL
-0.9387
0.2153
0.1654
-0.0119
0.0563
-F1
RLL8
-0.7167
0.5216
0.4341
-0.0179
0.0560
-F1
SP1
0.3854
0.0863
0.7690
0.4242
0.2478
F3
R4.0
-0.2233
-0.5225
0.3035
0.2078
-0.1436
-F2
SP
0.5812
0.0920
0.6707
0.2909
0.1502
F3
DEVi
0.4714
-0.2544
0.0733
0.3380
-0.6131
-F5
AZIm
0.0014
-0.3612
-0.0557
0.6878
-0.5777
F4
GR
0.8821
0.1847
-0.1908
0.1693
-0.0919
F1
AC
0.5460
0.4899
0.3584
-0.3177
-0.2317
F1
RML
-0.8118
0.3679
0.3811
-0.1334
0.0970
-F1
RMN
-0.8246
0.2634
0.3477
-0.1923
0.1560
-F1
CAL
0.5561
-0.5715
0.2381
-0.2163
0.0736
-F2
CNL
0.7624
0.1063
0.2082
0.1967
-0.4226
F1
R4.0%
-0.0779
0.1750
-0.4772
0.1440
0.3502
-F3
cn1%
0.7995
0.0681
0.2281
0.1915
-0.3588
F1
GR%
0.2561
0.6046
-0.3808
0.0029
-0.2110
F2
AC%
0.3194
0.5467
0.3056
-0.3112
-0.3043
F2
RILD%
-0.7759
0.5058
-0.0757
0.2622
-0.0217
-F1
RILM%
-0.7665
0.5708
-0.0380
0.1860
-0.0247
-F1
RLL8%
-0.5806
0.5755
0.3504
0.2278
0.0278
-F1
SP1%
0.1625
-0.3648
0.8463
0.2566
0.1639
F3
SP%
0.2720
-0.4502
0.8191
0.0623
0.0082
F3
den%
-0.2817
-0.4590
-0.3156
0.7168
0.2260
F4
CAL%
0.5370
-0.5407
0.2497
-0.3365
-0.0003
-F2
RML%
0.7949
0.4900
-0.0719
0.0214
-0.2825
-F1
RMN%
-0.7964
0.4245
-0.0359
-0.0370
-0.2962
-F1
PORW
-0.4896
-0.8158
0.1766
-0.1256
-0.1005
-F2
PORT
-0.1836
-0.8663
0.0964
-0.0198
0.1030
-F2
PORR
-0.7881
-0.4600
-0.0655
-0.2831
-0.0867
-F1
PORF
-0.4896
-0.8158
0.1766
-0.1256
-0.1005
-F2
PERM
-0.4667
-0.6795
0.2352
-0.1264
-0.2072
-F2
SW
0.8697
0.1811
-0.4153
0.1136
0.0543
F1
SH
0.8296
0.3966
-0.0045
0.2471
-0.0593
F1
SX0
0.8399
-0.3496
-0.3708
0.0850
0.0007
F1
POR
-0.7249
-0.5302
0.3538
-0.1255
-0.0697
-F1
SPC
0.5812
0.0920
0.6707
0.2909
0.1502
F3
RT
-0.9573
0.1556
0.0985
0.0350
0.0472
-F1
PW
-0.4675
-0.7447
-0.2931
-0.2740
-0.1165
-F2
YW
0.5024
-0.7042
-0.4642
-0.0337
-0.0593
-F2
FW
-0.5498
0.0231
0.1749
0.0761
-0.2542
-F1
CID
0.9108
0.1228
0.2047
-0.2247
-0.0544
F1
CIM
0.9251
0.1211
0.2024
-0.1684
-0.0451
F1
CIL8
0.9674
0.0988
0.0640
-0.1321
0.0214
F1
5.2.3因子分析:
由上述的划归结果,根据每个主成分中因子的最大载荷值来确定最主要的影响因素,由上表数据,我们选出了以下八个主要因子:
密度(DEN)、自然电位(SP)、DEVI(井斜)、自然伽玛(GR)、声波(AC)、PORT(总孔隙度)、电阻率(RT)、CIL8
然后将一号井的八个因子所对应的数据输入,用SPSS在进行一次主成分分析,所得结果如下:
主方差和累计贡献率:
主成分载荷:
5.3综合指标的求解:
由于上表中,前四个主成分的累计贡献率89.41%已经超过85%,所以第二次主成分分析确定的主成分数目为4。
其中,各主成分与各个因子的关系式可以表述如下:
F代表主成分,X代表各因子
系数矩阵:
其中,
的值等于所对应的主成分载荷除以相应的主成分方差的均方根即:
=Load/
(Load表示主成分载荷,total表示主成分方差)
那么综合指标Z与与各个因子的关系式可以表述为:
Z=
为综合指标与成分因子的关系系数,其中,根据权重分析
的计算表达式可以表述为:
=
(
为对应各主成分的贡献率所占的总贡献率的权重)
5.4有综合指标引出的自动分层:
根据综合指标可以求解出2号井到7号井各深度的综合指标,再以一号井的综合指标为参照标准,以极差最小为标准,从而将2号到7号测井进行自动分层。
当然由于八个因子数据的数量级可能会有较大偏差,为了消除影响,在求算综合指标时可以先将数据标准归一化,消除数据数量级的影响。
自动分层的结果如下:
长71
长72
长73
长81
长82
长91
长92
底深
底深
底深
底深
底深
底深
底深
2号井
565.00
610.875
638.25
679.75
717.75
748.75
807.375
3号井
535.37
583.75
631.5
667.75
695.5
733.75
783.5
4号井
615.75
649.875
681.87
725.125
757.625
816.625
850.125
5号井
777.0
813.375
863.25
887.375
947.125
982.625
1023.0
6号井
528.02
560.150
600.27
651.900
682.275
718.650
778.650
7号井
670.47
695.600
748.10
778.475
828.225
844.475
914.850
2至7号井的自动分层结果:
长31
长32
长33
长41
长42
长61
长62
长63
底深
底深
底深
底深
底深
底深
底深
底深
2号井
256.750
295.750
331.375
373.375
424.750
462.250
515.125
544.125
3号井
210.625
251.875
275.625
341
374.625
419.125
446.125
513.625
4号井
282.875
317.500
357.875
401.750
439.375
503.875
536.250
559.625
5号井
444.500
489.375
545.125
580.0
617.250
668.625
690.875
755.125
6号井
251.650
317.650
347.775
412.025
431.775
476.525
7号井
338.475
367.100
421.100
437.975
497.975
523.225
580.850
616.350
对于2号井到7号井的分层,在一号标准井的计算数据参照下,采用综合指数极差最小的原则,确定出测井的地质层分层面。
作出最终综合评价指标随深度变化曲线,以一号井与四号井的比较为例,结果如下:
一号井长33底深至长41底深的自动分层
四号井长33底深至长41底深的自动分层
通过两图的比较可以发现:
一号井和四号井的综合指数-深度曲线的走势大致趋同,但是曲线在每个层面的跳变起伏较大,也间接反映在每个地质层面中其各个指标的综合作用影响是分布不均的。
从而之前提出的模型以参照标准与计算求得的综合指数的相差极值最小为评判准则就显得有些欠妥,可能造成不可避免的偏差。
5.5问题二模型的建立与求解:
为了避免模型一中地质层各因素综合作用影响分布不均而产生的偏差,我们対原模型进行了修改,在用模型一将8至13井进行自动分层后,根据其分层的范围再利用最优分割法分层的基本思想:
在大致确定层界面位置后,再对相邻两层用方差分析分层法找出准确的层界面位置.
5.5.1最优分割法确定具体分层位置:
对于两层介质,设共有N个采样点,
,
分别为这两层第j点的测井值,若层界面在n,n+1采样点间,则两层的层内差方和S为:
式中:
此时,分层点位置的确定只要保证被分成两部分的层内方差最小。
根据上述准则,8至13井进行自动分层的结果如下:
长31
长32
长33
长41
长42
长61
长62
底数
底数
底数
底数
底数
底数
底数
8号井
213.875
240.25
287.625
343.625
365.875
418.5
449.875
9号井
251.25
270.875
319.05
340.875
399.625
446.625
488.75
10号井
211.05
241.375
290.25
313.625
358.25
407.5
444.05
11号井
291.125
313.375
356.625
395.25
433.625
468.05
510.625
12号井
244.5
276.625
325.375
358.875
402.375
455.5
498.125
13号井
289.875
325.05
359.25
411.375
458.25
493.5
518.375
长63
长71
长72
长73
长81
长82
长91
底数
底数
底数
底数
底数
底数
底数
8号井
496.25
524.875
565.25
642.625
665.375
694.875
759.25
9号井
537.625
570.375
606.25
644.375
672.375
708.75
747.25
10号井
495.05
531.25
567.675
613.25
668.375
685.5
736.875
11号井
546.375
615.625
638.875
674.05
718.125
751.5
800.375
12号井
545.875
583.375
594.05
624.625
663.5
705.375
761.125
13号井
561.5
623.25
643.375
689.05
735.125
772.875
801.625
长31
长32
长33
长41
长42
长61
长62
底数
底数
底数
底数
底数
底数
底数
8号井
218.25
245.875
288.375
348.625
372.5
425.375
450.25
9号井
255.75
289.25
324.625
358.25
403.875
453.375
492.05
10号井
221.05
258.375
300.625
342.875
387.5
415.05
465.625
11号井
298.375
323.625
366.05
405.05
446.25
478.875
520.875
12号井
254.25
286.375
335.875
370.375
410.875
467.625
508.5
13号井
300.5
335.375
372.625
421.25
467.05
500.5
528.375
长63
长71
长72
长73
长81
长82
长91
底数
底数
底数
底数
底数
底数
底数
8号井
500.5
534.375
567.875
648.625
671.375
702.05
760.25
9号井
541.375
577.25
611.625
652.875
686.05
715.625
752.625
10号井
501.375
535.625
577.05
623.25
678.875
695.25
746.875
11号井
556.05
621.125
648.05
685.375
726.875
759.375
809.05
12号井
552.625
591.875
605.375
638.25
675.05
723.25
771.375
13号井
582.25
625.125
663