基于概率统计模型的地震数据分析与处理Word文件下载.docx

上传人:b****5 文档编号:20401912 上传时间:2023-01-22 格式:DOCX 页数:24 大小:190.13KB
下载 相关 举报
基于概率统计模型的地震数据分析与处理Word文件下载.docx_第1页
第1页 / 共24页
基于概率统计模型的地震数据分析与处理Word文件下载.docx_第2页
第2页 / 共24页
基于概率统计模型的地震数据分析与处理Word文件下载.docx_第3页
第3页 / 共24页
基于概率统计模型的地震数据分析与处理Word文件下载.docx_第4页
第4页 / 共24页
基于概率统计模型的地震数据分析与处理Word文件下载.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

基于概率统计模型的地震数据分析与处理Word文件下载.docx

《基于概率统计模型的地震数据分析与处理Word文件下载.docx》由会员分享,可在线阅读,更多相关《基于概率统计模型的地震数据分析与处理Word文件下载.docx(24页珍藏版)》请在冰豆网上搜索。

基于概率统计模型的地震数据分析与处理Word文件下载.docx

;

(2)对于每一个

,有

(3)对于每一个

,都有

那么

就称为由

决定的马尔可夫更新过程.

2.1.2马尔科夫更新过程推论

(1)

是带有转换矩阵

和初始分布

的马尔可夫链.

(2)当

时,有

条件独立.

在本文中,马尔可夫链

表示连续可见的状态,过程

表示连续的等待时间.在我们的应用中,可视化的状态是已经发生过的地震,可以按照不同的震级来进行分类.

2.2指数分布简介

定义:

若随机变量X的概率密度为:

其中λ(>

0)为常数,则称随机变量X服从参数为λ的指数分布。

指数分布的累计分布函数为

指数分布的特性:

指数函数的一个重要特征是无记忆性(MemorylessProperty,又称遗失记忆性)。

这表示如果一个随机变量呈指数分布

当s,t≥0时有P(T>

s+t|T>

t)=P(T>

s)即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。

2.2威尔分布简介

由于它可以利用概率纸很容易地推断出它的分布参数,被广泛应用与各种寿命试验的数据处理。

双参数威尔分布是一种单峰的正偏态分布函数,其概率密度函数表达式为:

式中:

k——形状参数,无因次变量;

c——尺度参数,其量纲与速度相同。

第三章基于概率统计模型的分析方法在地震数据处理中的应用举例

表1:

华东地区5级以上地震(1970年-2011年)

3.1数据处理

在这里我们选取地震局的关于华东地区地震数据,从中得到该地区地震的时间及震级数据.本文主要针对5级以上地震进行研究,从中经过筛选得到关于5级以上地震数据如表1所示:

时间

(年月日)

震级

19700810

5.0

19790302

5.4

19860523

5.1

20020422

19710605

5.2

19790619

5.5

19870217

20020723

19711227

19790709

6.3

19891225

5.3

20020903

19711230

19790711

19900210

20030323

19721012

19800309

19910129

20030330

19730804

19800802

19911105

20031125

19731130

19811109

6.1

19920123

5.6

20051126

6.0

19731231

19820214

5.8

19940726

19740422

19820422

19950920

20060704

19750902

5.7

19831107

6.2

19961109

6.4

20100605

19840521

19970728

20101024

19761006

19980210

20110112

19761102

19851130

19980907

20120720

根据以上表1所列的数据,可以把相邻两次地震的时间间隔求出来,并列于下表:

表2:

表1所列地震事件的时间间隔(单位:

年)

0.82144596651

0.29622336377

0.73443302892

0.25470700152

0.56008751903

0.05670091324

2.85437785388

0.10971080670

0.00845319635

0.00523592085

0.12540525114

0.55511035008

0.78275494673

0.65994101979

0.96923706240

0.02083713851

0.81148021309

0.39717656012

0.76875761035

0.65234018265

0.32077815830

1.26904680365

0.21471461187

2.00218607306

0.08775304414

0.26605022831

2.50776255708

0.00046803653

0.30747526636

0.18690068493

1.15131849315

0.60628044140

1.36320585997

1.54192732116

1.13775114155

3.92043759513

0.00036339422

0.54046423135

0.71650494673

0.38493150685

1.09265601218

0.00000190259

0.53603500761

0.21625000000

0.07196347032

1.52454337900

0.57496385084

1.52315829528

2.33446537291

0.47862823440

3.62268264840

对表2的数据进行排序可得表3:

表3:

排序之后的时间间隔

0.12876712

0.40000000

0.71506849

1.27123290

0.18356164

0.47671233

0.73972603

1.36438360

0.21643836

0.53698630

0.76712329

1.52876710

0.00547945

0.21917808

0.53972603

0.78630137

1.54520550

0.00821918

0.25205479

0.55068493

0.81095890

2.00547950

0.01917808

0.26575342

0.56164384

0.81917808

2.32876710

0.05479452

0.29863014

0.57260274

0.96712329

2.50684930

0.0739726

0.30684932

0.60273973

1.09589040

2.85479450

0.08493151

0.32328767

0.65753425

1.13972600

3.62465750

0.11506849

0.38630137

0.66301370

1.15342470

3.92328770

3.2实验

3.2.1震级频率柱状图

根据表1提取的震数据,利用matlab绘制震级频率柱状图如下图所示:

(程序见附录,程序1)

图1震级频率柱状图

由图1可明显看出,发生5.0级地震次数较多,发生6.0及以上级地震次数较少,发生5.9级地震次数为0即断开点为5.9级,且以此为断开点后震级呈现两段走的趋势.根据对马尔科夫更新过程的理解我们可将前后两个状态分别对应马尔科夫更新过程的两个状态,亦即:

将震级

定义为状态“1”,将

定义为状态“2”.由此我们可以将华东地区5级以上地震数据分成两部分进行研究.

3.2.2时间间隔的箱线图

根据表2所提供的数据,我们可以利用matlab绘制时间间隔的箱线图,如下图所示:

(程序见附录,程序2,3)

图2时间间隔的箱线图

图3时间间隔的直方图

从图2中可以清楚地看出,在所研究的数据集合中存在一些异常值,一般地处理方式是删除这些异常值,但在我们的研究中,从地震孕育的物理背景考虑,我们推测这些异常值的出现告诉我们在所研究的数据集合中可能存在两种不同的行为模式,也就是说存在采用两种分布的混合对数据集合进行拟合的可能性.同时从图3中我们发现地震间隔时间的范围大体在0—3.9之间,大多数时间间隔小于2.0,部分数据大于2,仅有2个时间间隔值大于3.这样的数据特征反映出在华东地区5级以上地震的时间间隔中表现出双重的行为特征,其中具有较大时间间隔我们采用Weibull分布,对于具有较小时间间隔的数据,通过大量实验,我们采用指数分布来描述,这一点我们可以通过下面3.2.3和3.2.4来说明:

3.2.3采用标准的指数分布来拟合数据集

我们采用标准的指数分布来拟合表3时间间隔

的数据,其结果如下图所示:

(程序见附录,程序4)

图4:

标准的指数分布拟合

由图4可知对于较小的时间间隔用指数分布拟合效果较好,而对于较大的时间间隔其效果不是很好.

3.2.4采用标准的威布尔分布拟合数据集

我们再利用matlab工具采用标准的威布尔分布对表3的时间间隔

进行拟合,其结果如下图所示:

(程序见附录,程序5)

图5:

标准的威布尔分布拟合

由图5可看出,对于较大的时间间隔用威布尔分布的拟合效果较好.综合3.2.3的结果可以采用一个指数分布与威布尔分布的混合分布来拟合数据

其混合分布的概率密度函数的形式为:

(5)

其中

为指数分布的概率密度函数,

为威布尔分布的概率密度函数.形式如下:

(6)

(7)

利用极大似然估计对混合分布的概率密度函数中的参数进行估计,如下表所示:

(程序见附录,程序6)

表4:

混合分布中的参数估计值

中的参数

权重

=0.8225

a=1.5054

b=6.5579

q=0.9026

将上述估计值代入(5)式子,得混合分布的概率密度函数,即我们所研究的对象服从指数分布和威布尔分布的混合分布.由(5)式计算对应的累积分布函数

作图如下:

(程序见附录,程序7)

图6实验数据和由(5)式推导出来的理论数据的累计分布图

从图6中看出,实验数据的累计分布图和混合分布的累积分布曲线具有很好地一致性,说明华东地区5级以上的地震间隔时间较好地服从了指数分布和威布尔分布的混合分布.

3.3地震发生的概率计算和模型验证

前面我们由已知的数据,通过分析,建立了数据模型.我们要利用这个数据模型对华东地区未来5级以上地震的发生趋势做出判断,下面我们分为几个步骤来阐述这个问题.

3.3.1地震发生的概率计算公式

地震发生概率的计算问题主要是讨论在已知上一次发生5级以上地震的前提下,经过时间

的平静期之后,发生下一次5级以上地震的可能性,即概率值.基于上述考虑,我们给出地震发生的概率表达式:

分别表示最后一次发生的地震和下一次将发生的地震,

表示最后一次发生的地震和下一次将发生的地震之间的时间间隔,

表示预测的时间跨度.

假设

为对应的分布函数,同时我们研究的是5级以上的地震,因此对应的马尔科夫更新过程中只有一个状态(

),因此(7)式也可表示为:

(8)

3.3.2概率计算及分析验证

我们以华东地区1970年1月1日-2011年1月31日之间的5级以上地震目录为训练集合,建立服从指数分布和威布尔分布的混分分布函数,由(8)式计算继上一次5级以上地震之后,经过

时间的平静期之后(

),未来

=1年,2年,3年,4年,5年)之后再次发生5级以上地震的概率,计算结果如表5所示:

(程序见附录,程序8)

表5:

利用(1970年1月1日-2011年1月31日)数据计算

华东地区未来发生5级以上地震的概率

1年

0.6414

0.7783

0.7041

2年

0.9205

0.9344

0.9123

3年

0.9765

0.9806

0.9740

4年

0.9930

0.9942

0.9923

5年

0.9979

0.9983

0.9977

运用我们建立的概率模型,训练样本集中最后一次发生的5级以上地震(2011.1.12,

),根据地震目录,我们已经知道的下一次在华东地区发生5级以上的地震是在2012.7.20,

.根据我们给出的模型,

大致取1.5年,计算出发震概率为0.8514.同时,从表5中的第1列,我们也能看出从

开始,从最后一次地震(2011.1.12,

)起,未来1年内和2年内发生的概率分别是0.6414和0.9205,未来1年半左右发生5级以上地震的概率接近0.85.上述分析说明我们所采用概率模型在分析华东地区5级以上地震是有一定效果的.

第四章总结与展望

本文提出了一种新的模型来对华东地区过去几十年地震发生的时间间隔进行分析,并且对实验结果与过往数据进行了对比验证,发现了该方法与实际数据的吻合度较好.这种方法诉诸马尔科夫更新过程与极大似然估计原理,其本质是一种统计学方法.这里开发的方法所使用的数据没有任何的地球物理方面的资料,这使得这种方法并不能真实的触及地震发生的本质,从而并不能用于精确的地震预测工作.所以,在未来的研究中,我们期待着一种基于本文所提供的方法,同时考虑到地球物理科学的假说来提供精确的地震预测,并且希望得到事实的验证.

由于地震专业知识和本人能力水平有限,以及时间有限,本文的研究工作还能进一本深入和提高,本人对此将一些不足和有待完善的研究工作展望如下:

(1)时间仓促,只是实现了该模型的粗略预测,并没有得到非常精确的预测模型。

(2)对于地震的震级,我们只是选取了华东地区的5级及以上地震作为研究对象,并没有将研究的对象进一步延伸。

(3)可以拓宽思路,结合地质学和其他新兴科学中寻找思路,以期能找到很好的地震预测模型,能真正为地震预测服务。

相信随着研究的深入和研究人员的不懈努力,最终能找到一种能够服务于社会的地震预测模型,能够为人类安全做出贡献。

参考文献

[1]MATLABR2007基础教程/刘慧颖编著.—北京:

清华大学出版社,2008.7

[2]应用随机过程/张波,商豪编著.2版.北京:

中国人民出版社,2009

[3]

附录

程序1:

>

x=[5.0

];

[a,b]=hist(x,15);

a=a/length(x);

bar(b,a);

ylabel('

频率'

);

xlabel('

震级'

程序2:

formatlong

x=[

0.00000190259

0.000363394

0.000468037

0.005235921

0.008453196

0.020837139

0.056700913

0.07196347

0.087753044

0.109710807

0.125405251

0.186900685

0.214714612

0.21625

0.254707002

0.266050228

0.296223364

0.307475266

0.320778158

0.384931507

0.39717656

0.478628234

0.536035008

0.540464231

0.55511035

0.560087519

0.574963851

0.606280441

0.652340183

0.65994102

0.716504947

0.734433029

0.76875761

0.782754947

0.811480213

0.821445967

0.969237062

1.092656012

1.137751142

1.151318493

1.269046804

1.36320586

1.523158295

1.524543379

1.541927321

2.002186073

2.334465373

2.507762557

2.854377854

3.622682648

3.920437595

boxplot(x);

相邻两次地震发生的时间间隔(单位:

年)'

华东地区'

程序3:

test=load('

C:

\Users\LiJie\Desktop\data.txt'

x=sort(test);

hist(x,20);

程序4:

formatlong;

3.6

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 其它课程

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1