华北电力大学毕业设计证据理论文档格式.docx

上传人:b****6 文档编号:17318493 上传时间:2022-12-01 格式:DOCX 页数:46 大小:393.48KB
下载 相关 举报
华北电力大学毕业设计证据理论文档格式.docx_第1页
第1页 / 共46页
华北电力大学毕业设计证据理论文档格式.docx_第2页
第2页 / 共46页
华北电力大学毕业设计证据理论文档格式.docx_第3页
第3页 / 共46页
华北电力大学毕业设计证据理论文档格式.docx_第4页
第4页 / 共46页
华北电力大学毕业设计证据理论文档格式.docx_第5页
第5页 / 共46页
点击查看更多>>
下载资源
资源描述

华北电力大学毕业设计证据理论文档格式.docx

《华北电力大学毕业设计证据理论文档格式.docx》由会员分享,可在线阅读,更多相关《华北电力大学毕业设计证据理论文档格式.docx(46页珍藏版)》请在冰豆网上搜索。

华北电力大学毕业设计证据理论文档格式.docx

Facedwithalargenumberofrecentlyproducedandaccumulateddataandinformation,informationquerystatisticscannolongermeettheneedsofscienceandtechnology,automateddataanalysisrequiresincreasinglyhigh.Developmentofdataminingandinformationfusionhasmadeitpossibletoidentifyusefulinformationandvaluableknowledgefromalarge,uncertainorinterferencedata.Berepresentedandevidencetheoryisapowerfultoolforhandlinguncertaintyorknowledge.

Inthisarticle,wediscusstheapplicationofDSevidencetheory,andfoundthatithassomeapplicationexamplesexist,identifyitsadvantagesanddisadvantages,discussedthebrightfutureoftheirapplication.Thenthereappearedanalysismethodsappliedarelimitationsandsubjectiveevidenceagainstthetheoryofbelieffunctionstogettheproblemofsubjectivity,anewmethodisproposedtoobtainthereliabilityfunctionthroughstatisticalsampleoftypicaleigenvaluesdeterminethetypicalsampledistributioncurvefittingdistribution,usedistributiondensityfunctiontoestablishthedensityofbelieffunctions,getthebasicprobabilitydistribution,obtainedbynormalizationbelieffunctions,andfinallythroughDSfusionrulestogetthefinalresult.Theresultsdemonstratedthatinmanypowerplantsarehighlyapproximatetargetmodeobediencetothenaturalnumberλisthenumberofindependentvariablesonnormaluseofbelieffunctiondensityfunctionwasimprovedobjectivity,withtheuseofvalueengineering.

Keywords:

Evidencetheory;

belieffunctionassignment;

lognormaldistribution;

coalsdiscrimination

1绪论

1.1课题背景

自上世纪70年代起始,多传感器模式识别技术就已经产生,随着计算机和互联网技术的应用和发展,模式识别技术得到了空前的发展,上世纪90年代开始,一些较成熟的数据融合算法就应用在了专家系统和目标识别中,并且已经成为现代的研究热点。

多传感器数据融合技术形成于上世纪80年代,目前已成为研究的热点。

它不同于一般信号处理,也不同于单个或多个传感器的监测和测量,而是对基于多个传感器测量结果基础上的更高层次的综合决策过程。

把分布在不同位置的多个同类或不同类传感器所提供的局部数据资源加以综合,采用计算机技术对其进行分析,消除多传感器信息之间可能存在的冗余和矛盾,加以互补,降低不确实性,获得被测对象的一致性描述,从而提高系统决策、规划、反应的快速性和正确性,使系统获得更充分的信息,从而进行下一步的专家诊断和模式识别。

在现有的数据融合技术中,D-S证据理论以其融合算法简单实用、简洁明了而显示其优越性,在数据融合和模式识别中得到了广泛的应用。

自上世纪70年代该理论问世以来,已经逐渐成为研究的热点问题,在一些军工领域和电子技术领域都得到了广泛应用,并且在发电厂和电力系统中也得到了应用。

但是D-S证据理论也有其固有缺陷(接下来的部分有详细论述),这导致了其在应用中存在瓶颈。

因此,解决证据理论的应用瓶颈成为了现在该领域研究的方向。

1.2D-S证据理论发展概述

自从上世纪70年代,A.P.Dempster提出了证据理论的雏形[1,2],而后他的学生G.Shafer在其研究的基础上加以完善和发展[3],形成了现在的证据理论,该理论针对于不确定问题的处理,区分不确定信息与未知信息对系统的影响,从而可以更好的处理多来源的相互独立的证据源的信息,有效消除证据的片面不确定性,使得到更加准确的结果。

在证据理论的发展过程中,其在理论水平主要有两个问题:

一是当证据中存在相违背的信息时,得到的结果可能会产生悖论[4];

二是证据理论是以集合的形式存在的,当集合中的焦元数量过大时,在进行数据分析的过程中,可能会产生信息爆炸的问题[5]。

1.2.1证据理论的诞生与形成

20世纪60年代末美国哈佛大学数学家A.P.Dempster在利用上、下限概率来解决多值映射问题方面的研究工作中,为了区别不确定信息和未知信息对结果的影响,提出了证据理论的雏形。

1967年起发表了第一篇论文[1],将证据理论的雏形展现在世人眼前,随后,他又发表了一系列的文章[2],标志着证据理论的正式诞生。

Dempster的学生G.Shafer对证据理论做了进一步的发展,引入信任函数概念,形成了一套基于“证据”和“组合”来处理不确定性推理问题的数学方法,并于1976年出版了《证据的数学理论》(AMathematicalTheoryofEvidence)[3],这标志着证据理论正式成为一种处理不确定性问题的完整理论。

1981年J.A.Barnett发表了名为”Computationalmethodsforamathematicaltheoryofevidence.”的文章,首次把D-S证据理论引入AI领域[6]。

1.2.2证据理论的核心、优点、适用领域和局限性

核心:

Dempster合成规则,这是Dempster在研究统计问题时首先提出的,随后Shafer把它推广到更为一般的情形[2,3]。

在本文中的第二章有该合成规则的具体阐述。

优点:

由于在证据理论中需要的先验数据比概率推理理论中的更为直观、更容易获得,再加上Dempster合成公式可以综合不同专家或数据源的知识或数据,这使得证据理论在专家系统、信息融合等领域中得到了广泛应用。

适用领域:

信息融合、专家系统、模式识别、情报分析、法律案件分析、多属性决策分析,等等。

局限性:

(1)要求证据必须是独立的,而这有时不易满足。

(2)证据合成规则没有非常坚固的理论支持,其合理性和有效性还存在较大的争议。

(3)计算上存在着潜在的指数爆炸问题。

1.2.3Zadeh悖论

Zadeh悖论[3]是D-S证据理论发展中一个非常重要的质疑理论。

1984年,Zadeh发表了一遍经典文献,提出了D-S证据理论中典型的悖论问题,即D-S证据理论中存在不合理不现实的问题,从而对D-S证据理论提出质疑。

Zadeh悖论的典型例证如例1.1所示。

例1.1:

利用Dempster证据合成规则对两个目击证人(W1,W2)判断某宗“谋杀案”的三个犯罪嫌疑人(Peter,Paul,Mary)中究竟谁是真正的凶手,得到的结果(认定Paul是凶手)却违背了人的常识推理结果,Zadeh认为这样的结果无法接受。

 

表1-1Zadeh悖论融合结果

m1()

m2()

m12()

Peter

0.99

0.00

Paul

0.01

1.00

Mary

表1-1中,m1、m2为两个目击证人W1、W2的信度函数(BeliefProbabilityassignment),根据上述的BPA函数进行Dempster合成,得到的结果为m12,此时,出现了一个违背常识的结果,两位证人W1、W2均认为Paul是凶手的可能性只有0.1,但是融合结果却100%的认为凶手是Paul,这样的结果是Zadeh认为无法接受的。

Zadeh指出,在证据存在冲突时,Dempster合成法则是不适用的。

这就对证据的来源提出了进一步的要求,证据要避免冲突。

1.2.4解决Zadeh悖论的方法

为了避免出现与Zadeh相悖的组合结果,即解决冲突较大的证据的有效融合问题,一系列的学者对D-S证据理论模型提出了大量的完善和改进的方案,但总的来说,这些改善方案无外乎两个方面,一是修正D-S融合规则,二是修正冲突证据源[7]。

大部分学者认为Zadeh悖论是由于融合规则的缺陷造成的,需要对D-S证据理论规则的融合算法进行修改以适应高冲突的情况。

还有学者则认为融合规则没有问题,证据不完善带是带来悖论的主要原因。

依据这两种思路可以把这些方法分为两大类:

前者典型的如Yager[8]方法、Dubois和Parade[9]的方法等;

而后者典型的如Murphy[10]方法、邓勇[11]的方法等。

第一类解决悖论的思路为:

D-S证据理论是否足够完善的核心问题是处理冲突问题,证据高度冲突下组合规则的标准化过程是产生不符合直觉的融合结果的原因[12]。

所以,对冲突信息必须按解决冲突信息的规则重新进行分配,但又面临分配给谁和如何分配的问题。

Yager[8]提出了一种新的证据理论组合规则,其主要思想是将冲突的证据分配给完全未知的命题,改进后的合成公式如下。

(1-1)

尽管此公式可以组合高冲突的证据,但该分配规则显得过于保守,使得多源证据的组合结果显得不太可取,而且证据的合成顺序也会对合成结果造成一定的影响[11]。

1.2.4D-S证据理论的发展

一系列的科学家在Dempster与Shafer之后对证据理论进行了诸多研究,覆盖了理论和应用两大领域,取得了一系列的建树,主要包括:

专家系统MYCIN的主要开发者之一Shortliffe:

对证据理论的理论模型解释和算法实现进行了研究[13]。

AI专家Dubois&

Prade:

指出证据理论中的信任函数(Belieffunction)是一种模糊测度,以集合论的观点研究证据的并、交、补和包含等问题[9,14]。

Smets等人:

将信任函数推广到识别框架的所有模糊子集上,提出Pignistic概率和可传递信度模型(TBM)[15,16]。

粗糙集理论的创始人Pawlak:

认为粗糙集理论使得无限框架上的证据处理向有限框架上的证据处理的近似转化成为可能。

1.2.5D-S证据理论的局限性的解决方法

为解决悖论问题:

Zadeh提出了悖论问题[4],之后Shafer指出了证据理论的适用范围,对证据的独立性和非冲突性进行了约束[17]。

为了避免证据组合爆炸,提高证据合成的效率:

Voorbraak:

提出一种Dempster证据合成公式的Bayes近似方法,使得焦元个数小于等于识别框架中元素的个数[18,19]。

Dubois&

Prade:

提出一种“和谐近似”(Consonantapproximation),即用和谐函数来代替原来的信任函数[14]。

Tessem:

提出了一种称为(k,l,x)近似方法[20]。

Yen等人:

将模糊集引入证据理论。

1.3D-S证据理论在中国的发展

1.3.1证据理论的早期理论发展

段新生:

在1993年出版了一本专门论述证据理论的专著《证据理论与决策、人工智能》[21]。

但由于此书出版时间较早,故其内容不是很新,未能反映证据理论及其应用方面的最新成果。

刘大有等人:

国内较早研究证据理论的专家,并发表了一系列的论文,主要集中研究该理论的模型解释、理论扩展、近似实现等问题[7,22,23]。

肖人彬等人:

对证据的相关性及相关证据的组合问题进行了研究[24]。

苏运霖、管纪文等人:

对证据理论与粗糙集理论进行了比较研究[21]。

曾成等人:

研究了不完备的识别框架下的证据合成问题,并提出相应的证据合成公式[25]。

顾伟康等人:

对证据合成公式进行扩展,提出一种改进的证据合成公式。

徐从富等人:

1999-2001总结国内外关于证据理论及其应用的代表性文献,先后发表2篇关于证据理论及其应用的综述文章[26-29]。

以上成就均为早期学者研究成果,主要是在理论方面对证据理论的完善,而近些年来,众多学者对证据理论的研究主要在于应用层面,包含证据理论的单独应用和与其他理论,如模糊理论,神经网络理论的综合应用等等。

1.3.2近些年来证据理论的应用

近些年来,基于多传感器的故障诊断技术不断发展,并且在各个领域都有应用[30-32],其最大的进步在于利用更多的故障征兆参数更加准确及时的判别故障。

D-S(Dempster-Shafer)证据理论的联合规则在上世纪70年代提出后,被广泛的应用于多传感器数据融合领域[33-36],其融合算法基本固定,但信度函数分配的获取方法不尽相同,最终融合的结果与得到的信度函数分配紧密相连。

文献[32]提出了一种提出了一种基于传感器相关系数和环境加权系数获得信度函数分配的方法,但是其主观色彩较浓,一旦相关系数等不能正确反映现场情况,融合结果不能正确诊断故障结果。

文献[34]提出了基于神经网络通过训练获得信度函数的方法,但神经网络法的固有缺陷可能会影响其在实际中的应用。

文献[35]提出了一种基于典型样本的方法获得信度函数分配,利用汉明距离的观点来减小主观性,但是其受理想模型约束,一旦实际模型分配不均匀,得到的结果可能会有些出入。

文献[36]中提出了一种基于正态分布概率密度函数获得基本概率赋值并得到典型样本的方式,但是其理想色彩决定了其不能应用在目标模式偏离正太分布的情况。

1.4本文主要研究内容

本文拟讨论一种基于改进型的信度函数的获取方法,通过对以往历史运行数据的统计,拟合出典型样本分布规律,发现当单值典型样本不能很好的拟合的实际情况时,利用分布规律的密度函数建立信度函数密度,得到信度函数。

作者在研究证据理论的应用问题时主要进行了如下五个方面的工作:

1)证据理论的理论框架及融合算法

首先研究了D-S证据理论的基本理论框架,分析了D-S证据理论的融合算法,并利用EXCEL编程实现Dempster法则,回顾了近些年来证据理论论文中的观点,指出其在应用层面的优势和特点,分析其在应用范围内的瓶颈,找出研究的突破口。

2)提出一种新型的证据理论信度函数的获取方法

本文讨论一种基于新型的信度函数分配方法,通过对以往历史数据的研究和分析,当正态分布不能很好的拟合的典型样本,对数正态分布可以很好的拟合,从而获得相应的基本概率分配后进行D-S融合,实时判断故障类别,进一步减小了主观性,为后续的电厂生产控制提供了及时有效依据。

3)根据新型的信度函数获取方法完善证据理论

利用典型样本对数正态分布的规律,拟合信度函数密度,从而得到的信度函数,在通过归一化算法,得到符合证据理论要求的信度函数,再利用Dempster法则进行数据的融合,最后得到目标识别的结果,最后根据目标识别的一系列条件,给出目标识别的结论。

4)以现场中实时煤种判别为例,验证该理论的正确性

以电场中实时煤种判别为例,通过数学手段处理原始数据,拟合典型样本及其分布曲线,利用上述理论,进行仿真试验,得出结论,证明该理论的正确性与实用性。

5)整理数据,绘制曲线,完成毕业设计论文

利用MATLAB绘制典型样本对数正态分布曲线,利用EXCEL编程进行数据处理及Dempster法则融合计算,进行分析和处理之后得出结论。

整理文字、图线及表格等,撰写毕业设计论文。

1.5本章小结

本章结合证据理论和数据融合的发展史,介绍了证据理论的产生和发展,与其他的数据融合技术相较的优缺点,给出了毕业论文的主要工作及基本内容,介绍了主要的研究问题及解决手段,指明了研究的方向。

2信息融合框架及证据理论

2.1引言

目前,故障诊断的信息融合方法按其融合算法的不同,主要可分为以下几种:

贝叶斯定理信息融合故障诊断方法;

模糊信息融合故障诊断方法;

D-S证据理论信息融合故障诊断方法;

神经网络信息融合故障诊断方法;

集成信息融合故障诊断方法等。

近些年来,基于多传感器的故障诊断技术不断发展,并且在各个领域都有应用[38-40],其最大的进步在于利用更多的故障征兆参数更加准确及时的判别故障。

D-S(Dempster--Shafer)证据理论的联合规则在上世纪70年代提出后,被广泛的应用于多传感器数据融合领域[4-7],其融合算法基本固定,因此,获取客观的信度函数就成为了正确实现目标模式判别的关键。

证据处理是人类智能活动的一项新的里程碑,人们依据观察到的可以进行推理的过程中的包含着大量的不确定性因素。

D-S证据理论中使用了信度函数、似然函数等来表示“不确定性”或“未知不明”等人的认知曾面的重要概念,对未知的或不确定等概念方面的解释更加接近人们依据证据做出的推理方面思维习惯,可以说是从另一个角度深入的探讨了人类推理的不确定性[37]。

文献[41]提出了一种提出了一种基于传感器相关系数和环境加权系数获得信度函数分配的方法,但是其主观色彩较浓,一旦相关系数等不能正确反映现场情况,融合结果不能正确诊断故障结果。

文献[42]提出了基于神经网络通过训练获得信度函数的方法,但神经网络法的固有缺陷可能会影响其在实际中的应用。

文献[43]提出了一种基于典型样本的方法获得信度函数分配,利用汉明距离的观点来减小主观性,但是其受理想模型约束,一旦实际模型分配不均匀,得到的结果可能会有些出入。

文献[44]中提出了一种基于正态分布概率密度函数获得基本概率赋值并得到典型样本的方式,但是其理想色彩决定了其不能应用在特征值不服从正太分布的条件下。

本文讨论一种基于改进型的信度函数的获取方法,通过对以往历史运行数据的统计,拟合出典型样本分布规律,发现当正态分布不能很好的拟合的典型样本,利用分布规律的密度函数建立信度函数密度,得到信度函数。

在一些偏正态分布领域,对数正态分布被广泛应用,Sá

ncheZ和Torí

oP[43,44]利用对数正态分布建立了脉冲噪声水平和竖直的模型,杨娟[45]等在悬浮颗粒散射光脉冲信号幅度、宽度随机性分布特征研究时也发现,对应的计数分布服从以自然数为自变量的对数正态分布,林颖璐[46]等在研究噪声信号特征量分布函数相似特性时指出:

独立特征量均能够与以自然数λ为自变量的对数正态分布函数高度符合。

基于统计概率分布等价条件,噪声信号特征量统计分布呈现出高度相似特征可进一步推导特征量统计函数对应自变量之间存在非线性变换关系,这是种普遍的幂函数变换关系。

以上研究成果表明,对数正态分布在独立特征变量偏离正态分布时对建立统计模型具有指导意义。

2.2各类信息融合算法综述

2.2.1常用理论及其优缺点

贝叶斯理论是基于概率论的推理方法,它以概率密度为基础,综合多来源的各种信息来描述相关状态,从而进行模式识别、优化设计或故障诊断。

模糊的基本思想是将通常集合中的绝对隶属度灵活化,使数据源对集合的隶属度从原本的信号值0、1扩充到取[0,1]区间中的任一数值,因此很适合于对传感器信息的不确定性进行描述和处理。

模糊的理论可以应用在多传感器数据源融合,模糊集理论首先用隶属函数来表示各数据源信息的不确定性,然后利用模糊变换进行数据处理。

模糊理论的信息融合、故障诊断、优化设计等方面的方法计算简单、应用方便、结论明确直观。

但在模糊融合数据融合中,构造隶属函数是实现模糊集数据融合的前提,它是主观设计的,受人为的可更改因素影响过大,不适合大规模的诊断与应用;

同时在选择各数据源的权重系数时也含有一定的主观因素,如果选择不当,必将影响数据融合的准确性与普适性[47]。

神经网络的基本思想:

神经网络数据融合是将人工神经网络(如BP网络)引入数据融合之中,同时结合模糊集合论进行数据分析与处理。

其具体过程如下:

通过多传感器测量相关数据,求出每一传感器在某症状下对目标模式中各类情况的隶属度值;

将所有传感器的隶属度值矢量作为神经网络的输入,网络输出即为融合后该数据源属于各类

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 文化宗教

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1