基于本体网络的重尾质研究.docx
《基于本体网络的重尾质研究.docx》由会员分享,可在线阅读,更多相关《基于本体网络的重尾质研究.docx(11页珍藏版)》请在冰豆网上搜索。
![基于本体网络的重尾质研究.docx](https://file1.bdocx.com/fileroot1/2022-12/29/f65bf9fc-88df-4b06-9877-c830e7a1194c/f65bf9fc-88df-4b06-9877-c830e7a1194c1.gif)
基于本体网络的重尾质研究
基于本体网络的重尾质研究
摘要:
本文对本体和复杂网络的概念、性质、特点等方面做详细的介绍,对Protégé软件进行了充分的了解,并应用此软件建立了一个农业本体。
对重尾性质的研究历史与当前的现状和农业本体的选择、研究进行简单的阐述,分析过去发展历史和未来前景的展望。
最后对重尾性质进行了具体的分析。
关键字:
本体复杂网络重尾性质研究
1、本体、复杂网络理论介绍
自20世纪90年代以来,随着知识共享、信息集成、语义web和web服务等技术的快速发展,本体研究在计算机领域倍受关注,逐渐成为研究的前沿和热点。
本体作为表达知识的共享概念模型,已日渐成为知识工程、知识管理、智能信息集成、信息检索和语义网等多个领域的重要组成部分,特别是自语义Web提出以来,本体正在成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面有重要的意义。
本体的概念
所谓本体,最著名或最多被引用的定义是由Gru.ber提出的“本体是概念模型的明确的规范说明”。
通俗地讲,本体是用来描述某个领域甚至更广范围内
的概念以及概念之间的关系,使得这些概念和关系在共享的范围内具有大家共同认可的、明确的、唯一的定义。
Studer等学者认为本体有四大特征:
(1)本体是明确的(Explicit):
是指概念所属的上位类与在使用次概念时的限制条件应预先得到明确的定义和说明。
(2)本体是形式化的(Fromal):
是指本体应该具有机器可读性。
(3)本体是共享的(Shared):
是指在一个本体中,知识所表达的观念、观点应该抓住知识的共性。
(4)本体是概念化的:
它是一个概念体系,又称概念模型(Conceptualization)。
根据本体不同方面的属性,可以将本体分为不同的类别:
(1)根据详细程度和领域依赖程度两个指标。
本体可分为:
顶级本体、领域本体、任务本体和应用本体。
(2)根据本体的形式化程度,本体分为高度非形式化的、结构非形式化的、半形式化的和严格形式化的。
(3)根据本体的描述对象不同,本体分为特殊领域本体(如农业、医药、地理等)、一般世界知识本体、问题求解本体和知识表示语言本体等。
复杂网络研究正渗透到数理学科、生命学科和工程学科等众多不同的领域,对复杂网络的定量与定性特征的科学理解已成为网络时代科学研究中一个极其重要的挑战性课题。
结构决定功能是系统科学的基本观点。
如果我们将系统内部的各个元素作为节点、元素之间的关系视为连接,那么系统就构成了一个网络。
例如神经系统可以看作大量神经细胞通过神经纤维相互连接形成的网络,计算机网络可以看作是计算机通过通信介质如光缆、双绞线、同轴电缆等相互连接形成的网络,类似的还有电力网络、社会关系网络、交通网络等等。
强调系统的结构并从结构角度分析系统的功能正是复杂网络的研究思路,所不同的是这些抽象出来的真实网络的拓扑结构性质不同于以前研究的网络,且节点众多,故称其为复杂网络。
近年来/大量关于复杂网络的文章在国际一流的刊物上发表,从一个侧面反映了复杂网络已经成为国际学术界一个新兴的研究热点。
Protege软件的熟悉以及使用
portege是美国斯坦福大学开发的本体开发工具,也是基于知识的编辑器。
portege使用JAVA和OpenSource作为操作平台,可用于编制本体和知识库(KnowledgeBase),portege可以根据使用者的需要进行定制,通过定制用户的界面以更好地适应新语言的使用;有可自行设置的数据输入模式,可以将portege的内部表示转制成多种形式的文本表示格式,如:
XML、RDF(S)、OIL、DAML、DAML+OIL、OWL等系统语言。
portege工具本身没有嵌入推理工具,不能实现推理,但它具有很强的可扩展性,可以插入插件来扩展一些特殊的功能如推理、提问、XML转换等。
portege提供可扩展的独立平台环境,用于构建和编辑本体以及知识库。
portege开放源码,运行多重继承,提供本体建设的基本功能,而且它采用图形化界面,界面风格与OilEd一样,都与WINDOWS操作系统的风格一致,模块划分清晰。
另外,portege本体结构和OntoEdit一样,也是以树开的等级体系结构来显示,用户可以通过点击相应的项目来增加或编辑类、子类、实例等,所以用户使用portege不需要掌握具体的本体表示语言,是用户比较容易学习、使用的本体开发工具。
它已成为国内外众多本体研究机构的首选工具。
portege应用范围很广,可用于:
类模拟(Classmodeling):
portege提供了一个图形化用户界面来模拟类(领域概念)和它们的属性及关系。
实例编辑(Instanceediting):
从这些类中,portege自动产生交互式的形式,全用户或领域专家进入的有效实例成为可能。
模型处理(Modelprocessing):
portege有一个插件库,可以定义语义、解答询问以及定义逻辑行为。
模型交换(Modelexchange):
最终的模型(类和实例)能以各种各样的格式被装载和保存,包括XML、UML和资源描述框架RDF.
调用protégé构建研究本体就是全面的、准确的描述和表示科学研究领域的相关要素,对知识检索、科研评价、热点揣测等应用中意义重大,这种设计不仅丰富了现有的实体类型,还能获得各知识对象彼此之间的层次类目关系,可以为进一步的研究应用提供有力的支撑。
Protege支持所有OWL建模原语,并提供语法检查、一致性检测、推理及调用等功能。
重尾性质的研究历史与现状
无论对于极值理论,还是对于其它的理论,重尾性质的研究都具有重要的意义,大量的实证结果表明,农业个链条的分布都是呈现出重尾性质的,因而重尾性质的研究都引起了人们的关注,许多学者提出了各种方法,都有不同程度的存在一定的局限性。
农业本体的选择、研究
按照联合国粮农组织的定义,农业本体是一个包含农业术语、定义及术语间规范关系说明的体系。
构建概念清晰、逻辑结构正确的农业领域本体,可以更好地检索资源。
增加农业领域内的交互作用.有助语义网站对多种语言的农业资源进行描述,并把它们联合起来.在获得这些资源过程中增加功能性及相关性.为共享农业领域内的通用说明、定义和关系提供一个框架,为农业知识服务提供更好的数据支持。
目前国内外对农业领域本体研究取得了一定进展。
FAO自2001年起开展了农业本体服务同计划的研究。
目前已构造了三个领域的原始本体,即渔业本体、食品安全领域本体和食物、营养与农业的本体。
Lauser和Keizer等研究构建了生物安全本体模型,提出首先构建核心本体。
然后基于启发式方法扩展核心本体。
Kokla和Kavouras等对构建地理信息本体中的异质异构地理数据的分类和集成进行了研究。
主要涉及地理信息本体构建中的信息抽取、比较、异质异构元数据集成。
中国农业科学院农业信息研究所开发完成了基于农业科技文献的智能检索系统和农业知识本体管理系统,并在农业本体的构建理论和信息资源组织体系技术等方面作了一些前瞻性的研究。
西南交通大学杨骏等人研究了面向山地生物多样性保护的资源本体空间分析问题,建立了基于Mereotopology与定位理论的山地多层生物资源本体模型,在此基础上完成了数字峨眉资源环境动态监测系统。
河北农业大学王芳等人提出基于本体进行农业问答语义管理的方法,对农业问答知识库采用本体进行知识表示。
利用protege软件建立一个农业本体
新建项目。
打开protege,然后会出现对话框,点击CreateNewOWLontology
然后确定文章保存目录,具体如下图所示。
出现CreateNewProject对话框后,选择OWLFlies(.owlor.rdf),然后单击完成。
建立类。
protege的主页面中会出现,OWLClasses(OWL类),Properties(属性),Forms(表单),Individuals(个体),Metedata(元类)这几个标签。
我们选择OWLClasses来编辑。
在AssertedHierarchy(添加阶层)中,会有所有类的超类owl:
Thing上点击AssertedHierarchy旁边的Createsubclass或者在OWL:
Thing,点击右键选择Createsubclass。
会出现protege自动定义名为Class_1的类。
在右边的CLASSEDITOR(类编辑器)的Name选项中,输入Animal来替换自动定义的名字。
建立Animal的子类,在Animal点击上右键,选择Createsubclass,并按照上述方法将其名字变为Herbivore(素食动物)。
然后按照上面的方法,建立OWL:
Thing的另一个子类Plant(植物),然后建立Plant的子类Tree(树)。
状态如下图
因为动物和植物是不同的事物,也就是说它们互相具有排他性(owl:
disjointWith),我们来定义这个关系。
在选中Animal的状态下,点击右下角的Disjoints的第三个按钮,在出现的Addsiblingtodisjoints(将互为兄弟节点的类设为排他)对话框中,选择Mutuallybetweenallsiblings。
这样动物和植物就有互相排斥的属性了。
运行结果如图所示
步骤6建立属性。
新建一个ObjectProperty(注意不是DataProperty)选择Properties标签,Name改为is_part_of,
然后在右下角Transitive前面打上对号,说明这是一个传递性属性。
然后建立一个对象属性(owl:
ObjectProperty)eat(吃),在Domain(定义域)中定义该属性的主体的类是Animal。
最后再建立一个属性eated(被吃),它是属性eat的逆关系(owl:
inverseOf),
在右下角Inverser框中选择eat属性。
建立一个owl:
Plant的子类Branch(树枝),并附加限制条件。
在选择Branch的状态下,点击中下方的AssertedConditions(添加条件)中的第二个按钮(Createrestrition)。
在弹出的对话框中,选择Restrition中的allValuesFrom,然后点击下方的Insertclass...。
最后选择Tree,这样我们就定义了类Branch,它是树(Tree)的一部分(is_part_of)。
同以上方法,建立owl:
Plant的子类Leaf(树叶)类。
在AssertedConditions选择is_part_of属性,并在Restrition中的选择allValuesFrom,最后选择属性类Branch(树枝),这样我们就定义了树叶是树枝的一部分。
定义素食动物,素食动物是动物的子类,而且只吃植物或是植物的一部分(植物和一部分植物的并集,也就是植物)。
和以上步骤一样在CreateRestrition对话框中添加式子。
最后定义类Giraffe(长颈鹿),它是素食动物,只吃树叶。
按照上面的步骤进行定义。
步骤11查看关系图,在菜单中选择Project–>Configure在出现的对话框中,在OWLVizTab前打上对号,就会出新OWLViz的标签,单击OK按钮。
选择菜单栏中的Showallclasses,就可以看到最终的关系图。
网络节点的度服从幂律分布,在一定的条件下,系统将会出现两极分化的情况。
此时,许多节点的度只有一个,而少数的节点的度和占度总和的百分之八十,这种现象被发现并广泛的存在于经济学、生物学、计算机网络、图书馆学中。
这种现象令系统的结构呈现出独特的稳定性,破坏百分之八十的普通节点并不会使网络瘫痪,但破坏一点的关键节点却足以毙命,即所谓的“阿喀琉斯之足”这种特点从经人纷繁的表象中提示了优美的内涵,激发了人们的研究兴趣。
这些研究的发现,现实中的多数网络是复杂的,它们有其动力学的成因,它们介于从规则网络到完全随机图之间的某一演化阶段,它们可以用节点均距、平均耦合度等工具进行分析和分类。
这些的理论不仅为我们开辟了一种新的系统科学观,而且对一些实际问题的解决有启发意义。
小清新文章来源——海内论坛:
www.hnlt.org
参考文献
[1]贾秀玲.文教伟一种本体学习中分类关系提取方法的研究[期刊论文]-计算机技术与发展2007(10)
[2]何琳.杜慧平.侯汉清领域本体的半自动构建方法研究[期刊论文]-图书馆理论与实践2007(05)
[3]谢能付.王文生农业知识本体构建方法[期刊论文]-农业网络信息2007(08)
[4]刘柏嵩.高济基于web的通用本体学习研究2007
[5]朱永海.陈雄辉.李昊基于复杂网络理论的科技中介问题[期刊论文]-科技进步与对策2008(3)
[6]马杰良.邢雪.安莉莉基于科研合作网络的节点枢纽特性研究[期刊论文]-东北电力大学学报2008
[7]张大陆.王志晓.刘雯.杨哲基于复杂网络的本体结构分析[期刊论文]-同济大学学报2009
(2)