地理语义.docx

上传人:b****6 文档编号:4637626 上传时间:2022-12-07 格式:DOCX 页数:25 大小:847.05KB
下载 相关 举报
地理语义.docx_第1页
第1页 / 共25页
地理语义.docx_第2页
第2页 / 共25页
地理语义.docx_第3页
第3页 / 共25页
地理语义.docx_第4页
第4页 / 共25页
地理语义.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

地理语义.docx

《地理语义.docx》由会员分享,可在线阅读,更多相关《地理语义.docx(25页珍藏版)》请在冰豆网上搜索。

地理语义.docx

地理语义

第一章语义Web

§1语义Web的背景和意义

1.1语义web出现的背景

1.1.1背景

TimBerners-Lee提出了语义Web[1]的伟大构想。

简言之,语义Web就是能理解人类语言的智能网络,可以使人与计算机之间的交流变得很轻松。

1.1.2语义web概念

通过将Web内容的语法结构和语义以知识表示形式显示地表示出来,以实现与其它信息源共享,使得人之间、人和机器之间以及机器与机器之间能准确地相互理解,从而实现最大程度的互操作性。

1.1.3语义web出现的原因和可解决的问题

1.1.4语义Web的主要功能

语义Web要能顺利工作,就要求计算机能结构化地组织信息和规则集合,以使计算机利用规则进行自动推理。

1.1.5语义Web的基本结构

语义Web体系结构是一个七层模型,其结构如图1所示。

URI全球命名模式

XML层作为语法层

RDF层作为数据层

本体层(OntologyLayer)作为语义层

逻辑层(LogicLayer)提供了基于本体层上的智能推理规则

证据层(ProofLayer)支持代理间通讯的证据交换。

一个本体描述了一个特定研究领域的一个形式化的、共享的概念化模型。

本体非常适合于描述互联网上各种不同的、分散的、半结构化的信息资源。

通过定义共享的、通用的领域理论,本体帮助人和机器明确的交流,支持语义级的交换,而不仅仅是语法级的。

逻辑层提供了规则与推导方法,从而便于在本体层上进行推理,得到有用的语义信息。

从一定的程度上讲,本体层定义的是否合理直接关系到推理的难易和结果的有效性。

而证据层则在此基础上使代理可以交换推理的结果。

为了检查这些结果,需要将各代理的内部推理机制转化为一种通用的证据表示语言。

比如,某个在线服务找到了李小姐的联系信息,而令人惊讶的是她在上海。

当然,你要核对一下,所以你的计算机让服务来证明它的回答,服务立即将其内在的推理理由翻译成语义网络的统一语言,你计算机中的界面引擎证实了这个李小姐确实符合你的查询要求,如果你还有疑问,它能显示出相关的网页。

语义网结构中的数字签名和确信(Trust)则是为了保证信息交换的安全问题而设计的,信息交换的双方必须建立了一种信认关系才能在一定程度上保障信息的有效性。

Berners-Lee是WorldWideWebConsortium(W3C)的理事,以及麻省理工学院计算机科学实验室的研究员,他致力与互联网技术的研究很多年,提出了语义网理想的层次模型

1.2语义Web的意义

§2语义Web的关键技术

2.1XML

XML作为一种资源描述语言,由于其良好的可扩展性和灵活性,适合于表示各种信息,因而被广泛接受,已被认为是未来Web上数据交换的标准。

XML不仅提供对资源内容的表示,同时也提供资源所具有的结构信息。

但是,从方便信息搜索的角度看来,仅有XML是不够的。

2.2RDF与RDFSchema

一种用来描述数据的标准语法。

是W3C推荐的用于描述和处理元数据的一个草案,能为Web上的应用程序之间交互提供机器能理解(处理)的信息。

它独立于任何语言,适用于任何领域,是处理元数据的基础。

2.3本体(Ontology)

本体概念

本体是哲学上的概念,从哲学上讲本体就是客观现实的抽象本质。

人工智能领域,本体是指给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义。

计算机领域对本体最流行的定义就是概念模型的明确的规范说明。

本体的目标

本体的目标就是获取相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的概念及其属性,并从不同层次的形式化模式上给出这些概念和概念之间相互关系的明确定义。

本体应用中的目的

人类、数据库和应用软件使用本体来共享领域知识(一个领域是指一个特定的学科范围或者知识范围,例如医药、设备制造、房地产、汽车修理以及财务管理等)。

本体既包括一个领域内的知识也包括各种领域之间的知识,使用这种方式使知识被重用。

本体的描述语言和技术

本体描述语言有很多,如:

RDF(S)、OIL、DAML、DAML+OIL、OWL、SHOE和XOL等。

另外,开发本体的工具有很多,如KAONOntoMatSOEP、OntoEdit、Ontolingua、Protégé等。

在语义网中,Ontology具有非常重要的地位,是解决语义层次上Web信息共享和交换的基础。

2.4现实世界-实体的角色-表达格式

图表明了现实世界的表达(数据,元数据和本体),实体的角色(事实,定义和知识),表达格式(XML,RDF,DAML+OIL和OWL),以及语法(syntax),模式(schematics)语义(semantics)这些概念之间的关系。

XML层是数据表示的语法层,RDF层是元资料层,本体层是在元数据层基础上构造领域知识。

实现地理信息服务,需要解决三个层次上的问题,即地理认知不同所引起的问题、对地理认知的描述方式不一致的问题和数据层次上的问题。

借助于本体,能够明确地理信息的语义信息,解决由于地理认知不同所引起的问题及其逻辑描述的互译问题,从而达到知识层面上的地理信息服务。

§3语义Web的具体应用

3.1智能信息检索与语义搜索(地理实体知识搜索)

存在问题和问题原因

面对Web上的海量信息,传统的Web信息表示方法使信息检索的查准率和查全率均不理想。

根本原因在于当今万维网的信息主要是基于语法构建的,因此要改进信息检索的效果,就必须对万维网上的信息进行语义标记。

语义Web技术解决该问题方法和关键技术

提供这一机制就是本体。

本体的构建需要领域知识专家的参与。

从当代WWW上保留的大量普通Web页面中提取出语义信息,构建出页面内容的本体,然后根据本体对新的页面进行语义标记,这是一种可能的途径。

实现这一过程可采用本体自学习系统,从而实现本体的自动或半自动获取。

文本信息可以采用语义Web技术,结合模式识别和对象提取等技术,实现基于本体概念的检索。

语义web解决问题的实例方案

现有的搜索引擎是基于关键字的[3],关键词的多义性和同义性降低了搜索的准确性,在搜索时通常会找到大量的与目标无关的内容。

如搜索“老泰山”,可能返回大量与泰山有关的页面,而这与用户的本意相差太远。

语义Web技术能根据精确的概念、知识结构和推理规则进行搜索,从而得到与用户目标比较接近的结果。

如上例返回的结果就一定是与“岳父”有关的信息。

 

3.2个人和企业的知识管理(语义空间数据共享、建库或者语义空间数据模型)

存在问题和问题原因

过去的知识管理面向的是存放于文件或是数据库中的知识。

当知识库规模不断扩大,知识的检索和处理也就开始变得低效;而且,不同的异构数据源之间也很难达成数据共享。

语义Web技术解决该问题方法和关键技术

通过语义Web技术,特别是借助于本体(Ontology)和机器可处理的元数据(Metadata),对知识进行精确的语义标注之后,这为知识管理由更多的面向文件的观点转化为更多的面向知识项目的观点铺平了道路。

实现异构数据源的知识共享不再是难事。

(解决数据共享的模式

解决数据共享的模式大致有三种:

数据格式转换模式、直接数据访问模式和数据互操作模式[2].对于数据格式转换模式,由于缺乏对数据对象统一的描述方法,不同数据格式描述空间对象时采用的数据模型不同,因而转换后不能完全准确地表达原数据的信息,经常性地造成一些信息丢失,且各转换方案还没有为数据的集中和分布式处理提供解决方案,不能自动同步更新.直接数据访问提供了一种更为经济实用的多源数据共享模式,但直接数据访问同样要建立在对要访问的数据格式的充分了解的基础上,如果要访问的数据的格式不公开,就难以实现了.)

3.3基于Ontology的智能信息Agent(分布式Agent空间数据计算和知识获取)

存在问题和问题原因

面向Agent的计算能帮助人们在复杂、异构、不确定的信息环境中识别复杂模式。

可是,由于Agent难以理解和处理自然语言描述的数据[4],它不能充分发挥其优势。

语义Web技术解决该问题方法和关键技术

语义Web为智能Agent提供了很好的语义环境,如果由智能Agent存取Web上的信息,语义Web的本体库就显得很有用了,它允许Agent处理本体中的概念和一组推理规则,这提高了Agent处理信息的准确性。

语义web解决问题的实例方案

搜索Agent可以只搜索指向精确概念的那些Web页面,而不是含有具有歧义的关键词的所有页面。

更高级的Agent将根据本体自动把Web页面信息关联到相关的知识和规则,发现并获取Web上的有用信息。

3.4语义Web服务

语义Web在Web服务中的用途

语义Web服务是将语义Web技术应用到Web服务领域,实现Web服务的自动发现、调用和合成。

Web服务使用语义Web的条件

然而,这种假设基于两个前提[5]:

第一,所引用的Ontology支持自动推理;第二,智能Agent能够理解Ontology中的概念。

要实现这两个前提需要基于描述逻辑的本体形式语言如OWL和标准的、更高层次的本体如基于OWL的框架OWL-S[6-7]以使本体所表达的语义得到统一。

常用的描述Web服务的语义语言

OWL是一种定义和实例化“Web本体”的语言。

OWL提供了3种表达能力递增的子语言OWLLite、OWLDL和OWLFull,以分别用于特定的实现者和用户团体。

OWLLite用于提供给那些只需要一个分类层次和简单约束的用户,OWLDL支持那些需要最强表达能力的推理系统的用户,OWLFull支持那些需要尽管没有可计算性保证,但有最强的表达能力和完全自由的RDF语法的用户。

在OWL-S中,一个服务由3个部分来描述:

ServiceProfile、ServiceModel和ServiceGrounding。

ServiceProfile说明服务是干什么的,ServiceModel说明服务是怎么做的,ServiceGrounding详细地说明了该如何访问服务。

3.5语义Web挖掘

语义Web挖掘的优势

语义Web挖掘[8]旨在将Web挖掘和语义Web这两大研究领域结合起来,使其相互促进、共同发展。

一方面,Web挖掘的结果有助于构建语义Web;另一方面,语义Web的语义知识使得Web挖掘更易实现,同时能改善Web挖掘的结果。

语义Web挖掘的基本执行过程

语义Web赋予传统的WWW形式化的语义知识,从而为丰富传统的Web挖掘奠定了良好的基础。

在语义Web中超链接通过显式的方式表达出来,这使得知识工程师须对Web结构进行更进一步的挖掘;同时,Web页面内容具有了明确的语义要求能够接受更加结构化的数据输入的Web挖掘技术。

相应地,语义Web挖掘分为:

语义Web内容及结构挖掘和语义Web使用记录挖掘。

3.6语义网格

语义网格出现背景

在英国的e-Science计划研究中,人们发现,网格的现有努力和e-Science设想之间存在差距,要达到e-Science的易用性和无缝自动化要求,必须实现尽量多的机器可处理性和尽量少的人类介入,这和语义Web的目标有一定的相似。

语义网格概念

在2001年最先提出了语义网格的构想,并于2002年在全球网格论坛GGF成立了语义网格研究组SEM-GRD。

语义网格小组对语义网格进行的定义如下[9]:

语义网格就是“对当前网格的一个扩展,其中对信息和服务进行了很好的定义,可以更好地让计算机和人们协同工作”。

可以说语义网格是网格在语义能力上的扩展;从另一个角度也可以说语义网格是语义Web对计算能力的扩展。

语义网格构想的关键之处就是把所有的资源,包括服务,都用一种机器可处理的方式来描述,其目标是实现语义的互操作性。

实现语义网格方法

达到这个目标的一种实现方法是把语义Web的关键技术应用到网格计算的开发中,下至基础设施上至网格应用。

语义网格通过将网格上的信息进行更好的形式化描述以使计算机尽可能取代人进行网格上信息处理,从而让诸如电子商务、电子政务、数字图书馆等智能化服务在网格上开展成为可能。

当前研究状况

中国科学院计算技术研究所知识网格研究组在诸葛海研究员的带领下正在开展语义网格方面的研究。

重点解决3个方面的问题:

资源的规范组织、语义互联和智能聚合。

3.7对等计算(P2P)

P2P[10]与语义Web技术结合的优势

P2P[10]与语义Web技术的结合可支持分散的异构的环境,可用较小的努力来分享知识,知识分享和发现比较容易。

P2P[10]与语义Web技术结合关键技术

它们能否结合成功的关键在于“即时语义”的使用。

“即时语义”建立在轻载的或重载的本体上,这些本体由不同的个人、部门或组织创建。

为了能为不同的个人或组织提取共享的本体,“即时语义”考虑了本体定义、概念的使用、与实际数据的关系之间的重叠。

智能代理将使用这样的定义来确保知识被适当地构造,以便能轻易地被重用。

3.8电子商务

存在问题和语义Web可解决内容

传统的电子商务存在许多问题:

控制问题、信息发现问题、环境问题、兼容性问题和智能问题等。

在电子商务应用中引入语义Web技术能在一定程度上解决上述问题。

研究状况

目前国内外对语义Web技术在电子商务中应用的研究[11]主要集中在描述语言、基于本体的企业商务集成方法与架构(用户需求或产品或企业商务过程的语义描述、本体映射、Web服务发现与组合、电子商务集成框架)、领域本体的管理(包括电子商务本体构建、本体库的管理)、CRM、电子交易、企业知识管理等方面。

3.9电子政务

语义Web技术在电子政务中的优势

在电子政务建设中,充分利用语义Web赋予Web资源更明确、更完善的语义,使得在政府不同部门之间、公众与政府之间对词汇的表示达成一致的同时,机器也能够理解Web上的内容并实现不同政务系统之间的协同工作。

同时,语义Web给智能Agent和Web服务提供了语义信息和必要的推理机制,这使得电子政务平台在分布式的环境下具有良好的智能,各种政务应用能够无缝地进行语义互操作,克服现有电子政务平台的一些不足。

语义Web技术在电子政务中可解决的问题

语义Web技术对电子政务的影响主要有:

解决电子政务中标准化问题,提供智能的查询服务,提供一站式服务,实现语义互操作和政务智能以及实现有效的知识管理等。

3.10语义门户

传统门户的问题

传统门户是基于传统Web技术建造的,以人为使用对象,而传统Web技术在信息的搜索、访问、提取、注释和处理方面表现出很大的局限性,如缺乏对Web上信息的描述。

HTML提供的链接缺乏语义,基于关键词检索的查准率低下,从而限制了门户网站对信息共享和通信的支持。

语义门户的优势

语义门户[12]是语义Web技术驱动的门户网站,它是实现具有共同兴趣目标的用户之间的信息交流和共享的平台。

语义门户使用语义Web技术来提供语义检索、浏览和内容集成,语义Web标准为这种门户的设计开创了新思路。

尤其是它可以为人们如何揭示门户信息提供相关标准;RDF的出现使得信息项及相关元数据具有了灵活的、可扩展的格式;OWL能够明确揭示对信息项进行分类与建构的领域本体。

同传统门户相比,使用语义Web标准进行门户设计具有以下优点:

多维检索和浏览、信息结构的演化和扩展、领域扩展、跨学科门户整合等。

已有一些建成的语义门户实例

目前在国外已有一些建成的语义门户,比如OntoWeb、Esperonto、EmpolisK42、MondecaITM、SWWS、ITM、Mindswap、OntoWebEdu等,而在国内尚少。

创建语义门户的方法和框架也有很多,比如SEAL、ODESeW、K42、ITM、OntoWebber、Onto-Weaver等。

这些方法各有其特点,奥地利的HolgerLausen等人建立了一套评价体系,并对上述的前4种方法作了比较详细的比较和评价。

第二章基于本体的空间信息集成与共享技术

§1空间信息共享存在的问题

1.1空间数据组织管理方式

空间数据组织管理方式具有很大的差异性

表现在属性字段组织、空间索引、数据存储方式等方面。

空间数据属性结构千差万别,不同的应用领域、不同的部门行业等都有不同的数据需求,专题空间数据结构也会根据实际应用进行重定义、重组织。

空间数据库在组织设计阶段就已经产生了概念化的异构

空间数据的索引方式也是多种多样,目前主流的索引方式包括格网索引、四叉树空间索引、R树和R+树索引等,不同的GIS厂商采用不同的索引方式,如ESRI公司的空间数据库引擎ArcSDE采用的是网格索引方式。

1.2空间信息的异构性

目前,参与共享的空间信息资源具有分散和异构特点。

空间数据信息来自不同的部门、不同的组织,分布于各业务部门各自的计算机上,对应各自的应用和管理系统具有不同的结构。

空间信息资源在这些方面存在异构性特点。

它们从概念分类、应用性质、获取手段上都具有很大的差异性。

基本的数据模型基于矢量模型表达和基于栅格模型表达两种

具体到各个应用部门,针对不同的业务需求,不同的地理空间数据采用不同的地图投影和地理坐标系统,造成空间数据参考信息的差异性。

异构主要表现在:

●数据内容和数据源

●空间数据模型表达机制、

●空间数据格式、

●空间参考信息、

●空间数据存储方式、

●支撑软件平台

1.3空间数据库在设计过程中产生的概念化异构

1.4空间信息缺乏语义描述

●GIS主要侧重表达地理特征的几何成分,语义关系不被重视,对现实世界空间几何目标的抽象忽视了地理现象的本质特性及现象之间的内在联系,减少了信息容量;

●注重空间位置描述的矢量或栅格数据组织模型,丧失了以分类属性和相互关系为基础的结构化实体所提供的丰富的分析能力。

●基于专题地理分层的空间数据表达思想和单一图层内以矢量或栅格数据结构基本单元作为地理实体或现象基本建模单元的表达方式,对于复杂地理实体或现象的描述及地理过程分析存在严重不足。

●这就使已有的地理信息系统成了功能层次较低的空间数据存贮和管理系统,难以进行较高层次的空间分析和辅助决策。

忽视语义关系会使人们在己有的认知水平上对原本为有机整体的地理世界进行僵硬的分割,从而导致基于这种认识的GIS在复杂的、深层次的空间分析上显得被动。

1.5对空间知识理解差异导致语义异构

●由于人们对各自领域内空间信息认知的不同,导致对同一地理现象观察描述会侧重于对象不同的切面,从而产生观点上的差异,形成语义异构。

●由于现有的空间数据模型多是从计算机表达的角度出发,而不是面向真实地理环境,所以缺少对领域内空间地理实体或现象的显式定义和基础关系描述,不能在语义层次上实现数据的共享。

§2空间信息集成共享发展阶段

(1)文件管理模式阶段

空间信息互操作与数据共享主要通过数据格式转换来实现,存在的问题是数据格式相互封闭、空间数据在转换过程中会有信息丢失、效率很低下等,因此,无法解决空间信息共享问题。

(2)空间数据库管理模式阶段

通过把图形与属性数据同时存放于对象关系数据库中或通过空间数据库引擎(SDE)来存入关系型数据库实现数据与信息的共享,由于不同的GIS软件平台所采用的数据库存储格式与空间索引方式仍然不相同,因此,也不能从根本上解决空间数据共享集成问题;

(3)元数据信息交互模式阶段

通过抽取空间数据的元数据信息,提供对空间数据的名称、来源、组织结构、适用范围等特征描述,利用空间数据元数据建立的空间信息的数据目录和数据交换中心实现对数据的发现、获取、理解,从而实现空间信息的共享集成利用,但共享仅限于语法层次,无法满足基于语义的共享集成。

(4)Ontology驱动的空间信息共享与互操作阶段

一代Web(SemanticWeb)出现了,它试图在语义与知识的层次上实现互联网上资源的全面连通交互与共享,特别是Web信息或知识等资源语义级的精确表达、共享与互操作。

研发支持语义环境下空间信息与知识互操作的关键机制与技术已成为必然。

现在,在语义层次上的知识与信息互操作核心技术方面,人工智能(AI)与知识工程(KE)领域的Ontology理论与技术己经成为国内外相关研究的主流,许多研究者或机构已经开始了基于Ontology的信息与知识系统集成方法(OntologyBasedInformationSystemIntegration)研究,并己经取得阶段性成果;Web环境下语义层次的空间信息或知识互操作与共享研究也己经开始,并且也引入了基于Ontology的GIS集成方法研究。

研究实践表明,Ontology技术将对语义化Web环境下的空间信息集成共享起到关键性作用。

§3本体的构建

3.1本体(Ontology)概念及目标

上世纪70-80年代信息科学特别是计算机科学开始了对自然世界认知的形式化的表示的研究,也就是可被计算机表示,解释和利用的知识的形式化研究。

Ontology:

通过对概念的严格定义和概念与概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识。

范畴

提出时间/提出人

定义

哲学

客观存在的一个系统的解释和说明,客观现实的一个抽象本质

计算机

1991/Neches等

给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义

1993/Gruber

概念模型的明确的规范说明

1997/Borst

共享概念模型的形式化规范说明

1998/Studer

共享概念模型的明确的形式化规范说明

共享概念模型的明确的形式化规范说明:

1.概念模型(conceptualization)

通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态

2.明确(explicit)

所使用的概念及使用这些概念的约束都有明确的定义

3.形式化(formal)

Ontology是计算机可读的。

4.共享(share)

Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。

Ontology的目标

Ontology的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。

不同的系统描述领域的时候使用不同的概念和术语。

所以很难从一个系统中提取知识运用到另一个系统中。

开发可重用的Ontology以推进共享和重用是Ontology研究的一个重要目标。

3.2Ontology的建模元语

五个基本的建模元语(ModelingPrimitive)

✧类(classes),概念(concepts):

概念的定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间关系的集合,以及用自然语言对该概念的描述。

✧关系(relations):

关系代表了在领域中概念之间的交互作用。

形式上定义为n维笛卡儿乘积的子集:

R:

C1×C2×⋯×Cn。

如:

子类关系(subclass-of)。

✧函数(functions):

函数是一类特殊的关系。

在这种关系中前n-1个元素可以惟一决定第n个元素。

形式化的定义如下:

F:

C1×C2×⋯×Cn-1→Cn。

例如Mother-of关系就是一个函数,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 高中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1