空间数据仓库元数据的研究现状综述.docx

上传人:b****5 文档编号:7609874 上传时间:2023-01-25 格式:DOCX 页数:10 大小:309.35KB
下载 相关 举报
空间数据仓库元数据的研究现状综述.docx_第1页
第1页 / 共10页
空间数据仓库元数据的研究现状综述.docx_第2页
第2页 / 共10页
空间数据仓库元数据的研究现状综述.docx_第3页
第3页 / 共10页
空间数据仓库元数据的研究现状综述.docx_第4页
第4页 / 共10页
空间数据仓库元数据的研究现状综述.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

空间数据仓库元数据的研究现状综述.docx

《空间数据仓库元数据的研究现状综述.docx》由会员分享,可在线阅读,更多相关《空间数据仓库元数据的研究现状综述.docx(10页珍藏版)》请在冰豆网上搜索。

空间数据仓库元数据的研究现状综述.docx

空间数据仓库元数据的研究现状综述

空间数据仓库元数据的研究现状综述

空间数据仓库元数据的研究主要取决于地理空间元数据的研究,它们之间有区别又有联系,由于空间数据仓库元数据的研究较少,下面我们重点叙述一下地间元数据的研究现状,搞清地理空间元数据的研究现状对我们研究空间数据仓数据至关重要。

地理空间元数据的研究涉及计算机科学、信息科学及元数据主题涉及到的各个学科,对地理空间元数据的研究现状的说明有助于更好地开发和利理空间元数据。

地理空间元数据被列为数字地球的六大关键技术之一,它是数理空间信息共享的核心标准之一。

目前,越来越多的数据生产者和数据用户都认识到元数据的重要价值,国内外已有不少组织或部门对其进行研究。

1.国外对地理空间元数据的研究

 

国际社会对地理信息标准化的研究工作已有十年左右,美国联邦地理数据委员会(FGDC)、开放GIS协会(OGC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(150)地理信息/地球信息业技术委员会(150/TC211)等组织都己经成立了各自的工作组,并从影响地理数据发展的不同方面开始讨论地理信息共享标准的制定工作,元数据标准是他们主要的攻关课题,成为各个组织首要研究的内容(见表1.1)。

对于地理空间元数据标准的研究,目前国际上主要有三个组织做了大量的工作,它们是美国联邦地理数据委员会(FGDC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(150)地理信息/地球信息业技术委员会(150/TCZll)。

(1)数字地理空间元数据内容标准(CSDGM)

美国联邦地理数据委员会(FederalGeographicalDataCo咖ittee,FGDC)由农业部、商业部、能源部、内务部、国务院、交通部、环保局、国会图书馆、宇航炳、档案局等多个部门组成,并由内务部负责,其目的主要是负责联邦地理数据的协调发展、使用、共享和宣传,成立于1990年,17位专家组成。

1992年6月举办了地理空间元数据讨论会,与会者认为需要研制地理空间数据的元数据内容标准。

该委员会一下设的标准化工作组起草了CSDGM标准草案,后几经征求意见、修改、测试,于1994年8月通过并发布第一版CSDGM。

此后,联邦政府内外的许多单位根据12906号总统令的要求,从1995年开始执行这一标准,并利用自动索引和服务机制,为用户提供通过因特网访问其数据库的服务。

FGDC于1997年完成了第二版CsDGM。

FGDC数字地理元数据内容标准的功能是确定一个描述数字地理空间数据的术语及其定义集合,包括满足这个功能的数据元素、复合元素(一组数据元素)以及它们的定义和域值,用以描述数字地理空间数据集的元数据信息内容。

CSDGM说明一组数字地理空间数据的元数据的信息内容,提供与元数据有关的术语与定义,说明哪些元数据元素是必需的、可选的、重复出现的,或者是按CSDGM产生规则编码的。

CSDGM是参照文件,它说明当用户在评价数据集的用途、获得该数据或有效使用数据时,需要知道的事情。

该标准的元数据包含7个主要子集和3个次要子集(见表1.2),共有460个元数据实体(含复合实体)和元素。

CSDGM中的内容主要是根据下面四个方面的原则制定的:

·获取性:

确定某一地理数据集所在位置的信息

·适用性:

决定数据集是否满足特殊需要的信息

·数据访问:

获取某一地理数据集所需的信息

·数据转换:

处理和使用某一数据集所需的信息

 

元数据元素是元数据的关键术语,是其最基本的单元。

一个元数据元素说明地理空间数据的某一方面的特征。

按数据库语言,它们是添入数据的“字段”。

一个或若干个元数据元素组成元数据实体。

复合实体则由元数据实体、元数据元素和/或其它复合实体构成。

每个元数据元素、实体或复合实体均需说明其名称、定义、类型、值域、简称等特征信息。

元数据子集是由若干元素、简单的或复合的元数据实体组成的集合。

CSDGM标准规定了三种性质的子集、实体和元素。

这三种性质是:

必需的,即必需提供的信息;一定条件下必需的,即如果正在建立的元数据包含某子集、某个实体,或某个元素说明的特征,则必需提供的信息;可选的,即该信息是可选的,由用户决定是否将其包含在元数据文件中。

其中有几点需要注意:

.元数据子集、实体和元素名称必须与标准完全一致;

.元数据的实体(含复合实体)与其元素之间的关系必须处理好,即元素总是跟随各自的实体;

.元数据即使符合标准,看起来也可能是不一样的。

这是由于标准仅说明元数据的内容,而不是它的格式。

不同格式包括:

元数据元素分层缩排、编号系统、元素名后加冒号、在元素名称下划线,或者将其作为分开的单词等。

可以利用元数据操作软件将它们规则排列起来。

操作工具可以读入元数据文件,输出与标准一致的元素名称。

CSDGM是目前世界上许多国家和组织制定其元数据标准内容体系的基础,它主要来源于美国信息高速公路(Nll)政策的出台以及政府对高科技的重视和投资,美国投入了大量的人力和财力从事这方面的研究〔FGDC,1994,1997〕。

美国在制定FGDC第一个地理信息元数据草案时,克林顿总统便在1994年4月n日签署了名为“协调地理数据的获取与访问:

国家空间数据基础设施”的12906号总统令,以加速美国空间信息基础设施的建设步伐,并要求“在执行令发布后的最初九个月时间中,每个机构对新采集的数据应直接或间接地按照FGDC制定的标准制成电子版形式,并能通过数据交换中心进行访问[NSDI,1994〕。

在执行令发布的一年时间里,所有的机构应同FGDC协商制定一个计划,把以前直接或间接采集的所有地理数据制成电子版,并在交换中心网络中可以访问。

无疑,12906号执行令的发布大大促进了美国地理信息标准化的发展,同时,元数据在美国社会产生了巨大的影响,加快了全球空间地理信息高速公路建设的步伐以及数字地球概念的提出。

当然,该标准既没有确定信息在计算机中的组织形式,也没有确定信息的传输、通讯或信息如何到达用户手中的方式,因此真正的信息共享还有待于其他标准的共同发展。

(2)150/TC211地理信息

国际标准化组织(InternationalStandardorganization,简称ISO)作为全球标准的权威机构,对地理数据标准化问题一直比较重视。

随着标准的发展,采取一种统一的协作方式,尽快建立可共享的标准化体系便成为全球关注的热点,而引人注目的便是ISO/TC211的行动。

ISO/TC211是一个关于地理信息/地球信息业的标准化技术委员会,成立于1994年,专门研究和建立编号为ISO15046地理信息标准系统,元数据标准是其组成部分之一。

该委员会下设五个工作组,分别是:

框架和参考模型(WG1)、地理空间数据模型和算法(WG2)、地理空间数据管理(WG3)、地理空间服务(WG4)、专用标准(WG5)。

每个工作组又由一定数量的工作小组组成,共有二十个工作小组,标准的制定工作便由工作小组来完成。

它的目的是建立一个处理与地球位置有直接或间接关系的地理对象的标准体系,包括数字地理信息的获取、处理、分析、访问、表示以及转换的方法、工具和服务体系。

自其成立以来,就将“地理信息一元数据”作为其首批研制的20个国际标准之一,编号为ISO15046-15(见表1.3),由美国国家影像制图局(NIMA)的DavidDanko先生担任项目负责人,它以地理信息的实时性、精度、数据内容和属性、数据来源、价格、图层以及适用性等为研究对象。

 

1996年3月完成第一版工作草案(WDv.1.0)。

经过多次修改,先后完成近10个更新版本,1998年5月完成最后一版工作草案(WDv.4,4),已作为委员会草案(CD)提交给ISO/TC211各成员团体征求意见.该标准以FGoc等的己有标准为基础,按照国际标准化组织制定的标准导则要求制定。

其工作范围是:

定义说明地理信息和服务所需要的信息。

它提供有关数字地理数据标识、覆盖范围、质量、空间和时间模式、空间参照系统和发行等信息。

该标准适用于数据集编目、数据交换网络,以及数据集的详尽说明,适用于地理数据集、数据集系列、地理要素和属性。

它定义:

.必选和一定条件下必选的元数据实体和元素—提供元数据应用、数据发现、决定数据对于应用的适合程度、数据访问、数据转换和数据应用所需要的最少的核心内容;

.可选的元数据元素—如果需要,对地理数据的更加详细的标准说明;

.为适应特殊需要对元数据进行扩展的方法。

尽管该标准是用于数字数据的,它的原则也能扩展用于许多其他形式的地理资料,如地图、图表、文本文件等。

在150/TCZll中,元数据的内容标准由两大部分组成[ISO/TC211,Metadata],一部分是用户必须遵循的标准化部分;另一部分信息化部分,它用于通过提供事例等方法来帮助指导用户,以便更好地理解标准。

同时为了使标准能够满足不同应用需求,把标准内容又分为目录信息和标准部分两层,其中目录信息用于从宏观上获取元数据信息,而标准部分则是元数据的详细信息,以全面地描述地理数据集的内容(图1.1)。

 

标准化部分是元数据内容的核心,它定义了描述地理信息所必须的规则以及元数据的元素组成。

这些标准元素适用于所有的地理数据,可用于描述数据集系列、数据集、独立地理要素以及它们的属性等,并对描述数据集所需的必选项、条件必选项和可选项等作了明确的定义。

另外,为了满足不同专业的标准化需求,ISO/TC211中还增加了扩展元数据元素所需的规则,使不同行业和区域可根据自己的用途扩展元数据元素,以形成元数据的行业标准。

这样按照扩展标准制定的元数据元素,就可以方便地被其他用户理解和使用了。

该标准是迄今最为完整、也最为复杂的标准方案,它的制定,必将影响许多国家的地理信息元数据标准的制定和实施,并进而对全球数据管理与服务产生很大的影响。

(3)CEN地理信息一数据描述一元数据

欧洲标准化组织(CEN)于1995年推出的一个有关地理信息描述的元数据标准乃案。

欧洲标准化组织是从事元数据研究比较早的单位〔CEN/TC287,Secretariat,1996〕,欧洲地理信息标准化委员会(CEN/TC287)早在1992年就开始了有关数字地理信息标准化方面的工作,并成立了四个工作组分别进行地理信息标准化枢架、地理信息模型和应用、地理信息传输以及地理信息定位参考系统等方面的标准制定熟作。

CEN/TC287成立后,通过会议等方式很快建立了一系列标准草案,并通过14G个工作组展开工作(第4和第12工作组空缺),其中元数据属于第2个工作组中的第9个工作小组,即287009(见表1.4)。

它的目的是想通过建立一系列结构化标准,以确定一种用于定义、描述、传输以及表示现实世界的标准方法,促使与地理位置有关的数据信息的使用。

 

在CEN/TC287中,把元数据分为标识信息、数据集综述信息、数据质量元素、空间参照系信息、范围信息、数据定义、分类信息、管理信息、元数据参考信息和元数据语言等10个部分来描述(图1.2),每一部分又有各自的组成元素。

 

(4)其它元数据标准

除了上述元数据标准外,国外还有许多机构根据需要制定了或正在制定具有自己特色的元数据标准,如:

美国国家航空与航天局(NASA)的目录交换格式DIF。

主要用于说明遥感数据特别是卫星遥感数据的一个实际应用的元数据标准。

澳大利亚和新西兰的元数据核心元素标准。

澳大利亚和新西兰土地信息委员会(ANZLIC)1994一1997年战略计划要求制定和执行澳大利亚、新西兰国家土地和地理数据目录系统。

美国国际地球科学信息网络中心(CIESIN)的元数据标准。

CIESIN是1989年成立的一个非盈利、非官方组织,目的是为科学家、决策者和公众提供有关信息,以便更好地认识不断变化的地球。

该组织主要从事全球和地区网络开发、科学数据管理、决策支持、培训、教育和技术咨询服务,它也是WDC一A(世界数据中心一A)的中心,存储大量科学数据。

为了对其存储的数据进行有效地管理和便于用户使用,它制定了元数据标准,并建立了元数据库,供用户通过网络查询检索。

加拿大一般标准委员会(CGSB)的描述数字地理参考集的目录信息。

开放GIS协会(OGC)作为全球性的一个权威Gis组织,元数据是其考虑的重要规范之一,ISO/TC211的元数据标准将是它在地理信息元数据方面的标准依据。

为了适应全球化发展,OGC与ISO/TC211进行磋商并已经达成合作协议,SO/TC211组织制定的标准,OGC予以采纳和实施,使该标准具有沉OGC和ISO/TC211的“双重标记”,以便能共同形成一个满足GIS互操作的元数据标准体系。

2.国内对地理空间元数据的研究

与国外相比,国内对地理空间元数据的研究起步较晚,但是元数据在地理信息共享中的重要作用已被充分认识到,现已组成专门的科技攻关组对其进行研究。

各专题组对美国、加拿大、英国、澳大利亚、新西兰、印度等国家及ISO/TC211、CEN\TC287等的元数据标准进行深入分析,因此,我们可以在一开始就立足于国际前沿,并保持与国际标准体系的同步。

(1)中国可持续发展信息共享元数据标准

《中国可持续发展信息共享元数据内容标准》是国家基础地理信息中心按照国家“九五”科技攻关计划“中国可持续稳定地增长发展信息共享示范”(97一925)项日的相关专题而设计制定的,它主要参考了FGDC和150的元数据标准。

该标准的主题内容是“提供中国可持续发展信息共享元数据的内容,包括可持续发展数据标识、内容、质量、状况及其他有关特征”,标准可用于数据集的全面描述、数据集编目及信息交换网络服务。

标准将元数据分为三层:

元数据子集、元数据实体和元数据元素(图1.3)。

 

元数据元素是元数据最基本的单元,元数据实体是同类元数据元素的集合,元数据子集是相互关联的元数据实体或元素的集合。

在同一个子集中实体可以有两类,即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。

标准规定中国可持续发展信息共享元数据分为两级,即:

一级—唯一标识一个数据集(数据集、数据集系列、要素和属性)所需要的最少的元数据实体和元素,内容只包含编目信息。

二级—建立完整的数据集(数据集、数据集系列、要素和属性)文档所需要的全部元数据实体和元素,内容包含8个主要子集:

标识信息、数据质量信息、数据志信息、空间数据表示信息、参照系统信息、要素分类信息、发行信息、元数据参考信息和3个可重复使用的子集:

引用文献、负责单位、地址。

标准定义三种性质的元数据子集、实体和元素:

必选(M)、一定条件下必选(C)、可选(0)。

由于可持续发展信息具有多样性特点,这就意味着标准中规定的元数据内容可能满足不了所有方面的需求,需要对其进行扩充。

按照标准规定的原则,用户可以扩展二级元数据。

(2)NREDIS信息共享元数据内容标准

本标准是国家信息中心系统集成与软件开发部按照国家“九五”科技攻关计划“国土资源环境与地区经济信息系统和国家空间信息基础设施关键技术研究”(97一759)项目的相关专题而设计制定的。

它主要参考了美国FGDC的CSDGM。

其目的是为空间数据集提供一套通用的描述元素及规范,为国家国土资源环境与区域经济信息系统的数据共享提供信息支持。

该标准建立了一套用于描述数据集、数据集系列和实体属性的复合元素、元素、这些元素的定义、元素的值域及相互关系的规范。

在标准中,各元素的选择是基于数据集的可用性、数据集的适用性、如何获取该数据集和如何使用该数据集这四个方面来考虑的。

该标准由10个部分组成见表1.5,其中8一10不能独立存在,而由其他复合元素引用。

数据集生产者或共享用户可以定义扩展元素,但必须依照扩展原则进行。

 

 

〔3)基于我国NSll的元数据标准

这是北京大学遥感与GIS研究所结合国家“九五”科技攻关计划“国土资源环境与地区经济信息系统和国家空间信息基础设施关键技术研究”(97一759)项目的需求,从国家空间信息基础设施这一层次出发提出的一套标准。

该标准由两层组成:

第一层是目录层,它所提供的元数据复合元素和数据元素是国家空间数据交换中心上管理与查询地理数据的所需元素,它是元数据内容体系中比较宏观的信息;第二层是元数据标准的主体,它由8个标准部分和4个引用部分组成,它们包括了全面描述地理空间信息的必选项、条件必选项、以及可选项的内容。

标准的整个内容按照构成元数据体系的部分、复合元素及数据元素三个层次进行组织(见图1.4)。

 

目前国际上和国内都建立了许多元数据系统。

如:

由FGDC推荐的I-Site免费软件包,它是FGDc推荐的用于建设空间信息交换中心(Clearing一house)的软件包。

国家空间信息交换中心(NationalGeospatialInformationExchangingCenter,NGIEe)已经有这种网站(WWW.NSII.GOV.CN),用户可以通过浏览器来查询各个节点上相关的空间信息的元数据。

其他比较著名的有已经商业化的由BlueAngel一Technologies开发的Metastar系列,ARC/INFO的MetadataDocument等等。

分析这些元数据管理系统,可以得出它们都具有以下主要功能模块:

元数据浏览器负责空间数据库的浏览和导航,提供查询界面,以及数据预览功能;元数据编辑器实现元数据的各种编辑功能,如新建、插入、删除、更新等;元数据服务器管理元数据数据库,并在网络上进行发布。

户间交换元数据、元数据库和元数据工具的方法。

(4)数据库文件或数据库表(Table)即建立元数据库,并将元信息保存在其中。

针对这种形式的元数据,主要是利用visualC++、visualBasic、Delphi、PowerBui1der等编程语言或开发环境建立数据库应用系统通过ODBC(即开放式数据库互连)完成对元数据的输入、查询、修改、输出等处理工作。

(5)针对特殊应用的元数据文件(主要表现为二进制文件)这种形式的元数据文件是针对某些组织或工程特殊的应用的。

往往需要通过特别的元数据管理程序来产生和修改,其可读性较差,不利于元数据共享。

为完成元数据信息的共享,则需要转换成元数据的其他形式。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1