什么叫做元数据.doc
《什么叫做元数据.doc》由会员分享,可在线阅读,更多相关《什么叫做元数据.doc(4页珍藏版)》请在冰豆网上搜索。
什么叫做元数据
胡经国
本文作者的话
云计算具有很强的知识性和专业性。
对于业外读者来说,云计算可谓“博大精深”。
业外公众要学习云计算,有必要循序渐进地学习有关云计算的一系列基础知识。
本文作为《漫话云计算》系列文稿和学习云计算笔录之一,供云计算业外读者进一步学习和研究参考。
希望能够得到大家的指教和喜欢!
下面是正文
一、元数据基本概念
1、元数据基本概念解读
(1)
元数据(Metadata),又叫做中介数据、中继数据,是指描述数据的数据(dataaboutdata,关于数据的数据),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
元数据算是一种电子式目录,为了达到编制目录的目的,必须描述并收藏数据的内容或特色,进而达到协助数据检索的目的。
元数据是关于数据的组织、数据域及其关系的信息。
简言之,元数据就是关于数据的数据(dataaboutdata)。
元数据(MetaData)是关于数据仓库的数据,是指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。
同时,元数据还包含关于数据含义的商业信息。
所有这些信息都应当妥善保存,并很好地管理,为数据仓库的发展和使用提供方便。
元数据是一种二进制信息,用以对存储在公共语言运行库中的可移植可执行文件——PE文件或存储在内存中的程序进行描述。
将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中;而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。
在模块或程序集中定义和引用的每个类型和成员,都将在元数据中进行说明。
当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类型、成员、继承等信息。
链接:
PE文件
PE文件(PortableExecutableFile,可移植可执行文件),一种文件格式,用于编写可执行程序和链接在一起形成可执行程序的文件。
链接:
MSIL
MSIL(MicrosoftIntermediateLanguage,微软中间语言)。
MSIL反汇编程序是MSIL汇编程序(Ilasm.exe)的伙伴工具。
Ildasm.exe采用包含Microsoft中间语言(MSIL)代码的可迁移可执行(PE)文件,并创建相应的文本文件作为Ilasm.exe的输入。
反汇编程序是一种语言转换程序,它的功能和汇编程序相反,能把二进制机器语言程序转换为(返回到)汇编语言程序,来查阅目标码程序的正确性。
它也可作为一种“破译”程序。
链接:
运行库
从字面上看,运行库是指程序在运行时所需要的库文件。
在运行库中一般包括编程时常用的函数,如字符串操作、文件操作、界面等内容。
由于不同的语言所支持的函数通常是不同的,因而不同的语言所使用的运行库也是完全不同的。
链接:
程序集
程序集(assembly)是一个及一个以上托管模块,以及一些资源文件的逻辑组合。
.程序集是包含一个或者多个类型定义文件和资源文件的集合。
程序集是经由编译器编译得到的,供CLR进一步编译执行的那个中间产物。
程序集必须依靠CLR才能顺利执行。
CLR(CommonLanguageRuntime,公共语言运行时),负责资源管理(内存分配和垃圾收集),并保证应用和底层操作系统之间必要的分离。
CLR存在两种不同的释义:
公共语言运行时和公共语言运行库。
2、元数据基本概念解读
(2)
元数据(Metadata)是描述其它数据的数据或关于其它数据的数据(dataaboutotherdata),或者说是用于提供某种资源的有关信息的结构数据(structureddata)。
元数据是描述信息资源或数据等对象的数据。
元数据使用目的在于:
识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
元数据的基本特点主要有:
⑴、元数据一经建立便可共享。
元数据的结构和完整性,依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要。
⑵、元数据首先是一种编码体系。
元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系。
这导致了元数据和传统数据编码体系的根本区别。
元数据的最为重要的特征和功能,是为数字化信息资源建立一种机器可理解框架。
由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。
如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。
用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。
链接:
数据元
数据元(Dataelement,数据元素),是指通过定义、标识、表示以及允许值等一系列属性描述的数据单元。
在特定的语义环境中被认为是不可再分的最小数据单元。
数据元素(dataelement),单个数据单元,是数据的基本单位。
数据元素(dataelement),泛指结构化数据中的最小组成单位。
二、元数据定义解释
元数据被定义为:
描述数据及其环境的数据。
1、数据仓库领域的元数据
在数据仓库领域中,元数据是指描述数据仓库内数据的结构和建立方法的数据。
元数据按用途分为技术元数据和业务元数据。
链接:
数据仓库
数据仓库(DataWarehouse,DW或DWH),是为企业所有级别的决策制定过程提供所有类型数据支持的战略集合。
它是单个数据存储,出于分析性报告和决策支持目的而创建。
为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
数据仓库是决策支持系统(DecisionSupportSystem,DSS)和联机分析应用数据源的结构化数据环境。
数据仓库研究和解决从数据库中获取信息的问题。
数据仓库的特征在于面向主题、集成性、稳定性和时变性。
链接:
技术元数据和业务元数据
在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据;可将其按用途的不同分为两类:
技术元数据(TechnicalMetadata)和业务元数据(BusinessMetadata)。
技术元数据,是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。
业务元数据,从业务角度描述了数据仓库中的数据;它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。
语义层(SemanticLayer)技术,通过对数据库里的有关数据项定义,把数据库中的数据定义成有明确的业务含义的名称。
业务人员所面对的不再是表、字段和它们之间复杂的关联、计算关系,而是他所熟悉的业务术语和指标名称。
2、软件构造领域的云数据定义
在软件构造领域,元数据被定义为:
在程序中不是被加工的对象,而是通过其值的改变来改变程序行为的数据。
它在程序运行过程中起着以解释方式控制程序行为的作用。
在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。
链接:
软件构造
软件构造(SoftwareConstruction,SC),是指通过编码、验证、单元测试、集成测试和排错组合,具体创建一个可以工作的、有意义的软件。
3、图书馆与信息界的云数据定义
在图书馆与信息界,元数据被定义为:
提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。
其作用为:
描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。
一般认为,所谓元数据是关于数据的数据,或关于数据的结构化的数据。
从已有的结论看,元数据的含义是逐渐发展的。
元数据一词,早期主要指网络资源的描述数据,用于网络信息资源的组织;其后,逐步扩大到各种以电子形式存在的信息资源的描述数据。
目前,元数据这一术语实际用于各种类型信息资源的描述记录。
此外,元数据在地理界,生命科学界等领域也有其相应的定义和应用。
2017年2月24日编写于重庆
2017年2月26日修改于重庆
4