地震科学数据共享工程技术标准数据模式编写.docx
《地震科学数据共享工程技术标准数据模式编写.docx》由会员分享,可在线阅读,更多相关《地震科学数据共享工程技术标准数据模式编写.docx(51页珍藏版)》请在冰豆网上搜索。
地震科学数据共享工程技术标准数据模式编写
中国地震局发布
××××-××-××实施
××××-××-××发布
EDS/T2—2005
目次
1前言
本标准是《地震科学数据》系列标准的第二项标准,该系列标准的预计结构为:
——地震科学数据元数据编写指南;
——地震科学数据数据模式编写指南;
——地震科学数据数据库建库指南。
本标准由中国地震局地震科学数据共享工程技术标准实施组提出并归口。
本标准起草单位:
中国地震局地震台网中心、中国地震局地球物理研究所。
本标准主要起草人:
地震科学数据 数据模式编写指南
11 范围
本标准规定了科学数据共享工程领域地震科学数据数据模式的描述方式及其基本内容。
本标准适用于指导以地震数据为主要内容,以共享为主要目的的数据集数据模式的编写。
12 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。
然而,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
SDS/T2133-2004科学数据共享工程技术标准 数据模式描述规则和方法
DB/T11.1-2000地震数据分类与代码 第一部分:
基本类别
统一建模语言(UnifiedModelingLanguage,UML)1.5,对象管理组织(ObjectManagementOrganization,OMG),http:
//www.omg.org/cgi-bin/apps/doc?
formal/03-03-01.pdf统一建模语言1.5
13 术语和缩略语
13.1
3.1术语
本标准采用下列术语和定义。
13.1.1
数据模式dataschema
数据的概念、组成、结构、相互关系的总称。
13.1.2
数据模式描述语言languagefordescriptionofdataschema
用于对数据模式进行分析、构造、表现和记录的语言。
本标准中包括UML、数据字典、摘要三种表达方式。
13.1.3
数据字典datadictionary
以表格的形式列出并定义全部实体及元素的一种信息资源。
13.1.4
摘要abstract
从定义、名称、数据类型、值域、短名和注释等六方面对数据元进行解释。
13.1.5
E-R模型图E-Rmodeling
用图解的方法描述实体与联系以及它们的一些性质。
13.1.6
属性attribute
对象或实体的特性。
13.2 缩略语
本标准采用下列缩略语。
13.2.1
UML
统一建模语言,UnifiedModelingLanguage。
13.2.2
XML
扩展标记语言,ExtensibleMarkupLanguage。
14 数据模式编写基本要求
14.1 总体要求
4.1.1数据模式应和数据集同时提供。
4.1.2数据模式编写的内容应由数据集的所有者认可的作者完成。
4.1.3数据模式编写的内容应与所描述的数据库或数据文件的内容及其逻辑关系保持一致。
14.2 内容要求
4.2.1按照数据模式的编写要求,从头开始,逐项填写,直到结束。
4.2.2数据元的约束条件、数目、类型和值域应按照规定填写。
4.2.3根据具体数据集的特点,在不与本标准相矛盾的情况下,可以扩充。
14.3 形式要求
4.3.1数据集的数据模式以专门为本标准编写的软件填写生成的XML文件形式提供。
4.3.2文件名为:
数据集全名_提供日期,扩展名.XML。
15
数据模式UML模型
15.1 说明
数据模式UML模型是指用统一建模型语言(UML)描述的数据模式模型。
本章节的每幅图表示实体的构成及相互关系。
在类图中,类名后面(Bn)中n表示该实体与第6章第n个表对应;若为(+Bn)则表示该实体在第6章第n个表中;属性名后面[m]表示该属性出现的次数,{}为条件。
组成关系线上文字表达为条件,关系线终端数字为实体的组成数目。
没有任何附加符号的表示该属性/实体为唯一必选。
15.2 UML图
15.2.1 数据集基本信息
15.2.2 矢量数据集内容说明
15.2.3 关系数据集内容说明
15.2.4 栅格数据集内容说明
15.2.5 影像数据集内容说明
15.2.6 数据集参数
15.2.7 数据表的说明信息
15.2.8 负责单位信息
16
数据模式数据字典
16.1 概述
数据字典由实体和元素构成。
数据字典内容表中带晕线的行定义实体。
本标准中用八个属性定义数据字典中的实体和元素,即中文名称、英文名称、英文短名、定义、约束/条件、最大出现次数、数据类型、域等。
16.1.1 中文名称
赋给实体或元素的一个标记,分为中文名称和英文名称。
实体名称在本标准的整个数据字典中是唯一的。
元素名称在实体中是唯一的,而在本标准的整个数据字典中不一定是唯一的。
16.1.2 英文名称
实体英文名称开头为大写字母,而元素的英文名称开头为小写字母,以示区别。
英文名称中没有空格。
取而代之的是将多个单词连接,其中每一个新的单词开头为大写字母(如:
XnnnYmmm)。
16.1.3 英文短名
名称的缩略语,在本标准中是唯一的。
可以通过可扩展标记语言(XML)、ISO8879(SGML)或其它类似的执行技术使用这些英文短名。
按照与产生实体和元素英文名称相类似的命名规则产生英文短名。
16.1.4 定义
实体/元素的说明
16.1.5 约束/条件
这是一个描述符,说明实体/元素是否应当总是选取,或有时选取(即有值)。
该描述符可以有如下值;M(必选),C(条件必选),或O(可选).
16.1.5.1 必选(M)
实体或元素总是应当选取。
16.1.5.2 条件必选(C)
当满足一定条件时,至少一个实体或元素是必选的。
“条件必选”用于以下三种可能性之一:
—————表示在两个或更多个选项中选择。
至少一个选项是必选的,并必须有值。
——当另一个元素已经选取时,选取一个实体或元素。
——当另一个元素已经选择了一个特定值时,选取一个元素。
为便于人们阅读,特定值使用纯文本。
如果条件成立,则该实体或元素应当是必选的。
16.1.5.3 任选(O)
该实体或元素可以选择,也可以不选择。
宜尽可能多地选择这些任选实体和任选元素,以更充分地说明其数据。
任选实体可以有必选元素,但是,如果一个任选实体未被选用,则该实体所包含的元素(包括必选元素)都不选用。
16.1.6 最大出现次数
说明实体或元素可以具有的实例的最大数目。
只出现一次用“1”表示;重复出现用“N”表示。
允许不为一的出现次数,并用相应数字表示(即“2”,“3”…等)。
16.1.7 数据类型
说明表示元素的一组不同的值;例如整型、实型、字符串等。
16.1.8 域
就实体而言,域说明该实体所包含的元素所在行的行号。
对一个元素而言,域说明允许的值或使用自由文本。
“自由文本”表明对字段的内容没有限制。
16.2 数据字典内容
数据字典内容见表1至表11。
表1数据集基本信息
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
1
数据集基本信息
DatasetBasicInformation
dsBasicInfo
地震数据集的基本信息
M
1
实体
第2-14行
2
数据集全名
DatasetIdentifier
dsIdentifier
数据集中文名称
M
1
字符串
自由文本
3
数据集简称
DatasetAlias
dsAlias
计算机内存储的数据集名称
O
1
字符串
自由文本
4
数据集存储格式
DatasetFormat
dsFormat
数据集在计算机内的物理存储格式,如doc、rtf、dbf、e00、dgn、shp、mif、tiff、img、eps、avi等
M
1
字符串
自由文本
5
数据集内容说明
DatasetContentInformation
dsContentInfo
数据库、数据文件、影像等所表述的主要内容,包括分层信息、表的说明、矢量要素分类信息、几何特征、内容简介等
M
1
实体
第6-11行
6
内容概述
DatasetAbstract
dsAbstract
对数据集内容的概要说明
M
1
字符串
自由文本
7
数据库管理系统
DatasetDatabase
dsDatabase
数据库管理系统及版本号
C/使用数据库
1
字符串
自由文本
8
矢量数据集内容说明
VectorDatasetInformation
dsVectorInfo
对矢量数据集内容的说明
C/矢量数据集
1
实体
表2
9
关系数据集内容说明
RelationalDatasetInformation
dsRelaInfo
对关系数据集内容的说明
C/关系数据集
1
实体
表3
10
栅格数据集内容说明
RasterDatasetInformation
dsRasterInfo
对栅格数据集内容的说明
C/栅格数据集
1
实体
表4
11
影像数据集内容说明
ImageDatasetInformation
dsImageInfo
对影像数据集内容的说明
C/影像数据集
1
实体
表5
12
数据使用方法简介
UsageDescription
usageDesc
数据使用方法简介,包括硬件、操作系统及工具软件要求、解压缩方法、数据库倒入、调用说明等
O
1
字符串
自由文本
13
数据集备注信息
DatesetComment
dsComment
数据字典各项内容无法包括的信息或数据字典作者认为有必要让用户了解的信息
O
1
字符串
自由文本
14
负责单位信息
DatasetAuthorityInformation
dsAuthorInfo
对本数据字典负责的单位或个人信息,包括名称、地址、联系方法等
M
1
实体
表8
表2矢量数据集内容说明
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
15
矢量数据集内容说明
VectorDatasetInformation
dsVectorInfo
对矢量数据集内容的说明
C/矢量数据集
与引用本实体的对象相同
实体
第16-20行
16
数据集参数
DatasetPrameter
dsPara
数据集参数,详见表6
O
1
实体
表6
17
数据层内容说明
VectorDatasetLayerDescription
dsVectorLayer
对矢量数据集各层内容的说明
M
N
实体
第18-20行
18
数据层名称
LayerName
layerName
数据层名称
M
1
字符串
自由文本
19
数据层主要内容及几何特征描述
LayerDescription
layerDesc
数据层主要内容及几何特征描述
M
1
字符串
自由文本
20
数据表内容说明(属性)
LayerAttribute
layerAttribute
属性数据表内容说明,详见表7
O
N
实体
表7
表3关系数据集内容说明
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
21
关系数据集内容说明
RelationalDatasetInformation
dsRelaInfo
对关系数据集内容的说明
C/关系数据集
与引用本实体的对象相同
实体
第22-23行
22
数据表间关系说明
TableRelationDescription
tableRelDesc
通过描述表与表之间主键与外键的对应关系来说明表间关系。
形式为:
(表名.主键)=[表名.外键]=…;即主键用圆括号括起来,外键或其他关联字段用方括号括起来,=号表示对应关系
O
1
字符串
自由文本
23
数据表内容说明
TableContentInformation
tableContInfo
对数据表内容的说明,详见表7
M
N
实体
表7
表4栅格数据集内容说明
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
24
栅格数据集内容说明
dsRasterInfo
对栅格数据集内容的说明
C/栅格数据集
与引用本实体的对象相同
实体
第25-31行
25
数据集参数
DatasetParameter
dsPara
数据集参数,详见表6
O
1
实体
表6
26
覆盖地理区域概述
ExtentDescription
extDesc
覆盖地理区域概述
O
1
字符串
自由文本
27
行数
RowCount
rowCount
行数
M
1
整型
28
列数
ColumnCount
colCount
列数
M
1
整型
29
角点横坐标
CornerAbscissa
cornerX
角点横坐标
M
1
实型
30
角点纵坐标
CornerOrdinate
cornerY
角点纵坐标
M
1
实型
31
角点坐标度量单位
CornerCoordinateUnit
conerCordUnit
角点坐标度量单位
M
1
整型
1-投影坐标
2-经纬度
表5影像数据集内容说明
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
23
影像数据集内容说明
ImageDatasetInformation
dsImageInfo
对影像数据集内容的说明
C/影像数据集
与引用本实体的对象相同
实体
第24-34行
24
数据集参数
DatasetParameter
dsPara
数据集参数,详见表6
O
1
实体
表6
25
覆盖地理区域概述
ExtentDescription
extDesc
O
1
字符串
自由文本
26
光学分辨率
OpticalResolution
optResol
O
1
字符串
自由文本
27
几何分辨率
GeometricResolotion
geomResol
M
1
字符串
自由文本
28
像幅宽
RealWidth
realWidth
影像实地宽(km)
O
1
字符串
自由文本
29
像幅长
RealLength
realLength
影像实地长(km)
O
1
字符串
自由文本
30
行数
RowCount
rowCount
行数
M
1
整型
31
列数
ColumnCount
colCount
列数
M
1
整型
32
起始像元横坐标
StartCellAbscissa
startCellX
起始像元横坐标
M
1
实型
33
起始像元纵坐标
StartCellOrdinate
startCellY
起始像元纵坐标
M
1
实型
34
起始像元坐标度量单位
StartCellCoordinateUnit
startCordUnit
起始像元坐标度量单位
M
1
整型
1-投影坐标
2-经纬度
表6数据集参数
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
35
数据集参数
DatasetParameterSpecification
dsParaSpec
关于数据集的参数,如矢量、栅格和影像数据库/数据文件采用的投影等相关参数说明
C/矢量、栅格或影像数据集
与引用本实体的对象相同
实体
第36-39行
36
参数总体说明
ParameterTotalDescription
paraTotalDesc
参数总体说明
O
1
字符串
自由文本
37
参数项
ParameterItem
paraItem
参数项
M
N
实体
第38-39行
38
参数名称
ParameterName
paraName
参数名称
M
1
字符串
自由文本
39
参数值
ParameterValue
paraValue
参数值
M
1
字符串
自由文本
表7数据表的说明信息
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
40
数据表说明信息
TableDetails
tblDetails
矢量、关系数据库包含的所有数据项定义及说明
使用参照对象的约束条件
N
实体
第41-52行
41
数据表名称
TableName
tblName
M
1
字符串
自由文本
42
数据表内容概要说明
TableContentDescription
tblDesc
对所包含主要内容和特点的简要描述
O
1
字符串
自由文本
43
数据表字段说明
FieldSpecification
fldSpec
数据表字段说明
M
N
实体
第44-52行
44
字段序号
FieldNumber
fldNo
表中字段的顺序号
M
1
字符串
自由文本
45
字段名称
FieldName
fldName
表中该字段的唯一标识符。
字段名以英文小写字母及下划线命名
M
1
字符串
自由文本
46
字段定义
FieldDefinition
fldDefi
字段定义
M
1
字符串
自由文本
47
字段性质
FieldType
fldType
字段性质
M
1
整型
1-主键
2-外键
3-关联
4-一般
48
字段取值类型
FieldValueType
fldValueType
⏹char:
定长字符型;
⏹varchar:
变长字符型;
⏹tinyint:
整型的一种,可表示的数据范围为0-255;
⏹smallint:
整型的一种,可表示的数据范围为0-65535;
⏹integer:
整型的一种,可表示的数据范围为0-232-1;
⏹decimal:
浮点型;
⏹datetime:
日期型;
⏹boolean:
布尔型;
⏹blob:
二进制大对象型;
M
1
字符串
自由文本
49
字段长
FieldLength
fldLength
对于字段类型为定长字符型、变长字符型、浮点型的字段,须指明字段长度。
对于字段类型为变长字符型的字段,表示该字段可存储的字符串的最大长度。
对于字段类型为浮点型的字段,字段长度表示格式为n.m,其中n表示包括小数点前的位数、小数点和小数点后的位数在内的字段长度,m表示小数点后的位数
M
1
实型
实型数
50
值域说明
FieldDomainDescription
fldDomainDesc
包括取值范围、代码表以及相关代码的说明
M
1
字符串
自由文本
51
能否为空
CanBeNull
canBeNull
Y表示可为空,N表示不可为空
M
1
字符串
自由文本
52
计量单位
FieldUnit
fldUnit
M
1
字符串
自由文本
表8负责单位信息
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
53
负责单位信息
DatasetAuthorityInformation
dsAuthorInfo
数据集负责人和单位识别和联系方法
与引用本实体的对象相同
与引用本实体的对象相同
实体
第54-57行
54
负责人名
IndividualName
rpIndName
负责人姓名、头衔,用分隔符隔开
C/列出了负责单位名和职务
1
字符串
自由文本
55
负责单位名称
OrganisationName
rpOrgName
负责单位名
C/列出了负责人名和职务
1
字符串
自由文本
56
职务
PositionName
rpPosName
负责人角色和职务
C/列出负责人名和负责单位名
1
字符串
自由文本
57
联系信息
ContactInfo
rpCntInfo
负责单位地址
O
1
实体
表9
表9联系信息
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
58
联系信息
ContactInfo
rpCntInfo
与负责人和/或负责单位联系所需信息
与引用本实体的对象相同
与引用本实体的对象相同
实体
第59-63行
59
地址信息
Address
address
负责人或负责单位物理地址和电子邮件地址
O
1
实体
表10
60
在线资源信息
onLineResource
cntOnlineRes
可以用于与负责人或负责单位联系的在线信息
O
1
实体
表11
61
电话
Voice
voiceNum
与负责人或负责单位通话的电话号码
O
N
字符串
自由文本
62
传真
Facsimile
faxNum
与负责人或负责单位联系的传真号码
O
N
字符串
自由文本
63
电子邮箱
EmailAddress
emailAdd
与负责人或负责单位联系的电子邮箱地址
O
N
字符串
自由文本
表10地址信息
序号
中文名称
英文名称
英文短名
定义
约束/条件
最大出现次数
数据类型
域
64
地址信息
Address
address
负责人或负责单位地址
与引用本实体的对象相同
与引用本实体的对象相同
实体
第65-69行
65
详细地址
DeliveryPoint
delPoint
所在街道和门牌号
M
1
字符串
自由文本
66
城市
City
city
所在城市
M
1
字符串
自由文本
67
行政区
AdministrativeArea
adminArea
所在省、直辖市或自治区
M
1
字符串
自由文本
68
邮政编码
PostalCode
postCode
邮政编码
M