土地信息系统.docx
《土地信息系统.docx》由会员分享,可在线阅读,更多相关《土地信息系统.docx(22页珍藏版)》请在冰豆网上搜索。
土地信息系统
第一章绪论
第一节GIS的基本概念
一、信息、地理信息
1、信息和数据
数据是通过文字、图表、符号、图像、声音经过有效的组合后对特定现象客观描述的载体,数据随载荷它的物理设备的形式而改变。
信息(Information)是用文字、数字、符号、语言、图像等介质来表示事件、事物、现象等的内容、数量或特征,从而向人们(或系统)提供关于现实世界新的事实和知识,作为生产、建设、经营、管理、分析和决策的依据。
信息具有客观性、适用性、可传输性和共享性等特征。
信息来源于数据(Data)。
数据是一种未经加工的原始资料。
数字、文字、符号、图像都是数据。
数据是客观对象的表示,而信息则是数据内涵的意义,是数据的内容和解释。
信息与数据总是相互关联、不可分割的。
没有数据则不能表达信息,数据是信息的载体,但不是信息。
只有理解了数据的含义,对数据做出解释,才能得到数据中包含的信息。
因而信息是经对数据解译或处理后,对人们的行为能产生影响并赋予一定意义的数据,即信息是数据的涵义或内容。
数据作为记录下来的可识别的符号,具体形式多种多样,数据的表达形式可以转换,但其中包含的信息内容不会改变。
总之,信息与数据是不可分离的,数据本身并没有意义,数据只有对实体行为产生影响时才成为信息,数据是信息的表达,信息是数据的内涵。
2、地理信息
地理信息是有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。
空间位置、属性及时间是地理空间分析的三大基本要素。
3、地理信息的特征
(1)空间分布性
(2)数据量大(3)信息载体的多样性。
二、信息系统
1、信息系统的基本组成
信息系统是具有采集、管理、分析和表达数据能力的系统。
由计算机硬件、软件、数据和用户四大要素组成、另外,智能化的信息系统还包括知识。
2、信息系统的类型,根据系统所执行的任务,信息系统可分为事务处理系统(Transactionprocesssystem)和决策支持系统(Decisionsupportsystem)。
三、地理信息系统
地理信息系统(GeographicInformationSystem或Geo-Informationsystem,GIS)有时又称为“地学信息系统”或“资源与环境信息系统”。
它是一种特定的十分重要的空间信息系统。
它是在计算机硬、软件系统支持下,对整个或部分地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
第二节GIS的发展概况
一、国际发展状况
综观GIS发展,可将地理信息系统发展分为以下几个阶段:
1、地理信息系统的开拓期(60年代):
2、地理信息系统的巩固发展期(70年代)
3、地理信息系统技术大发展时期(80年代):
4、地理信息系统的应用普及时代(90年代):
第三节地理信息系统的构成
完整的GIS主要由四个部分构成,即计算机硬件系统、计算机软件系统、地理空间数据和系统管理操作人员,其核心部分是计算机软硬系统,空间数据库反映了GIS的地理内容,而管理人员和用户则决定系统的工作方式和信息表示方式。
第二章空间信息基础
第一节常规的地理空间信息描述法
一、地球空间模型描述
地球表面几何模型可以分为四类:
第一类是地球的自然表面。
第二类是相对抽象的面,即大地水准面。
第三类是模型。
第四类是数学模型。
二、地理空间坐标系的建立
建立地理空间坐标系,主要的目的是确定地面点的位置。
地理信息系统中的地理空间,通常就是指经过投影变换后放在笛卡儿坐标系中的地球表层特征空间,它的理论基础在于旋转椭球体和地图投影变换。
三、地图对地理空间的描述
在地图学上,把地理空间的实体分为点、线、面三种要素,分别用点状、线状、面状符号来表示。
四、遥感影象对地理空间的描述
遥感影象对空间信息的描述主要是通过不同的颜色和灰度来表示的。
这是因为地物的结构、成分、分布等的不同,其反射光谱特性和发射光谱特性也各不相同,传感器记录的各种地物在某一波段的电磁辐射反射能量也各不相同,反映在遥感影象上,则表现为不同的颜色和灰度信息。
第二节地理信息数字化描述方法
计算机对地理实体的显式描述也称栅格数据结构,计算机对地理实体的隐式描述也称矢量数据结构。
栅格和矢量结构是计算机描述空间实体的两种最基本的方式。
在矢量数据结构中,地理实体的形状和位置是由一组坐标对所确定。
矢量数据结构对地理实体的描述类似于地图对地理信息的描述,一般也把地理实体分为点、线、面三种,每种实体有不同的编码方法。
由至少有两种数字化的方法可以表示空间信息:
栅格法:
由一系列x,y坐标定位的像元,每个像元独立编码,并载有属性。
矢量法:
三种主要地理实体的点、线、面中,点类似于像元,但不占有面积,其余两种均由一系列内部相关联的坐标形成,一定的面或线则与一定的属性连接。
第三章土地信息系统数据采集与数据质量
第一节数据采集
一、空间数据的基本特征
数据的涵义
数据可定义为有意义的实体,它涉及到事物的存在形式。
数据可分为模拟数据和数字数据两大类。
模拟数据是在某个区间内连续变化的植,又如温度和压力也都是连续变化的值,数字数据是离散的值,例如文本信息和整数。
土地信息系统中,按照其特征,土地数据可分为三种类型:
空间特征数据(定位数据)、时间属性数据(尺度数据)和专题属性数据(非定位数据)。
对于绝大部分土地信息系统的应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性特征数据统称为空间数据。
一般认为空间数据具有三个基本特征:
1、空间特征。
2、属性特征。
3、时间特征。
二、空间数据的类型
表示地理现象的空间数据从几何上可以抽象为点、线、面三类,
对点、线、面数据,按其表示内容又可以分为七种不同的类型:
1、类型数据例如考古地点、道路线和土壤类型的分布等;
2、面域数据例如随机多边形的中心点,行政区域界线和行政单元等;
3、网络数量例如道路交点、街道和街区等;
4、样本数量例如气象站、航线和野外样方的分布区等;
5、曲面数据例如高程点、等高线和等值区域;
6、文本数据例如地名、河流名称和区域名称;
7、符号数据例如点状符号、线状符号和面状符号等。
三、数据采集
地形图测量
摄影测量与遥感
已有图件数字化
属性数据采集
通常,土地数据输入主要考虑以下三个方面的问题:
(1)统一的地理基础;
(2)空间数据(位置数据)输入;
(3)属性数据输入。
地理基础是土地数据表示格式与规范的重要组成部分,它主要包括统一的地图投影系统、统一的地理坐标系统以及统一的编码系统。
四、空间数据的拓扑关系
在GIS中,为了真实地反映地理实体,不仅要包括实体的位置、形状、大小和属性、还必须反映实体之间的相互关系。
这些关系就是指它们之间的邻接关系,关联关系和包含关系。
空间数据的拓扑关系,对数据处理和空间分析具有重要的意义:
(1)根据拓扑关系,不需要利用坐标或距离,可以确定一种空间实体相对于另一种空间实体的位置关系。
拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何数据有更大的稳定性,不随地图投影而变化。
(2)利用拓扑关系有利于空间要素的查询。
(3)可以根据拓扑关系重建地理实体。
。
第二节土地信息系统数据质量
一、数据质量的基本概念
空间数据的质量问题主要与数据的不准确性、数据的不完整性、数据的不一致性等方面相关。
(1)误差(Error):
误差反映了数据与真实值或者大家公认的真实值之间的差异。
它是一种常用的描述准确性的表达方式。
(2)数据的准确性(Accuracy):
数据的准确性被定义为结果、计算或估计值与真实值或者大家公认的真实值的接近程度。
空间数据的准确性根据所指的位置、拓扑关系、或非空间数据进行描述。
(3)数据的精密度(Precision):
数据的精密度指数据的精密程度,数据表示的有效位数,它表现了测量本身的离散程度。
(4)不确定性(Uncertainty):
数据的不确定性是关于空间过程和特征不能被准确确定的程度,是自然界各种现象自身固有的属性。
。
(5)空间分辨率(SpatialResolution):
分辨率是空间目标或是两个可测量数值之间最小的可辩识的差异。
那么空间分辨率可以看作记录变化的最小距离。
(6)比例尺(Scale)精度:
比例尺是地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。
二、土地数据质量
土地数据质量是指土地数据适用于不同应用对象与目的的能力。
在很长一段时期内,数据质量的概念主要是指数据在生产过程中形成的质量指标,客户满意度的内涵纳入土地数据质量的含义之中,。
另外数据的方便获取度、用户满意度、表达清晰度、易于表达性、动态性也成为土地数据质量的重要组成部分。
由于土地数据主要有三大类数据组成,如定位数据、非定位数据、数据的元数据基本组成。
数据质量侧重问题在于两方面:
一方面数据的可信度;另一方面是数据的可用度。
特性
内容概要
解释与说明
数
据
可
信
度
精确性
位置的准确度
评价数据是否与其对应的客观实体的特征相一致
时间属性与时间关系的准确度
定量属性的精度
定性属性的精度
各土地要素及其相互关系分类的准确度
完整性
土地要素、属性以及相互关系的完整性
评价数据的特征信息是否完整
数据是否存在缺失记录或缺失字段
一致性
土地数据与概念模式规则、数据库设计的符合程度
评价同一实体的同一属性的值在不同的系统或者数据集中是否一致,以及与数据结构、属性及关系的逻辑一致程度
土地数据存储格式与数据集物理结构的匹配
土地数据显示编码的拓扑特征的准确度
拓扑关系与属性组合
有效性
土地数据是否具有实际利用价值
评价数据值对值域的符合情况,是否满足用户定义的条件或在一定的值域范围内
唯一性
数据记录与特征信息是否存在一一对应的关系
评价数据是否存在冗余
数
据
的
可
用
度
时间性
数据描述对象的时间尺度
评价土地数据描述的是当前数据还是历史数据
数据稳定程度
评价土地数据能否持续对客体进行描述
可得性
基础数据是否可靠
评价数据来源
获得途径合法性
评价数据版权的问题
满意度
土地数据客户满意度
评价用户对数据情况是否满意
土地数据质量满意度
评价数据表达方式的合理性
土地数据质量生命力
评价数据是否有动态质量的扩充能力
3.3.3土地数据误差来源
1.空间现象自身存在的不稳定性
空间数据质量问题首先来源于空间现象自身存在的不稳定性。
2.空间现象的表达
数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响,这对于数据的生成会出现误差。
如在地图投影。
3.空间数据处理中的误差
在空间数据处理过程中,容易产生的误差有以下几种:
投影变换。
地图数字化和扫描后的矢量化处理。
数据格式转换。
数据抽象。
建立拓扑关系。
与主控数据层的匹配。
数据叠加操作和更新。
数据集成处理。
数据的可视化表达。
数据处理过程中误差的传递和扩散。
4.空间数据使用中的误差
表3—4土地数据误差来源分析
数据处理过程
误差来源
数据搜集
野外测量误差:
仪器误差、记录误差
遥感数据误差:
辐射和几何纠正误差、信息提取误差
地图数据误差:
原始数据误差、坐标转换、制图综合及印刷误差
数据输入
数字化误差:
仪器误差、操作误差
不同系统格式转换误差:
栅格-矢量转换、三角网-等值线转换误差
数据存储
数值精度不够
空间精度不够:
每个格网点太大、地图最小制图单元太大
数据处理
分类间隔不合理
多层数据叠合引起的误差传播:
插值误差、多源数据综合分析误差
比例尺太小引起的误差
数据输出
输出设备不精确引起的误差
输出的媒介不稳定造成的误差
数据使用
对数据所包含的信息的误解出现的误差
对数据信息使用不当出现的误差
3.3.4常见的土地数据元的误差分析
数据的误差主要有四大类,即几何误差、属性误差、时间误差和逻辑误差。
2.地图数据的质量问题
地图数据是现有地图经过数字化或扫描处理后生成的数据。
在地图数据质量问题中,不仅含有地图固有的误差,还包括图纸变形、图形数字化等误差。
3.3.5土地数据质量控制
空间数据质量控制常见的方法有:
1.传统的手工方法2.元数据方法3.地理相关法
第四节元数据
利于数据的交换、更新、检索、数据库集成以及数据的二次开发利用等,这一切都离不开元数据(Metadata)。
对空间数据的有效生产和利用,要求空间数据的规范化和标准化。
一、元数据概念与分类
1、元数据概念
一般都认为元数据就是“关于数据的数据”。
元传统的图书馆卡片、出版图书的介绍、磁盘的标签等都是元数据。
元数据的主要作用可以归纳为如下几个方面:
(1)帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解;
(2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络(clearinghouse)及数据销售等方面的信息,便于用户查询检索地理空间数据;
(3)提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息;
(4)帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;
(5)提供有关信息,以便用户处理和转换有用的数据。
元数据的内容主要包括对数据集的描述;对数据集中各数据项、数据来源、数据所有者及数据生产历史等的说明;对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、源数据的比例尺等;对数据处理信息的说明,如量纲的转换等;数据转换方法的描述;对数据库的更新、集成方法等的说明。
元数据的性质:
元数据是关于数据的描述性数据信息,它应尽可能多地反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用。
2、元数据的常用形式和类型
最基本的方法是文本文件。
元数据的另一种形式是用超文本链接标示语言(HypertextMarkuplanguage,HTML)编写的超文本文件。
用通用标示语言(StandardforGeneralMarkuplanguage,SGML)建立元数据。
分类的原则不同,元数据的分类体系和内容将会有很大的差异。
如根据元数据的作用可以把元数据分为两种类型:
1)说明元数据2)控制元数据是用于计算机操作流程控制的元数据,这类元数据由一定的关键词和特定的句法来实现。
二、空间数据元数据的概念和标准
1、空间数据元数据的概念
空间数据(Geospatialdata)用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其边界的信息;空间数据元数据指对于这些空间数据的描述或说明,主要包括以下方面:
·类型(Type)在元数据标准中,数据类型指该数据能接收的值的类型;
·对象(Object)对地理实体的部分或整体的数字表达;
·实体类型(Entitytype)对于具有相似地理特征的地理实体集合的定义和描述;
·点(Point)用于位置确定的0维地理对象;
·结点(Node)拓扑连接两个或多个链或环的一维对象;
·标识点(Labelpoint)显示地图或图表时用于特征标识的参考点;
·线(Line)一维对象的一般术语;
·线段(Linesegment)两个点之间的直线段;
·线(String)由相互连接的一系列线段组成的没有分支线段的序列,线可以自身或与其它线相切;
·弧(Arc)由数学表达式确定的点集组成的弧状曲线;
·链(Link)两个结点之间的拓扑关联;
·链环(Chain)非相切线段或由结点区分的弧段构成的有方向无分支序列;
·环(Ring)封闭状不相切链环或弧段序列;
·多边形(Polygon)在二维平面中由封闭弧段包围的区域;
·外多边形(UniversePolygon)数据覆盖区域内最外则的多边形,其面积是其它所有多边形的面积之和;
·内部区域(Interiorarea)不包括其边界的区域;·格网(Grid)组成一规则或近似规则的棋盘状镶嵌表面的格网集合,或者组成一规则或近似规则的棋盘状镶嵌表面的点集合;·格网单元(Gridcell)表示格网最小可分要素的二维对象·矢量(Vector)有方向线的组合;
·栅格(Raster)同一格网或数字影像的一个或多个叠加层;
·像元(Pixel)二维图形要素,它是数字影象最小要素;
·栅格对象(Rasterobject)一个或多个影象或格网,每一个影象或格网表示一个数据层,各层之间相应的格网单元或像元一致且相互套准;
·图形(Graph)与预定义的限制规则一致的0维(如Node点)、一维(Link或Chain)和二维(T多边形)有拓扑相关的对象集;
·数据层(Layer)集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或者有一公共属性或属性值的空间对象的联合(Association);
·层(Stratum)在有序系统中数据层、级别或梯度序列;
·纬度(Latitude)在中央经线上度量,以角度单位度量离开赤道的距离;
·经度(Longitude)经线面到格林尼治中央经线面的角度距离;
·中央经线(Meridian)穿过地球两极的地球的大圆圈;
·坐标(Ordinate)在笛卡儿坐标系中沿平行于X轴和y轴测量的坐标值;
·投影(Projection)将地球球面坐标中的空间特征(集)转化到平面坐标体系时使用的数学转化方法。
·投影参数(ProjectionParameters)对数据集进行投影操作时用于控制投影误差、变形实际分布的参考特征。
·地图(Map)空间现象的空间表征,通常以平面图形表示;
·现象(Phenomenon)事实、发生的事件、状态等;
·分辨率(Resolution)由涉及到或使用的测量工具或分析方法能区分开的两个独立测量或计算的值的最小差异;
·质量(Quality)数据符合一定使用要求的基本或独特的性质;
·详述(Explicit)由一对数或三个数分别直接描述水平位置和三维位置的方法;
·介质(Media)用于记录、存贮或传递数据的物理设备;
·其它。
2、空间数据元数据的标准
有关空间数据元数据的几个现有主要标准。
元数据标准名称
建立标准的组织
CSDGM地球空间数据元数据内容标准
FGDC,美国联邦空间数据委员会
GDDD数据集描述方法
MEGRIN,欧洲地图事务组织
CGSB空间数据集描述
CSC,加拿大标准委员会
CEN地学信息一数据描述一元数据
CEN/TC287
DIF目录交换格式
NASA
ISO地理信息
ISO/TC211
三、空间数据元数据的获取与管理
1、空间数据元数据的获取获取可分为三个阶段:
数据收集前、数据收集中和数据收集后。
2、空间数据元数据的管理
空间数据元数据管理的理论和方法涉及到数据库和元数据两方面。
由于元数据的内容、形式的差异,元数据的管理与数据涉及的领域有关,它是通过建立在不同数据领域基础上的元数据信息系统实现的。
另外,全球信息源字典采用两步实体关系模型(Two—stages—Entity—Relationship—Model)来管理元数据。
四、空间数据元数据的应用
1、为什么在地理信息系统中使用元数据
(1)完整性(Completeness)
(2)可扩展性(Extensibility)(3)特殊化(Specialization)
(4)安全性(Safety)(5)查错功能(Debugging)(6)浏览功能(Browsing)
(7)程序生成(Programgeneration)
2、空间数据元数据的应用
(1)帮助用户获取数据
(2)空间数据质量控制
(3)在数据集成中的应用(4)数据存贮和功能实现
第4章土地数据管理
4.1土地数据库
4.1.1数据库的发展
数据管理指的是对数据的分类、组织、编码、储存、检索和维护。
经历了三个阶段:
人工管理阶段、文件管理阶段、数据库系统阶段。
4.1.2数据库概述
数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。
1.数据库的特征
数据库具有以下主要特征。
(1)数据集中控制特征
(2)数据冗余度小的特征
(3)数据独立性特征(4)复杂的数据模型(5)数据保护特征
2.数据库的系统结构
数据库系统的结构,一股分为三个层次,它们是概念模式,外模式和内模式。
(1)概念模式概念模式是数据厍的总框架,是对数据库中关于目标存储的逻辑结构和特性、基本操作、目标以及目标与操作的关系和依赖的描述,以及对数据的安全性、完整性等方面的定义。
(2)外模式亦称子模式,是数据库用户的数据视图。
它属于概念模式的一部份,描述用户数据的结构、类型、长度等。
(3)内模式亦称存储模式。
是对数据库在物理存储器上具体实现的描述,它规定数据在存储介质上的物理组织方式、记录寻址技术、定义物理存储块的大小、溢出处理方法等。
与概念模式相对应,内模式由数据存储描述语言进行描述。
4.1.3空间数据库
空间数据库,是以描述空间位置和点、线、面、体特征的拓扑结构的位置数据及描述这些特征的性能的属性数据为对象的数据库。
空间数据库与一般数据库相比,具有以下特点:
(1)数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往很大。
(2)不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。
(3)数据应用广泛,例如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等。
4.1.4土地数据库
土地数据库是一个空间数据库,土地数据库是土地信息系统在计算机物理存储介质上存储与应用相关的土地空间数据的集合。
4.2土地数据模型
4.2.1数据模型概述
1.数据模型
空间数据模型是关于现实世界中空间实体及其相互间联系的概念,在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息,它为描述空间数据的组织和设计空间数据库模式提供着基本方法。
通俗地讲数据模型就是现实世界的模拟。
数据结构、数据操作和数据的约束条件是数据模型的三要素。
数据结构:
数据结构用于描述系统的静态特性,研究与数据类型、内容、性质有关的对象,例如关系模型中的域、属性、关系等。
数据操作:
数据库主要有检索和更新(包括插入、删除、修改)两大类操作。
数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。
数据的约束条件:
数据的约束条件是一组完整性规则的集合。
完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
此外,数据模型还应该提供定义完整性约束条件的机制。
实体:
实体是可以相互区别而又可以被人识别的事、物、概念的统称。
属性:
实体的属性是指描述实体的若干特征。
联系:
实体与实体之间会有各种关系,例如建设用地管理处与用地申请者有审批的关系等。
码:
惟一标识实体的属性集。
域:
属性的取值范围。
2.实体之间的关系