城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx

上传人:b****5 文档编号:20778615 上传时间:2023-01-25 格式:DOCX 页数:84 大小:2.72MB
下载 相关 举报
城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx_第1页
第1页 / 共84页
城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx_第2页
第2页 / 共84页
城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx_第3页
第3页 / 共84页
城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx_第4页
第4页 / 共84页
城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx_第5页
第5页 / 共84页
点击查看更多>>
下载资源
资源描述

城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx

《城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx》由会员分享,可在线阅读,更多相关《城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx(84页珍藏版)》请在冰豆网上搜索。

城市地址信息空间化的原理及方法研究初稿本科毕业论文Word格式.docx

山东科技大学

二零一一年六月

论文题目:

作者姓名:

入学时间:

专业名称:

地图学与研究方向:

3S技术集成

地理信息系统与应用

指导教师:

教授

副教授

论文提交日期:

2011年5月

论文答辩日期:

2011年6月日

授予学位日期:

PrinciplesandMethodofSpatializationofCityAddressInformation

ADissertationsubmittedinfulfillmentoftherequirementsofthedegreeof

MASTEROFPHILOSOPHY

from

ShandongUniversityofScienceandTechnology

by

Supervisor:

ProfessorWenbaoLiu

ProfessorNaixiaMu

GeomaticsCollege

May2011

声明

本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的研究成果。

该论文资料尚没有呈交于其它任何学术机关作鉴定。

硕士生签名:

日期:

AFFIRMATION

Ideclarethatthisdissertation,submittedinfulfillmentoftherequirementsfortheawardofMasterofPhilosophyinShandongUniversityofScienceandTechnology,iswhollymyownworkunlessreferencedofacknowledge.Thedocumenthasnotbeensubmittedforqualificationatanyotheracademicinstitute.

Signature:

Date:

摘要

随着地理信息系统在各行业的广泛应用、我国城市规模的不断发展扩大以及街区范围的逐渐增大,城市管理部门对空间数据与非空间数据共享整合的要求日益迫切。

由于地址信息并不直接等同于空间的地理位置,因此城市地址信息空间化正是解决这一问题的关键。

通过对国内外地址信息空间化的应用进行全面研究发现,国外已经具备了成熟的地址匹配技术,但由于我国地址信息的特殊情况,不能够简单搬用这套方法。

本文通过借鉴国外进行地址编码的经验,总结地址匹配的一般方法,并对我国城市地址进行系统分析,本着科学性、可行性和易推广性等原则,提出了一种新的解决办法。

通过对中文地址的特点和编码规则进行总结,并设计出符合进行中文城市地址信息空间化的地址数据库。

在对众多中文分词算法进行研究的基础上,提出一种新的、适合我国地址现状的,以正则表达式和中文分词为基础的中文地址分词和地址标准化算法,能够对中文地址进行有效清洗和整理,并最终进行成功地匹配。

在以上研究的基础上,开发出以武汉市为例的中文地址匹配引擎,实现了中文地址匹配的功能,将属性信息同空间位置进行关联,大大提高了城市信息空间化的效率。

该引擎已在武汉市国土规划管理信息系统和新疆石河子规划系统中得到应用。

关键词:

数字城市,地址编码,地址匹配,信息空间化,中文分词

Abstract

Thepaperanalysisthesurveyingproductdemandaftergeologicaldisastersindifferentstagesofemergencyresponse,summedupthetaskfacingandshouldprovidetechnicalservicesofemergencydepartmentofsurveyingandmappingintheemergencyresponseofdifferentstages.Studiessurveyingproductsapplicationmodelsandservicemodeindifferentstageofemergencyresponse,hoperealizethequickresponseofemergencywiththeexistingtechnology.Summarizedthequicklymethodsandtechniqueofdataacquisitionanddatapost-processing,introducedindetailtheprocessingofdataacquisitionanddatapost-processingbyUAVremotesensingsystemforexample,hopetoguidethedataproductionofrapidresponseintheemergency.Collectallkindsofdomesticexistingbasesurveyingdataandspecialdatainemergencydepartment,analyzedspaceandattributesfeatureofallkindsofdata,storageandmanagementmassivedatausingOracledatamanagementsystem.Forrasterdata,constructrasterdatapyramidmodel,realizedthemassiveremotesensingimagesandDEMrasterdatadelamination,slicestorage,andformulateduniformnamingrulesassociatedwithspatiallocation,usingthequadtreeindextechnologycreatedspaceindex.Atthesametime,torealizetheefficientorganizationandmanagementofvectordata,forexamplefundamentalgeographicinformationdata,emergencyspecialdata.AndusingRtreeindextechnologybuildspatialindex,realizequicksearchofvectordata.Designeddatabasewarehousinginterface,realizedrasterdataandvectordatafastwarehousing,updateandextraction.Throughtheinformationissueservice,realizesthedatathelong-distanceaccess.Accordingtoemergencyresponsedirectionrescuedemand,designemergencydirectiondecisionsystemfunctionmodule,hopetorealizethegoalthatemergencyrecoverycontrolcentercontroloverallsituation,fastdirectandadjustment..Finallysummarizeseachkindofemergencymappingdataachievementapplicationpattern,makeemergencyspecialapplicationnewproductspattern.

KeyWords:

Digitalcity,geocoding,informationspatialization,Chineseparticiple

目录

1绪论1

1.1论文研究的背景及意义1

1.2国内外研究现状2

1.3研究目标与内容17

2城市社会信息空间化方法20

2.1社会经济信息空间化的基本方法20

2.2基于地理格网的空间化方法21

2.3基于地址编码的空间化方法22

3中文地址的组成及编码规则29

3.1中文地址的特点29

3.2中文地址组成形式31

3.3中文地址的编码规则34

3.4中文编码模型研究37

3.5地址标准化39

4中文地址匹配算法41

4.1中文分词41

4.2模式匹配理论50

4.3中文地址匹配算法53

4.4中文地址匹配流程60

5中文地址匹配软件设计64

5.1系统开发工具及平台64

5.2地址数据库设计66

5.3系统功能实现70

5.4地址匹配引擎在综合系统中的应用82

6结论与展望87

6.1结论87

6.2展望87

致谢89

参考文献91

作者学习经历和科学研究94

Contents

1Introduction1

1.1BackgroundandSignificanceoftheResearch1

1.2TheAimoftheReasearch2

1.3CurrentReasearchHomeandAbroad17

2DemandAnalysisandApplicationModelsofEmergencymappingProduct20

2.1EmergencyWarning20

2.2EmergencyRespond21

2.3DisasterEvaluation22

3QuickAcquisitionandProcessingofEmergencyData29

3.1QuickAcquisitionofEmergencyData31

3.2QuickProcessingofEmergencyData37

4EmergencybaseDatabaseDesign41

4.1ExistingSurveyingandMappingData41

4.2ExistingQuestionofCurrentlEmergencyDatabase50

4.3EmergencybaseDatabaseDesign53

4.4PreliminaryPlanofEmergencyCommandingDecision60

5EmergencyspecialdataachievementbasedonEmergencybaseDatabase64

5.1SpecialMapOutputbasedonArcGIS64

5.2Multi-sourceDataOverprintingDisplaybasedonGISPlatform66

5.33DEmergencyCommandingDecisionInformationSystembasedonGISPlatform70

6ConclusionandOutlook87

6.1Conclusion87

6.2Outlook87

Thanks89

ReferenceDocuments91

MainWorkAchievementoftheAuthorduringWorkingonMasterPaper94

1绪论

1.1论文研究的背景及意义

1.1.1论文研究的背景

在城市中,地址数据是非常普遍的,城市地址已经成为人们首先使用的重要方式来表达他们感兴趣点的位置,包括他们办公和居住的地方,这些地址成为城市空间索引关键字就很自然了。

随着地理信息的普遍应用,越来越多的传统行业中开始引入GIS,如果实现了高匹配率和高精度地址匹配技术,那么大量的社会经济数据,比如人口、工商、医疗、公安等信息就变成了带有空间坐标的空间信息了。

通过地址编码技术,能够将工商、税务、信用、规划、建设等社会经济部门的资料和数据库中的地址转换为真实的地理坐标(经纬度),并映射到地图、遥感影像上,实现地址名称与空间信息的整合,进而可以完成对社会经济信息的分析、统计、管理、制图和可视化表示,为所有的部门提供实时、准确和权威的集成与融合工具,以支持政府的管理和决策。

因此,地址地理编码技术在城市空间定位和分析领域具有非常广泛的应用前景,如商业应用的实施过程中,经常遇到大量的客户位置信息无法确定的问题,从而限制了地理信息技术的推广,一些单位为了实现业务智能管理、物流配送等功能,不得不通过调研公司进行城市普查,以获取自己所关心的位置信息。

这种方法存在的问题是实施的周期长、操作上难度性大、准确性难以确定、费用较高、资源重复投入,还有区位分析,选址分析等,要彻底解决这些问题就必须借助于地址编码技术;

还可以满足资源环境管理,城市规划建设以及公安部门的报警系统等基于位置的服务要求。

1.1.2论文研究的意义

城市管理宏观决策的最重要的依据就是经济信息的分布及资源配置情况,统计表格形式的经济信息数据库进行统计、分析等基于文本数据的操作优势明显,但是如果考虑到这些经济信息的空间分布和地理特征,目前存储经济数据的关系数据库显得捉襟见肘。

GIS在空间数据统计、分析和辅助决策等方面具有先天优势,如何将已经存在并将继续存在的相互独立的经济信息和空间信息在某一种规则的基础上进行统一描述,是社会、经济信息空间化的主要研究内容。

既要保证各个系统的独立性,即各行政管理数据库的独立运行、独立维护,又要保证数据之间的无缝连接和充分共享。

传统的空间数据的加工过程,即将属性数据和图形数据关联的方式当然是一种最为直接的方式,但是由于地址数据、地名数据的模糊性和几何数据定位的不确定性,将两者在数据库中关联,将社会、经济信息作为空间数据的属性字段的方式面对海量的空间数据明显是不可行的,不仅因为这种关联费时费力,而且由于社会、经济信息的随时地发展变化,导致其与空间数据的不一致性继续扩大。

更为严重的是,社会、经济信息分散在不同的部门,难以综合管理,这与图形数据主要由城市规划管理部门生产和维护不同[1]。

将分散在不同管理部门的社会、经济数据统一起来,不仅是不合理的,也是不现实的。

除了技术原因以外,往往许多社会经济数据具有保密性质。

因此无论从技术层面上讲,还是从现实层面上看,传统的空间数据的加工过程不适于大量存在的空间数据的处理。

在这个处理过程中,必须考虑不同部门的社会、经济数据的本质特点,实现社会经济数据与空间地理数据动态的、智能的、模糊的连接,并在空间位置上专题化,这是空间决策的基础依据。

1.2国内外研究现状

1.2.1国外社会经济空间化研究现状

随着空间信息在我国城市信息化建设中越来越广泛的应用,城市管理部门之间对空间数据与非空间数据共享整合的要求日益迫切。

据专家分析,政府各职能部门拥有的大量业务信息中的信息都与地理空间位置密切相关,但是这些信息几乎都没有空间坐标,因此无法与其它信息整合,无法实现可视化的空间分析。

为了将这些空间信息与非空间信息、非空间信息与非空间信息进行集成与融合,真正为公众提供直观、生动的基于空间位置的服务,就需要建立空间与非空间信息之间的联系,地理编码正是建立这二者之间联系的最重要最实用的手段。

地理编码体系是一个基于地理标识的空间参照系统,它并不基于精确的坐标,而是建立在地理要素的位置关联基础上的。

研究地址编码体系的目的,就是要将目前分散在各个部门相对孤立的信息统一于一个信息可充分共享的环境中,使这些数据发挥更大的效益。

1.2.1.1DIME模型与TIGER模型在美国的应用

美国是地址编码应用最早、最广泛的国家。

为配合1970年的人口普查,20世纪60年代中期,美国国情普查局研究发展了“双重独立地图编码系统”(DualIndependentMapEncoding,简称DIME),其基本思想是按照各要素的拓扑关系来组织数据,形成一个地理基础文件系统。

特别值得一提的是,在城市道路中心线的每个弧段均带有道路左右两边的门牌起止信息,为地址信息的定位奠定了基础。

在随后进行的人口普查工作中普查的分区及调查、数据的整理,都以这个地理基础文件系统为参照。

20世纪80年代后期,为了准备1990年的国情普查,美国国情普查局又将DIME系统发展为TIGER(TopologicallyIntegratedGeographicEncodingandReferencing)系统,意为拓扑集成的地理编码与参照系统。

TIGER数据库是1990年人口调查用的覆盖全国的所有地图资料库。

例如,在人口普查中,需要使用地理编码给划分出的普查地理区域分配数字代码,来代替普查区域的文字名称,以方便计算机处理。

利用地理信息系统可以对不同地域的分类信息进行统计分析,把人口普查得到的住户和个人资料方便地与其所在地域联系起来,反映出普查资料的地理特征。

TIGER数据库的内容处于不断更新之中,差不多每两年就有一个新版本发布,并以多种形式的文件向社会公众提供。

只需要付一定的工本费,就可以方便地得到所需地域的TIGER数据[3]。

DIME地理基础文件和TIGER模型都是曾经在美国人口普查过程中成功应用的地理编码模型,对于后来的地址编码模型的建立都具有重要的参考意义。

这两种模型都不存储单独的地址,是以“地址范围”为基础,街道由线段序列表示,若一个连续的线段序列,除断点外没有其他交点,并且每条线段明确关联了左右多边形及始末节点信息,在TIGER的拓扑结构中被称作“完整链”。

完整链的首尾点称作StartNode与EndNode。

“地址范围”是指相对完整链的结点编号方向,第一个与最后一个可能的沿街门牌号对,即地址范围包含了号码可能的全部范围,即便被标识为某号码的地物实际并不存在。

组成地址范围的地址号码一般为“城市类型地址”的号码,最简单的“城市类型地址”由号码、街道名以及5位邮政编码组成,例如“312MainSt90210”,通常一条地址还提供更多的其他信息。

1.2.1.2其它国家的应用

1.英国使用的是基于BritishStandard7666框架的NLPG(NationalLandandPropertyGazetteer)数据库。

英国的人口普查与邮政编码有关,全国有几乎2百万个编码,每15个household就有一个编码,普查的区域EnumerationDistrict基本上有10个邮编的大小,400人左右,统计后的数据经过复杂的数学模型后切分到每个邮编上[4]。

2.自从1990年以来,澳大利亚开始意识到了广泛的高质量地址编码数据库的重要性。

经过多年的计划合作和发展,国家地址地理编码文件G-NAF(AGeocodedNationalAddressFile)终于在2004年3月问世了。

13个团体组织将近32,000,000条地址记录用来5步清洗和集成,产生了一个包括22种常态的文件。

通过对所采集的地址进行统一地理编码实现地址信息空间化,满足了寻址服务的需求。

3.加拿大、德国、以色列等国家,同样很早就对地址编码技术做了大量而细致的研究工作和实际应用。

同美国一样,这些成果对各自国家的规划、行政、测绘等事业的工作都起到了积极的作用。

如加拿大完成了国家级的地理编码数据库建设,由于使用了文件系统管理地理编码数据,使得地理编码数据库具有较高的响应速度,加拿大全国拥有1.5G字节的地理编码数据量,而进行地址匹配仅需1秒钟[5]。

4.日本的地址编码不同于西方基于街道的地址编码,日本许多城市的发展是源自古代的城下町,为此道路狭窄且不整齐,很难用道路为地址命名。

因此日本的地址编码多采用“街区方式”,很少采用“道路方式”[4]。

5.随着南非城市化进程的发展,各领域对地址信息的要求也日渐广泛,但目前南非地址系统还不健全,存在着诸多问题,如私人地籍信息不健全;

一些黑人社区的房屋只有门牌号码没有具体的地址信息;

宗地边界变动频繁等。

南非没有官方的地址注册机构,但和其他国家一样,南非有很多机构拥有与地址有关的数据库,比如南非邮政局,南非测绘总局,南非地理名称董事会以及一些注册机构等,由于不同机构间的职能不同,地址描述的侧重点不同,使得这些数据可以互补。

南非现有750万至1100万条地址,但录入到现有数据库的只有300万到500万。

目前,南非一方面在完善国家地址数据库系统,另一方面要求实现各机构数据库的数据交换。

2006年6月,南非地址标准(SouthAfricanaddressstandard,SANS1883)和地理信息地址标准(GeographicInformationAddressStandard)项目正式启动,至今已经出台了三部标准草案:

①地址结构数据标准;

②地址数据库建立、数据传输、交换与协作指南;

③地址定位与更新指南。

标准草案将南非地址分为11类:

街道地址、街道交叉口地址、点位地址、地标地址、建筑物地址、农场地址、非正式地址以及四个邮政系统地址(邮箱地址、邮局地址、邮政线路地址、乡村地址)[6]。

总体来讲,SANS1883包含了南非所使用的所有地址类型,并规定了不同地址类型之间的数据交换方法,为南非地址标准化打下了基础。

南非地理信息系统标准的主要成果集中反映在南非地址编码国家标准的制定,其中主要涉及的标准包括:

南非“国家空间信息基础设施(NSIF)”法案和南非空间信息基础设施的元数据交换与空间数据发现设施的建立。

这两个成果是南非地理信息技术的重大突破,对于促进南非地理空间信息技术的广泛应用将具有重大意义。

1.2.1.3国外软件产品的应用

目前国际主要GIS软件有Esri公司的ArcGIS系列产品,Intergraph公司的GIS系列产品,PBBI的MapInfo系列产品,TitanGIS系列产品以及Bentley系统公司GIS产品等。

常用的GIS软件都具备地理编码功能,如ArcGIS的Geocoding和MapInfo的MapMarker等,并且地理编码方式基本相同。

1.地址匹配工具Geocoder通过上网免费获取地址信息,根据某个Key寻找地理位置的坐标,这个K

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1