房产档案数字化清理方案.docx

上传人:b****4 文档编号:5031661 上传时间:2022-12-12 格式:DOCX 页数:30 大小:39.37KB
下载 相关 举报
房产档案数字化清理方案.docx_第1页
第1页 / 共30页
房产档案数字化清理方案.docx_第2页
第2页 / 共30页
房产档案数字化清理方案.docx_第3页
第3页 / 共30页
房产档案数字化清理方案.docx_第4页
第4页 / 共30页
房产档案数字化清理方案.docx_第5页
第5页 / 共30页
点击查看更多>>
下载资源
资源描述

房产档案数字化清理方案.docx

《房产档案数字化清理方案.docx》由会员分享,可在线阅读,更多相关《房产档案数字化清理方案.docx(30页珍藏版)》请在冰豆网上搜索。

房产档案数字化清理方案.docx

房产档案数字化清理方案

资料范本

 

本资料为word版本,可以直接编辑和打印,感谢您的下载

 

房产档案数字化清理方案

 

地点:

__________________

时间:

__________________

 

说明:

本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容

房产档案数字化

清理方案

西安必特思维软件有限公司

二○一一年七月

TOC\o"1-3"\h\z\uHYPERLINK\l"_Toc297818498"1需求PAGEREF_Toc297818498\h1

HYPERLINK\l"_Toc297818499"1.1政策需求PAGEREF_Toc297818499\h1

HYPERLINK\l"_Toc297818500"1.2现实需求PAGEREF_Toc297818500\h2

HYPERLINK\l"_Toc297818501"1.2.1贵单位档案现状PAGEREF_Toc297818501\h2

HYPERLINK\l"_Toc297818502"1.2.2档案现存问题PAGEREF_Toc297818502\h2

HYPERLINK\l"_Toc297818503"1.3项目实施效益PAGEREF_Toc297818503\h3

HYPERLINK\l"_Toc297818504"2分析PAGEREF_Toc297818504\h4

HYPERLINK\l"_Toc297818505"2.1我们对数据清理的理解PAGEREF_Toc297818505\h4

HYPERLINK\l"_Toc297818506"2.1.1数据清理的定义PAGEREF_Toc297818506\h4

HYPERLINK\l"_Toc297818507"2.1.2数据清理的实现方式PAGEREF_Toc297818507\h6

HYPERLINK\l"_Toc297818508"2.1.3数据清理与档案数字化加工的区别PAGEREF_Toc297818508\h7

HYPERLINK\l"_Toc297818509"2.1.4技术路线PAGEREF_Toc297818509\h8

HYPERLINK\l"_Toc297818510"2.2数据清理重点和难点PAGEREF_Toc297818510\h9

HYPERLINK\l"_Toc297818511"2.2.1数据清理重点PAGEREF_Toc297818511\h9

HYPERLINK\l"_Toc297818512"2.2.2数据清理难点PAGEREF_Toc297818512\h10

HYPERLINK\l"_Toc297818513"2.3数据清理关键技术应用PAGEREF_Toc297818513\h11

HYPERLINK\l"_Toc297818514"2.3.1人工智能PAGEREF_Toc297818514\h11

HYPERLINK\l"_Toc297818515"2.3.2语义分析PAGEREF_Toc297818515\h13

HYPERLINK\l"_Toc297818516"2.3.3档案分形PAGEREF_Toc297818516\h13

HYPERLINK\l"_Toc297818517"3总体设计PAGEREF_Toc297818517\h17

HYPERLINK\l"_Toc297818518"3.1总体架构PAGEREF_Toc297818518\h18

HYPERLINK\l"_Toc297818519"3.2技术特点PAGEREF_Toc297818519\h21

HYPERLINK\l"_Toc297818520"3.3性能指标PAGEREF_Toc297818520\h21

HYPERLINK\l"_Toc297818521"4技术方案PAGEREF_Toc297818521\h22

HYPERLINK\l"_Toc297818522"4.1档案数字化加工PAGEREF_Toc297818522\h22

HYPERLINK\l"_Toc297818523"4.1.1档案整理PAGEREF_Toc297818523\h22

HYPERLINK\l"_Toc297818524"4.1.2档案扫描PAGEREF_Toc297818524\h23

HYPERLINK\l"_Toc297818525"4.1.3数据录入PAGEREF_Toc297818525\h24

HYPERLINK\l"_Toc297818526"4.2建立逻辑幢PAGEREF_Toc297818526\h39

HYPERLINK\l"_Toc297818527"4.2.1数据移植PAGEREF_Toc297818527\h40

HYPERLINK\l"_Toc297818528"4.2.2分词处理PAGEREF_Toc297818528\h41

HYPERLINK\l"_Toc297818529"4.2.3分形处理PAGEREF_Toc297818529\h44

HYPERLINK\l"_Toc297818530"4.2.4分形后处理PAGEREF_Toc297818530\h46

HYPERLINK\l"_Toc297818531"4.3建立自然幢及房屋落地PAGEREF_Toc297818531\h50

HYPERLINK\l"_Toc297818532"4.3.1分幅编幢PAGEREF_Toc297818532\h51

HYPERLINK\l"_Toc297818533"4.3.2外业调查PAGEREF_Toc297818533\h55

HYPERLINK\l"_Toc297818534"4.3.3自然幢录入PAGEREF_Toc297818534\h66

HYPERLINK\l"_Toc297818535"4.3.4关联落地PAGEREF_Toc297818535\h73

HYPERLINK\l"_Toc297818536"4.4成果利用PAGEREF_Toc297818536\h78

HYPERLINK\l"_Toc297818537"4.4.1质量检查PAGEREF_Toc297818537\h78

HYPERLINK\l"_Toc297818538"4.4.2生成登记簿PAGEREF_Toc297818538\h78

HYPERLINK\l"_Toc297818539"4.4.3数据利用PAGEREF_Toc297818539\h78

HYPERLINK\l"_Toc297818540"5项目实施方案PAGEREF_Toc297818540\h79

HYPERLINK\l"_Toc297818541"5.1项目实施计划PAGEREF_Toc297818541\h79

HYPERLINK\l"_Toc297818542"5.2项目管理计划PAGEREF_Toc297818542\h81

HYPERLINK\l"_Toc297818543"5.3项目成果移交PAGEREF_Toc297818543\h82

HYPERLINK\l"_Toc297818544"5.4项目管理PAGEREF_Toc297818544\h82

HYPERLINK\l"_Toc297818545"5.4.1项目整合管理PAGEREF_Toc297818545\h82

HYPERLINK\l"_Toc297818546"5.4.2项目范围管理PAGEREF_Toc297818546\h83

HYPERLINK\l"_Toc297818547"5.4.3项目时间管理PAGEREF_Toc297818547\h83

HYPERLINK\l"_Toc297818548"5.4.4项目进度控制计划PAGEREF_Toc297818548\h84

HYPERLINK\l"_Toc297818549"5.4.5项目成本管理PAGEREF_Toc297818549\h85

HYPERLINK\l"_Toc297818550"5.4.6项目质量管理PAGEREF_Toc297818550\h85

HYPERLINK\l"_Toc297818551"5.4.7质量控制的难点及重点PAGEREF_Toc297818551\h86

HYPERLINK\l"_Toc297818552"5.4.8项目小组人员配备PAGEREF_Toc297818552\h87

HYPERLINK\l"_Toc297818553"5.4.9项目设备的组织PAGEREF_Toc297818553\h88

HYPERLINK\l"_Toc297818554"5.4.10项目安全管理PAGEREF_Toc297818554\h90

需求

政策需求

随着我国城镇住房制度改革的深化、住房建设步伐的加快和住房消费的有效启动,我国房地产行业得到了飞速发展,在国民经济建设中发挥着巨大的带动作用,并已成为了我国的重要支柱行业。

房屋权属登记档案是房地产行政管理部门在房产登记、调查、测绘、产权转移、房屋变更等房产权属管理工作中直接形成的,有保存价值的文字、图表等不同形式的历史记录,是房屋权属登记管理工作的真实记载和重要依据。

记载房屋物权归属和内容的权属档案,具有法律效力,是房地产管理部门和人民法院确认房屋产权、处理房屋纠纷的重要依据。

2007年10月1日,对房地产权属登记行为、登记信息系统都影响深远的《中华人民共和国物权法》(后简称《物权法》)正式执行,其中,第十八条规定权利人、利害关系人可以申请查询、复制登记资料,登记机构应当提供。

2008年,为了贯彻落实《物权法》,规范房屋登记行为,建设部下发了《房屋登记办法》(建设部令第168号),指出“县级以上人民政府建设(房地产)主管部门应当加强房屋登记信息系统建设,逐步实现全国房屋登记簿信息共享和异地查询。

”为房屋权籍档案的利用提出了新的要求。

为抑制过快上涨的房价,国务院再出房地产调控重拳,2009年12月14日,温家宝总理主持召开国务院常务会议上,就促进房地产市场健康发展提出增加供给、抑制投机、加强监管、推进保障房建设等四大举措,简称“国四条”。

2010年4月17日,《国务院关于坚决遏制部分城市房价过快上涨的通知》(国发〔2010〕10号,简称“新国十条”)出台。

在重申加强房地产市场监管、维护正常房地产市场秩序等要求的同时,首次提出了要根据购房人家庭当前拥有房屋套数,执行差别化的信贷政策要求,并在通知中提出“加快个人住房信息系统的建设”。

2010年6月24日,在“加快推进全国个人住房信息系统建设”会议上,齐骥副部长发表的讲话中提出“要充分认识加快个人住房信息系统建设的重要性和紧迫性,并且要理清工作思路,明确工作目标和任务,狠抓落实,扎实推进个人住房信息系统的建设。

”个人住房信息系统建设的数据基础就是各城市通过数字化清理形成的业务历史数据库,因此,进行房产档案数字化清理也是建设个人住房信息系统的需要。

现实需求

贵单位档案现状

目前贵单位现存纸质档案××万卷,约××万宗。

其中××万宗档案进行了扫描;档案数据存储在××系统中,约××万。

档案现存问题

档案系统信息不完整

由于在当时办理业务时,没有严谨的录入规范,导致档案系统中很多信息没有录入,致使信息并不完整。

档案系统记载与实际不符

在档案系统中,存在有些信息与纸质档案信息不一样的情况。

档案系统数据录入不规范

同样由于业务办理时没有统一严格的录入规范,致使档案系统中的数据相当的不规范。

档案系统数据前后不一致

在档案系统中,同样存在数据前后不一致的情况,如同样一套房子,前一手和后一手在办理业务时录入的信息不完全一致。

档案本身记载信息有误

上面介绍的都是档案系统信息的缺失、不完整、不一致等问题。

其实除了档案信息系统的问题以外,档案本身也存在着很多问题。

由于档案是业务办理的结果,每个时期业务办理的规则也不尽相同。

而且早时期都采用的手工办案方式,因此难免会产生一些错误。

如此种种,在手工办案时代,由于房产权属业务的复杂性,导致档案本身发生错误的情况屡见不鲜。

项目实施效益

有利于贯彻落实“个人住房信息系统”的建立;

有利于个人所得税、房产税的征收;

有利于解决历史遗留问题掌握现实状况;

有利于贯彻《房屋登记办法》和建立房屋登记簿;

有利于贯彻宏观调控政策;

有利于提高工作效率;

有利于降低登记风险;

有利于加强规范化管理;

有利于协助房屋普查工作;

有利于方便群众、服务社会;

有利于与金融部门协同工作。

分析

我们对数据清理的理解

数据清理的定义

随着计算机技术的飞速发展和信息技术的深入应用,信息量急剧膨胀,用户积累了大量的电子数据,这些数据记录了用户的工作成果,非常珍贵。

由于录入错误、部门合并以及业务规则随着时间的推移而改变等因素,都会影响数据的质量。

根据“垃圾进,垃圾出”的原理,为了支持正确的分析决策,就要求原始数据完整准确。

数据清理就是为了解决数据质量问题而提出的。

数据清理在不同应用领域的要求不完全相同,很难有一致的定义,但总的来说,数据清理的目的是检测数据中存在的错误和不一致,剔除或者改正它们,以提高数据的质量。

在通常的信息系统开发项目中,数据质量往往只被理解为控制错误数据的输入,即在数据输入程序程序中加入检查和防范机制,保证进入系统的输入都是合法的数据值。

但数据质量的真正含义远不止此。

从语义角度而言,数据是事实及意义的结合体,数据质量可以通过正确性、准确性、不矛盾性、一致性、完整性、集成性等几个元素来描述。

按照广义的数据质量定义,高质量的数据就是指那些适合于用户使用的数据。

常见有质量问题的数据主要包括不完整数据、错误数据和重复数据三类。

不完整数据的特征是一些应有的信息缺失,如产权人身份证号空缺等。

错误数据产生的原因是业务系统不够健全,在接收输入后没有进行判断而直接写入后台数据库。

错误值包括输入错误和错误数据,输入错误是由原始数据录入人员疏忽而造成的,而错误数据大多是由一些客观原因引起的,例如业务类型定义不规范等。

异常数据是指所有记录中如果一个或几个字段间绝大部分遵循某种模式,其它不遵循该模式的记录,如身份证字段输入信息位数不足或超出规定的长度等。

重复数据也就是“相似重复记录”,指同一个现实实体在数据库集合中用多条不完全相同的记录来表示,由于它们在格式、拼写上的差异,导致数据库系统不能正确识别。

从狭义的角度看,如果两条记录在某些字段的值相等或足够相似,则认为这两条记录互为相似重复。

数据质量的问题并不会突然之间显现出来,很多是历史遗留问题,加上一些主观或客观因素所造成的,诸如系统平台的不一致,缺乏规范的操作流程和标准,数据处理人员水平的差异,组织缺乏数据质量监督管理措施等。

基于以上概念我们可以给出广义的数据清理的定义:

利用相关信息技术如数理统计、人工智能、数据分形等预定义清理规则,对数据源进行处理,补充完整缺失数据,规范不一致数据,清除错误数据和重复数据,从而提高数据的质量。

具体到房产档案数据清理,包括档案数字化、输入、处理和输出三部分。

档案数字化:

房屋登记和交易的纸质档案通过整理、扫描、录入的方式,生成电子图片、非结构化数据,并为后续清理工作提供基础数据。

输入:

把档案数字化生成的数据移植到中间库;

处理:

1、在中间库,采用智能算法(分词、分形等)生成楼盘表和基于楼盘表的案例上下手关系、权利人和物权(所有权、抵押权、用益权和限制权);2、采用地理信息技术(GIS)对照档案数据到现场进行实地勘察,实现楼栋落地。

输出:

把楼盘表、楼盘表和宗地的关系导出到业务库和档案库。

数据清理的实现方式

数据清理的实现方式通常有以下几种:

手工实现

通过人工检查,理论上只要投入足够的人力、物力、财力和时间,也能发现所有错误,但效率低下。

尤其在大数据量的情况下,几乎是不可能的。

定制开发专用的数据清理软件

目前,国内外针对数据清理已提出了一些有效的清理算法,或根据某种算法针对特定应用领域开发出一些专门的清理软件。

但是,由于数据清理的复杂性,对不同的数据源,要求数据清理适应不同的数据类型、数据数量及具体业务。

这种方法能解决某个特定的问题,但不够灵活,特别是清理过程需要反复进行多次(一般来说,数据清理一遍就达到要求的很少),导致程序复杂。

清理过程变化时,工作量大,而且这种方法也没有充分利用目前数据库提供的强大数据处理能力。

基于开放式框架的数据清理平台

如何把数据质量问题与用户业务领域知识结合起来,设计一个能够把数据清理与特定业务领域知识结合起来的模型框架已势在必行,人工智能的发展则给这个领域带来了新的生机。

必特思维基于长达二十年的房地产管理信息系统开发经验和取自数百家用户的房地产管理专业知识,集合人工智能、语义分析、档案分形等国际最前沿的IT技术,创新性的开发出了国内第一个专门针对房地产管理领域的开放式的数据清理平台。

该平台利用专家系统的外壳,便于规则的表示和利用,规则库和算法库是其核心。

在对数据源进行数据处理之前,通过预定义清理规则和选择合适的算法,使平台具有较强的通用性和适应性。

在数据清理过程中,由于很多错误不可预料,不可能所有错误都被自动清理,人工交互是必要的。

当数据清理过程中出现异常错误时,系统会给出相应的警告信息,提示用户手工处理。

另外,基于开放式框架的数据清理平台还具有开放的规则库和算法库,可不断扩充新的数据清理算法,并可根据具体业务定义所需的清理规则,能够大大提高数据清理的工作效率。

数据清理与档案数字化加工的区别

综上所述,数据清理是一项复杂的系统工程,它的专业性和技术性要求不言而喻,然而在实际工作中并没有得到足够的重视。

有些人认为数据清理是一个需要大量劳动力的过程,往往容易将它与档案数字化加工这一劳动密集型工作混淆起来,而忽视了其中所蕴含的技术含量。

其实不然,档案数字化加工的主要目的是通过扫描、录入等方式将用户的纸质档案转化为电子影像档案,方便查询。

虽然在这一过程中也会借助于一些简单的软件工具来进行数据输入输出处理,但数据质量基本上还是靠人工检查而不是依托严密的逻辑校验算法。

与之相反,数据清理的原则则是最大限度的发挥计算机的数据处理能力,减少人工的工作量。

简单地说,档案数字化加工是人工为主,软件为辅;数据清理则是软件为主,人工为辅。

因此,数据清理与档案数字化加工在形式上虽有相似之处,但其本质上是完全不同的。

技术路线

具体工作分为三大部分,分别是:

档案数字化加工,建立逻辑幢,建立自然幢及房屋落地。

档案数字化

包括档案整理和档案扫描和档案录入三个部分,将对登记和交易的纸质档案拆分后进行扫描,形成电子图片。

再按照数据清理要求和数据录入规范,对纸质档案数据进行录入。

建立逻辑幢

建立逻辑幢包括以下内容:

(1)数据移植

将录入的档案数据移植到数据清理数据库。

(2)房屋组栋

通过分词、分形等软件智能算法,自动建立逻辑幢。

(3)登记关系清理

以组建的逻辑幢楼盘表为基础,对存在于数据库的登记数据按照登记的前后手顺序进行清理,建立起房屋与登记业务之间的唯一对应关系。

建立自然幢及房屋落地

建立自然幢及房屋落地工作包含以下内容:

(1)建立自然幢

通过开展外业调查,组建自然幢楼盘表。

(2)房屋落地

将组建的自然幢楼盘表与地籍图上的建筑物图元进行关联。

数据清理重点和难点

数据清理重点

数据的完整性

此次数据清理形成的房产基础数据,是业务系统运行的基础。

数据录入的完整性、准确性直接影响到数据清理的成败和业务系统运行的效果。

尤其房屋信息、土地信息、权利人基本信息等,它们是房屋登记薄生成的基本要求,因此,必须尽可能地全面采集这些信息,才能确保数据清理达到预期的目的。

数据清理将完善和统一基础数据,使基础数据更加真实和准确,为下一步新业务系统顺利实施奠定基础。

因此本项目的重点之一是数据的完整性。

数据的规范化

按照数据大集中、应用大集中的设计思想,房产数据信息系统所有数据要统一规划、统一标准。

在本项目实施过程中需要通过一定的技术手段将现有系统中不规范、不统一的数据,按事先制定的房产数据标准进行规范。

因此,本项目的重点之二是数据的规范化。

数据的安全性

房产档案数据安全的重要性,如何强调都不为过。

数据安全关系到业务活动正常开展,关系权利人的切身利益、关系到社会的稳定,在数据清理过程中数据的安全性必须得到保证。

因此,本项目的重点之三就是保证数据的安全性。

数据清理难点

项目的质量保障

保证数据质量是数据清理工作开展的前提,对于海量的档案数据,上千万个的字段记录,以及大量的图片,案例与案例,案例与房,房和楼,楼和楼的关系的质检,必须依托于计算机的逻辑检验并辅以人工的重点检查。

如何利用技术手段和管理机制保证数据清理的质量是本项目首先要解决的难点。

项目的进度控制

数据清理项目工作量大,要想在合理的时间内完成,必须最大限度的发挥计算机的数据处理优势,尽量减少人工处理的工作内容,这也是本项目需要解决的一个难点。

项目管理与协调

数据清理涉及用户的多个业务部门,涉及面广,参与人员众多,尤其还涉及到外业测绘调查,需要大量协调和配合工作,任何一个环节协调不好配合不积极都会影响项目的整体推进,影响数据清理的质量和进度。

因此本项目的难点之一是加强各相关单位人员的管理和协调。

清理工具的开发

对于海量数据的清理,要求实施单位能够提供性能先进的清理软件工具,清理工具的开发除了要有扎实的房地产管理专业知识和成熟的智能算法外,还要对用户现有的业务系统非常的熟悉和了解,才能有针对性的研发出合适的清理工具,实现数据的顺利移植和输出。

此外,还需具有测绘能力,而想达到这一点,绝大部分公司是难以做到的,这也是此次项目的难点之一。

清理设备的组织

清理设备在房产档案数据清理整合当中,起到非常重要的作用,如何在短时间内组织大量的设备,满足用户的需要,将是数据清理工作需要解决的又一大难点。

清理人员的组织

和清理设备的组织类似,清理人员的组织也是数据清理工作面临的又一大难点,如何在短时间内组织足够的专业人员,保证项目的顺利实施,将是数据清理工作的重要难点。

上述难点,我们将在后续的方案中一一提出解决方法。

数据清理关键技术应用

必特思维开发的数据清理平台中采用了多种先进的IT技术,如人工智能、语义分析、档案分形等,下面我们分别介绍。

人工智能

人工智能(ArtificialIntellige

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 中医中药

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1