汉王数字化档案馆解决方案.docx
《汉王数字化档案馆解决方案.docx》由会员分享,可在线阅读,更多相关《汉王数字化档案馆解决方案.docx(20页珍藏版)》请在冰豆网上搜索。
汉王数字化档案馆解决方案
汉王数字化档案馆解决方案
第一部分背景概述
档案是过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录。
与传统载体、原子形式的档案相比,数字化形式的档案的最大特点是能够通过网络迅速流动。
数字档案馆的研究和建设将彻底改变档案的利用方式,冲破档案利用的种种局限,使档案馆从封闭走向开放,为政府决策、企业经营服务,做到“科技服务档案,档案服务经济”。
数字档案馆是具有管理数字化档案能力的一个系统,是综合性档案馆的组成部分,它能够全方位、全过程地对数字档案进行管理,并能够为所属地区立档单位提供数字档案管理服务。
数字档案馆包括行政组织、管理规范和支撑其运作的计算机网络应用系统。
通过数字档案馆,档案信息价值可以得到充分体现。
数字档案馆的建设将促使综合性档案馆从档案的保管和利用职能向信息采集、管理和信息服务方面职能转变。
数字档案馆是档案从库存资料向信息资源转换的中间站,也是档案信息化、产业化的支撑平台。
数字化档案馆主要是强调馆藏的数字化,将数字化的档案信息上网提供利用,是建设数字档案馆的的基础,是建设数字档案馆必不可少的前期准备工作,是构成数字档案馆的一部分。
国家十五计划已对数字化档案馆的建设提出了明确要求和具体实施步骤,这标志着中国数字化档案馆建设工程已进入具体实施阶段,这是一项充满创新和挑战的工程,需要社会各界广泛参与,从而使中国档案管理现代化的步伐跟上世界发展的脚步。
在国家档案局档案科学研究所的指导下,汉王科技与汉王公司联合推出包括数字档案资源建设、数字档案管理利用两个重要环节的数字化档案馆应用方案。
第二部分数字档案资源建设
一、“汉王OCR录入工厂系统(网络版)”加工方案:
信息资源对于网络时代,正如蒸汽机于工业社会,我们致力于信息资源建设,正是在构建未来社会的基石。
要丰富网络资源,提高原有信息知识的利用效率,对图书、文献、档案等信息资料的数字化就显得尤其重要。
但如何将种类繁多的文档资料、行业信息进行自动化处理,以满足各种数字化信息的应用,这就是OCR技术(光学字符识别)在信息数字化建设中起到的至关重要的作用。
1、总体功能:
实现大量原始资料的快速扫描录入与保存;
OCR录入、校对、整理;
数据库存储、备份、检索和管理;
对各工序环节能进行监督和调度协调;
员工岗位的管理;
质量控制;
系统管理。
2、系统特点:
1)大量原始资料的快速扫描录入与保存
各种版式的现代书籍:
横版、竖版、简体、繁体;
古籍:
特别是珍本、善本;
各年代的报刊杂志及内部资料;
各年代公文档案;
各种报表或票据。
2)汉字识别之王:
国际领先的OCR录入、校对、整理功能
采用汉王先进的OCR识别技术,识别率高、速度快;快捷精确的横校、纵校、对比校对;支持多种电子文档存储格式:
PDF、HTML、RTF、TXT、XLS,方便地实现全文检索,并将逐步与国际标准电子文档格式接轨。
3)完善的员工管理功能
综合了考勤管理、岗位管理、工资管理三大功能,系统自动记录员工出勤情况,自动为各岗位分配工作并记录分配情况及工作量,并根据以上记录情况生成员工工资明细表;提供轻松友好的工作界面。
4)自动进行各工序环节的监督和调度协调
服务器给各岗位分配任务,并进行任务协调,使各客户端的任务既相互独立又形成完整的生产流程,提高工作效率,使得文字处理速度可达到每人班10-12万字,比手工录入的效率提高5-8倍。
系统自动进行员工工作量计算、差错量监控,可将整体差错量控制在万分之二以内,从而达到了出版质量要求。
5)对本套系统的监控、管理及日常维护,并定期生成安全日志
二、系统结构:
1、系统网络结构图:
2、网络拓扑结构:
三、系统功能描述:
汉王OCR海量录入软件系统具备四大功能:
文字自动录入、流水线管理、质量控制和员工管理、系统管理。
1)文字自动录入功能
OCR海量录入系统采用汉王在OCR领域领先的成熟的文字自动录入技术,可实现自动图像预处理、版面分析,能识别中文简体、繁体、英文及混排,多字体多字号文档。
2)流水线管理功能
OCR海量书籍录入系统的操作分为几个步骤:
纸质资料的整理、扫描、图像预处理、版面分析、识别、校对和保存。
单机OCR系统要求操作员熟悉每个步骤:
扫描、图像预处理、版面分析、识别、校对和保存,这种串行的工作方式会降低效率,对操作员技能要求也较高。
但是,如果将冗长、复杂的生产过程合理地划分成若干道工序,每道工序操作简便,合理安排工作岗位,并行操作,生产效率和质量就能得到很大的提高。
OCR海量录入系统就是采用生产流水线管理方式,根据OCR技术和操作的特点,将生产过程划分成以下几道工序:
四、工序说明:
1、图书资料整理:
为了便于扫描和以后的查询、检索而进行的图书分类、拆装、命名、编号等。
2、扫描:
扫描是纸质文稿图像输入计算机的过程。
一般把相关文稿顺序扫描,在扫描质量控制程序自动检测并修正后,自动保存到数据库中。
3、图像处理:
为了提高识别率,对图像进行“消蓝去污”的处理,即去掉图像上影响识别率的噪音如麻点、下划线等,图像质量控制程序自动监测图像处理质量。
4、版面分析:
能自动进行版面理解并定位,判别划框区域是横排文本区、竖排文本区、表格区还是图像区,并对不同属性的区域以不同颜色的线框标识出来。
自动版面分析在后台运行,操作人员可在前台进行确认,必要时对自动版面分析结果加入手工干预。
5、识别:
把文字图像转化为计算机文字内码,可以识别印刷体和手写体中文(包括简体字和繁体字)、表格、中英文混排,识别出来的文字内码可以是GB码、BIG5码、GBK码或者Unicode码。
识别过程在后台运行。
6、纵向校对:
具有很强的查错、纠错能力。
纵向校对是将一个图像或若干个图像中识别成同一个字的文字图像列在一起显示,并以突出颜色标出可疑字,便于操作员发现错误和修改。
7、横向校对:
这是传统的人工校对方法,操作员直接对比识别结果文本和图像,以发现识别错误文字。
系统自动调出文字对应的图像,进行比对。
同时,以醒目的颜色标出识别可信度不高的文字。
8、版面还原:
将识别并修改好的文本还原成跟扫描文稿版面的布局一样、可以供计算机阅读和查询检索的RTF、PDF、HTML、SGML/XML格式的数字文档。
9、数据入库:
版面还原数字文档的保存。
10、质量控制和员工管理:
质量控制是为了保证和控制系统的录入质量而采取的一整套方法与措施。
主要是在各工序中加入对员工工作完成情况及差错量的监控和工作量的计算,以求将整体差错量控制在万分之五以内。
员工的工作态度将会直接影响到数据录入的质量和工作效率,要使员工保持一种积极的工作态度,必须有好的管理制度和客观的评价标准及依据。
OCR海量录入系统还可以详尽地提供员工考勤情况和工作质量数据,对员工的工作情况给予公正的评估。
员工管理系统在整个系统中处于支配地位。
该部分由考勤管理、工资管理、质量控制、工作分配、返工单管理和建立用户等几个模块组成。
11、考勤管理:
记录各员工的出勤、缺勤状况。
12、岗位管理:
记录各岗位的工作分配及员工的工作量、差错量(质、数量的差错要求控制在万分之五以内)的状况。
13、系统管理功能
“OCR海量录入软件系统”是一个大型的Intranet网络系统,它包含成千上万的加工数据资料和员工详尽的工作信息。
管理人员通过简明友好的系统管理界面可以方便地查询数据、备份数据和系统维护。
OCR海量录入系统还提供安全日志,供管理人员查询。
五、系统逻辑模型:
说明:
整个系统围绕两个互相联系的数据库:
员工管理数据库、OCR扫描文件数据库展开工作。
员工管理数据库由员工信息表、工种信息表、员工考勤表、员工工作量表、班次表、工资管理表等构成一个完整的员工资料库。
员工依流程指定的步骤登录、考勤、申请工作、执行操作并接受管理监督。
OCR录入资料数据库经由扫描录入、图像处理、版面分析、识别、纵校、横校、版面还原等工序处理最终形成。
其中在信息传输上采取申请任务方式与分配任务方式相结合使用:
1、申请任务方式:
用户完成一件工作包的同时查看是否有已经分配的工作包,如没有,则申请另一个工作包。
2、分配任务方式:
由管理员分配工作包给每一个员工。
为对此流程进行有效管理,我们建立了原始工作包表、工序跟踪表、返工单表、员工工作分配表、工作包表等。
第三部分数字档案的管理利用
此部分采用汉王公司在国家档案局科研所指导下,根据档案管理国家标准(GB)和行业标准(DA),在对档案管理业务充分理解的情况的基础上,全面考虑各地区、各行业档案管理不同需求而研发出的新一代档案管理软件---汉王3.0版。
它具有专业性、易用性和可扩展性三大特性。
一、系统功能:
通过对各地、各行业多个机关企事业单位的分析,根据其档案管理特点,系统设计了以下功能:
文件、档案种类自定义,著录标引,文件管理,自动组卷、检索查询,利用管理,报表设计、原文管理、权限控制等。
1、著录标引
对各类文件、档案进行著录登记。
2、快捷录入
选择录入、代码录入方式。
3、人性化设计,自定义著录界面
用户按照习惯任意定义录入界面,增强程序亲和力。
4、自动纠错
对用户错误的输入、误输入自动提示纠正。
5、自动标引
自动生成主题词。
6、任意导入历史数据
7、原文管理
文字、图像、多媒体等各种格式电子文件以及纸质文件材料直接扫描存储管理。
原文数据的加密、压缩。
文件、档案以及各种原文数据可以存储至磁带机、光盘塔。
8、整理编目
自动组卷:
遵循国家标准,同时支持传统与简化两种组卷方式进行自动组卷;另外允许用户自定义组卷条件,对各种专门类型档案进行自动组卷;自动生成档案管理所需案卷号、件号、起止号等各种序号;
档案整理:
数据采集功能可以直接导入其他档案管理系统的历史数据;针对自动组卷或已经组好的案卷,可以采用可视化方式进行案卷的分拆、合并、剔除、排序等调整;提供档案校验功能,对已有的案卷号、件号等各种档案管理序号可以自主修改和重新排序,对重号、错号自动校验;
面对各大部委,部门组卷,档案处监督的情况,以后组卷不再是到下一年年初组上一年度的情况,而是随时可能组卷,随时提交给档案处,档案处在接收这些案卷的时候,可以对档案组卷情况进行检查,如果组卷符合要求,就接收;如果不符合要求,就提醒相应部门重新组卷,并指明问题所在。
9、打印编目:
自动生成符合档案工作相关标准的案卷目录、卷内目录、案卷封面以及备考表等;
提供多种地区、行业报表模版,报表格式可以任意定义扩充。
超强报表设计器,可以快捷制作专业报表。
10、检索统计:
单条件简易查找——逐条查询、批量筛选,方便快捷。
多条件组合检索——复合模糊条件,高速检索响应。
根据用户需求进行全文检索、图文声像一体化检索。
对检索结果进行排序、打印、格式转换、远程传递等处理。
登记借阅利用情况,超期自动催还,统计借阅情况,打印借阅登记单。
借阅利用情况和文件档案记录“自动互查”。
11、档案统计
可根据档案统计年报中的各种统计报表制作模板.
可灵活定义一些统计报表。
12、系统维护
用户管理:
用户分级权限控制,确保信息万无一失。
实体分类:
无限扩展空间,管理百种档案。
制作目录:
报表随意制作,满足特定行业需求。
二、系统特点:
系统采用VB6.0作为主要开发环境,对不同的用户可选用ACCESS或SOL做数据库,并且自行选择单机运行或联网运行。
1、功能强大专业性强
系统涵盖了文书处理和档案管理全过程,集文件登记、公文处理、自动组卷、自动编目、智能检索、统计编研、档案保护等功能于一体。
系统采取“一次登记,无限次使用”管理模式,用户只需要录入文件或档案基本信息,由程序来自动完成处理、传阅、查询、组卷、打印乃至销毁等档案室基本业务工作。
用户可根据需要自由设计表格,既能套打,也能全表输出;系统的多种条件和智能模糊检索功能,查准率达100%,查全率达99%以上。
2、系统分级的安全策略
通过严格的分级权限机制,系统管理员可以对各个用户设置相应的用户权限及登录口令。
并对数据进行加密处理,确保了数据的安全性。
系统数据库经过加密处理,防止未授权打开,确保了系统的安全性。
1)原文数据经过加密、压缩后存入数据库,防止了误删除、误修改、泄密等问题,确保了数据的安全性。
2)系统有详细的权限设置功能,可定义从系统管理员级到系统访问者级用户的各项权限
3)系统采用事务追踪,从登录系统,到修改、删除资料的所有操作都一一登记,
用户可按权限随时查阅数据处理信息。
3、组件式设计,可扩充性强定制和通用相结合,兼容性好
1)系统管理对象无限扩充,用户可以任意增加各门类的文件、档案以及其他相关信息资料。
管理对象可无限分级,用户可按自己需要实施分类方案。
2)可根据用户的特殊需要随时增加新的功能,版本升级换代容易,提供数据导入导出功能,用户用任何软件录入的历史数据均可转入本系统
3)系统采用动态智能菜单设置,系统自动根据用户需要以及相关设置,调整菜单项。
4)系统界面可自行调整,满足不同用户的习惯。
4、图文并茂,直观易学
1)系统采用图形化界面,资源管理器模式,使操作过程一目了然。
2)各模块界面统一,便于学习掌握。
系统设计了动态联机在线帮助,能对操作随时提供支持;有详细的操作手册和安装说明,操作人员只要阅读手册,就可掌握该软件的基本使用方法。
它拥有强劲的查询功能和灵活的用户定制特点,文档格式完全符合国家标准(GB)和行业标准(DA)要求。
PC人脸识别登陆系统
十几年来,在手写、OCR、生物特征等模式识别领域,汉王的技术和产品一直处于国内和国际市场领导者地位。
在指纹识别、图像处理、嵌入式开发方面积累了丰富的经验,汉王研发的指纹识别系统在国际权威的FVC2004上获light组第3名(国内第1名),平均ERR(等错误率)仅为3.96%。
早在2003年,汉王就瞄准人脸识别技术的国际前沿,结合国内市场发展趋势,开展人脸识别技术的潜心研究,五年磨一剑,现在我们拥有完全自主知识产权的“DualSensor”人脸识别算法,识别性能达到国际一流,它具有如下技术特点:
1.独特的人脸关键区域定位方法,定位准确度高,识别率高;
2.人脸识别算法具有自学习功能,可以有效解决人脸的缓慢岁月变化问题;
3.采用专用双摄像头,属于准三维人脸识别技术,识别性能大大超过二维人脸识别,算法复杂度远低于三维人脸识别,技术优势明显;
4.识别性能不受环境光线的影响,黑暗中也可识别,满足各种不同的用户需求和使用环境;
2008年,汉王全力推出一系列人脸识别技术及其产品,突破国外技术垄断,正式拉开国内人脸识别产业化的序幕!
PC人脸识别登陆系统
型号:
FaceLogonV1.0
产品功能特点:
1.与Windows系统无缝连接,无需输入密码,无需记忆复杂的密码,人像识别登陆计算机,方便安全;
2.根据用户需要,可以设置高、中、低三个安全级别;
3.用户可以查看所有人像识别登陆日志,掌握企图试探进入的人员信息;
规格参数:
·操作系统:
WindowsVista、WindowsXP
·摄像头:
30万像素以上普通摄像头
·光线:
可见光
·软件大小:
20MB
·识别速度:
15帧/秒
·识别率:
〉95%
·日志记录:
7天
速录笔
速录笔是汉王新近推出的一款联机扫描资料笔,只需轻轻一划,即可将纸质资料上的文字、数字、符号等直接输入到电脑光标位置,直接编辑,不必打字,每分钟可输入上千字。
产品特性:
·全自动精准输入
无需左右手设置,采用全自动智能处理技术,自动判断中文稿件文字横、竖排版方向,只需轻轻划过,即可快速将识别结果发送到电脑中;自动判断语言种类。
·识别文字范围广
简体:
国标GB2312-80的全部一、二级汉字及常见符号;繁体:
可混识5400多个繁体字;可识别全部纯英文字符集。
·识别快速精准
一分钟可输入上千字,提笔即可得到识别结果,达到同步扫描,同步阅读。
·图像提取、反馈、校正
采用自动定位中间行技术,自动对中间行文字进行提取识别;提供原始扫描图像预览,实时反馈扫描图像,矫正扫描动作;系统自动检测文字倾斜角度并自动调整。
·中英文翻译学习功能
产品附赠全新翻译软件,融合了先进的中英双向翻译引擎,能对扫描的内容及时进行中英双向翻译。
·人性化设计
轻巧便携,产品净重45克,人机工程学设计,适合左右手使用,手持扫描舒适轻松。
产品技术规格:
产品尺寸:
131mm×19mm×31mm
重量:
净重45克,含USB线83克
扫描速度:
15cm/秒,最长单次扫描30cm
可扫描字体大小:
5—22磅字或小六号到二号字
可识别语言:
简体中文,繁体中文,英文
通过认证:
CE、FCC、ETL、ANSI/UL、CAN/CSA、RoHS
支持系统:
WindowsXP/VISTA/7
产品功耗:
工作状态100mA,待机状态5mA
没有手写板的手写笔!
·无线无板,一笔双稿
全新超声波技术,没有手写板,回归自然。
直接用笔书写.手写输入自由无极限。
把接收器夹在普通稿纸上,在纸上写字、画图的同时,电脑里也保存一份相同的电子文档。
·汉王手写识别,中英文字全识别
汉王全新手写识别软件,支持GB18030超大字符集,支持英文单词多词连笔书写;用工整、连笔、倒插笔、简化、繁体、行草等多种不同写法输入。
可通过TTS语音核心支持,校对书写正确性。
·笔式鼠标,玩转电脑
汉王笔迹王TNT-81笔式鼠标设计,用笔代替鼠标操作电脑,不仅可以体验手写输入的便捷,还能够在Office2007(Word、Excel、PowerPoint、OneNote)中使用微软的“数字墨水”技术。
·汉王阅读精灵,电脑文字全能读
全新发声核心。
可以对Word、网页、电子书等电子文档进行朗读,支持普通话、粤语、英语发音。
·汉王随意签,OA办公好助手
在电子文档中进行签字、批注,无纸办公时代彰显领导风采;还能够在QQ、MSN等聊天工具中进行亲笔聊天,写写画画别具一格。
汉王文本仪双面批量版
汉王文本仪双面批量版PL1600D是汉王公司面向商务领域最新推出的一款双面全彩自动馈纸式扫描仪,他能满足用户大量票据和文档专业性扫描录入数字化工作的需求。
PL1600D机身小巧,便于携带,易于存放。
该扫描仪采用滚轮式进纸方式,支持A4纸张以及名片、身份证、银行卡等卡片双面扫描,扫描速度达到每分钟25PPM/50IPM,是您高效办公的理想选择。
技术指标
·识别字符:
简体字符集:
国标GB2312-80全部一、二级汉字6800多个。
纯英文字符集。
简繁字集:
除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字。
·识别字体种类:
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
·识别字号:
初号——小六号字体。
·表格识别:
自动判断、识别各种通用型印刷体表格。
电子表格还原准确精美,输出的电子表格可随意编辑。
·正确识别率:
一般的识别条件下,对印刷体文稿都能达到很高的识别正确率。
·识别速度:
在PIV-2.0计算机上,印刷文稿识别速度达1000字/秒。
·主要特性:
体积小巧,不占用太多桌面空间;
快速,轻便,易于文件扫描;
25PPM/50IPM高速扫描;
滚轮式进纸,维护简便;
扫描各种名片、身份证、银行卡及带凸字卡片;
可扫描A3大尺寸
产品特点
·智能识别,准确无误
全智能识别核心,识别速度快,识别效率高,超强识别下划线文字、斜体字;
·一键扫入,WORD输出
用户操作简单快捷,与WORD无缝连接,只需轻松按下一键,文档自动输出到WORD;
·照片屏幕,任意摘抄
即时高效的文表图摘抄功能,使您使用数码设备更加得心应手;屏幕的文字内容,顺手画下即能识别;
·多种模式,任意选择
用户可根据工作需要或个人习惯选择自动、单步智能工作模式或专业批量工作模式;
·复杂版面,自动分析
智能分析各种中、英、繁、表、图混排格式的文本,无需过多人工干预;
·表格输入,轻松实现
多样化的表格判识,完美精确的表格还原,瞬间即可转化为可任意编辑的电子表格;
·批量输入,快速高效
大批量的文件扫描,全自动化的文字识别,速度快,效率更高;
·公文处理,精美准确
精心的公文处理,再现公文原貌。
·版面还原,原文重现
全新分栏技术,精确保留原版面格式,准确恢复文本原貌,使编辑更轻松;
·文件保存,多种格式
识别完的文档可以保存为多种格式(PDF、HTML、RTF、XLS、TXT)的文件,方便实用;
·图文索引,方便快捷
识别完成,轻松导出ACDSee图文索引,助您实现图片快速检索;
·工程管理,更加轻松
工程文件方便管理,工作进度随时保存,打开工程文件即可继续工作;
·影像采集,优化处理
获取、浏览、编辑影像方便快捷,优化处理并保存多种格式;
·拼图精灵,大幅录入
解除不能进行大幅扫描的烦恼,使您花小钱办大事;
·文本朗读、翻译,省时省力
汉王阅读精灵,避免眼睛疲劳,让您随心所欲听;翻译软件助您跨越语言障碍;