desi方正阿帕比特色资源加工与安全发布解决方案.docx
《desi方正阿帕比特色资源加工与安全发布解决方案.docx》由会员分享,可在线阅读,更多相关《desi方正阿帕比特色资源加工与安全发布解决方案.docx(24页珍藏版)》请在冰豆网上搜索。
desi方正阿帕比特色资源加工与安全发布解决方案
desi方正阿帕比特色资源加工与安全发布解决方案
特色资源建设与安全公布
整体解决方案
北京方正阿帕比技术
2010年05月
名目
第一章数字资源建设的目的及意义
随着社会科技水平、信息化水平的不断提高,运算机以及网络的进展,数字图书馆技术受到了广泛的关注。
各类学校图书馆,企事业单位等信息情报机构,都在努力建设数字图书馆。
与传统图书馆相比,数字图书馆具有不受地域限制、共享性强、易于检索等优点,能够真正的实现信息资源共享。
数字图书馆是高技术的产物,信息技术的集成在数字图书馆的建设中扮演了重要角色。
其涉及到数字化技术、超大规模的数据库技术、网络技术、多媒体信息处理技术、信息压缩与传送技术、信息抽取技术、数据挖掘技术、基于内容的检索技术等等。
广义而言,数字图书馆应包括所有数字形式的图书馆资源:
通过数字化转换的资料,与纸质资料同步出版的数字资料,通过回溯性加工的馆藏资料等。
数字资源种类繁多、应用系统各异,信息数据格式和储备方式多样,资源治理不统一,使得图书馆的信息孤岛问题日益严峻。
网上的各类信息资源如数据库、声像资料、多媒体资料等通过有机的整合链接,以动态的方式为读者提供服务,成了各图书馆服务的要紧内容,建立具备本馆特色的数据库随之成为图书馆建设的一项重要内容。
“方正德赛数据加工与安全公布系统”实现了格式转换、数据标引、分类、公布等功能流程治理,而在各种数字资源的整合和统一检索方面尤为明显。
我国的数字图书馆建设逐步形成包括软件和内容提供商、运营商、用户在内的产业链。
第二章需求分析
从国外信息化建设与数字资源建设的实践看,我国的机构资源信息化和数字化今后将会面临以下几方面的挑战:
2.1传统的图书馆治理体制与数字图书馆要求之间的矛盾
数字图书馆建设是国家信息化的一个专门重要的组成部分。
由于我国在图书馆治理体制方面仍旧是各自为政,如此在数字图书馆建设中必定会产生许多不和谐的问题,诸如数字图书馆建设中的资源重组问题,资源数字化、信息化的规范与标准问题,数字化图书馆建设中的网络知识产权问题,文献信息资源与网络信息资源的共建与共享问题等。
假如我们不能尽快从体制的角度进行变革,势必阻碍我们数字图书馆建设的进程。
2.2数字图书馆建设中的网络文献信息资源重组
网络环境下的文献信息资源建设要紧包括两个方面,一是一样文献信息资源的建设,二是网络文献信息资源的建设。
一样文献信息资源建设是基础,而网络文献信息资源建设是数字图书馆建设的目标。
我们所说的网络文献信息资源的重组,确实是立足于一样文献信息资源建设的基础上,进行网络文献信息资源的建设;而网络文献信息资源的建设通常又要紧包括:
不同类型的图书馆中的文献数字化的范畴和类型,文献信息数字化的国家标准和规范,数字化文献信息的网络传输,网络文献信息资源的结构与规模,以及网络文献信息资源的网络运行与治理等。
2.3网络环境下的数字图书馆的数据库建设
文献信息数字化是图书馆进展的趋势。
关于我国图书馆事业进展而言,数字化的文献如何及时准确的提供给网络用户,关键是要求图书馆必须做出序列化的数据库。
假如没有相当数量的数据库,数字图书馆的建设便是无源之水、无本之木。
简言之,上述系列问题,必定会对文献信息资源数据库建设产生种种阻碍。
针对图书馆在建设中暴露出来的问题,方正阿帕比技术通过不断的摸索和研究,推出了能够全面解决图书馆信息化建设的整体解决方案。
方案涉及到资源数据库建设、资源压缩储备、资源的信息检索、资源的传播与操纵以及知识产权爱护等方面,全面推动图书馆信息化建设的进程。
方正Apabi独有的数字版权爱护技术,就能够满足如此的要求,通过方正DESiSCORE安全公布系统加密公布的电子资源,能够保证资源只在图书馆限定的范畴内传播,读者下载后无法拷贝、打印,有效的防止了二次传播的可能。
方正Apabi的数字版权爱护技术,得到了国家有关部门的大力认可:
✧方正Apabi数字版权爱护技术获信息产业部2003年“信息产业重大技术发明”奖
✧“2003年中国电脑教育年会”上被评为“2003年教育行业数字图书馆最佳品牌奖”
✧通过教育部中央电化教育馆专家鉴定
✧被“北京市科学技术委员会”、“北京市进展打算委员会”认定为“北京市高新技术成果转化项目”
✧国家级火炬打算项目奖
✧……
第三章Apabi数字化方案的技术前瞻性
Ø全面符合OEB国际标准,可连续进展
一个产品是否连续进展的生命力,关键因素之一确实是要看那个公司的产品是否符合相关的国际标准或国家标准,符合标准的产品在今后的产品升级、不同公司产品接口连接、兼容性等方面就可不能存在问题,保证软件运行的稳固性。
方正公司的软件产品作为国内唯独一家符合OEB国际标准的产品,不断引领国内数字图书的进展潮流,同时也引领国内图书馆用户追赶世界数字图书馆进展潮流。
Ø信息安全公布,爱护资源拥有者的版权权益
在中国加入WTO之际,方正公司就差不多意识到版权问题将得到越来越多人的重视,版权将不再是少数人的情况。
关于数字资源来说,版权差不多将作者、出版社、图书馆多方的利益联系在一起,任何一个环节显现问题,带来的都将是复杂的法律问题。
为此,在设计数字图书馆整体方案之初,方正电子公司就将版权爱护技术(DRM)引入到产品之中。
通过采纳168位和1024位高强度加密技术、通过加密、信息安全传递等技术,防止数字信息的非法拷贝、非法打印和散发,全面爱护所有人的合法权益。
Ø曲线显示技术,高保真,原版式
数字图书显示质量的好坏,最终决定软件产品是否能够得到最终用户也确实是读者的认可,方正电子的数字图书方案源于方正对印刷排版技术的深刻明白得,了解读者阅读图书的需要。
我们推出的数字图书系统不是简单的电子文档似的转化,而是保持纸书原貌、显示清晰的数字图书,不管是页面的放大依旧缩小,文字、图像都可不能有任何的失真。
以屏幕当作纸书的页面,以鼠标当作笔,用阅读纸书的方式看数字图书,关于读者来说差不多上专门情愿和容易同意的。
而超越纸书和其他电子图书的功能是,方正数字图书有效的结合了当今流行的多媒体技术,在枯燥的文字间融入了视音频,强化了书籍的阅读成效。
Ø最先进的文件压缩技术,占用系统空间少,节约硬件成本
方正数字图书拥有最好的阅读成效,这一切不是以牺牲系统资源为代价的,纯文本数字图书的储备空间是目前市场上最小的,关于期望建立一个数字图书馆的用户来说,不必要在储备的硬件上面做过大的投资,节约成本。
支持多种阅读设备
纸书不一定非要在图书馆里面看,数字图书同样能够实现不同的阅读方式。
通过与国内杰出的硬件供应厂商合作,目前,方正的数字图书能够实现在专用掌上电脑、手持阅读器上阅读,打破了空间对数字图书阅读的限制,使阅读数字图书和阅读纸书一样,成为一件欢乐的情况。
第四章Apabi特色资源建设解决方案介绍
Apabi特色资源加工与安全公布解决方案包含资源标准化、资源加工、资源公布、资源应用四个环节。
其整体结构图如下:
下面以加工系统为线索介绍方正特色资源建设方案。
1.
2.
3.
4.
4.1.方正德赛(DESi)特色资源加工与安全公布系统
方正德赛(DESi)数字资源加工系统助您将各式各样的文献资源数字化,统一成符合国际标准格式的电子资源,再进行深度数据加工和加密处理后在网络上安全公布,供特定范畴内的读者使用。
4.1.1.德赛的应用领域
Ø图书馆、高等院校、科研机构治理硕博论文、讲义课件、剪报、古籍、缩微胶片等自有特色资源。
Ø图书馆、博物馆、科研机构治理、展现馆藏图片资源。
Ø出版社、企业、国家机关治理内部保密资料、应用文档、报告文件等。
Ø远程教育、网络学校治理课程讲义、课件、辅导资料等。
Ø档案馆数字化内部档案资料。
4.1.2.德赛的特点
✓将扫描获得的图像文件和原有的各种格式电子文档进行深度的数据加工;
✓内容加密使之无法随意的拷贝、打印、散发,实现了文档的安全爱护。
✓功能强大的加密入库及安全治理引擎,以及重点举荐和读者身份注册等人性化服务;
✓支持电子资源的全文检索;
✓支持网络公布并进行各种统计;
✓授权限定范畴内的读者下载阅读;
✓爱护图书馆的劳动,爱护知识产权,实现特色资源的增值。
4.1.3.德赛工作流程图
4.2.方正德赛(DESi)功能介绍
2009年,方正德赛(DESi)公布了最新的4.1版本,在保持原有功能和特点的基础上,新版本的德赛增加了如下功能和改进:
•简化操作流程,提高了系统的易用性。
•集成一体化:
用户没有安装MicrosoftOffice的情形下DESi4.1客户端也能安装使用。
•支持图片的加工:
能够对图片进行编辑,并自动生成符合精品图库规范的图片和文件。
•加强加工功能:
支持批量标引、批量分类,完善分类制作功能。
•支持多渠道公布:
支持数字资源平台的电子书库、精品图库和光盘;支持数字出版系统的数字资源治理系统和多功能书店。
4.2.1.方正德赛(DESi)4.1系统构成
4.2.2.方正德赛(DESi)4.1加工系统
德赛(DESi)4.1集成了数据加工制作过程中从系统治理、任务分配、资源加工、资源审核、资源公布等多项任务,能对任务进行分配,并对任务的完成情形进行统计分析。
德赛(DESi)4.1的将所有数据进行统一的储备和治理,用户使用起来更加方便;既适合多人的制作小组分别进行流水作业,也适合小型图书馆不分配任务一人独立完成全部任务的制作方式;多种选项的设置使得治理员使用起来更加得心应手。
德赛(DESi)4.1不仅能处理扫描图书、电子文档、图片,还能将多媒体文件链接进来,充分发挥数字资源的优势,使读者在充分享受数字资源带来的的阅读乐趣的同时,又平滑地完成从传统阅读到数字阅读的过渡。
系统的总体结构图如下:
下面,我们针对每一个功能进行详细的介绍:
1.
2.
3.
4.
4.1.
4.2.
4.2.1.
4.2.2.
4.2.2.1.系统治理模块
DESi数据加工系统系统治理包括分类治理、资源库治理和用户治理。
●分类治理
德赛内置中图法分类法,系统治理员能够通过分类治理功能进行新建分类、导出/导入分类、备份/复原分类等操作,同时能够通过分类查询工具进行分类查询。
●资源库治理
德赛内置多种标准资源库可供选择,各资源库有不同的元数据标准对应不同出版物,要紧的库类型有文本库和精品图片库。
系统治理员能够通过资源库治理进行新建资源库、导入导出库结构、备份复原资源库。
在资源库治理中,系统治理员能够为每个资源库指定所需元数据标准,也能够通过新建元数据标准对资源库进行定制。
●用户治理
系统治理员能够通过用户治理界面对不同的操作人员、不同的资源库设置不同的操作权限。
DESi系统的用户包括制作用户和WEB提交用户,制作用户又包括治理员和一般用户。
1.
2.
3.
4.
4.1.
4.2.
4.2.1.
4.2.2.
4.2.2.1.
4.2.2.2.任务治理模块
任务治理是指治理员将元数据标引、名目制作、分类、多媒体链接制作四项任务分配给不同的操作员,每个操作员只能看到分配给自己的任务;同时治理员能够统计分析各操作员的任务完成情形,便于治理员进行治理。
同时,考虑到不同用户的不同模式,治理员也能够设置不启动“任务分配选项”,则只要有权限的操作员都能看见所有的文档,适合小型图书馆各个任务都只有一个人,不需要分配任务的情形。
1.
2.
3.
4.
4.1.
4.2.
4.2.1.
4.2.2.
4.2.2.1.
4.2.2.2.
4.2.2.3.资源加工模块
资源加工模块包括元数据标引、分类、名目制作和多媒体链接几个工序。
●图片加工
德赛4.1能够将图片资源进行裁切、格式转换、尺寸调整等工作,同时能够对其元数据进行标引,公布到精品图库系统。
●元数据标引
元数据标引是对文档的元数据进行标引的工具。
不同的库有不同的元数据,图书库和论文库的元数据就不相同。
在标引时,能够方便地直截了当从文档中选取相应的文字而减少了录入工作造成的效率低下。
下图为元数据标引的界面:
德赛4.1新增的批量标引功能,能够对格式统一的元数据进行批量处理。
同时,关于无法拷贝文字的资源,如MP3、EXE等文件,也可通过直截了当输入的方式来标引元数据信息。
●分类
分类是将图书库中的图书分到某种分类法的一个类目中去的工具。
我们系统中内置了中图法第四版,能够直截了当录入分类编码或者分类名称快速定位分类号,也能够通过鼠标点击分类树进行分类工作。
关于系统治理员依照自己的资源库设置的其他分类方法,同样能够通过这种方法来做分类工作。
下图是分类的界面:
德赛4.1新增的批量分类功能,能够对同类型的文档进行批量处理。
●名目制作
名目制作模块是制作精美名目的专用工具。
制作好的名目能够在两个地点展现:
网站上显示文档的详细信息时,以及下载阅读文件时。
名目是一个树形的可多层显示的结构,与我们常见的图书的名目结构相同。
名目制作时,关于电子文档,将从CEB文件中抽取前数页的文字;关于纸张扫描文档,将抽取从前数页的图片中OCR出来的文字。
系统依照抽取出的信息构成一个名目结构,制作人员能够在此基础上进行手工调整,形成最终的名目结构。
名目制作也支持灵活的手工调整,包括调整名目条目对应的页数、调整名目条目的层次结构、插入修改或删除名目条目等。
●
多媒体链接制作
链接制作是指在CEB中制作多媒体链接、文档内链接的工具。
多媒体链接是指将视频和音频文件(avi文件、wav、midi文件)链接到CEB文件之中,与CEB文件合为一体,读者下载或借阅时,能够同时阅读或播放多媒体文件。
文档内链接是指能够将某个区域或文字链接到指定的页码,读者点击该区域或文字时,能够跳转到指定的页码。
立即公布的新版多媒体链接制作工具还增加了对mp3、rm、rmvb、wmv、swf等常用格式的支持。
●操作助理
操作助理是指系统资源加工主界面左下角的操作助理,它可依照用户选中的任务或加工区域数据项会自动显示能够执行的所有命令操作。
操作助理界面如图所示。
在不同的资源加工操作中状态中,操作助理会自动显示能够执行的所有命令,点击相应命令执行相应操作,提高易用性。
1.
2.
3.
4.
4.1.
4.2.
4.2.1.
4.2.2.
4.2.2.1.
4.2.2.2.
4.2.2.3.
1.1.1.1.
数据审核模块
数据审核模块是指文档制作的质量检查人员对元数据标引、分类、名目制作、多媒体制作进行检查的工具。
如所有任务均没有问题,能够标识为“记录正确”,否则,能够标识某一项错误,错误的记录将返回原操作员的“错误条目”之中。
通过检查,能有效提高数据制作的质量。
下面是检查的右键菜单:
1.1.1.2.资源公布模块
资源公布模块要紧能够将各种形式的文档转换成CEB文件并上载到服务器端。
公布渠道有电子书库、精品图库、数字资源治理系统、多功能书店、本地磁盘等。
关于扫描而得的图象文件,能够通过“新建扫描文档”来整理扫描纸张文档顺序,将所有文档的图象文件统一合并成为一个CEB文件。
本模块能够按文件名称自动整理图像文件的顺序,能够方便地设置封面、封底、能够对其中的图片进行多种角度的旋转(90度、180度、270度,关于横向插页的调整有用),同时,还能够手工插入某些插页的图片、调整前后次序,是将图像文件整理成册的方便的工具。
关于其他格式的电子文档,如DOC、PDF、S2、S72、PS、WPS等多种文件格式,都能够通过“新建其他文档”来转换为CEB文件,同样能够支持对源文件的拆分、合并。
所有格式的文件,只要是能够打印的,都能够通过虚拟打印的方式转换成CEB的格式。
转换前,能够依照对清晰度、压缩比例的要求选择相应的模版。
转换过程中,假如没有安装相应的字体,软件会自动用常用的字体替换掉。
制作上载模块还能够批量转换一系列的电子文件,并能够部分的OCR其中的内容。
比如只OCR识别名目页。
关于一些资源,如mp3、flash等,没有必要或者不能转换成ceb文件的,能够通过“增加其他文件”来直截了当上载到服务器端,储存在DESi的数据库中。
1.1.1.3.光盘公布模块
光盘出版是特色资源公布的另外一个表现的形式,它以光盘形式发放给读者进行阅读。
在那个光盘中不仅有正文文件,还有检索的功能,读者能够在那个界面中通过字段的检索或者分类的扫瞄来检索到文献资源。
通过光盘出版功能,使得专门多没有条件通过网络来下载资源的读者以光盘的形式猎取到资源,而且能够方便的携带,是对特色资源公布的一个重要补充。
4.2.3.信息公布系统
4.2.3.
1.1.1.4.DESiCore/Score公布系统
Core/Score公布系统是将制作好的数据公布到网络上,供宽敞读者进行查询、检索、借阅,供治理员进行举荐、上架下架、下载量统计等多种治理的平台。
公布系统分为Core和Score两种。
两者功能差不多一样,区别确实是上载到Core公布系统的文档不能进行加密;S-core是安全核心(Securecore)的简称,上载文档时能够对文档进行加密,从而达到防止二次传播、爱护知识产权的目的。
针对用户的界面,能够支持多种查询、检索方式,包括指定元数据查询、全面检索、全文检索等。
Core包含所有的借阅和治理的核心功能,拥有后台治理和面对阅读者的前台治理。
后台要紧为治理员设置,通过后台治理能够进行所有信息的增加,删减,信息类别的设置,阅读者身份的治理,权限的设置,信息的公布。
面对阅读者的前台要紧是为大伙儿提供一个信息借阅和检索的可视界面。
要紧功能特点如下:
1、能够自由进行信息的增加、删减
2、能够自主进行信息的组合和分类
3、统计信息的下载量,随时把握各种信息的利用率
4、支持网络公布:
能够向内部网站或外部网站公布信息
5、支持与自动化系统的无缝连接
6、能够轻松升级
7、使用简单
●加密公布
Score在Core的基础上,增加了以下功能:
1、完善的读者注册机制,能够自由设置信息阅读者的范畴
2、信息的安全爱护机制:
未经许可的运算机不能阅读、拷贝、打印有关信息
3、支持多种查询、检索方式:
●能够指定元数据项进行查询,如作者是xxx。
●全面检索:
即只要字段中显现,都能够检索到,而不用关怀是哪个字段,提高检索的效率
●全文检索:
可对文档进行全文检索,并能够按检索命中的页数倒排序。
关于扫描图书,能够对自动OCR识别出来的文字进行全文检索,制作起来省时省力。
(注全文检索是一个可选的模块,能够依照需要来确定是否选用。
)
●跨库检索:
对公布在Apabi公布系统上的所有资源,能够通过跨库检索对公有字段做一个统一的检索。
检索结果为各个库中符合检索要求的所有记录信息。
公布系统是将制作好的数据公布出来,供宽敞读者进行查询、检索、借阅,供治理员进行举荐、上架下架、下载量统计等多种治理的平台。
公布系统S-Core是安全核心(SecureCore)的简称,上载文档时能够对文档进行加密,从而达到防止二次传播、爱护知识产权的目的。
包含所有的借阅和治理的核心功能,拥有后台治理和面对阅读者的前台治理。
后台要紧为治理员设置,通过后台治理能够进行所有信息的增加,删减,信息类别的设置,阅读者身份的治理,权限的设置,信息的公布。
面对阅读者的前台要紧是为大伙儿提供一个信息借阅和检索的可视界面。
要紧功能特点如下:
1.能够自由进行信息的增加、删减
2.能够自主进行信息的组合和分类
3.统计信息的下载量,随时把握各种信息的利用率
4.支持网络公布:
能够向内部网站或外部网站公布信息
●支持与自动化系统的无缝连接
●能够轻松升级
●使用简单
●完善的读者注册机制,能够自由设置信息阅读者的范畴
●信息的安全爱护机制:
未经许可的运算机不能阅读、拷贝、打印有关信息
●SCORE公布系统支持多种查询、检索方式:
能够指定元数据项进行查询,如作者是xxx。
●全面检索:
即只要字段中显现,都能够检索到,而不用关怀是哪个字段,提高检索的效率
●全文检索:
可对文档进行全文检索,并能够按检索命中的页数倒排序。
关于扫描图书,能够对自动OCR识别出来的文字进行全文检索,制作起来省时省力。
●跨库检索
4.2.4.其他应用工具
数据导入工具
数据导入工具能够将已有的其他格式的元数据和分类信息导入到DESi相应的数据库中,如此就不必将往常用其他软件做好的数据库元数据重新制作一次。
该工具支持的数据源有SQLServer、Access、Excel、XML、文本文件、CNMARC等格式。
DESi网络提交工具
网络提交工具承诺操作员以WEB方式将资源的主文件及元数据提交到服务器中,那个工具的功能类似方正的TASi论文提交系统,只是可提交的元数据和正文能够由系统信筒治理员在后台自定义。
上传的资源同样能够进行标引、分类、名目制作、多媒体连接制作等工作。
CNMARC数据生成工具
元数据生成工具是生成CNMARC的数据工具。
能够生成库中所有电子书的MARC数据,生成自上次生成后新入库的电子书的MARC数据,生成某时刻段内入库的电子书的MARC数据,可指定生成MARC数据时,生成图书的或所有的MARC数据。
包括生成CNMARC数据、重定向页面生成等。
●生成CNMARC数据
(1)导出数据范畴:
☆生成所有:
生成所有时刻段入库的图书,不对时刻段做限制。
☆仅新入库:
只生成上次生成MARC数据以后的所有新入库图书。
☆入库时刻范畴:
可在下拉框选择。
生成的数据包括在这两天中入库的图书。
(2)查看数量:
系统依照当前的数据范畴和数据类型,查看共有多少条记录。
全文检索治理器
全文检索指关于填写的某一个检索词,假如某书的内容中含有该词,系统将能查出该书。
全文检索治理器是为数字图书系统下载站点中的CEB和XEB图书建立和爱护索引库功能的工具。
由图书系统的系统治理员对电子书进行全文检索的创建和爱护。
输入系统治理员的用户名和登录密码,按下“登录”按钮后,假如具有足够的权限,将会启动全文检索治理器。
eBook数据库最多能够包含255个全文检索数据库,每一个全文检索数据库最多存放5000本书。
备份复原工具
能够通过备份复原工具备份数据库中的数据,防止由于黑客或者病毒引起系统崩溃造成的数据丢失。
第五章运行环境
2.
3.
4.
5.
5.1.数据加工服务器
1.硬件环境
CPU:
PentiumⅢ450及以上
内存:
256MB及以上
硬盘:
10G及以上
2.软件环境
操作系统:
简体中文Windows2000(Advanced)Server&Windows2000ServicePack4和微软新出的安全补丁
数据库:
MSSQLServer2000&ServicePack4或MSSQLServer7.0&ServicePack4
其他:
DESi制作系统加密锁
5.2.数据加工客户端
1.硬件环境
CPU:
PentiumⅢ450及以上
内存:
128MB及以上
硬盘:
500MB及以上
2.软件环境
操作系统:
中文Windows98、Windows2000、WindowsXPProfessional
提示:
OCR软件目前只能在Windows2000和WindowsXPProfessional操作系统上使用。
举荐在Windows2000操作系统上使用。
在以下的建议显示设置中使用方正D