印刷数字资产管理文档格式.docx
《印刷数字资产管理文档格式.docx》由会员分享,可在线阅读,更多相关《印刷数字资产管理文档格式.docx(21页珍藏版)》请在冰豆网上搜索。
3)销售人员:
获取最新信息(检索、多终端查看)
4)IT人员:
确保信息安全(加密、审核)
5)发布人员:
快速发布信息(多渠道发布、多终端发布)
5、印刷:
(1)内容:
1)原始资产:
印刷企业的服务对象
2)电子文件
3)增值服务
(2)技术:
1)元数据
2)XML
3)数据库技术
4)可变数据印刷流程
5)跨媒体出版流程
6)数字版权管理
第二部分元数据
一、定义:
描述资料的资料,用来协助对网络电子资源的辨识、描述、指示器位置的任何资料,是关于数据的数据
二、发展:
1、早期:
网络资源的描述
2、后期:
所有数字内容对象
三、作用:
1、资源著录与描述:
对数字对象的内容、特征和位置等进行描述和著录,为数字对象的存取和利用打基础,以MARC为代表
2、资源发现与确认:
数字内容的位置信息,帮助人们检索和确认所需要的资源,数据元素限于作者、标题、主题、位置等简单信息,以DublinCore为代表
3、资源管理:
支持资源存储和使用,数据元素包括描述信息、权限管理、电子签名、访问管理、支付审计等
4、资源保护与长期保存:
详细的格式信息、制作信息、保护条件、转换方式、保存责任等
三、类型:
1、技术性元数据:
软件自动确定
2、描述性元数据:
手工或半自动创建
四、规范:
1、标准元数据:
DC、MARC、DICOM、IPTC、XMP
2、应用程序元数据:
acdsee、pdf
3、数字权限管理元数据:
cc、prism
4、摄影领域元数据:
Exif、TIFF、MPEG-7
5、打印领域元数据:
pdf、pdfx、prism、xmp
6、多媒体元数据:
xmpDM、xmpMM
四、常用元数据:
1、DC(都柏林核心元数据集):
(1)意义:
规范Web资源体系结构的国际性元数据标准
(2)方面:
1)资源内容:
a.标题
b.主题
c.描述
d.来源
e.语种
f.关联
g.覆盖范围
2)知识产权:
a.创作者
b.出版者
c.其他责任者
d.权限
3)外部属性:
a.日期
b.类型
c.格式
d.资源标识符
注:
最低限度
(3)特点:
1)简易性
2)通用性
3)可选择性
4)可重复性
5)可扩展性
2、EXIF:
(1)来源:
数码相机
(2)内容:
记录相机拍摄过程中的信息
可附加在JPEG、TIFF等文件中,增加有关数码相机拍摄信息的内容和索引图或图像处理软件的版本信息
3、IPTC:
自行编辑和更改信息(作者姓名、版权信息、拍摄地点、关键字、文字信息等)
(2)作用:
助于机遇内容的图片处理
4、XMP(可扩展元数据平台):
(1)公司:
Adobe公司
(2)目标:
实现不同文件格式和设备间的信息共享
(3)国际标准:
ISO16684-1
(4)本质:
嵌入在文件中的数据始终粘在文件上,随文件流动,为管理人员和操作人员提供基础信息,也可在生产过程中读出和更改
(5)特点:
1)可扩展,可根据需要自定义标记
2)能接纳已有的元数据标准,不必重新构造应用系统
3)普遍适用性
4)不受特定文件格式和数据库限制
(6)平台:
处理数据和简化工作流程的基础工具,能在生产过程间实现数据沟通,查阅、编辑、存储元数据,将简单文件转换为数据资产
五、应用软件:
1、CameraRaw
2、AdobeBridge
第三部分 XML(可扩展的标记语言)
1、可扩展:
用户允许按照XML的规则自定义标记
2、标记:
对数据进行编码的方法
3、语言:
是一种元语言(定义置标语言的语言)
二、特性:
1、是标准通用标记语言(SGML)的子集
2、是一种类似于HTML的标记语言
3、是用于描述数据的语言
4、的标记不是在XML中预定义的,你必须定义自己的标记
三、特点:
1、数据的搜索:
可以提取文档中任意位置的数据
2、数据的显示:
内容与形式分开,可以以多种方式呈现,如HTML、PDF等
3、数据的交换:
能对各种编程语言编写的数据进行管理,使得在任何平台、软件下都能通过解析器来读取XML数据
4、具有验证机制:
通过DTD或者XMLSchema检验XML文档是否符合规范
5、丰富的显示样式:
通过CSS或者XSL格式化XML文档的显示样式
6、选择性更新:
数据可以在选择的局部小范围内更新
7、面向对象
四、与HTML区别:
1、两种不同用途的语言
(1)XML:
用于描述数据(什么是数据,怎么存放数据)
(2)HTML:
用于显示数据(显示数据以及如何显示数据)
2、XML可扩展,HTML不可扩展
五、应用:
1、网络服务领域
2、EDI(电子数据交换)
3、电子商务
4、数据库
5、跨媒体出版
六、数字资产管理方向:
1、元数据:
(1)作用:
采用XML格式储存元数据,再将其与数字文档进行链接
(2)特点:
利于储存和搜寻,亦能更快速地与流程管理系统接轨
2、数字内容描述:
将数字资产内容从非结构化数据向半结构化数据进行转换,实现内容与格式的分离
3、与数据库进行映射:
实现数字资产内容与数字资产数据库之间的存储和读取
4、数据交换:
在不同的数字资产管理系统,或者数字资产管理系统与其他应用软件之间进行数据交换
5、跨媒体出版:
实现数字资产内容向不同出版格式的转换
七、语法:
1、组成:
(1)声明
(2)文档类型定义
(3)注释
(4)标记和内容
2、元素:
标记头、标记末和标记间的字符串数据,所有元素均可拥有文本内容和属性
(1)根元素:
只有一个元素,是所有其他元素的父元素
(2)子元素
3、属性:
用来修饰某个元素
(1)属性名:
用来修饰同一个元素的属性的属性名不能相同
(2)属性值:
必须用引号括起来,不能包含&
、‘、<
等字符
属性名和值成对出现
4、树形结构:
5、规则:
(1)所有XML元素都须有关闭标签
(2)XML标签对大小写敏感:
必须使用相同的大小写来编写打开标签和关闭标签
(3)XML必须正确地嵌套
(4)XML文档必须有根元素
(5)XML的属性值须加引号
(6)实体引用:
1)&
lt:
<
(小于)
2)&
gt:
>
(大于)
3)&
amp:
&
(和号)
4)&
apos:
'
(单引号)
5)&
quot:
"
(引号)
(7)元素命名:
1)可含字母、数字以及其他的字符
2)不能以数字或者标点符号开始
3)不能以字符“xml”(或者XML、Xml)开始
4)不能包含空格
5)可使用任何名称,没有保留的字词。
6)尽量避免使用-、.、:
等符号,名称尽量简短
(8)属性:
1)XML属性必须加引号(单引号或双引号)
2)属性值本身包含双引号,要使用单引号包围或使用实体引用
(9)避免使用XML属性
1)无法包含多个值(子元素可以)
2)无法描述树结构(子元素可以)
3)不易扩展(为未来的变化)
4)难以阅读和维护
5)使用元素描述数据,使用属性只提供与数据无关的信息
七、处理:
1、编辑软件:
记事本、XmlSpy、Editplus
2、显示软件:
浏览器
八、显示:
1、方法:
(1)CSS:
利用简单的规则来控制XML元素在浏览器中显示
(2)XSL(可扩展样式语言)
2、引用:
(1)内部:
?
xml-stylesheettype="
text/css"
(2)外部:
xml-stylesheettype=“text/css”href=“xxx.css”?
xxx.css是外部链接
九、验证:
1、DTD:
描述XML文档的结构
(2)构成:
1)元素的定义规则
2)元素之间的关系规则
3)属性的定义规则
4)可使用的实体或符号规则
1)验证XML文档数据的有效性
2)为某类XML文档提供统一的格式和相同的结构
3)保证在一定范围内,XML文档数据的交流和共享
4)程序设计人员根据DTD能知道对应XML文档的逻辑结构,编写出相应的处理应用程序
2、Schema(XML模式或XML架构):
规范和描述XML文档的第二代标准
可用来详细规定XML文档的数据模式及组织结构
第四部分数字内容处理
一、获取:
1、意义:
数字资产管理的首要环节,是生产信息产品和提供信息服务的基础
2、指标:
(1)可靠性
(2)信息量
(3)及时性
(4)全面性
(5)易获取性
(6)经济性
3、方法:
(1)文字:
1)键盘输入
2)文件/网页复制
3)OCR
4)格式转换
5)语音录入
(2)图形
(3)图像:
1)拍照
2)扫描
3)下载
4)截屏
5)制作
(4)音频
(5)视频
(6)动画
(7)多媒体
4、途径:
(1)付费外购
(2)定向索取
(3)公开征集
(4)网络采集
(5)转移和复制
(6)对等交换
(7)加入共享联盟
(8)自我生产
5、原则:
(1)针对性原则
(2)经济性原则
(3)系统性原则
(4)可靠性原则
二、加工:
1、目的:
便于组织、存储和未来的开发利用
2、内容加工:
(1)录入:
纸质载体上的数据信息和文本信息通过机器或手工的方式采集到系统中,形成数字化的信息,主要是数据和文本型内容加工
(2)转换:
1)目的:
为了统一的格式要求处理并存储内容
2)类型:
a.同一种形式内,不同格式之间的转换
b.将不同内容在不同形式之间进行转换
(3)拆分:
把某一个事物按照内在的逻辑关系分解成不同力度的组成单元
不同类型的内容拆分的方式和技术也各不相同
1)数据:
按照体积或长度进行分割
2)文本:
按文本内部的叙事逻辑关系或者条目顺序进行分割
3)图像:
按一定的比例和规则把一幅大图像分割成小图像或根据图像内容分割
4)声频:
对一个声频文件的多个片段进行分割
5)视频:
对一个视频文件、结合音频文件进行分割
6)数据库:
把数据库分成小的“字库”,散布在多个分布式服务器上
(4)组合:
按一定规则拆分之后的数字内容,或原本是零散的且存在一定关联的内容,按照一定的规则进行拼接或集成,生产出新的完成的数字内容
(5)压缩:
1)有损压缩
2)无损压缩
(6)生成缩略图:
代表一个数字文件概览的小图
(7)加/解密:
成对出现
(8)添加水印:
将一些标识信息直接嵌入数字内容当中或是间接表示,不影响原来载体的使用价值,不易被发现和修改,但可被生产方识别和辨认,达到防伪效果
1)可见水印
2)不可见水印
3、形式:
(1)对内容本身的加工
(2)对元数据的加工
三、组织:
数字内容加工的后续工作
2、信息组织:
(1)定义:
通过对信息外部特征和内容特征的描述和排序,实现无序信息集合转换为有序信息集合的过程
(2)特征:
1)外部:
信息物理载体的外观
2)内容:
信息内容的主题
两者是基本对象
(3)过程:
1)信息选择:
内容获取的环节
2)信息分析:
分析单个内容的特征,通过横向或纵向比较分析,发现分析对象自身的特殊性,为下一步信息描述和解释做好准备
3)信息描述与揭示:
针对内容外部特征的著录、内容主题特征的标引、著录和标引结果的编目
4)信息存储
(4)类型:
借助数据库完成的
语法、语义、语用
a.给图像文件添加元数据
b.将图像内容的主题信息用文字表示出来
通过声音识别转换技术将音频转换为文字,进一步对音频内容主题信息进行描述
借助图像和音频的组织方法,对切分后的内容片段的主题表示和元数据描述
6)软件:
不能拆分,需要在元数据标注上进行细化处理
(1)分类法:
1)原理:
a.依据事物的属性区分或分组,把具有相同属性或特征的对象集中在一起
b.按照区分出来的分组进行排序,并在这一类中进一步按照相同点和不同点进行区分和组织
a.杜威十进制分类法:
.人物:
麦尔威·
杜威
.内容:
a.中国图书馆分类法(中图法):
(2)主题词法:
1)定义:
用自然语言中的词语或者规范化的词语对事物的主题进行标识,并以此进行编排和查询
a.《汉语主题词表》
b.《中国分类主题词表》
c.《美国国会图书馆标题表》
d.《医学标题表》
(3)分众分类法(大众分类法):
由网络用户自发的给某个数字内容定义的一组标签组成
四、索引:
1、定义:
将信息集合中具有检索意义的事物名称及特征,从资源中抽取出来形成的条目集合,并按照某种分类体系进行组织
2、目的:
内容的检索
3、实质:
检索信息资源“地址”的表示系统
4、功能:
指示某个特定的主题在内容资源中的位置
5、类型:
(1)题名索引:
将资源的题名特征(书名、刊名、篇名)作为索引标题次所编制的索引系统
(2)人名索引:
将资源上署名的著者、译者、编撰者以及文献中所描述的人物名称作为索引标题词所编制的一种索引系统
(3)主题索引:
将表征资源主题的主题词作为索引标题词的索引系统
(4)关键词索引:
广义的主题索引
五、存储:
1、单位换算:
(1)1KB(千字节)=1024B(字节)
(2)1MB(兆字节或兆)=1024KB
(3)1GB(吉字节或千兆)=1024MB
(4)1TB(太字节)=1024GB
(5)1PB(拍字节)=1024TB
(6)1EB(艾字节)=1024PB
(7)1ZB(泽字节)=1024EB
(8)1YB(尧字节)=1024ZB
(9)1BB(一千亿亿亿字节)=1024YB
2、介质:
(1)磁介质:
1)容器:
硬盘存储
2)最早的磁介质:
a.时间:
1956年
b.大小:
5000字节/cm2
(2)光介质:
光盘存储
2)方式:
利用激光束在光盘表面的金属膜上打微孔实现信息的高密度存储
3)特点:
a.优点:
容量大,价格低廉,存储寿命长。
b.缺点:
误码率比较高,需要留有20%-30%的空间用于核对误码
(3)磁带介质:
磁带存储
2)特点:
单位存储信息成本最低、容量最大、标准化程度最高
3、方式:
(1)文件库方式:
直接把文件存放在磁盘目录中或特定的文件管理软件中
简单方便,读取速度较快
.有些文件格式跨平台,有些不跨平台
.管理功能较少,难以实现高级的管理功能
(2)数据库方式:
要处理的数据经过合理分类和规范化处理之后,以记录的形式存储在计算机中,用户通过关键词等方式就可以找到所需的信息,是对大量的规范化数据进行管理的技术
(3)存储网络方式:
基于现有的局域网、以太网之类的网络访问的文件服务的网络存储技术
可实现真正的实际共享
(4)云存储方式:
将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的系统
六、检索:
根据用户的信息需求,从组织好的信息资源中找到所需信息的过程
2、类型:
(1)数据检索:
从存储大量数据、图标的检索系统中获取数值型信息
(2)书目检索:
从著录信息的系统中获取相关资源线索
(3)全文检索:
从存储整篇论文、专利说明书、网页乃至整本著作的检索系统中获取全文信息
(4)多媒体检索:
从存储多媒体文件的检索系统中获取多媒体信息
(5)事实检索:
存储大量知识信息、事实信息和数据信息的检索系统中获取某一事物发生的时间、地点及过程
从系统中检索出所需信息后,再加以逻辑推理给出最终结论
七、安全:
1、数字版权管理(DRM):
涉及到技术、法律和商业各个层面的系统工程,为数字媒体的商业运作提供了一套完整的实现手段
(2)本质:
对数字产品在分发、传输和使用等各个环节进行控制,使数字产品只能被授权使用的人,按照授权的方式,在授权使用的期限内使用
(3)数字水印:
在文字、图像、声音等多媒体数据中埋入某种信息,并使其隐蔽起来
不能直接感知,只能通过数据压缩、过滤等方法才能检测埋入的信息
3)作用:
他人擅自去除埋入的信息,就会严重影响数字化作品的质量
4)流程:
5)特性:
a.可证明性:
能为受到版权保护的信息产品的归属提供完全和可靠的证据
b.不可感知性:
视觉上的不可见性和用统计方法也是不能恢复的
c.鲁棒性:
能够承受大量的、不同的物理和几何失真
6)应用范围:
a.版权保护
b.隐藏标识
c.认证
(4)数据加密:
1)流程:
a.发送者必须产生一对密钥,其中一把是公钥一把是私钥
b.发送信息时,发送者用私钥对信息加密,然后将加密后的密文发送给接收者,接收者利用发送人的公钥核查发送人的密文,并通过解密到信息
非对称密码:
密钥之间具有一一对应关系,但由公钥是无法推知私钥的内容,也就是
2)作用:
保护版权
(5)数字签名:
将摘要信息用发送者的私钥加密,与原文一起传送给接收者,接收者只有用发送者的公钥才能解密被加密的摘要信息,用HASH函数对收到的原文产生一个摘要信息,与解密的摘要信息对比,相同说明信息没被修改;
不同则就被修改
a.不可抵赖:
签名者不能否认其执行了签名的事实
b.不可伪造:
任何其他人均不能伪造该签名
c.完整性:
使得传输数据的双方都不能在传输的过程中进行修改
d.鉴权:
如果双方当事人对签名发生了争执,能够由公正的第三方进行仲裁,通过验证其签名来确认其真伪
4)方式:
工作流程、技术环节和电子认证等
(6)数字证书:
互联网通讯中标志通讯各方身份信息的一串数字,提供了一种在Internet上验证通信实体身份的方式
不是数字身份证,是身份认证机构盖在数字身份证上的一个章或印
2)CA机构(证书授权中心);
发行数字证书
在网上识别对方的身份
(7)数字指纹:
将指纹利用数字水印技术嵌入到数字媒体中,然后将嵌入了指纹的数字媒体分发给用户,发现盗版后可提取盗版产品中的指纹,确定非法复制
的来源,对盗版者进行起诉,保护版权
2、纸质防伪:
(1)骑缝章防伪
(2)数字水印防伪
(3)二维条码防伪