ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:3.63MB ,
资源ID:6184444      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6184444.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(ABBYY FineReader使用指南.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

ABBYY FineReader使用指南.docx

1、ABBYY FineReader使用指南ABBYYFineReader使用指南(2012-09-19 18:36:31)转载标签:扫描校对书籍ocr分享杂谈分类:他山之石首先,什么是 OCR 技术?OCR (Optical Character Recognition,光学字符识别)传统上是指,电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。本文所述 OCR,特指将 PDF 文档,拆分为一幅幅图像文件,用 OCR 技术通过相应软件,将图片中文字转换成文本,便于

2、下一步操作(例如导入书苑的 epubBuilder 制作软件)。传说中一步到位的 PDF 转换成 EPUB ,并不在本文的讨论范畴内。一、准备工作:1.准备 PDF 源文件,并将 PDF 按页拆分成图像文件。方法有很多,不一一赘述了,如图例1;2.准备 OCR 软件,本人用的是ABBYY FineReader 10,如图例2;二、初始工作:1.新建 FineReader 文档,如图例3;2.点击上栏“打开”图标,打开图像,打开后,软件处理图像添加进文档,如图例4、5;提示:在新建的FineReader文档中,添加若干图像文件,可以合理安排工作量,例如:按章节分派,每个文档就是一个章节的图像文件

3、;平均分派,每个文档取一个固定值的图像文件,便于均衡校对的工作量。3.保存 FineReader 文档,如图例6;提示:建立并保存FineReader文档后,下次可以打开未完成的文档,继续校对工作。三、设置工作:1.将输出设置为“另存为TXT”,如图例7;提示:个人认为无格式的TXT文档便于后期编辑,具体喜好因人而宜。2.点击“选项”图标,设置“文档语言”,这个很重要,如图例8;提示:简体中文书籍,繁体书籍,英文书籍请按相应语言设置,也可按右侧“编辑语言”,设置你要的语言,不要添加过多选项,否则将影响准确率。如图例9。3.在“选项”内选“查看”标签,设置软件显示待校对文字的字体,如图例10;提

4、示:我选“楷体”,并不是说我喜欢这个字体,而是因为,很多生僻字在楷体字库下显示不出,例如“事”和“亊”,识别为“亊”,在宋体下能显示,楷体不显示,便于纠错。四、校对工作:1.打开 FineReader 文档(类似一个专辑),调出一组图像文件;2.一般情况打开左右两栏,左侧原图,右侧待校对文字;3.调整好两栏显示大小;4.打开右上角“显示不可打印字符”按钮,便于将不规则字符去除;如图例115.遇到书源不好的PDF,字迹比较模糊,也可调整为上下俩栏(共4栏),识别校对,如图例12;6.软件会将可能错误的字符以背景颜色显示出来,便于校对更正,更正时可以手动输入,也可以鼠标移动待修改字,右键以显示待选

5、字符,再选择正确字符。如图例13;7.将此档校对完毕,保存输出,如图例14;8.其他一些情况,如中英文混编的书籍,更复杂一些。建议分别选择识别区域,分别识别,如图例15。9.OCR 技术的扩展应用,一份小女的卷子,手机拍下,分别识别校对。五、总结:有书友提出不必拆分为图片,直接进行转换,甚至有的软件号称可以直接 PDF 转 EPUB。当然那也是可以的,同样的 OCR 软件输出质量应该是相差无几的。但是本人是完美主义者,做事的理念是:“不喜欢难看的东西,更不喜欢错误的东西”。所以多做了一些前期工作,喜欢以图片、文字对照的方式边读边校对。作完一本书,就是读完一本书,用时肯定比别人长,但精度也肯定比别人强一些。所以,修改了一下帖子,谨将此帖献给励志做精校、精确书籍,让他人有舒畅阅读体验的书友们!

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1