实验指导书2多媒体素材采集与处理.docx

资源描述

实验指导书2多媒体素材采集与处理.docx

《实验指导书2多媒体素材采集与处理.docx》由会员分享，可在线阅读，更多相关《实验指导书2多媒体素材采集与处理.docx（15页珍藏版）》请在冰豆网上搜索。

实验指导书2多媒体素材采集与处理.docx

实验指导书2多媒体素材采集与处理

一、实验目的：

学会使用扫描仪猎取书页影像并将之转换为电子文档；把握图像、音频多媒体素材的采集与编辑方法。

二、实验内容：

1．学会使用扫描仪扫描影像的方法。

2．把握扫描软件Scanwizard5、OCR软件尚书七号的使用

3．把握在Windows环境下录制、播放和编辑声音文件的方法。

4.把握Goldwav音频录制和编辑技巧。

三、实验仪器设备：

MicroteckScanMaker3860扫描仪、运算机、耳麦。

四、实验原理：

扫描仪是一种猎取影像的装置,并将之转换为运算机能够显示、编辑、储存和输出的数字格式。

那个地点所讲的影像是指照片、文字页、图形和插画等,甚至如硬币或纺织品等三维物件都确实是影像的一种。

实际上,这意味着扫描仪能够完成以下工作:

●在文件中结合美术图形和照片。

●将印刷文字扫描输入到文书处理软体中,免去重新打字。

●将传真文件扫描输入到数据库或文书处理软体中储存。

●在多媒体中加入影像。

●在摘要中结合影像资料使其能更有效的表达主题。

扫描仪可区分为两种类型:

●平台式扫描仪,用来扫描照片和印刷品.平台式扫描仪都具有一个玻璃面,用来摆放扫描稿件。

●透射式扫描仪,用来扫描幻灯片和底片。

在我们实验中使用的中晶MicroteckScanMaker3860是一种典型的平台式扫描仪。

在扫描系统中,扫瞄仪仅是组成整个系统的其中一部份,除了扫描仪以外,还需要其它的组件:

①一条特定的连接线,连接扫描仪和电脑。

②操纵扫描仪工作的扫描软件。

③用影像编辑软件将扫描影像结合到您的工作中;或用文字辨识软件将扫描文字结合到您的工作中。

④一个合适的屏幕用来显示彩色或灰阶影像。

⑤用来输出您工作成果的输出设备,如印打印机。

工作原理：

对原稿进行光学扫描，然后将光学图像传送到光电转换器中变为模拟电信号，又将模拟电信号变换成为数字电信号，最后通过运算机接口送至运算机中。

扫描仪扫描图像的步骤是:

第一将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上，原稿能够是文字稿件或者图纸照片；然后启动扫描仪驱动程序后，安装在扫描仪内部的可移动光源开始扫描原稿。

为了平均照亮稿件，扫描仪光源为长条形，并沿y方向扫过整个原稿；照耀到原稿上的光线经反射后穿过一个专门窄的缝隙，形成沿x方向的光带，又通过一组反光镜，由光学透镜聚焦并进入分光镜，通过棱镜和红绿蓝三色滤色镜得到的RGB三条彩色光带分不照到各自的CCD上，CCD将RGB光带转变为模拟电子信号，此信号又被A/D变换器转变为数字电子信号。

至此，反映原稿图像的光信号转变为运算机能够同意的二进制数字电子信号，最后通过串行或者并行等接口送至运算机。

扫描仪每扫一行就得到原稿x方向一行的图像信息，随着沿y方向的移动，在运算机内部逐步形成原稿的全图。

人耳的听觉特性涉及生理声学和心理声学方面的咨询题。

人耳可听的声音频率范畴为20Hz至20KHz，但人耳对不同频率的声音敏锐程度是不一样的，中频段（3kHz～5kHz）最敏锐，幅度专门低的信号都能被人耳听到。

低频区和高频区较不敏锐，能被人耳听到的信号幅度比中频段要高得多。

话音信号是典型的连续信号，不仅在时刻上是连续的，而且在幅度上也是连续的。

在时刻上“连续”是指在一个指定的时刻范畴里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。

我们把在时刻和幅度上差不多上连续的信号称为模拟信号。

声音数字化确实是将模拟的（连续的）声音波形数字化（离散化），以便利用数字运算机进行处理，要紧包括采样和量化两个方面。

数字化音频的质量取决于采样频率和量化位数这两个重要参数。

采样频率是对声音波形每秒钟进行采样的次数。

人耳听觉的频率上限在2OkHz左右，依照采样理论，为了保证声音不失真，采样频率应在40kHz左右。

经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz等。

采样频率越高，声音失真越小、音频数据量也越大。

量化数据位数（也称量化级）是能够用来表示每个采样点的数据范畴，经常采纳的有8位、12位和16位。

例如，8位量化级表示每个采样点能够表示成256个（0-255）不同量化值，而16位量化级则是指每个采样点可表示成65536个不同量化值。

量化位数越高，表示区不声音的差不更细致，因此音质越好，数据量也越大。

声音数字化信息量=采样频率（Hz/s）×量化位数（bit）×声道数

五、实验步骤

步骤1.安装ScanWizard5驱动程序

关于初次使用的扫描仪，请第一打开镜头锁，关于Scanmaker3860来讲，镜头锁在扫描仪的底面右下角，第一使用镊子或尖嘴钳把阻挡物拔出，然后把镜头锁开关向外拨动到“ON”的位置。

（注：

实验用扫描仪均已打开镜头锁，此步可跃过）如下图所示：

按照扫描仪所附的安装指南和光盘片上的安装界面,将ScanWizard5扫描仪驱动程序安装到Windows系统中。

（注：

本实验所用运算机系统已安装扫描仪驱动，此步可跃过。

）

步骤2.将扫描稿件放到适当位置

把扫描槁件（照片、书页等）面朝下,放到扫描仪的玻璃面板上，摆放稿件时，尽量靠齐扫描玻璃的一个侧条，可确保稿件的摆入端正。

由于扫描仪会生成一个倒立的像，因此放入待扫描材料时，应倒放在玻璃面板上。

步骤3.执行ScanWizard5扫描软件

直截了当在桌面的ScanWizardEasy图示

上点两下执行,或从“开始”->“程序”->“ScanWinzard5”开始执行扫描程序。

扫描程序的默认界面如下图所示：

预览：

当你一开始进入标准操纵模式,程序预设会自动预览你的稿件。

假如你想取消此功能,能够从属性中取消即可。

到Web按钮：

扫描到按钮能够切换为到Web按钮,只要按住按钮两秒钟即会显现副选单.

原稿：

选择待扫描材料的材质

扫描类型：

输出的色彩位数

输出目的：

图片输出到何处，本实验选择输出到文件

输出比例：

选择输出影像输出尺寸的比例大小.（50%,75%,100%,150%,或200%）

调整：

调整对比度、锐度等

属性：

扫描仪的参数设定.

界面上的各按钮的功能如下表所示：

图标

功能

移动

缩放（放大/缩小）

信息按钮

改变窗口尺寸

切换到高级模式

扫描仪信息

关心讲明

最小化

关闭程序

点击

按钮后ScanWizard切换到高级模式，界面如图所示：

可依照具体扫描要求选择不同的扫描参数，选用参数时，请注意以下几点：

①关于照片，选用300ppi的辨论率即可达到良好的成效，不必选择最高的1200ppi，否则会使扫描出的图像文件过于庞大，甚至会达到上百光兆的大小。

②关于大头贴等较小的等扫描材料，能够把缩放比设为大于100%，以使输出图像足够大。

③假如待扫描的材料专门多，单张面积又比较小，能够把多张待扫描材料一块放到玻璃面板上，摆放时，注意待扫描材料间留出一定的间距，以便于后期裁切，一次扫描输出，再使用图像处理软件（例如PhotoShop）进行裁切。

例如能够玻璃面板上摆放多张照片，然后一次扫描到一张图像上，然后进行裁切。

步骤4.扫描稿件

进入ScanWizard5后,先预览你的稿件,假如发觉摆入的稿件不端正，打开盖板，把稿件放正后，再进行预览，直到摆放端正为止。

步骤5.储存稿件

依照稿件的材质类型，设定扫描参数。

设定完毕后，能够点击“扫描到”按钮直截了当存档,或是把影像传送到不的地点做其它的应用,如打印机、电子邮件、OCR及Web。

步骤6.离开ScanWizard5扫描软件只要点击窗口右上角的离开按钮

即可。

●第二部分：

OCR软件的使用

一、猎取图像：

有两种方式猎取图像，扫描图像或打开运算机中差不多存在的图像文件。

扫描图像之前应设置好储存扫描图像文件的路径、图像文件名、图像文件名后缀。

设置图像路径，能够直截了当在

窗口中键入路径名，或单击

按钮，在扫瞄路径窗口中选定路径。

图像名的命名规则为:

若干位字母前缀+3位数字，3位数字的范畴从000到999，每扫描一幅图像后系统会自动在数字尾数加1，如图像名前缀取“hw”，图像名数字尾数取“003”，图像名后缀取tif，则当前图像名为hw003.tif，下一幅图像名自动改为hw004.tif；假如当前图像名尾数达到最大值，如hw999.tif，则下一幅图像名自动改回为hw000.tif，因此相同路径下相同文件名前缀的文件数最多为1000幅。

假如扫描过程中弹出“此文件差不多存在，是否替换该文件？

”提示框，讲明该路径下差不多存在同名的旧图像文件，假如旧图像文件不再需要，择选择“是”，以新扫描的图像替换旧图像；假如还需要旧图像文件，则选择“否”，并在“另存到”窗口中重新设定路径或图像文件名。

不同批次的扫描图像最好分不储存于不同的路径之下，或者在相同路径下而选取不同的图像名前缀，以防止相同路径下相同文件名前缀的文件数超过1000幅。

图像文件名后缀只能取bmp，tif，jpg三种图像格式，一样情形下，黑白二值图像储存为tif格式，灰度彩色图像储存为jpg格式将占用较少的硬盘空间。

例如，C:

\hwocr\image\hw003.tif是一个完整合法的图像文件名。

单击工具栏上的

按钮或单击“文件”菜单中的“扫描”命令，通过扫描仪开始批量扫描文件；单击工具栏上的

按钮或单击“文件”菜单中的“打开图像”命令，打开运算机中差不多扫描好的图像文件。

二、图像处理：

为提高识不率，对图像进行图像反白，自动倾斜校正，调整边框，去噪音（如麻点、下划线等），表格画线等处理。

三、版面分析：

单击工具栏中的

按钮，或单击“识不”菜单中的“版面分析”命令，自动对图像的版面布局、内容进行分析明白得，切分图像页，判不图像框的版面属性（横栏、竖栏、表格、图像），并以不同颜色的线框标识图像框属性。

对分析错误的版面能够手动调整，方法为，先以鼠标选中需要调整的版面块，再调整版面块的边框改变大小，或单击工具栏上的属性按钮（横栏、竖栏、表格、图像）改变该版面块属性。

四、识不图像：

单击

按钮或单击“识不”菜单中的“开始识不”命令，按照版面属性（横栏、竖栏、表格、图像），自动对图像文件治理器选择的图像进行批量识不。

五、校对：

通过对比识不结果文本和原图像，以发觉识不错误的文字。

用户可按Ctrl+Tab、Shift+Tab组合健直截了当查找系统用醒目的颜色标出的可信度不高的文字，进行校对。

六、版面还原：

单击“输出”菜单中的“到指定格式文件”命令，将识不并修改好的文本输出、还原成可供运算机阅读和查询检索的RTF、HTML、XLS、TXT格式的电子文档。

七、删除不再需要的数据文件：

系统在识不处理过程中生成一些数据文件，这些文件和相关的图像文件放在同一文件夹之下，这些文件以对应的图像文件名字命名而分不加上不同的后缀，包括*.bki，*.pst，*.tmp。

例如关于图像文件hw003.tif，对应生成的数据文件有hw003.tif.bki（不一定存在该文件），hw003.tif.pst，hw003.tif.tmp。

当这些图像的识不结果不再需要时，用户能够使用Windows资源治理器删除这些文件。

●第三部分　使用Windows“录音机”录制、编辑声音

Windows系统提供了方便的声音处理工具，直截了当利用附件中的“录音机”，就能完成声音的录制、播放和一些简单的编辑功能。

一、使用Windows录音机录制声音

在Windows系统中，能够通过“录音机”录制人的语音、CD光盘音乐和任何能够输入声音卡的外来声音源的声音，并将录制的声音以一种标准文件格式WAV储备起来。

步骤1.将麦克风的插头插入声音卡的麦克风（MIC）插座，然后试一下麦克风，确保在音箱中能听到麦克风中传出的声音。

假如听不到麦克风中的声音，则执行“程序”->“附件”->“娱乐”->“音量操纵”。

将麦克风选项下的静音取消，然后试一下有没有声音。

注意，试好声音以后，要将麦克风选项下的静音重新设置好。

同时，能够调剂一下麦克风的音量。

方法是在“音量操纵”的菜单中，选择“选项”中的“属性”命令，将“调

步骤2.启动“录音机”程序，执行“程序”->“附件”->“娱乐”->“录音机”程序。

Windows98下的“录音机”程序的操作界面与真实的录音机专门相似，使用专门直观和方便。

底部从左到右，依次为倒带、快进、播放、停止和录音按钮。

录音机的最大录音能力为60秒。

录音机正在录音

步骤3.开始录音，用鼠标左键单击录音按钮，对着麦克风讲话，即可完成录音工作。

讲话时，在操作界面上能够看到声音的波形和当前差不多录制的时刻，随着人的讲话，应该能够看到波形的变化。

讲完后，单击停止按钮。

步骤4.储存录音，在“录音机”程序的操作界面的菜单上选择“文件”中的“储存”命令，在弹出的对话框中输入声音文件名，然后储存，就能够将差不多录入的声音以WAV文件的格式储存在指定的位置。

二、使用Windows“录音机”播放音频文件

注意：

使用Windows“录音机”只能用来播放WAV格式的声音文件。

步骤1.在“录音机”操作界面的菜单上执行“文件”中的“打开”命令。

选择要播放的声音文件。

步骤2.单击“录音机”中的“播放”按钮，播放差不多打开的声音文件。

操作界面上的位置滑块指示当前的播放位置，能够随意地移动滑块到新的位置进行播放。

三、使用Windows“录音机”编辑音频文件

录制的声音或从其它途径得到的声音文件并不总是能达到理想的成效，我们能够对其进行编辑修改，使之达到我们的要求。

Windows“录音机”能够对已有的WAV格式声音文件进行裁剪、合并、混音和属性转换。

1、对声音的裁剪

Windows“录音机”提供了两种声音裁剪的方式。

一种是剪去当前点往常的声音，另一种是剪去当前点以后的声音。

通过这两种裁剪方法的综合使用，能够得到我们需要的声音片断。

裁剪声音的操作过程如下：

（1）启动“录音机”程序并打开需要编辑的WAV格式声音文件。

（2）将滑块移到期望保留声音的开始位置。

（3）执行“录音机”菜单“编辑”中的“删除当前位置往常的内容”命令，在弹出窗口中单击“确定”按钮，即可剪去当前位置前不要的声音。

（4）将滑块移到期望保留声音的终止位置。

（5）执行“录音机”菜单“编辑”中的“删除当前位置以后的内容”命令，在弹出窗口中单击“确定”按钮，即可剪去当前位置后不要的声音。

（6）试听一下，检查声音是否在指定的位置开始和终止，假如不对能够舍弃这些操作，重新打开该声音文件重新裁剪。

假如声音的位置符合要求，就能够储存裁剪好的声音，方法同上。

2、合并多个声音文件

假如期望将两个WAV格式声音文件中的声音合并为一个声音文件，比如，我们明白“录音机”程序的录音功能最多只能提供60秒钟的录音时刻，假如需要录制的声音长度超过了那个时刻限制，那就不可能一次性录制完成。

能够将这一段声音分几次录制，分不储存起来，然后再将他们合并成一个声音文件，那个合并起来的声音数据文件是没有60秒钟时刻长度限制的。

使用Windows“录音机”合并多个声音文件有两个不同的方法，一个方法是从其它声音文件中将声音插入到当前打开的声音文件的指定位置后面，其操作步骤如下：

（2）将滑块移动到第二个声音文件预备插入的位置。

（3）执行“录音机”菜单“编辑”中的“插入文件”命令。

（4）在弹出的“插入文件”窗口中，选中第二个声音文件后，单击打开按钮。

（5）储存合并后的声音文件。

另一个方法，则是利用Windows系统的剪贴板，因为剪贴板除了能够储存文字、图象等信息外，也能够储存声音，因此，同样能够将剪贴板中的声音插入到当前打开的声音文件指定位置的后面。

运用这种方法合并声音文件的操作步骤如下：

（1）启动“录音机”程序，并打开第二个声音文件。

（2）执行“录音机”菜单“编辑”中的“复制”命令，将这段声音复制到剪贴板上。

（4）执行“录音机”菜单“编辑”中的“粘贴插入”命令。

（5）储存合并后的声音文件。

3、两个声音文件的叠加

为了增强声音的成效，能够将两种不同的声音进行叠加，即混音。

混音的操作步骤是：

（2）将滑块移动到预备混合第二个文件的开始位置。

（3）执行“录音机”菜单“编辑”中的“与文件混合”命令。

（4在弹出窗口中，选择第二个声音文件，单击“打开”按钮。

（5试听一下，再储存混音后的声音文件。

声音文件的混音，除了用“与文件混合”命令外，还能够使用“粘贴混合”命令，方法与声音文件合并时的“粘贴插入”类似。

一、录制诗朗诵或课件解讲词

步骤1.启动GoldWave，使用“文件/新建”命令打开“新建声音”窗口，设置录音时的声道数、采样率，依照诗朗诵或课件解讲词的具体内容预设录制声音的“初始化长度”。

步骤2.使用“工具/操纵器”命令，在“操纵器”窗口点击“设置操纵器属性”按钮或按F11键，在“录音”选项卡中“录音模式”选为“无限制”，在“音量”选项卡中选择“麦克风”，并适当调剂麦克风的录音音量大小。

步骤3.点击操纵器窗口中的“开始录音”按钮，开始录音，编辑窗中显示录制的声音波形。

录音终止后，按“停止录音”按钮，录音终止，并形成一个“无标题”的音频文件。

步骤4.选择“文件/储存”命令，将录制的声音命名和储存。

二、音频特效制作

1、音量成效

步骤1.在GoldWave中打开刚才录制的诗朗诵或课件解讲词，选择“成效/音量”中的“更换音量”命令，在“更换音量”窗口，拖动音量滑块，0db表示原始音量的大小，声音既不放大也不衰减。

向右拖动音量滑块，分贝值大于0，声音被放大，分贝值越高，音量越大。

向左拖动音量滑块，分贝值小于0，声音被衰减，分贝值越低，音量越大。

依照录音情形，适当拖动音量滑块，对录制的诗朗诵或课件解讲词进行增益或衰减处理。

利用绿色播放按钮，视听当前设置成效。

步骤2.在GoldWave中打开音频文件（如吉祥三宝），按住并拖动鼠标左健，选择音频文件的开始部分（选择的声音片段以高亮度显示），选择“成效/音量”中的“淡入”命令，适当调剂初始音量，利用绿色播放按钮，视听当前设置成效，中意后单击“确定”，为音频添加淡入成效。

步骤2.用鼠标拖选音频文件的结尾部分，选择“成效/音量”中的“淡出”命令，适当调剂最终音量，利用绿色播放按钮，视听当前设置成效，中意后单击“确定”，为音频添加淡出成效。

2、回声成效

步骤1.在GoldWave中打开音频文件（如荷塘月色），选择“成效/回声”命令，弹出回声窗口。

步骤2.适当调整参数设置，利用绿色播放按钮，视听当前设置成效，直到中意为止。

3、改变音高

步骤1.在GoldWave中打开音频文件（如隐形翅膀），选择“成效/回声”命令，弹出回声窗口。

步骤2.左右拖动参数设置滑块，降低或升高音调，利用绿色播放按钮，视听当前设置成效。

注意：

若选择“比例”调剂参数，数值100表示原始音高，大于100，音调升高，小于100，音调降低。

若选择“半音”调剂参数，数值0表示原始音高，大于0，音调升高，小于0，音调降低。

4、声相成效

步骤1.在音频文件（如隐形翅膀）中用鼠标选择部分片段作为选区，选择“成效/立体声/声相”命令，弹出声相窗口。

步骤2.将声相包络线调成上图所示形状，视听声音在声场中左右位置的变化成效。

5、声音文件格式转换

步骤1.选择“文件/批处理”命令，弹出“批处理”窗口。

步骤2.利用“添加文件”按钮，添加欲转换格式的声音文件，单击“另存类型”下拉按钮，选择新的格式。

步骤3.选择窗口中的文件夹选项卡，在其中选择新生成文件的储存路径，是否覆盖已存在的文件，设置完成后，单击“开始”，即可生成和储存新格式的音频文件。

六、实验注意事项

●用好的原稿

好的原稿关于得到高品质的扫描结果是十分重要的,即使您的影像扫描软件和影像编辑程序具有改善影像品质的工具,也只是是亡羊补牢的做法,关于那些焦距不准、污损或感光专门差的影像,则不管花费多大精力进行处理都可不能有多大改善

●保持扫描仪的洁净

在扫描之前,要确认您扫描仪的玻璃面板是洁净的.假如发觉扫描仪的玻璃面脏了,请用洁净的软布沾玻璃清洁剂擦拭即可。

●选择正确的扫描类型和扫描设置

扫描前,先设定正确的影扫描类型、适当的辨论率和缩放比例。

假如影像是单一颜色的黑白影像,请选用黑白影像类型。

关于黑白照片.用灰阶影像类型进行扫描,能够得到较小的影像档。

假如想打印车成效为黑白色，则在灰阶下扫描。

最后,在扫描的时候,请设定适当的扫描解析度,能够减少您影像的档案大小。

●辨论率的选择

选择正确品质因素的标尺缩图，打印屏影像少于或等于133线perinch，设置品质因素到2；高于133线peiinch，设置到1.5；contone打印机（连续调色打印机，例如染料升华打印机）设置到1.0。

假如你输出影像到显示器（例如多媒体工作），你不需要把扫描影像的辨论率高与72ppi，因为显示器只能显示影像到72ppi。

高的辨论率在显示器上显示可不能有什么差不且只会使得文档过大。

越高的辨论率，影像文挡也就越大，一个8.5"x11"的彩色照片以75ppi扫描大致会有1.6M。

成倍辨论率到150ppi将会4倍增大文档，相当于6.3M！

辨论率到300ppi，大小将为26.2M。

若需要可选择尽可能低但可提供较好影像品质的辨论率以保持易治理的文档大小。

两个影像以不同的辨论率扫描，但打印出成效无大区不，这是因为所有的打印机和印刷都有他们的最高辨论率。

最终大小太小也无需在150ppi。

●正确使用影像修正工具

扫描彩色影像时使用ScanWizard5扫描软件的色彩校正功能,能够得到更为准确的色彩。

除此之外,您可尝试一下在扫描软件中所提供的影像修正工具。

比如使用亮度和对比度工具,调整影像的整体显示成效,或者使用曲线工具来处理影像的某个特定区域。

展开阅读全文