13年碎纸片拼接复原数模论文B概要Word格式.docx-资源下载

13年碎纸片拼接复原数模论文B概要Word格式.docx

1、问题一，我们首先把碎片图形进行二值化处理，根据所给纵切黑白碎片边缘的像素关系（相邻两张碎片，一张碎片矩阵右边的像素与另一张碎片左边的像素相同），我们采和自定义相似度算法，利用附件一和附件二求出碎片间的相似度，然后根据所需要满足的条件即相似度最大原则，建立了纵切碎片拼接模型一及其算法，运用Matlab编程实现该模型，并得到碎片复原结果（见表一表二）.问题二，要实现快速准确的拼接复原纵横切碎片，在问题一的思路基础上，我们采用了模糊C的均值聚类方法，先对附件三所有碎片进行初步的分类，然后在自定义相似度算法上增加了约束条件，以此来排除有若干碎片在匹配时相似度相同的情形，建立了改进的中文纵横切碎片拼接

2、模型二，同样利用Matlab软件求得碎片的复原结果（见表三）.对于英文纵横切碎片的拼接问题，我们采用了字符切割和字符识别思想，即在碎片的二值化矩阵中选取适当大小的行与列，对碎片边缘的英文字母进行切割，与其他图片匹配合并，提取切割字母的特征（统计特征或结构特征），再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符，将两张碎片拼接在一起，先一行一行地进行拼接，再利用模型二横切碎片方法，利用Matlab软件求得碎片的复原结果（见表四）.问题三，在处理双面打印纵横切碎片时，经分析发现两面图片最大的区别在于光滑度的不同，纸张的正面比反面要光滑，因此在模型二的基础上还需增加一步筛选工作，就

3、是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”，再根据不同页面的频率范围，设定一段频率值，借助计算机将双面打印的碎片进行分类，分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可，通过这种方法求得碎片的复原结果. 关键词：碎片拼接均值聚类方法相似度模型傅里叶变换一、问题重述1.1背景：破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础，而且图像配准算法的计算量一般非常大，因此图像拼接复原技术的发展很大程度

4、上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息，然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.1.2重述：该题研究的是如何对碎纸片进行拼接复原.传统上，拼接复原工作需由人工完成，准确率较高，但是效率低.随着计算机技术的发展，当碎纸片数量巨大的时候，人们试图开发碎纸片的自动拼接技术，以提高拼接复原的效率.问题1 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，写出干预方式及干预的时间节点.问题2 对于碎纸机

5、既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、4给出的中、英文各一页文件的碎片数据进行拼接复原.如果复原过程需要人工干预，写出干预方式及干预的时间节点.问题3 对于双面打印文件的碎纸片拼接复原问题设计碎纸片拼接复原模型和算法，并针对附件5给出的一页英文印刷文字双面打印文件的碎片数据进行拼接复原，结果表达同上.二、问题分析碎纸机破碎纸片的拼接复原，都需要经过获取图像，导入图像，图像预处理，图像配准，和图像的拼接复原步骤.其中图像配准是碎纸片拼接复原技术中最重要的环节之一.针对本题中给出的三种不同的情况，需采用不同的模型和算法来提高拼接复原的效率和准确度2：对于问题1 所需要拼

6、接复原的碎纸片为纵向切割的小纸条，通过Matlab软件将所给图片转换成为的二值矩阵，先随机选择一个碎片的矩阵作为基本矩阵，将剩余矩阵与基本矩阵作比较，通过matlab软件计算出相比较矩阵的相似度，再根据模型一的匹配方法将碎纸片进行拼接复原,此拼接模型不需要人工干预.对于问题2 对于碎纸机既横切又纵切的情形，所得碎片的像素较低，采用模型一的算法无法完全拼接复原个碎片，需要先对碎片进行聚类分析，筛选出特征相同的碎片，再根据二重判别标准的相似度刻画原则，将碎片进行横向和纵向的拼接复原.对中文碎片进行拼接时，先通过二值矩阵找出字间距和一个字的间距，通过聚类分析法先将所有碎片分行找出，把横纵切拼接问题转

7、化为横切碎片拼接，再利用行间距和字的行高约束条件，运用遗传算法拼接复原整个图片.英文碎片拼接与中文碎片拼接不同，在拼接碎片时，需要采用字符切割的方法，提取英文字母的特征，根据碎片边缘字母的特征，再利用字符识别的方法，寻找相匹配的碎片，根据这一原则运用遗传算法的匹配方法拼接复原英文碎片.对于问题3 要想拼接复原双面打印碎片，必须先将所有碎片进行分类.把同一页的碎片分离出来.经过分析可得，两面打印的纸张的粗糙度不同，正面比反面光滑，根据这一特征，需要采用傅里叶变换处理图像，从而得到碎纸片的“频率”图.高频代表图像的细节、纹理信息，低频代表图像的轮廓信息.对所有碎纸片进行高频滤波.滤波后可得图像的纹

8、理信息.运用Matlab软件计算若干碎纸片的频率信息，设定频率范围，将所有碎纸片分为正反页面图片两类.再采用模型二的算法拼接复原整个图片.三、基本假设1、碎纸机破碎的每个纸片的长、宽和厚度均相同；2、所有碎片是黑白图片，图片清晰；3、碎片完整没有缺损缺失，可以完全拼接复原；4、碎纸片的正反两方面的印刷效果都一样，互不影响；5、扫描图片没有变异，文字与图片上边界平行；6、文件页边距和行距固定；7、碎片中的文字方向相同，不需要考虑碎片拼接时需要旋转拼接复原.四、符号说明符号含义表示第个碎纸片的像素矩阵表示所选碎纸片像素矩阵中参与比较的行数表示两个碎纸片像素边界矩阵元素相同的数目b表示两个碎纸片像素

9、边缘矩阵的相似度（表示二值矩阵的聚类中心表示矩阵的向量空间五、模型的建立与求解通过我们建立的自动拼接模型，在图片拼凑过程中，我们可以预测图片的拼接大致需进行图片处理、边界比较、图片输出等步骤. 通过我们所得的模型预测，可以得出预测方程.具体流程图如图5-1所示：图5-1 模型方法预测（一）问题一模型的建立与求解 5.1.1 图像的导入运用Matlab软件采用二值法原理将碎片的图像转换成为的（0,1）矩阵，记为. 5.1.2图像的去噪边缘处理采用中值滤波的原理对图像边缘进行去噪.中值滤波就是用相邻像素的中值来替代该像素的值，利用Matlab对图像所成二值矩阵进行光滑处理，以此提高碎片匹配时

10、的相似度. 中值滤波法是一种非线性平滑技术，它将每一象素点的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值.中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术，中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个拎域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点。方法是去某种结构的二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升（或下降）的为二维数据序列。二维中值滤波输出为，其中，分别为原始图像和处理后图像。W为二维模板，通常为区域，也可以是不同的的形状，如线状，圆形，十字形，圆环形等中值滤波的函数为：5.1.3图像的配准 1

11、）遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法，是一种有效的解最优化问题的方法.借助计算机选取第一张碎片作为第一张图，采用遗传算法，将该图片的右边缘矩阵与剩下的18张图的相对应的左边缘矩阵随机的根据相似度进行比较，然后把相似度最高的图片作为第二张图并与第一张图片拼接起来.将第一张图作为基准图，向右匹配，若右方向的匹配完成，再朝左方向匹配，以此类推，直到将所有图片拼接复原完成.问题一不需要进行人工干预.图5-2 遗传算法流程图2）相似度的计算方法：计算机自动选择一张碎片为第一张碎片（此处就以000.bmp为第一张），具体实现算法为用嵌套循环，第一重循环取出每张图片最右边（第72列）的像

12、素矩阵，第二重循环取出每张图片最左边（第1列）的像素矩阵，然后作这两个矩阵的比较，结果相同为1不同为0，对其结果矩阵求和作为刻画相似度的标准，如果是自身比较则置为0，当结果中出现1980（说明两张图片是100%匹配，可以判断出第一张和最后一张），用这种方法就可以得到完整的拼接图像，剩余图片的矩阵随机编号为，利用Matlab软件选取矩阵中的n行运用同或运算法则进行相似度的计算.假设让的最右列与的最左列的元素一一对应作比较，同行的两元素相同则为,1，不同记为0，从第一行开始累加，累加的结果记为相似度记为：（n=1980）.5.1.4图像的导出1）根据配准结果进行矩阵的拼接.2）运用Matlab

13、软件编程实现图像的导出.表一附件一图片排序008014012015003010002016001004005009013018011007017000006表二附件二图片排序（二）问题二模型的建立与求解问题二为纵横切有11个碎片，每个碎纸片的边缘像素相对于问题一来说要少很多，无法直接利用模型一求解问题二.在模型一的基础上，我们首先对中文碎片进行拼接复原，根据图片的特征对图片进行分类，然后再采用双重标准定义相似度的算法来进行图片的拼接.拼接英文碎片时，采用字符切割和字符识别的方法，问题二需要人工介入.5.2.1 图像导入同样采用二值法，运用Matlab软件将碎纸片的图像转换为180的（0,1

14、）矩阵.5.2.2图像边缘处理采用模型一的中值滤波的方法对209张图片的边缘进行光滑处理，以提高图片在匹配时的相似度，排除噪声对图片的影响.5.2.3图像配准（拼接中文碎片）1）采用模糊C均值聚类方法根据同行图片的特征，同一行图片的同列字间的间距相同，缺损字的上边缘或下边缘与碎片的边缘之间的距离相同.还可以根据字的最左端到图片边缘之间的距离相等筛选出文章最左列碎片，运用Matlab软件编程将209张碎片进行初步分类，再利用Matlab软件建立元胞数组，将碎片分行导入元胞数组，同行碎片不分顺序3.模糊C均值聚类：设,表示P维实数向量空间.令表示第k个样本属于第i类的隶属度， =1，。记为第i类的

15、聚类中心.则X的一个模糊C均值聚类就是求如下目标函数的最小值：其中为第k个序列到第i类中心的欧式距离。聚类准则取为求J（U,V）的极小值：minJ（U,V）.求模糊C均值聚类的具体步骤如下：（1）取定c,m和初始隶属度矩阵，迭代步数I=0.（2）计算聚类中心V为：（3）修正U：（4）对给定的，实际计算时应对取定的初始值进行迭代计算直至，则算法终止，并得到结果。若，则第j类.如：图5-3 图片5-4 图片5-5其中可判定图片5-3与5-4为同一行，图片5-3与图片5-5不在同一行.2）因用人工干预找出完整图片的左下角的碎片，先只拼接这一行，由于明确了方向两两图片只需单向作比较，可将已确

16、定的图片标记为1不再被比较。因图片可能有孤立两点和黑点，为忽略像素间的比较那些点的影响，采用绝对值来控制同行或同列像素间其比较结果取值范围。有采用模型一的贪婪算法和每张图片做相似度的大小比较并在此基础上加上这张图片的特性约束及深度比较和中途的人工干预可正确筛选出一行完整图片。以此思想继而课求出此图片的纵列，以后以纵列的每张图片再进行此算法的类推可拼接完整图片.例：（1）中文版确定007.bmp为开头的所在行确定029.bmp为开头的所在行（2）英文版确定081.bmp为开头的所在行确定191.bmp为开头的所在行3）定义相似度：约束一：与模型一的相似度算法近似.约束二：用以上得出的字与字，字与

17、页边距的规律求出要拼接的这行为首图片的特征来加以约束要比较的图片.约束三：当有多个像素相似度值很接近和相等时再精确深入作比较，利用同一行碎片的二值矩阵的特征即上下两个字的间距为28个像素点，左右两个字6个像素点，进一步比较.如果出现异常情况，人工干预进行修正.在对英文碎片进行拼接时采用同样的方法，只是需要改变它们之间的行间距与字间距的约束条件.4）通过以上步骤将每行的碎片拼接完成，并确定了最后一行的图片，将11 个碎片拼接复原问题转换为11个碎片拼接问题.横切碎片比纵切碎片拼接复原的要复杂，所以还需另一种二重约束的相似度算法.取约束一条件下相似度最高的碎片，如有相同的再运用约束二的条件进行匹配

18、，横向拼接的方法为模型一的遗传算法，从完整图片的最后一行向上进行拼接。如果出现异常情况，人工干预进行修正.5.2.4图像配准（拼接英文碎片）1、字符切割：选取碎片二值矩阵边缘的若干列（一个字符间距加一个字母的像素），分离出单个字符，选取的若干列中会有一个或多个完整或不完整的字符，这就相当于多个约束条件的匹配.2、特征提取：从切割的字符中提取统计特征或结构特征，进行归一化、细化处理.3、字符识别：先借助计算机构建52个字母（大小写）的特征库（用1,0矩阵构造的字母图样），根据特征库的信息，对于同一字母进行识别，从而挑选出相匹配的拼接碎片.4、拼接算法：采用中文拼接的方法（遗传算法），即先拼接行，

19、再拼接列.5）图像的导出表三附件三的复原结果4954651431862571921781181909511221292891188141611978676999162961317963116163726177205236168100766214230412314719150179120861952618718381484616124358118912210313019388167258910574141283159821991351273160203169134393151107115176943484183904712142124144771121499713616412758431251

20、31821091971618411018766106150211731571812041391452964111201592180483775554420610104981721715972081381581266817545174137535693153701663219671156831322001780332021981513317020585152165276089146102154114401512071551401851081174101113194119123表四附件四的复原结果（三）问题三的求解5.3.1傅里叶变换处理图像通过对问题三的分析可得双面印刷碎片的特征，即为不同面的

21、碎纸片的光滑度不同，所以需要利用傅里叶变换将图像从“空域”变为“频率”，再根据不同页面的频率范围，设定一段频率值，借助计算机将双面打印的碎片进行分类，分离出在同一页面的碎片，以此降低碎片拼接复原的难度.快速傅里叶变换（FFT）是计算离散傅里叶变换（DFT）的快速算法.离散傅里叶变换运算量巨大，计算时间长，即运算时间很长.而快速傅里叶变换的提出将傅里叶变换的复杂度由降到了，很大程度上减少了计算量. 令，u=0，1，2，M-1.则 .5.3.2 采用模型二拼接英文碎片的算法借助Matlab软件将所有碎片分为两类，分类完成后就与问题二拼接英文碎片相同了，因此可采用模型二拼接因为碎片的方法将碎片一页

22、一页地拼接完成.六、误差分析虽然我们建立了针对不同情况碎片拼接的模型，也得到了碎片的复原结果，但是模型是建立在理想的假设基础之上的，实际上碎片不全是非常清晰的，也有不明朗的模糊灰色区域，特别是在碎片的边缘处，在对这些区域计算相似度时会由于阀值的不稳定性产生一些误差，可能导致图像拼接时出现错误拼接现象.除此之外，在问题二、三中采用聚类分析法对碎片分类时，可能得到的结果与主成分分析的结果有一定差异，就会导致分类时有些行的碎片会有多余的情况出现，从而无法完整拼接复原图片，所以实际与理论之间总会存在一定的误差，这是难以避免的.七、模型的优缺点讨论7.1模型的优点通过对模型的分析，验证了模型的可靠性，模型过程清晰明了，并且可用Matlab软件快速求解，为此类碎片的拼接复原提供了方便可行的设计方法，具有重要的实际意义和较高的应用价值.模型一研究的是对纵切碎片的拼接复原，该模型简单方便，误差小，在没有异常情况下，无需人工干预，并且拼接效果优良.自定义的相似度算法简单可

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？