13年碎纸片拼接复原数模论文B解析.docx

资源描述

13年碎纸片拼接复原数模论文B解析.docx

《13年碎纸片拼接复原数模论文B解析.docx》由会员分享，可在线阅读，更多相关《13年碎纸片拼接复原数模论文B解析.docx（33页珍藏版）》请在冰豆网上搜索。

13年碎纸片拼接复原数模论文B解析.docx

13年碎纸片拼接复原数模论文B解析

2013高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

重庆XX大学

参赛队员（打印并签名）：

1.祝XX

2.冯XX

3.周XX

指导教师或指导教师组负责人（打印并签名）：

张XX

（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。

以上内容请仔细核对，提交后将不再允许做任何修改。

如填写错误，论文可能被取消评奖资格。

）

日期：

20XX年X月XX日

赛区评阅编号（由赛区组委会评阅前进行编号）：

2013高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时使用）：

评

阅

人

评

分

备

注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

碎纸片的拼接复原

摘要

图像碎片自动拼接复原是需要借助计算机把大量碎片重新拼接复原成初始图像的完整模型，这一研究在考古、刑侦犯罪、古生物学、医学图像分析、遥感图像处理以及壁画保存复原等方面具有广泛、实际的应用[1].

本文主要解决碎纸机破碎文档的自动拼接复原问题.我们利用图像数字化技术，借助Matlab软件将图像转化为矩阵.通过建立数学模型，运用矩阵论、聚类分析方法、自定义相似度方法、遗传算法、字符分割和字符识别等方法，对数据进行处理，实现对图像碎片自动拼接，从而将所给碎片拼接复原为完整图像.

问题一，我们首先把碎片图形进行二值化处理，根据所给纵切黑白碎片边缘的像素关系（相邻两张碎片，一张碎片矩阵右边的像素与另一张碎片左边的像素相同），我们采和自定义相似度算法，利用附件一和附件二求出碎片间的相似度，然后根据所需要满足的条件即相似度最大原则，建立了纵切碎片拼接模型一及其算法，运用Matlab编程实现该模型，并得到碎片复原结果（见表一表二）.

问题二，要实现快速准确的拼接复原纵横切碎片，在问题一的思路基础上，我们采用了模糊C的均值聚类方法，先对附件三所有碎片进行初步的分类，然后在自定义相似度算法上增加了约束条件，以此来排除有若干碎片在匹配时相似度相同的情形，建立了改进的中文纵横切碎片拼接模型二，同样利用Matlab软件求得碎片的复原结果（见表三）.

对于英文纵横切碎片的拼接问题，我们采用了字符切割和字符识别思想，即在碎片的二值化矩阵中选取适当大小的行与列，对碎片边缘的英文字母进行切割，与其他图片匹配合并，提取切割字母的特征（统计特征或结构特征），再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符，将两张碎片拼接在一起，先一行一行地进行拼接，再利用模型二横切碎片方法，利用Matlab软件求得碎片的复原结果（见表四）.

问题三，在处理双面打印纵横切碎片时，经分析发现两面图片最大的区别在于光滑度的不同，纸张的正面比反面要光滑，因此在模型二的基础上还需增加一步筛选工作，就是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”，再根据不同页面的频率范围，设定一段频率值，借助计算机将双面打印的碎片进行分类，分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可，通过这种方法求得碎片的复原结果.

关键词：

碎片拼接均值聚类方法相似度模型傅里叶变换

一、问题重述

1.1背景：

破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础，而且图像配准算法的计算量一般非常大，因此图像拼接复原技术的发展很大程度上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息，然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.

1.2重述：

该题研究的是如何对碎纸片进行拼接复原.传统上，拼接复原工作需由人工完成，准确率较高，但是效率低.随着计算机技术的发展，当碎纸片数量巨大的时候，人们试图开发碎纸片的自动拼接技术，以提高拼接复原的效率.

问题1对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，写出干预方式及干预的时间节点.

问题2对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、4给出的中、英文各一页文件的碎片数据进行拼接复原.如果复原过程需要人工干预，写出干预方式及干预的时间节点.

问题3对于双面打印文件的碎纸片拼接复原问题设计碎纸片拼接复原模型和算法，并针对附件5给出的一页英文印刷文字双面打印文件的碎片数据进行拼接复原，结果表达同上.

二、问题分析

碎纸机破碎纸片的拼接复原，都需要经过获取图像，导入图像，图像预处理，图像配准，和图像的拼接复原步骤.其中图像配准是碎纸片拼接复原技术中最重要的环节之一.针对本题中给出的三种不同的情况，需采用不同的模型和算法来提高拼接复原的效率和准确度[2]：

对于问题1所需要拼接复原的碎纸片为纵向切割的小纸条，通过Matlab软件将所给图片转换成为

的二值矩阵，先随机选择一个碎片的矩阵作为基本矩阵，将剩余矩阵与基本矩阵作比较，通过matlab软件计算出相比较矩阵的相似度，再根据模型一的匹配方法将碎纸片进行拼接复原,此拼接模型不需要人工干预.

对于问题2对于碎纸机既横切又纵切的情形，所得碎片的像素较低，采用模型一的算法无法完全拼接复原

个碎片，需要先对碎片进行聚类分析，筛选出特征相同的碎片，再根据二重判别标准的相似度刻画原则，将碎片进行横向和纵向的拼接复原.

对中文碎片进行拼接时，先通过二值矩阵找出字间距和一个字的间距，通过聚类分析法先将所有碎片分行找出，把横纵切拼接问题转化为横切碎片拼接，再利用行间距和字的行高约束条件，运用遗传算法拼接复原整个图片.

英文碎片拼接与中文碎片拼接不同，在拼接碎片时，需要采用字符切割的方法，提取英文字母的特征，根据碎片边缘字母的特征，再利用字符识别的方法，寻找相匹配的碎片，根据这一原则运用遗传算法的匹配方法拼接复原英文碎片.

对于问题3要想拼接复原双面打印碎片，必须先将所有碎片进行分类.把同一页的碎片分离出来.经过分析可得，两面打印的纸张的粗糙度不同，正面比反面光滑，根据这一特征，需要采用傅里叶变换处理图像，从而得到碎纸片的“频率”图.高频代表图像的细节、纹理信息，低频代表图像的轮廓信息.对所有碎纸片进行高频滤波.滤波后可得图像的纹理信息.运用Matlab软件计算若干碎纸片的频率信息，设定频率范围，将所有碎纸片分为正反页面图片两类.再采用模型二的算法拼接复原整个图片.

三、基本假设

1、碎纸机破碎的每个纸片的长、宽和厚度均相同；

2、所有碎片是黑白图片，图片清晰；

3、碎片完整没有缺损缺失，可以完全拼接复原；

4、碎纸片的正反两方面的印刷效果都一样，互不影响；

5、扫描图片没有变异，文字与图片上边界平行；

6、文件页边距和行距固定；

7、碎片中的文字方向相同，不需要考虑碎片拼接时需要旋转拼接复原.

四、符号说明

符号

含义

表示第

个碎纸片的像素矩阵

表示所选碎纸片像素矩阵中参与比较的行数

表示两个碎纸片像素边界矩阵元素相同的数目

表示两个碎纸片像素边缘矩阵的相似度（

）

表示二值矩阵的聚类中心

表示矩阵的向量空间

五、模型的建立与求解

通过我们建立的自动拼接模型，在图片拼凑过程中，我们可以预测图片的拼接大致需进行图片处理、边界比较、图片输出等步骤.

通过我们所得的模型预测，可以得出预测方程.具体流程图如图5-1所示：

图5-1模型方法预测

（一）问题一模型的建立与求解

5.1.1图像的导入运用Matlab软件采用二值法原理将碎片的图像转换成为

的（0,1）矩阵，记为

5.1.2图像的去噪边缘处理采用中值滤波的原理对图像边缘进行去噪.中值滤波就是用相邻像素的中值来替代该像素的值，利用Matlab对图像所成二值矩阵进行光滑处理，以此提高碎片匹配时的相似度.

中值滤波法是一种非线性平滑技术，它将每一象素点的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值.

中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术，中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个拎域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点。

方法是去某种结构的二维滑动模板，将板内像素按照像素值的大小进行排序，生成单调上升（或下降）的为二维数据序列。

二维中值滤波输出为

，其中，

，

分别为原始图像和处理后图像。

W为二维模板，通常为

区域，也可以是不同的的形状，如线状，圆形，十字形，圆环形等

中值滤波的函数为：

5.1.3图像的配准

1）遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法，是一种有效的解最优化问题的方法.借助计算机选取第一张碎片作为第一张图，采用遗传算法，将该图片的右边缘矩阵与剩下的18张图的相对应的左边缘矩阵随机的根据相似度进行比较，然后把相似度最高的图片作为第二张图并与第一张图片拼接起来.将第一张图作为基准图，向右匹配，若右方向的匹配完成，再朝左方向匹配，以此类推，直到将所有图片拼接复原完成.问题一不需要进行人工干预.

图5-2遗传算法流程图

2）相似度的计算方法：

计算机自动选择一张碎片为第一张碎片（此处就以000.bmp为第一张），具体实现算法为用嵌套循环，第一重循环取出每张图片最右边（第72列）的像素矩阵，第二重循环取出每张图片最左边（第1列）的像素矩阵，然后作这两个矩阵的比较，结果相同为1不同为0，对其结果矩阵求和作为刻画相似度的标准，如果是自身比较则置为0，当结果中出现1980（说明两张图片是100%匹配，可以判断出第一张和最后一张），用这种方法就可以得到完整的拼接图像，剩余图片的矩阵随机编号为

，利用Matlab软件选取矩阵中的n行运用同或运算法则进行相似度的计算.

假设

让

的最右列与

的最左列的元素一一对应作比较，同行的两元素相同则为,1，不同记为0，从第一行开始累加，累加的结果记为

相似度记为：

（n=1980）.

5.1.4图像的导出

1）根据配准结果进行矩阵的拼接.

2）运用Matlab软件编程实现图像的导出.

表一附件一图片排序

008

014

012

015

003

010

002

016

001

004

005

009

013

018

011

007

017

000

006

表二附件二图片排序

003

006

002

007

015

018

011

000

005

001

009

013

010

008

012

014

017

016

004

（二）问题二模型的建立与求解

问题二为纵横切有11

个碎片，每个碎纸片的边缘像素相对于问题一来说要少很多，无法直接利用模型一求解问题二.在模型一的基础上，我们首先对中文碎片进行拼接复原，根据图片的特征对图片进行分类，然后再采用双重标准定义相似度的算法来进行图片的拼接.拼接英文碎片时，采用字符切割和字符识别的方法，问题二需要人工介入.

5.2.1图像导入

同样采用二值法，运用Matlab软件将碎纸片的图像转换为180

的（0,1）矩阵.

5.2.2图像边缘处理

采用模型一的中值滤波的方法对209张图片的边缘进行光滑处理，以提高图片在匹配时的相似度，排除噪声对图片的影响.

5.2.3图像配准（拼接中文碎片）

1）采用模糊C均值聚类方法根据同行图片的特征，同一行图片的同列字间的间距相同，缺损字的上边缘或下边缘与碎片的边缘之间的距离相同.还可以根据字的最左端到图片边缘之间的距离相等筛选出文章最左列碎片，运用Matlab软件编程将209张碎片进行初步分类，再利用Matlab软件建立元胞数组，将碎片分行导入元胞数组，同行碎片不分顺序[3].

模糊C均值聚类：

设

表示P维实数向量空间.令

表示第k个样本属于第i类的隶属度，

，

=1，

，

。

记

为第i类的聚类中心.则X的一个模糊C均值聚类就是求如下目标函数的最小值：

其中

为第k个序列到第i类中心的欧式距离。

聚类准则取为求J（U,V）的极小值：

min{J（U,V）}.

求模糊C均值聚类的具体步骤如下：

（1）取定c,m和初始隶属度矩阵

，迭代步数I=0.

（2）计算聚类中心V为：

（3）修正U：

（4）对给定的

，实际计算时应对取定的初始值进行迭代计算直至

，则算法终止，并得到结果。

若

，则

第j类.

如：

图5-3图片5-4图片5-5

其中可判定图片5-3与5-4为同一行，图片5-3与图片5-5不在同一行.

2）因用人工干预找出完整图片的左下角的碎片，先只拼接这一行，由于明确了方向两两图片只需单向作比较，可将已确定的图片标记为1不再被比较。

因图片可能有孤立两点和黑点，为忽略像素间的比较那些点的影响，采用绝对值来控制同行或同列像素间其比较结果取值范围。

有采用模型一的贪婪算法和每张图片做相似度的大小比较并在此基础上加上这张图片的特性约束及深度比较和中途的人工干预可正确筛选出一行完整图片。

以此思想继而课求出此图片的纵列，以后以纵列的每张图片再进行此算法的类推可拼接完整图片.

例：

（1）中文版

确定007.bmp为开头的所在行

确定029.bmp为开头的所在行

（2）英文版

确定081.bmp为开头的所在行

确定191.bmp为开头的所在行

3）定义相似度：

约束一：

与模型一的相似度算法近似.

约束二：

用以上得出的字与字，字与页边距的规律求出要拼接的这行为首图片的特征来加以约束要比较的图片.

约束三：

当有多个像素相似度值很接近和相等时再精确深入作比较，利用同一行碎片的二值矩阵的特征即上下两个字的间距为28个像素点，左右两个字6个像素点，进一步比较.

如果出现异常情况，人工干预进行修正.在对英文碎片进行拼接时采用同样的方法，只是需要改变它们之间的行间距与字间距的约束条件.

4）通过以上步骤将每行的碎片拼接完成，并确定了最后一行的图片，将11

个碎片拼接复原问题转换为11个碎片拼接问题.横切碎片比纵切碎片拼接复原的要复杂，所以还需另一种二重约束的相似度算法.取约束一条件下相似度最高的碎片，如有相同的再运用约束二的条件进行匹配，横向拼接的方法为模型一的遗传算法，从完整图片的最后一行向上进行拼接。

如果出现异常情况，人工干预进行修正.

5.2.4图像配准（拼接英文碎片）

1、字符切割：

选取碎片二值矩阵边缘的若干列（一个字符间距加一个字母的像素），分离出单个字符，选取的若干列中会有一个或多个完整或不完整的字符，这就相当于多个约束条件的匹配.

2、特征提取：

从切割的字符中提取统计特征或结构特征，进行归一化、细化处理.

3、字符识别：

先借助计算机构建52个字母（大小写）的特征库（用1,0矩阵构造的字母图样），根据特征库的信息，对于同一字母进行识别，从而挑选出相匹配的拼接碎片.

4、拼接算法：

采用中文拼接的方法（遗传算法），即先拼接行，再拼接列.

5）图像的导出

表三附件三的复原结果

143

186

192

178

118

190

129

188

141

162

131

116

163

177

168

100

142

147

191

179

120

195

148

161

189

122

103

130

193

167

105

128

159

199

135

160

203

169

134

107

115

176

183

121

124

144

112

149

136

164

127

125

182

109

197

184

110

187

106

150

173

157

181

204

139

145

111

201

180

206

104

172

171

208

138

158

126

175

174

137

153

166

196

156

132

200

202

198

133

170

205

152

165

146

102

154

114

151

207

155

140

185

108

117

101

113

194

119

123

表四附件四的复原结果

191

154

190

184

104

180

106

149

204

147

201

148

170

196

198

113

164

103

101

100

146

107

158

186

117

150

127

194

141

121

126

105

155

114

176

182

151

202

165

159

139

129

138

153

123

120

175

160

187

203

108

116

136

207

135

199

173

161

179

143

208

142

168

169

192

133

118

189

162

197

112

137

195

172

156

122

185

109

132

181

167

163

166

188

111

144

206

130

110

178

171

205

157

145

134

183

152

128

200

131

125

140

193

177

124

102

115

（三）问题三的求解

5.3.1傅里叶变换处理图像

通过对问题三的分析可得双面印刷碎片的特征，即为不同面的碎纸片的光滑度不同，所以需要利用傅里叶变换将图像从“空域”变为“频率”，再根据不同页面的频率范围，设定一段频率值，借助计算机将双面打印的碎片进行分类，分离出在同一页面的碎片，以此降低碎片拼接复原的难度.

快速傅里叶变换（FFT）是计算离散傅里叶变换（DFT）的快速算法.离散傅里叶变换运算量巨大，计算时间长，即运算时间很长.而快速傅里叶变换的提出将傅里叶变换的复杂度由降到了，很大程度上减少了计算量.

令

，

，u=0，1，2，…，M-1.

则

，

5.3.2采用模型二拼接英文碎片的算法

借助Matlab软件将所有碎片分为两类，分类完成后就与问题二拼接英文碎片相同了，因此可采用模型二拼接因为碎片的方法将碎片一页一页地拼接完成.

六、误差分析

虽然我们建立了针对不同情况碎片拼接的模型，也得到了碎片的复原结果，但是模型是建立在理想的假设基础之上的，实际上碎片不全是非常清晰的，也有不明朗的模糊灰色区域，特别是在碎片的边缘处，在对这些区域计算相似度时会由于阀值的不稳定性产生一些误差，可能导致图像拼接时出现错误拼接现象.除此之外，在问题二、三中采用聚类分析法对碎片分类时，可能得到的结果与主成分分析的结果有一定差异，就会导致分类时有些行的碎片会有多余的情况出现，从而无法完整拼接复原图片，所以实际与理论之间总会存在一定的误差，这是难以避免的.

七、模型的优缺点讨论

7.1模型的优点

通过对模型的分析，验证了模型的可靠性，模型过程清晰明了，并且可用Matlab软件快速求解，为此类碎片的拼接复原提供了方便可行的设计方法，具有重要的实际意义和较高的应用价值.

模型一研究的是对纵切碎片的拼接复原，该模型简单方便，误差小，在没有异常情况下，无需人工干预，并且拼接效果优良.自定义的相似度算法简单可

展开阅读全文