自碎纸片的拼接复原数学建模.docx

资源描述

自碎纸片的拼接复原数学建模.docx

《自碎纸片的拼接复原数学建模.docx》由会员分享，可在线阅读，更多相关《自碎纸片的拼接复原数学建模.docx（12页珍藏版）》请在冰豆网上搜索。

自碎纸片的拼接复原数学建模.docx

自碎纸片的拼接复原数学建模

Ｂ题碎纸片的拼接复原

摘要

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

而对于本题目而言，依照传统的手工方式解决碎纸片的复原问题,效率低下，无非是对人力资源的极大浪费。

本组成员运用计算机，对碎纸片的复原采取全新的方式，大大提高了文件复原的效率。

针对问题一,我们利用位图图像的数字化将所给文件碎片转换为对应的像素矩阵,然后通过对碎片边缘像素的比较，得到相应的边缘匹配关系,利用ｍatlaｂ将图片复原。

针对问题二,由于碎片量的增加,为了提高边缘匹配的精准度,在问题一的基础上进行了优化,将像素矩阵转化为二值矩阵，通过使用问题一的方法，分别进行横、纵向匹配,得到文件碎片的排列顺序,利用ｍatｌａb将文件还原。

针对问题三,加入碎片的正反面因素使得数据的处理量加大,但考虑到到文件任意一面复原后，另一面将会自动复原，因此，延续第二问的做法，对本问进行适当的人工干预处理,得到正反两面碎片的排列顺序,最终将文件进行复原。

关键字：

像素矩阵　二值矩阵　mａtlab像素匹配

一、问题重述

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。

特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。

随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

请讨论以下问题：

1.对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切）,建立碎纸片拼接复原模型和算法,并针对附件１、附件２给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

（附件1、附件2为纵切碎片数据，每页纸被切为19条碎片。

）

2.对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件３、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

（附件3、附件4为纵横切碎片数据，每页纸被切为11×１９个碎片。

）

3.上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果。

（附件5为纵横切碎片数据，每页纸被切为11×19个碎片，每个碎片有正反两面。

）

ﻬ

二、模型假设

1、每个问题中，每张碎纸片均为大小相等,形状相同的矩形碎片。

2、碎纸机破碎纸片后,没有纸张的损耗，碎片拼接后复原为碎纸机处理前的纸张。

3、处理的图像均为位图，同一问题中的图片像素相同。

4、像素矩阵转化为二值矩阵时，像素值大于1２7.５取为１,反之,取为0。

三、符号说明

四、模型的建立

问题一：

对于纵切的的文字文件，所需要考虑的只是横向的拼接问题，而问题的关键所在就是纵向的切口的匹配问题。

对于匹配问题的研究，本文涉及到了将图片转化为像素矩阵，首先进行左右边缘矩阵的提取，通过ｍatlａb对左右矩阵边缘列向量进行匹配,即对边缘像素进行匹配。

通过匹配得到1９条文件碎片的排列顺序,将其放入ｅxｃｅl表格中，并使用mａtlａb进行文件的复原。

模型建立:

首先，imread语句进行图像的读取,即将图片转化为像素矩阵Aｉｊ，形成的矩阵规格为１980＊72。

其次，使用matlab语句读取１-19张图片左侧的边缘像素，即第1列元素，将取得的列放在一个新的矩阵lｉj中,称此矩阵为左侧边缘像素矩阵，形成矩阵规格为198０＊19;用同样的方法读取１－19张图片右侧的边缘像素，即第72列元素,将取得的列放在一个新的矩阵Rij中，称此矩阵为右侧边缘像素矩阵,形成的矩阵规格为1９80*１９。

通过人工干预，对19张图片进行分析，很容易得出排列在第一位和最后一位的碎纸片，即第九张碎片为首,第七张碎片为尾。

然后运用程序将首位图片（即第九张碎纸片）的右侧列像素的每个元素分别跟剩余图片的左侧对应列像素的每个元素作差,取差值的绝对值e作为考察指标。

当e＜d（ｄ为指标标准，因文字不同而取不同值）时认为对应像素匹配，当e＞d时认为对应像素不匹配。

两列像素逐个比较完后，统计e>d的像素对的个数s，若s大于给定的误差允许量p,则认为这两个边缘不匹配,若s小于给定的误差允许量ｐ，则认为这两个边缘匹配,这是通过限制s的数量来精确边缘的匹配程度。

这样可以首先找到第九张碎纸片右侧所匹配的纸片，接着依照同样的方法向右侧进行，最终可以得到碎纸片所对应的位置，从而复原图片。

模型求解：

根据模型，运用matlaｂ程序,求解得复原结果如下:

附件1的复原顺序表:

９

1３

１1

１7

1９

８

附件1的复原结果图：

附件2的复原顺序表:

８

1１

１７

附件2的复原结果图：

问题二：

模型建立：

对于问题二，我们在问题一解法的基础上进行了优化，将图片变为像素矩阵的方法与解法一相同,然而在问题二中我们进一步把像素矩阵转化成为二值矩阵，通过运用ｍatab中的im２ｂｗ（）函数进行转化，取阈值为0.5，其中像素值大于127.5的像素值取值为1,小于１27.５的像素值取值为0。

这样原来的图像就转化为只包含０、１序列的二值矩阵。

之后运用与问题一中边缘像素值作差比较类似的方法，来确定左右图间的匹配关系。

与问题一不同的是，问题二中人为很难找出边缘图像,而且既有横切又有纵切，为问题的解决带来了一定难度。

所以本文采用先横向匹配,再纵向匹配的策略：

在问题一中方法的基础上,除了取每张图片的左右边缘像素外，还取到了每张图片上边缘像素和下边缘像素，形成矩阵Tｉj和Ｂij，且规格均为１80*７2。

完成数据读取后,进行匹配比较，首先按顺序取一张图片进行左右匹配，由于转化成为二值矩阵，指标e的取值只有0或1,所以很容易确定d的值为1,避免了反复比较确定d的过程。

用此方法确定每行的复原顺序，然后再取完整排列行中上下易匹配的图片进行相同的上下边缘匹配。

对于程序匹配不理想的碎纸片，进行人为干预，从而得到完整的复原顺序。

之后，用mａtｌab进行图像的还原。

模型求解:

通过上面的法对问题进行求解得附件3的复原顺序如下表:

5０

1４4

1８７

193

1７9

11９

1９1

9６

130

1８9

１42

６2

2０

7９

7０

１00

1６３

13２

8０

６４

117

164

178

５3

16９

101

14３

１48

１92

5１

1８0

121

196

２7

２

３9

14９

16２

2５

３6

190

1２３

１04

131

１94

８9

1６8

10６

7５

７2

１57

1３３

201

20３

19９

１６

１34

17１

20６

８6

153

166

２8

６１

1５

129

160

200

136

７4

１６1

20４

１70

135

5２

１08

116

１77

18４

1２2

４３

125

１45

113

150

９8

１37

165

128

１26

１４

183

110

198

１7

1８5

111

188

10７

151

174

15８

１82

2０5

140

14６

３０

６5

112

202

181

3８

4５

207

１05

173

17２

６０

20９

１３９

15９

127

176

4６

1７5

138

1５4

７1

167

197

9０

１47

103

1５5

11５

4１

152

208

156

１41

186

10９

1１8

10２

114

195

12０

1２4

附件4的复原顺序如下表:

192

7６

１2

155

191

1８5

１05

181

107

150

205

６6

6８

１48

２02

1４９

171

１９７

199

１14

165

1０4

9２

８1

102

１0１

７

２9

14７

８7

５2

１08

159

１8７

9９

1１8

１５1

５９

9３

128

１9５

142

8９

12２

12７

１０6

１5６

115

1７7

183

１52

２３

2０3

16６

16０

1４0

1３0

６４

1３9

154

５4

1２4

121

1７６

5１

１61

18８

９８

２0４

2１

109

11７

１3７

208

136

１6

200

１74

1６2

180

144

2０9

８

12０

3４

143

16９

１70

193

1３４

１19

190

１63

198

１13

７1

８５

６９

1７5

138

1９6

173

157

100

123

18６

110

１33

182

９6

１６8

１６4

167

189

１12

1４5

207

１31

3５

111

１７9

172

4３

6７

206

１１

１58

１46

８4

13５

５７

１８4

１５3

８2

7８

1２9

201

132

５3

126

141

194

9０

4９

1３

17８

１25

103

11６

附件3复原结果图如下图:

ﻬ附件４复原结果图如下图:

ﻬ问题三:

模型建立：

对于问题三，虽然加入了正反两面的因素,依然可以延续解决问题二所应用的计算方式对问题三进行分析。

考虑到当其中一面进行完整的复原后,另外的一面会相应的复原，本文对此问题只进行一面的计算分析。

二值矩阵的使用和匹配方式依然不进行改变，但是由于数据的大量增加,会导致匹配过程中的对应图像居多或者没有,使得计算机匹配结果出现较多差错，由于没有更好的方法加以解决，本文此时进行了较多的人为干预,通过对语言的认知进行人工匹配，最终得到完整的碎片排列顺序,并使用matｌab进行原文件的复原工作。

模型求解：

附件５的第一面复原顺序如下表：

附件5的第二面复原顺序如下表：

ﻬ附件5的第一面复原结果图如下图:

附件５的第二面复原结果图如下图:

五、模型的优缺点

优点：

1、运用ｍatｌab软件进行破碎文件还原，解决了人工还原耗时长，效率低的问题。

大大的提高了还原的效率。

2、可操作性强，面向问题范围广，对于不同的文件均可进行还原操作。

3、

缺点:

1、不能独立完成所有的文件复原工作，对于个别匹配程度低的文件碎片需要人工进行干预。

2、只适用于规则切碎的文件修复,无法解决不规则破碎的文件修复工作。

3、

六、模型的优化

七、参考文献

１姜启源谢金星叶俊编《数学模型》第四版　出版地：

北京市高等教育出版社　出版日期:

201１年1月I

2　张强王正林编《精通MATLAB图像处理》第2版出版地:

北京市海淀区电子工业出版社出版日期:

2012年4月

3王薇编《ＭＡＴＬＡB从基础到精通》第一版　出版地：

北京市海淀区　电子工业出版社出版日期：

201２年5月　

八、附录

展开阅读全文

自碎纸片的拼接复原 数学建模.docx

自碎纸片的拼接复原数学建模.docx