自碎纸片的拼接复原 数学建模.docx

上传人:b****6 文档编号:4807372 上传时间:2022-12-09 格式:DOCX 页数:12 大小:506.62KB
下载 相关 举报
自碎纸片的拼接复原 数学建模.docx_第1页
第1页 / 共12页
自碎纸片的拼接复原 数学建模.docx_第2页
第2页 / 共12页
自碎纸片的拼接复原 数学建模.docx_第3页
第3页 / 共12页
自碎纸片的拼接复原 数学建模.docx_第4页
第4页 / 共12页
自碎纸片的拼接复原 数学建模.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

自碎纸片的拼接复原 数学建模.docx

《自碎纸片的拼接复原 数学建模.docx》由会员分享,可在线阅读,更多相关《自碎纸片的拼接复原 数学建模.docx(12页珍藏版)》请在冰豆网上搜索。

自碎纸片的拼接复原 数学建模.docx

自碎纸片的拼接复原数学建模

B题碎纸片的拼接复原

摘要

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

而对于本题目而言,依照传统的手工方式解决碎纸片的复原问题,效率低下,无非是对人力资源的极大浪费。

本组成员运用计算机,对碎纸片的复原采取全新的方式,大大提高了文件复原的效率。

针对问题一,我们利用位图图像的数字化将所给文件碎片转换为对应的像素矩阵,然后通过对碎片边缘像素的比较,得到相应的边缘匹配关系,利用matlab将图片复原。

针对问题二,由于碎片量的增加,为了提高边缘匹配的精准度,在问题一的基础上进行了优化,将像素矩阵转化为二值矩阵,通过使用问题一的方法,分别进行横、纵向匹配,得到文件碎片的排列顺序,利用matlab将文件还原。

针对问题三,加入碎片的正反面因素使得数据的处理量加大,但考虑到到文件任意一面复原后,另一面将会自动复原,因此,延续第二问的做法,对本问进行适当的人工干预处理,得到正反两面碎片的排列顺序,最终将文件进行复原。

关键字:

像素矩阵 二值矩阵 matlab像素匹配

一、问题重述

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

请讨论以下问题:

1.对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

(附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。

2.对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

(附件3、附件4为纵横切碎片数据,每页纸被切为11×19个碎片。

3.上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果。

(附件5为纵横切碎片数据,每页纸被切为11×19个碎片,每个碎片有正反两面。

二、模型假设

1、每个问题中,每张碎纸片均为大小相等,形状相同的矩形碎片。

2、碎纸机破碎纸片后,没有纸张的损耗,碎片拼接后复原为碎纸机处理前的纸张。

3、处理的图像均为位图,同一问题中的图片像素相同。

4、像素矩阵转化为二值矩阵时,像素值大于127.5取为1,反之,取为0。

三、符号说明

 

四、模型的建立

问题一:

对于纵切的的文字文件,所需要考虑的只是横向的拼接问题,而问题的关键所在就是纵向的切口的匹配问题。

对于匹配问题的研究,本文涉及到了将图片转化为像素矩阵,首先进行左右边缘矩阵的提取,通过matlab对左右矩阵边缘列向量进行匹配,即对边缘像素进行匹配。

通过匹配得到19条文件碎片的排列顺序,将其放入excel表格中,并使用matlab进行文件的复原。

模型建立:

首先,imread语句进行图像的读取,即将图片转化为像素矩阵Aij,形成的矩阵规格为1980*72。

其次,使用matlab语句读取1-19张图片左侧的边缘像素,即第1列元素,将取得的列放在一个新的矩阵lij中,称此矩阵为左侧边缘像素矩阵,形成矩阵规格为1980*19;用同样的方法读取1-19张图片右侧的边缘像素,即第72列元素,将取得的列放在一个新的矩阵Rij中,称此矩阵为右侧边缘像素矩阵,形成的矩阵规格为1980*19。

通过人工干预,对19张图片进行分析,很容易得出排列在第一位和最后一位的碎纸片,即第九张碎片为首,第七张碎片为尾。

然后运用程序将首位图片(即第九张碎纸片)的右侧列像素的每个元素分别跟剩余图片的左侧对应列像素的每个元素作差,取差值的绝对值e作为考察指标。

当e<d(d为指标标准,因文字不同而取不同值)时认为对应像素匹配,当e>d时认为对应像素不匹配。

两列像素逐个比较完后,统计e>d的像素对的个数s,若s大于给定的误差允许量p,则认为这两个边缘不匹配,若s小于给定的误差允许量p,则认为这两个边缘匹配,这是通过限制s的数量来精确边缘的匹配程度。

这样可以首先找到第九张碎纸片右侧所匹配的纸片,接着依照同样的方法向右侧进行,最终可以得到碎纸片所对应的位置,从而复原图片。

模型求解:

根据模型,运用matlab程序,求解得复原结果如下:

附件1的复原顺序表:

15

13

16

4

11

3

17

2

5

6

10

14

19

12

18

1

7

附件1的复原结果图:

附件2的复原顺序表:

4

7

3

16

19

12

1

6

2

10

14

11

9

13

15

18

17

5

附件2的复原结果图:

问题二:

模型建立:

对于问题二,我们在问题一解法的基础上进行了优化,将图片变为像素矩阵的方法与解法一相同,然而在问题二中我们进一步把像素矩阵转化成为二值矩阵,通过运用matab中的im2bw()函数进行转化,取阈值为0.5,其中像素值大于127.5的像素值取值为1,小于127.5的像素值取值为0。

这样原来的图像就转化为只包含0、1序列的二值矩阵。

之后运用与问题一中边缘像素值作差比较类似的方法,来确定左右图间的匹配关系。

与问题一不同的是,问题二中人为很难找出边缘图像,而且既有横切又有纵切,为问题的解决带来了一定难度。

所以本文采用先横向匹配,再纵向匹配的策略:

在问题一中方法的基础上,除了取每张图片的左右边缘像素外,还取到了每张图片上边缘像素和下边缘像素,形成矩阵Tij和Bij,且规格均为180*72。

完成数据读取后,进行匹配比较,首先按顺序取一张图片进行左右匹配,由于转化成为二值矩阵,指标e的取值只有0或1,所以很容易确定d的值为1,避免了反复比较确定d的过程。

用此方法确定每行的复原顺序,然后再取完整排列行中上下易匹配的图片进行相同的上下边缘匹配。

对于程序匹配不理想的碎纸片,进行人为干预,从而得到完整的复原顺序。

之后,用matlab进行图像的还原。

模型求解:

通过上面的法对问题进行求解得附件3的复原顺序如下表:

50

55

66

144

187

3

58

193

179

119

191

96

12

23

130

29

92

189

142

62

20

79

68

70

100

163

97

132

80

64

117

164

73

7

178

21

53

37

169

101

77

63

143

31

42

24

148

192

51

180

121

87

196

27

88

19

39

149

47

162

25

36

82

190

123

104

131

194

89

168

26

9

10

106

75

72

157

84

133

201

18

81

34

203

199

16

134

171

206

86

153

166

28

61

15

129

4

160

83

200

136

13

74

161

204

170

135

40

32

52

108

116

177

95

35

85

184

91

48

122

43

125

145

78

113

150

98

137

165

128

59

44

126

14

183

110

198

17

185

111

188

67

107

151

22

174

158

182

205

140

146

30

65

112

202

6

93

181

49

38

76

56

45

207

11

105

99

173

172

60

8

209

139

159

127

69

176

46

175

1

138

54

57

94

154

71

167

33

197

90

147

103

155

115

41

152

208

156

141

186

109

118

5

102

114

195

120

124

附件4的复原顺序如下表:

192

76

12

155

191

185

3

105

181

65

107

5

150

33

205

66

40

68

148

202

149

171

197

199

95

114

165

79

104

92

81

102

27

101

18

29

147

87

52

108

30

41

159

187

99

25

118

151

6

60

59

93

31

38

47

128

20

195

94

142

89

122

127

106

156

115

177

183

152

23

58

203

72

166

83

160

140

2

130

64

139

154

54

39

124

121

176

86

51

161

188

98

204

32

21

42

109

117

137

74

37

208

136

16

77

44

200

46

174

80

162

180

144

209

22

50

62

120

34

143

169

63

170

55

193

134

119

190

163

198

113

71

85

61

15

69

175

138

196

9

48

173

157

97

24

100

123

91

186

110

133

182

96

70

168

164

167

189

112

145

207

4

131

35

14

111

26

28

179

172

43

67

206

11

158

75

146

84

135

56

19

57

36

17

10

184

153

45

82

78

129

201

132

53

126

141

194

88

90

49

73

13

178

125

1

103

116

附件3复原结果图如下图:

ﻬ附件4复原结果图如下图:

ﻬ问题三:

模型建立:

对于问题三,虽然加入了正反两面的因素,依然可以延续解决问题二所应用的计算方式对问题三进行分析。

考虑到当其中一面进行完整的复原后,另外的一面会相应的复原,本文对此问题只进行一面的计算分析。

二值矩阵的使用和匹配方式依然不进行改变,但是由于数据的大量增加,会导致匹配过程中的对应图像居多或者没有,使得计算机匹配结果出现较多差错,由于没有更好的方法加以解决,本文此时进行了较多的人为干预,通过对语言的认知进行人工匹配,最终得到完整的碎片排列顺序,并使用matlab进行原文件的复原工作。

模型求解:

附件5的第一面复原顺序如下表:

附件5的第二面复原顺序如下表:

ﻬ附件5的第一面复原结果图如下图:

附件5的第二面复原结果图如下图:

五、模型的优缺点

优点:

1、运用matlab软件进行破碎文件还原,解决了人工还原耗时长,效率低的问题。

大大的提高了还原的效率。

2、可操作性强,面向问题范围广,对于不同的文件均可进行还原操作。

3、

缺点:

1、不能独立完成所有的文件复原工作,对于个别匹配程度低的文件碎片需要人工进行干预。

2、只适用于规则切碎的文件修复,无法解决不规则破碎的文件修复工作。

3、

六、模型的优化

 

七、参考文献

1姜启源谢金星叶俊编《数学模型》第四版 出版地:

北京市高等教育出版社 出版日期:

2011年1月I

2 张强王正林编《精通MATLAB图像处理》第2版出版地:

北京市海淀区电子工业出版社出版日期:

2012年4月

3王薇编《MATLAB从基础到精通》第一版 出版地:

北京市海淀区 电子工业出版社出版日期:

2012年5月 

 

八、附录

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1