高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx

上传人:b****3 文档编号:18396248 上传时间:2022-12-16 格式:DOCX 页数:32 大小:1.53MB
下载 相关 举报
高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx_第1页
第1页 / 共32页
高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx_第2页
第2页 / 共32页
高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx_第3页
第3页 / 共32页
高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx_第4页
第4页 / 共32页
高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx_第5页
第5页 / 共32页
点击查看更多>>
下载资源
资源描述

高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx

《高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx(32页珍藏版)》请在冰豆网上搜索。

高教社杯全国大学生数学建模竞赛 B题论文Word下载.docx

最后,由于曼哈顿距离公式计算快、数值小,数值矩阵与数值矩阵之间应用最小曼哈顿距离对碎纸片进行拼接复原。

问题一中碎纸机破碎纸片只有纵切,每页纸被切为19条碎片,经过处理可以得到19个数值矩阵。

对于每个数值矩阵,我们依次取出最左边一列从上至下各格的值组成一个向量,同样我们依次取出最右边一列从上至下各格的值组成一个向量。

计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离,再将得到的距离值进行排序,当某个距离值最小时、说明相应的左边向量与右边向量的匹配率最大,则该距离对应的左、右边认为是可拼接的。

若得到的最小距离值不止一个,则此时需要进行人工干预。

问题二是对碎纸机既纵切又横切的情形进行讨论,比问题一多了横切条件,此时每页纸被切为209个碎片。

首先,我们利用文件最左边碎片与最上面碎片的特殊性对这209个碎片进行聚类,得到两类特殊的碎片,分别是文件最左边一列碎片和最上面一行碎片,然后类似于问题一的处理方法,应用最小曼哈顿距离对每一类碎片按正确顺序拼接,此后对其余碎片再应用最小曼哈顿距离逐一进行拼接,直至剩余所有的碎片都拼接上。

问题三中,题目要求考虑双面打印文件的碎纸拼接复原问题的解决方案,此时每页纸虽然也是被切为209个碎片,但每个碎片却有正反两面,因此经过处理得到418个数值矩阵,,此时我们分别对每一面各自进行类似问题一的处理,然后综合每一面的聚类情况再应用最小曼哈顿距离对双面碎纸片进行拼接复原。

三、模型假设

1.假设碎纸机破碎纸片(纵切或横切)得到的碎纸片是规则且边缘是整齐的等大的矩形;

2.假设我们对文档碎纸片拼接复原不考虑碎片边缘的尖点特征、尖角特征、面积特征等基于边界几何特征;

3.假设附件中给出的所有中、英文文件中的文字排版是按标准格式排版的。

4.假设附件中给出的所有中、英文字符都是统一格式,且内容为普通文章。

四、符号说明

序号

符号

符号说明

1

数值矩阵

2

的最左边列向量

3

的最右边列向量

4

曼哈顿距离

5

隶属函数中的阀值

五、模型建立与求解

5.1问题一(曼哈顿距离)

Ø

模型一的建立

题目要求对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)建立碎纸片拼接复原模型和算法,并且要对中、英文各一页文件的碎片数据分别进行拼接复原。

首先,我们利用数学软件MATLAB软件将19条碎片数据化,得到19个像素值矩阵,像素值的变化范围是从0变化到255,此时我们设置

为阈值对像素值矩阵进行二值化处理,当矩阵某位置像素值小于等于

时,则将对应位置的数值设为0;

当矩阵某位置像素值大于

时,则将对应位置的数值设为127。

这样我们就得到19个二值化了的数值矩阵

,对于每个数值矩阵

,我们依次取出最左边一列从上至下各格的值组成一个向量,记为

,同样的我们依次取出最右边一列从上至下各格的值组成一个向量,记为

计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离

模型一的求解

对于得到的向量

和向量

,两向量的曼哈顿距离为

可求出附件1碎片与碎片之间的曼哈顿距离,如下表所示。

表1附件1碎片与碎片间的曼哈顿距离

编号

6

7

8

9

10

11

12

13

14

15

16

17

18

距离

102

117

48

128

81

113

159

112

120

82

84

34

77

78

97

124

105

从而可得到附件1碎片序号按复原后顺序如下表所示。

表2附件1碎片序号复原后顺序

附件1碎片复原图片如附录中图8.1所示。

同法可求出附件2碎片与碎片之间的曼哈顿距离,如下表所示。

表3附件2碎片与碎片间的曼哈顿距离

96

65

71

67

87

54

75

133

107

93

52

90

从而可得到附件2碎片序号按复原后顺序如下表所示。

表4附件2碎片序号复原后顺序

附件2碎片复原图片如附录中图8.2所示。

问题一人工干预情况如下表所示。

表5问题一人工干预情况

人工干预

图像

干预时间

干预方式

干预次数

附件1图像

附件2图像

5.2问题二(Manhattan距离)

模型二的建立

在中文文件中,两个连续的汉字中间的空白间隔所占像素宽度与其左边或者右边的汉字所占像素宽度的比值最大的约为

,则对于每一行文字,碎纸机纵切未切到文字的概率为

,对于每两行文字碎纸机纵切未切到文字的概率为

,而对于每三行文字碎纸机纵切未切到文字的概率更小,可以忽略不计,所以对于总共209个碎片,每个碎片上面的文字至少有两行(碎片上不完整的一行也算一行),所以出现某个碎片上面的文字完全没被碎纸机切割到(即文字完整无缺)的概率至多为

,我们把这样的碎片称之为干扰碎片。

我们知道,整篇文件的最上面一行字的上边缘是空白的,我们可以利用此特殊性对209个碎纸片进行聚类,可以得到一个特殊的类,即碎纸片上边缘为空白的类,此类碎纸片个数大于等于11;

出现个数大于11的情形即为混入上面提到的干扰碎片,此概率最大不超过

,可知此类碎纸片应该拼接在文件最上面一行,应用最小曼哈顿距离对此类碎片按正确顺序拼接。

同理可聚类出另一个特殊的类,即碎纸片左边缘为空白、拼接在文件最左边一列的类,并且也应用最小曼哈顿距离对此类碎片按正确顺序拼接。

然后以此拼接好的第一行和第一列碎片为基准,再应用最小曼哈顿距离拼接其余剩下的碎片,最后拼接复原出原中文文件。

在英文文件中,一个英文单词中两个连续的英文字母中间的空白间隔所占像素宽度与其左边或者右边的英文字母所占像素宽度的比值最大的约为

,则对于每一行英文单词,碎纸机纵切未切到英文单词的概率为

,对于每两行英文单词碎纸机纵切未切到英文单词的概率为

,而对于每三行英文单词碎纸机纵切未切到英文单词的概率为

,然后同上述中文文件的分析过程可知,此时对拼接在文件最左边一列归类时混入上面提到的干扰碎片的概率最大不超过

,最后拼接复原出原英文文件。

模型二的求解

我们利用SPSS软件根据每个碎片顶部空白高度或者文字高度的不同,应用聚类分析方法将碎片聚成11类,结果如下图所示。

图1根据碎片顶部文字高度聚类

图2根据碎片顶部空白高度聚类

结合上面的聚类图,可得出附件3的乱序矩阵,如下表所示。

表6附件3的乱序矩阵

49

22

129

178

118

143

188

192

57

141

91

190

28

186

95

61

79

116

72

20

69

163

177

36

99

19

63

162

131

168

179

30

23

142

191

147

62

76

86

195

26

100

41

50

38

167

74

46

103

148

88

35

24

193

161

189

25

130

122

205

27

200

60

85

33

156

170

198

132

202

152

83

165

80

115

199

176

160

73

31

51

203

169

135

39

134

94

58

149

42

144

136

164

47

127

121

183

43

125

187

173

139

66

150

197

182

106

181

145

109

21

110

184

157

204

29

104

172

55

171

98

37

206

59

92

201

64

44

180

111

32

56

175

153

166

196

137

45

208

174

68

158

138

53

70

126

89

151

114

140

207

155

101

146

194

119

40

123

108

154

185

同样的方法可得出附件4的乱序矩阵,如下表所示。

表7附件4的乱序矩阵

然后我们先求出附件3碎片与碎片之间的曼哈顿距离,从而得到附件3碎片序号按复原后顺序如下表所示。

表8附件3碎片序号复原后顺序

附件3碎片复原图片如附录中图8.3所示。

同法我们再求出附件4碎片与碎片之间的曼哈顿距离,从而得到附件4碎片序号按复原后顺序如下表所示。

表9附件4碎片序号复原后顺序

附件4碎片复原图片如附录中图8.4所示。

问题二人工干预情况如下表所示。

表10问题二人工干预情况

附件3图像

初始化最左边一列纸片需要人工排序

图像的最左边一列排序出错的地方进行调整

初次拼接结束后一小部分位置在水平方向出错

在程序运行初始化中强制将出错的一个图像安排在水平方向的正确位置

附件4图像

初次拼接结束后小部分位置在水平方向出错

在程序运行初始化中强制将出错的一个图像安排在水平方向正确位置

5.3问题三(曼哈顿距离)

模型三的建立

问题三在问题二的基础上继续加大碎片拼接复原难度,此时我们对双面碎纸片进行类似问题一的处理,得到418个数值矩阵,我们根据每个碎片顶部的空白高度或者文字高度对碎片进行区间分类,得到22组矩阵,再根据曼哈顿距离将得到的22组矩阵聚成两类,每类各包含某一面的11组矩阵,然后综合每一面的聚类情况再应用最小曼哈顿距离对双面碎纸片进行拼接复原。

然后再利用曼哈顿距离对碎纸片在竖直方向上进行聚合得到最终图像。

模型三的求解

问题三的解决方法与问题二的类似,不过我们分两步进行聚类分析。

第一步,我们根据每个碎片顶部空白高度的不同进行聚类,第二步,我们根据每个碎片底部空白高度的不同进行聚类。

然后我们选取第一、二步聚类产生的公共类,若得到的公共类数量小于22类,则再从单独由第一步聚类产生的类中选取,直到数量达到22类。

对于这22类碎纸片,我们再利用问题二的方法聚成两组,每组数量都为11类。

后面类似模型二的处理过程,结果顺序如下表所示。

表11附件5某一面碎纸的初次拼接位置

078b

153a

036a

157a

030a

058a

025b

179a

166b

061b

165b

043a

096b

051b

194b

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1