ImageVerifierCode 换一换
格式:DOCX , 页数:37 ,大小:1.53MB ,
资源ID:21613485      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/21613485.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(碎纸片的拼接复原高教社杯全国大学生数学建模竞赛B题论文Word文件下载.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

碎纸片的拼接复原高教社杯全国大学生数学建模竞赛B题论文Word文件下载.docx

1、最后,由于曼哈顿距离公式计算快、数值小,数值矩阵与数值矩阵之间应用最小曼哈顿距离对碎纸片进行拼接复原。 问题一中碎纸机破碎纸片只有纵切,每页纸被切为19条碎片,经过处理可以得到19个数值矩阵。对于每个数值矩阵,我们依次取出最左边一列从上至下各格的值组成一个向量,同样我们依次取出最右边一列从上至下各格的值组成一个向量。计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离,再将得到的距离值进行排序,当某个距离值最小时、说明相应的左边向量与右边向量的匹配率最大,则该距离对应的左、右边认为是可拼接的。若得到的最小距离值不止一个,则此时需要进行人工干预。问题二是对碎纸机既纵切又横切的情

2、形进行讨论,比问题一多了横切条件,此时每页纸被切为209个碎片。首先,我们利用文件最左边碎片与最上面碎片的特殊性对这209个碎片进行聚类,得到两类特殊的碎片,分别是文件最左边一列碎片和最上面一行碎片,然后类似于问题一的处理方法,应用最小曼哈顿距离对每一类碎片按正确顺序拼接,此后对其余碎片再应用最小曼哈顿距离逐一进行拼接,直至剩余所有的碎片都拼接上。问题三中,题目要求考虑双面打印文件的碎纸拼接复原问题的解决方案,此时每页纸虽然也是被切为209个碎片,但每个碎片却有正反两面,因此经过处理得到418个数值矩阵,此时我们分别对每一面各自进行类似问题一的处理,然后综合每一面的聚类情况再应用最小曼哈顿距离

3、对双面碎纸片进行拼接复原。三、模型假设1. 假设碎纸机破碎纸片(纵切或横切)得到的碎纸片是规则且边缘是整齐的等大的矩形;2.假设我们对文档碎纸片拼接复原不考虑碎片边缘的尖点特征、尖角特征、面积特征等基于边界几何特征;3.假设附件中给出的所有中、英文文件中的文字排版是按标准格式排版的。4.假设附件中给出的所有中、英文字符都是统一格式,且内容为普通文章。四、符号说明序号符号符号说明1数值矩阵2的最左边列向量3的最右边列向量4曼哈顿距离5隶属函数中的阀值五、模型建立与求解5.1 问题一(曼哈顿距离)模型一的建立题目要求对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)建立碎纸片拼接复原模型和

4、算法,并且要对中、英文各一页文件的碎片数据分别进行拼接复原。首先,我们利用数学软件MATLAB软件将19条碎片数据化,得到19个像素值矩阵,像素值的变化范围是从0变化到255,此时我们设置为阈值对像素值矩阵进行二值化处理,当矩阵某位置像素值小于等于时,则将对应位置的数值设为0;当矩阵某位置像素值大于时,则将对应位置的数值设为127。这样我们就得到19个二值化了的数值矩阵,对于每个数值矩阵,我们依次取出最左边一列从上至下各格的值组成一个向量,记为,同样的我们依次取出最右边一列从上至下各格的值组成一个向量,记为。计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离模型一的求解对于

5、得到的向量和向量,两向量的曼哈顿距离为可求出附件1碎片与碎片之间的曼哈顿距离,如下表所示。 表1 附件1碎片与碎片间的曼哈顿距离编号6789101112131415161718距离1021174812881113159112120828434777897124105从而可得到附件1碎片序号按复原后顺序如下表所示。表2 附件1碎片序号复原后顺序附件1碎片复原图片如附录中图8.1所示。同法可求出附件2碎片与碎片之间的曼哈顿距离,如下表所示。表3 附件2碎片与碎片间的曼哈顿距离96657167875475133107935290从而可得到附件2碎片序号按复原后顺序如下表所示。表4 附件2碎片序号复原

6、后顺序附件2碎片复原图片如附录中图8.2所示。问题一人工干预情况如下表所示。 表5 问题一人工干预情况 人工干预图像干预时间干预方式干预次数附件1图像无附件2图像5.2 问题二(Manhattan距离)模型二的建立在中文文件中,两个连续的汉字中间的空白间隔所占像素宽度与其左边或者右边的汉字所占像素宽度的比值最大的约为,则对于每一行文字,碎纸机纵切未切到文字的概率为,对于每两行文字碎纸机纵切未切到文字的概率为,而对于每三行文字碎纸机纵切未切到文字的概率更小,可以忽略不计,所以对于总共209个碎片,每个碎片上面的文字至少有两行(碎片上不完整的一行也算一行),所以出现某个碎片上面的文字完全没被碎纸机

7、切割到(即文字完整无缺)的概率至多为,我们把这样的碎片称之为干扰碎片。我们知道,整篇文件的最上面一行字的上边缘是空白的,我们可以利用此特殊性对209个碎纸片进行聚类,可以得到一个特殊的类,即碎纸片上边缘为空白的类,此类碎纸片个数大于等于11;出现个数大于11的情形即为混入上面提到的干扰碎片,此概率最大不超过,可知此类碎纸片应该拼接在文件最上面一行,应用最小曼哈顿距离对此类碎片按正确顺序拼接。同理可聚类出另一个特殊的类,即碎纸片左边缘为空白、拼接在文件最左边一列的类,并且也应用最小曼哈顿距离对此类碎片按正确顺序拼接。然后以此拼接好的第一行和第一列碎片为基准,再应用最小曼哈顿距离拼接其余剩下的碎片

8、,最后拼接复原出原中文文件。在英文文件中,一个英文单词中两个连续的英文字母中间的空白间隔所占像素宽度与其左边或者右边的英文字母所占像素宽度的比值最大的约为,则对于每一行英文单词,碎纸机纵切未切到英文单词的概率为,对于每两行英文单词碎纸机纵切未切到英文单词的概率为,而对于每三行英文单词碎纸机纵切未切到英文单词的概率为, 然后同上述中文文件的分析过程可知,此时对拼接在文件最左边一列归类时混入上面提到的干扰碎片的概率最大不超过,最后拼接复原出原英文文件。 模型二的求解我们利用SPSS软件根据每个碎片顶部空白高度或者文字高度的不同,应用聚类分析方法将碎片聚成11类,结果如下图所示。图1 根据碎片顶部文

9、字高度聚类图2 根据碎片顶部空白高度聚类结合上面的聚类图,可得出附件3的乱序矩阵,如下表所示。表6 附件3的乱序矩阵49221291781181431881925714191190281869561791167220691631773699196316213116817930231421911476276861952610041503816774461031488835241931611892513012220527200608533156170198132202152831658011519917616073315120316913539134945814942144136164471271

10、2118343125187173139661501971821061811451092111018415720429104172551719837206599220164441801113256175153166196137452081746815813853701268915111414020715510114619411940123108154185同样的方法可得出附件4的乱序矩阵,如下表所示。表7 附件4的乱序矩阵然后我们先求出附件3碎片与碎片之间的曼哈顿距离,从而得到附件3碎片序号按复原后顺序如下表所示。表8 附件3碎片序号复原后顺序附件3碎片复原图片如附录中图8.3所示。同法我们再求

11、出附件4碎片与碎片之间的曼哈顿距离,从而得到附件4碎片序号按复原后顺序如下表所示。 表9 附件4碎片序号复原后顺序附件4碎片复原图片如附录中图8.4所示。问题二人工干预情况如下表所示。表10 问题二人工干预情况附件3图像初始化最左边一列纸片需要人工排序图像的最左边一列排序出错的地方进行调整初次拼接结束后一小部分位置在水平方向出错在程序运行初始化中强制将出错的一个图像安排在水平方向的正确位置附件4图像初次拼接结束后小部分位置在水平方向出错在程序运行初始化中强制将出错的一个图像安排在水平方向正确位置5.3 问题三(曼哈顿距离)模型三的建立问题三在问题二的基础上继续加大碎片拼接复原难度,此时我们对双

12、面碎纸片进行类似问题一的处理,得到418个数值矩阵,我们根据每个碎片顶部的空白高度或者文字高度对碎片进行区间分类,得到22组矩阵,再根据曼哈顿距离将得到的22组矩阵聚成两类,每类各包含某一面的11组矩阵,然后综合每一面的聚类情况再应用最小曼哈顿距离对双面碎纸片进行拼接复原。然后再利用曼哈顿距离对碎纸片在竖直方向上进行聚合得到最终图像。模型三的求解问题三的解决方法与问题二的类似,不过我们分两步进行聚类分析。第一步,我们根据每个碎片顶部空白高度的不同进行聚类,第二步,我们根据每个碎片底部空白高度的不同进行聚类。然后我们选取第一、二步聚类产生的公共类,若得到的公共类数量小于22类,则再从单独由第一步聚类产生的类中选取,直到数量达到22类。对于这22类碎纸片,我们再利用问题二的方法聚成两组,每组数量都为11类。后面类似模型二的处理过程,结果顺序如下表所示。表11 附件5某一面碎纸的初次拼接位置078b153a036a157a030a058a025b179a166b061b165b043a096b051b

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1