(四)图片的整体拼接
上一步骤中我们得到了11×19的碎纸片拼接而成的11个等大小的纸片,那么接 下来,根据行偏差函数,判断11个纸片的上下拼接顺序,可以得到以下编号的图片可以上下拼接:
? 308
?169 39
?1595
?5062
完成以上组合的拼接后,进行人工干预,完成图片的整体拼接,结果如下(复原图片详见附录九):
表9 附件3拼接顺序
对于附件4,我们按照与处理附件3相同的模型和算法进行处理,得到拼接结果表格如下,(复原图片详见附录十):
表10 附件4拼接顺序问题三的模型建立与算法
对于第三个问题,图片的数量成倍的增长,我们不能单纯的利用图片边缘的特征进行拼接与复原,在问题二按上边缘裁截距进行聚类分析的基础上,增加图片下边缘裁截
11
距,综合进行聚类分析。具体流程图如下所示:
输入图片 将图片灰度处理 将灰度处理后的图片二值化处理 自上而下计算图片的裁接距与裁截空白间距(或裁截文字长度) N 高度是否相似? 标注备选 自下上计图片裁截与裁空白距 而算的距截间Y 运用问题二的方法进行匹配 N 匹配成功? 加入备选图片进行匹配 Y 备存 匹配成功,备存 完成组图 图8 算法流程图
5.3.1图片的初次聚类
运用问题二的聚类方法,利用matlab进行数据处理(程序见附录十一),将所得结果导入excel,做出图片上边缘的裁截文字长度(或者裁截空白长度)的分布图
12
604020裁截文字的长度0-20-40-60-80-100-120图片图9 附件5图片的裁截文字长度分布图
1265176101126151176201226251276301326351376401系列1
用spss进行快速聚类分析,可以看出能将一部分图片进行准确的分类,利用模型一的方法对分类后的图片进行边缘匹配,得到类似于下图的片段图像。
图10 匹配正确的片段图
5.3.2图片的再聚类
由于图片的双面性,我们在对其正面(反面)进行正确匹配之后,则其反面(正面)也就确定出来,这大大减少了数据量。但某些分类后却拼接失败的情况,使得拼接更加的困难。
在第二个问题中,我们利用图片从上到下文字的特征增加了信息量,为了更好进行图片匹配与拼接,对于问题三,我们再次增加图片从下到上的文字特征。在图片初次聚类的前提下,利用从下到上的裁截距,按照与问题二类似的办法进行第二次聚类,步骤同上,得到图片的裁截文字长度的分布直方图:
13
604020裁截文字长度0-20-40-60-80-100图片图11 图片裁截文字长度的分布直方图
1285582109136163190217244271298325352379406系列1
5.3.3图片的拼接
根据前两次图片的聚类之后,我们在对其进行分类,将分类后的图片进行边缘匹配,同时进行人工干预,挑选出匹配正确的片段,如下图所示:
图12 匹配正确的片段
对每一类图片匹配成功后,类似于问题二,利用计算机自动拼接与人工干预相结合,将所有各类进行整体拼接,结果如下:(复原图片见附录12)
14
表13 附件5其中一面的拼接顺序
表14 附件5另一面的拼接顺序
六、模型的评价与改进
6.1模型的优点
(1) 模型一对于解决纵切碎纸片的问题上,达到了很好的效果,对于所得的结果正确
率也是100%的,对于解决此类问题提供了良好的思想。
(2) 模型二充分考虑了碎纸片边缘的匹配问题以及文字内部的特征信息,对于既纵切
又横切的情形,先进行了聚类将图片进行了分组,大大减少了工作量,而且增加了准确度。 6.2 模型的缺点
(1) 对于问题一与问题二,所给的完整图片里面含有大量的的文字,所以我们可以利
用其文字特征,该结果也存在一定的偶然性。
(2) 对于问题三,对于大信息量的图片信息,只利用问题二的解决办法只能将部分的
图片进行分类,而不能单纯用计算机进行完整的拼接。
15
相关推荐: