(四)图片的整体拼接
上一步骤中我们得到了11×19的碎纸片拼接而成的11个等大小的纸片,那么接 下来,根据行偏差函数,判断11个纸片的上下拼接顺序,可以得到以下编号的图片可以上下拼接:
? 308
?169 39
?1595
?5062
完成以上组合的拼接后,进行人工干预,完成图片的整体拼接,结果如下(复原图片详见附录九):
表9 附件3拼接顺序
049 054 065 143 186 002 057 192 178 118 190 095 011 022 129 028 091 188 141 061 019 078 067 069 099 162 096 131 079 063 116 163 072 006 177 020 052 036 168 100 076 062 142 030 041 023 147 191 050 179 120 086 195 026 000 087 018 038 148 046 161 024 035 081 189 122 103 130 193 088 167 025 008 009 105 074 014 128 003 159 082 199 135 012 073 160 203 169 134 039 031 051 107 115 176 094 034 084 183 090 047 121 042 124 144 077 112 149 097 136 164 127 058 043 125 013 182 109 197 016 184 110 187 066 106 150 021 173 157 181 204 139 145 029 064 111 201 005 092 180 048 037 075 055 044 206 010 104 098 172 171 059 007 208 138 158 126 068 175 045 174 001 137 053 056 093 153 070 166 032 196 071 156 083 132 200 017 080 033 202 198 015 133 170 205 085 152 165 027 060 089 146 102 154 114 040 151 207 155 140 185 108 117 004 101 113 194 119 123 对于附件4,我们按照与处理附件3相同的模型和算法进行处理,得到拼接结果表格如下,(复原图片详见附录十):
表10 附件4拼接顺序 191 075 011 154 190 184 002 104 180 064 106 004 149 032 204 065 039 067 147 201 148 170 196 198 094 113 164 078 103 091 080 101 026 100 006 017 028 146 086 051 107 029 040 158 186 098 024 117 150 005 059 058 092 030 037 046 127 019 194 093 141 088 121 126 105 155 114 176 182 151 022 057 202 071 165 082 159 139 001 129 063 138 153 053 038 123 120 175 085 050 160 187 097 203 031 020 041 108 116 136 073 036 207 135 015 076 043 199 045 173 079 161 179 143 208 021 007 049 061 119 033 142 168 062 169 054 192 133 118 189 162 197 112 070 084 060 014 068 174 137 195 008 047 172 156 096 023 099 122 090 185 109 132 181 095 069 167 163 166 188 111 144 206 003 130 034 013 110 025 027 178 171 042 066 205 010 157 074 145 083 134 055 018 056 035 016 009 183 152 044 081 077 128 200 131 052 125 140 193 087 089 048 072 012 177 124 000 102 115 5.3问题三的模型建立与算法
对于第三个问题,图片的数量成倍的增长,我们不能单纯的利用图片边缘的特征进行拼接与复原,在问题二按上边缘裁截距进行聚类分析的基础上,增加图片下边缘裁截
11
距,综合进行聚类分析。具体流程图如下所示:
输入图片 将图片灰度处理 将灰度处理后的图片二值化处理 自上而下计算图片的裁接距与裁截空白间距(或裁截文字长度) N 高度是否相似? 标注备选 自下上计图片裁截与裁空白距 而算的距截间Y 运用问题二的方法进行匹配 N 匹配成功? 加入备选图片进行匹配 Y 备存 匹配成功,备存 完成组图 图8 算法流程图
5.3.1图片的初次聚类
运用问题二的聚类方法,利用matlab进行数据处理(程序见附录十一),将所得结果导入excel,做出图片上边缘的裁截文字长度(或者裁截空白长度)的分布图
12
604020裁截文字的长度0-20-40-60-80-100-120图片图9 附件5图片的裁截文字长度分布图
1265176101126151176201226251276301326351376401系列1
用spss进行快速聚类分析,可以看出能将一部分图片进行准确的分类,利用模型一的方法对分类后的图片进行边缘匹配,得到类似于下图的片段图像。
图10 匹配正确的片段图
5.3.2图片的再聚类
由于图片的双面性,我们在对其正面(反面)进行正确匹配之后,则其反面(正面)也就确定出来,这大大减少了数据量。但某些分类后却拼接失败的情况,使得拼接更加的困难。
在第二个问题中,我们利用图片从上到下文字的特征增加了信息量,为了更好进行图片匹配与拼接,对于问题三,我们再次增加图片从下到上的文字特征。在图片初次聚类的前提下,利用从下到上的裁截距,按照与问题二类似的办法进行第二次聚类,步骤同上,得到图片的裁截文字长度的分布直方图:
13
604020裁截文字长度0-20-40-60-80-100图片图11 图片裁截文字长度的分布直方图
1285582109136163190217244271298325352379406系列1
5.3.3图片的拼接
根据前两次图片的聚类之后,我们在对其进行分类,将分类后的图片进行边缘匹配,同时进行人工干预,挑选出匹配正确的片段,如下图所示:
图12 匹配正确的片段
对每一类图片匹配成功后,类似于问题二,利用计算机自动拼接与人工干预相结合,将所有各类进行整体拼接,结果如下:(复原图片见附录12)
14
表13 附件5其中一面的拼接顺序
表14 附件5另一面的拼接顺序
六、模型的评价与改进
6.1模型的优点
(1) 模型一对于解决纵切碎纸片的问题上,达到了很好的效果,对于所得的结果正确
率也是100%的,对于解决此类问题提供了良好的思想。
(2) 模型二充分考虑了碎纸片边缘的匹配问题以及文字内部的特征信息,对于既纵切
又横切的情形,先进行了聚类将图片进行了分组,大大减少了工作量,而且增加了准确度。 6.2 模型的缺点
(1) 对于问题一与问题二,所给的完整图片里面含有大量的的文字,所以我们可以利
用其文字特征,该结果也存在一定的偶然性。
(2) 对于问题三,对于大信息量的图片信息,只利用问题二的解决办法只能将部分的
图片进行分类,而不能单纯用计算机进行完整的拼接。
15
相关推荐: