龙源期刊网 http://www.qikan.com.cn
基于视觉词袋模型的图像匹配方法研究与实现
作者:盛虎
来源:《电子技术与软件工程》2015年第21期
摘 要 针对基于图像特征的图像匹配方法容易出现语义鸿沟,为此本文将视觉词袋模型应用到图像匹配中。在视觉词袋模型中,本文使用SIFT特征,并对SIFT特征聚类后生成视觉词汇;在此基础上,对图像库进行比对、统计、归一化处理等,形成频率直方图训练库;再通过构建待匹配图像的频率直方图,在训练库中进行搜索,匹配出相似的图像。为了解决匹配算法的速度较慢的问题,本文采用k近邻搜索的思想,将k-d树结构应用到匹配程序中,为频率直方图训练库构建索引。最后通过实验表明,本文算法具有较好的匹配效果和较高的匹配效率。 【关键词】基于内容的图像检索 视觉词袋模型 SIFT特征 K-D树 1 引言
本文借助视觉词袋模型中使用的底层特征是SIFT算法提取得到的图像的Sift特征,并且以XML格式存于文本文件中;视觉词典是通过K-Means聚类算法对所提取的大量Sift特征进行聚类处理得到的,其中视觉词汇的数量为K;得到基础视觉词汇,就可以对图像库中的每一幅图像进行比对、统计和归一化处理分析,为每一幅图构建词汇分布频率直方图,即视觉词汇特征;最后,本文采用最邻近搜索的思想,以k-d树的结构对生成的视觉词汇特征库构建索引,用以提高图像匹配速度。 2 基于视觉词袋模型的图像匹配
视觉词袋模型是一种基于内容的图像匹配模型。如果将每一张图像都类比成是一个文档,将从图像中提取的每个特征都看作是文档中一个词汇,我们将其称为“视觉单词”,同样,这些单词之间也看作是相互独立,没有顺序和关联的,那么用视觉单词来描述每一幅图像,通过类似的方法,我们可以得到图像的低维向量表示。这就是视觉词袋模型中的词袋。 3 图像底层特征提取
本文通过提取图像库的SIFT特征,并以XML格式存放于文本文档中,以供下一步聚类生成视觉词汇使用。SIFT特征提取算法主要包含如下步骤:构建尺度空间;尺度空间极值点的检测;准确找出极值点的位置,同时去除干扰点;分别为生成的关键点指定其方向参数;生成关键点描述子。下面分别简单介绍SIFT算法的各个提取步骤。 (1)构建尺度空间
相关推荐: