武汉理工大学《通信工程应用技术综合训练与实习》报告
对于基于网格的运动表示,锚定帧中的图像被分成互不重叠的多边元素,每一个元素用几个节点和节点的连线表示,这样的元素称为网格。基于网格的运动估计一般要解决两类问题:
在锚定帧中给定一个网格,如何确定目标帧中的节点位置,这实质上是一个运动估计问题。
在锚定帧中如何建立网格,使得网格与物体的边界一致。
注意,每一个元素对应于单个物体的一小块光滑表面的网格比任意配置的网格(例如,正规网格)能得到更精确的估计。一个物体自适应的网格也将更适应于帧序列的运动跟踪。关于网格生成,主要方法有健壮估计器、直接估计和间接估计。这里就不详细讲述了。
2.5 基于区域的运动估计
在基于区域的的运动估计中,把图像帧(锚定帧)分割成多个区域,并估计每一个区域的运动参数。这种分割应该使一个单一的参数运动模型可以很好地表示每个区域进行单独的平移运动。然而这个要求会造成太多小的区域,因为在对应于一个物理物体的区域中的二维运动,极少能够用一个简单的平移来模型化。这样一个区域必须分割成许多小的子区域,使每一个区域具有单一的平移运动。对于更高效的运动表示,应该使用正交和透视运动模型。
一般实现基于区域的运动估计有3中方法:
(1)第一种方法,首先把图像帧分割成不同的区域,即基于纹理同质性、边缘信息以及有时通过对两帧间不同图像的分析得到的运动边界,然后估计每一个区域中的运动,称这种方法为区域优先。
(2)第二种方法,首先估计整个图像的运动场,然后分割得到的运动场,使得每一个区域的运动可以用单一的参数模型描述,称这种方法为运动优先。得到的区域可以在一些空间的连通性约束下进一步优化。这个方法中的第一步可以利用前面描述的各种运动估计方法实现,包括基于像素、块、和网格的方法。第二步涉及基于运动的分割,这里不再详细讲述。
(3)第三种方法是对区域分割和每一个区域的运动进行联合估计。一般这
5
武汉理工大学《通信工程应用技术综合训练与实习》报告
时用一个迭代过程实现的,交替地进行区域分割和运动估计。
2.6 多分辨率的运动估计
前面介绍的运动估计方法存在的问题有:最小化误差函数可能收敛到局部最小值和最小化误差函数过程的计算量很大。
多分辨率运动估计可有效解决这两个问题。
首先在最小分辨率层(由空间低通滤波和欠取样获得)进行运动估计,并把结果作为下一层的初始解。
然后每层依次进行运动估计,每层的运动估计结果都将作为下一层的初始解 每层的运动估计可使用前面介绍的方法,如基于光流、像素、块、网格等运动估计方法。
图2.2 多分辨率运动估计分层
多分辨率运动估计优点:
(1)运动场接近最优解的概率更大
(2)较小分辨率层上,误差函数可以接近全局最小值,通过插值,获得高分辨率上的初始解,最后到达最大分辨率时,误差函数接近全局最小值的可能性更大。
(3)计算量比直接在最大分辨率上进行运动估计时要小 (4)较小分辨率层上,搜索范围限制在较小的范围。
6
武汉理工大学《通信工程应用技术综合训练与实习》报告
3 全搜索算法和三步搜索算法
上述介绍的几种运动估计算法中,基于块的运动估计硬件复杂度较少,易在超大规模集成电路中实现,被认为是最通用的方法
3.1 全搜索算法
全搜索法(Full Search, FS)也称为穷尽搜索法,是对(M+2dx)×(N+2dy)搜索范围内所有可能的候选位置计算MAD值,从中找出最小MAD,其对应偏移量即为所求运动矢量。此算法虽计算量大,但最简单、可靠,找到的必为全局最优点。
FS 算法描述如下:从原点出发,按顺时针螺旋方向由近及远,在逐个像素处计算MAD 值,直到遍历搜索范围内所有的点,然后在计算的所有点的MAD 中找到最小值,该点所在位置即对应最佳运动矢量。
FS 算法是最简单、最原始的块匹配算法,由于可靠,且能够得到全局最优的结果,通常是其它算法性能比较的标准,但因为对于搜索窗中的每一的候选运动矢量都需要计算一次它的平均绝对差值,所以它的计算量的确很大,这就限制了在需要实时压缩场合的应用,所以有必要进一步研究其它的快速算法。
由于块运动估计的全搜索算法具有很高的计算复杂度,因此在已有的文献中,人们提出了许多快速运动估计算法。这些算法可大致归为多步搜索算法和穷尽搜索算法这两类。对于多步搜索算法,只选择搜索窗中所有运动矢量的一个子集,这样就可以减少对MAD的计算次数。对于穷尽搜索算法,先计算MAD的一个下界,然后尽可能地利用此下界来避免计算MAD。
3.2 三步搜索算法
三步搜索算法、新三步搜索算法、四步搜素算法、基于块的梯度下降搜索算法、二维对数搜索算法、菱形搜索算法、交叉搜索算法、共轭方向搜索算法、正交搜索算法、分层块匹配算法、简易搜索算法是属于此类的快速算法。在这些搜
7
武汉理工大学《通信工程应用技术综合训练与实习》报告
索算法中,运动估计的过程都将包括几个步骤。每一个步骤都将选择一些搜索点,并计算这些搜索点的MAD/SAD值。本文着重介绍三步搜索算法(TSS)。
图3.1 三步搜服哦算法
三步法是应用得相当广泛的一种次优的运动估计搜索算法。此搜索算法如图2-2 所示,可分为下面三步:
第一步搜索9 个位置点,如图中方块所标示的9个点。对每一个位置点计算MAD,找出最小MAD值的点。
将搜索中心移动到第一步中具有最小MAD值的点上。搜索步长减少为第一步搜索步长的一半,进行第二步的搜索匹配,如图中圆形标示的点。对每个位置点计算MAD值,找出最小MAD值的点。
然后继续将搜索中心移动到第二步中具有最小MAD值的点上。搜索步长减少为第二步搜索步长的一半,来进行第三步的搜索匹配,如图中三角块标示的点。对每个位置点计算MAD值,找出最小MAD值的点。得到最佳的运动矢量MV(■→▲)。
由于第二步和第三步的9 个搜索点中均有一个点是在上一步中已经计算过MAD 值,所以第二步与第三步均只要计算8 个点而已,所以TSS 算法的计算次数是9+8+8=25 次,同直接匹配需要225 次比较,计算量大大减少。
8
相关推荐: