您的当前位置:首页正文

基于SIFT联合描述子的航拍视频图像镶嵌

来源:爱站旅游
导读基于SIFT联合描述子的航拍视频图像镶嵌
2010年2月 西北工业大学学报 Journal of Northwestern Polytechnical University Feb. 2010 第28卷第1期 Vo1.28 No.1 基于SIFT联合描述子的航拍视频图像镶嵌 程咏梅,张绍武,花永强,柳 丹,雷宝权 (西北工业大学自动化学院,陕西西安710072) 摘 要:针对存在明显旋转、尺度或模糊等变化的图像,文章提出了一种基于SIFT联合描述子的航拍 视频图像镶嵌算法。该算法首先计算经典的SIT特征局部描述子,然后通过引入图像的形状信息得 F到每个特征点的全局描述子,进而获得联合描述子;对联合描述子中的局部描述子采用欧氏距离、全 局描述子采用卡方距离进行双向匹配,通过加权平均法融合得到联合描述子的匹配距离;采用 RANSAC算法精确估计仿射变换模型参数。实验结果表明:该算法具有较好的鲁棒性,可获得较好的 镶嵌结果 关键词:航拍视频图像,镶嵌,SIT联合描述子,双向匹配,仿射变换 F中图分类号: I'P391.4 文献标识码:A 文章编号:1000—2758(2010)01-0051-06 近年来,针对图像尺度变换问题,涌现出许多算 法,其中G.Lowe在2004年正式给出了一种基于尺 与SIFT局部描述子一样,SIFT全局描述子也 是创建一个直方图,但SIT局部描述子创建特征点 F度空间的图像局部特征变换算子——SIFT算子 (Scale Invariant Feature Transform)…,该算子对图 邻域内梯度方向的直方图,而SIFT全局描述子是统 计以特征点为原点的对数极坐标中每一个扇格内的 边缘点数。由于物体边缘对亮度变化比较敏感,在 这里,采用以曲率图像代替边缘图像的办法 J。 对于1幅图像 ( ,Y),首先计算该图像的 Hessian矩阵/t( ,y)。 像的旋转、缩放、仿射变换、光照等变化不敏感,在特 征匹配领域取得了巨大的成功。SIFT描述子是一 种局部描述子 j,没有考虑图像的全局结构信息, 当图像中存在重复或者非常相似的场景(例如风格 统一的建筑等)时,产生误匹配的概率将增大。从 某种意义上来说,航拍视频图像配准的核心内容就 日( ): L r y r J : ,,,) gxy1(1) Lg o-g J 是找到2幅图像间的全局运动向量,因而全局信息 显得很重要。另外,对于航拍视频图像而言,相邻2 式中 和 分别是图像对 和Y的二阶偏导,r 是 混合偏导。这些二阶导数可由图像 ( ,Y)与相应的 帧之间在形状上具有很大的相似性,使得利用形状 关系描述全局信息成为可能¨ 。为此,本文把全 高斯二阶导数 、g 和酴卷积求得, 为所选取的 尺度。 局形状信息 l2 引人到图像匹配中,产生一种能反 映物体形状信息的全局描述子,并将其与SIFF局部 描述子结合,构造出关于特征点的联合描述子,基于 该sIFr联合描述子对航拍视频图像进行镶嵌。 图像上的每一点都可以求取一个2×2的 Hessian矩阵,每一个Hessian矩阵可确定2个特征 值,定义曲率图像如下 C( ,y)=I O/( , )l (2) 式中 ( ,Y)为2个特征值中较大的一个, ( ,Y) 1 SIFT联合描述子 1.1 曲率图像 收稿日期:2008—12-26 的具体计算方法详见文献[4]。 为了减小边界因素影响、提高计算效率,需要对 曲率图像进行预处理 J,这里采用Daubechies低通 基金项目:国家自然基金重点项目(60634030)与航空科学基金(2007ZC53037)资助 作者简介:程咏梅(1960一),女,西北工业大学教授,主要从事信号与信息处理、目标识别与跟踪及组合导航的研究。 ・52・ 西北工业大学学报 第28卷 小波滤波器进行滤波,对于滤波后的图像采用r,= 6的高斯低通滤波器进行平滑,得到最终的曲率图 d…ax(,,L log2( )+6 j)(4) 像C ( ,Y),如图1所示。 豳黧 (c)Daubcchies小渡低通滤波 (d) 高斯低通滤波后的 后的曲率图像 曲率图像 图l 曲率图像生成 1.2 SIFT全局描述子 求取SIFT局部描述子时,对特征点邻域范围内 的梯度方向进行了高斯加权,距特征点比较近的梯 度方向有较大的权值,距特征点较远的梯度方向有 较小的权值。同样,在求取SIFT全局描述子之前, 首先对曲率图像以特征点为中心进行高斯加权,设 特征点的坐标为(曼,多),则高斯权重函数为【3 J ( ,y):e一(( 一;) (y一 /(2 。’ (3) 式中cr等于SIFT局部描述子求取过程中,对SIFT 特征点邻域范围内的梯度方向进行加权时所用的高 斯参数值。(S)式可以看出,权重函数 ( ,Y)离特 征点越远其权重越小,离特征点越近其权重越大。这 样设计的目的是因为在离特征点比较近的范围内, 应使SIFT局部描述子发挥较大的作用,而在距离特 征点较远的范围内,应使全局描述子发挥较小的作 用,这样得到的联合描述子具有更好的鲁棒性。 在精确定位了特征点位置之后,假设特征点的 坐标为( , ),首先以特征点为中心,以r为半径确 立一圆形区域。然后以SIFT特征点的主方向为起始 方向,沿切线方向每隔30。一个扇格,共】2个;沿径 向方向以 、寺、÷和寺划分半径为5段,这样就可 以得到12×5共60个扇格。 口:『 f f 1—011 式中 =( ,Y) ,ll・JI为 范数,r为圆的半径, 其值等于该特征点到其它所有特征点之间的平均距 离。这样,通过(4)式确定n和d即可获知扇格的 位置。 以 代表由n和d所确定的扇格区域,以G。. 代表区域R 内的曲率累加和,即G。= . ∑ C ( ,Y)。然后通过归一化处理,消除光照变 【 ,y J EHd 化的影响,得到最终的全局描述子向量:G G —_o lI G l I图2给出了一个简单的例子,以点阵代替曲率 图像,以圆心所在特征点的主方向开始,遍历60个 扇格并记录每个扇格中的点数,得到一个6O维的向 量,即为该特征点的SIFT全局描述子。 图2 SIFT全局描述子生成示意图 SIFI’全局描述子由一个60维的特征向量组 成。通过引人特征点的主方向0和平均距离的概 念,使得该特征向量具有旋转、尺度不变性,归一化 后又可消除光照变化的影响,具有跟SITF局部描述 子一样的优良性质。 将SIFT特征点局部描述子和全局描述子联合 起来作为一个特征点的描述子,我们称之为联合描 述子。 2算法流程 该算法首先提取图像的SIFT特征点,然后计算 每个特征点的联合描述子,接下来运用双向匹配法 进行图像匹配,最后采用基于RANSAC算法和最小 二乘法的参数估汁方法求解变换模型参数,实现图 第1期 程咏梅等:基于SIFT联合描述子的航拍视频图像镶嵌 ・53・ 像镶嵌。算法流程如图3所示。 图像序列第 帧 图像序列第^+l帧 提取S[FT 提取 SlFT 特征点 崦 ’ _ l计算SIFT特征点 计算SIFT特征点 『的联合描述子 的联合捕述予 I j 运川双向匹 法 进行图像匹配 l 基于RANSAC算 法和最小二乘法的 参数估计 』 图像镶嵌 图3基于SIFT联合描述子的图像镶嵌算法流程 3 图像匹配 SIFT联合描述子同样具有尺度、旋转、光照等 不变性,可以直接用来进行图像匹配,但是考虑到2 种描述子分别描述了图像的不同信息,这里对组成 SIFt联合描述子的局部描述子和全局描述子分别 采用不同的匹配策略,得到不同的相似性系数。最 后融合2种相似性系数,得到联合描述子之问的相 似性系数,并以此作为匹配的依据。图4给出了基 于SIl ̄q"联合描述子的图像匹配流程图。 通过对图像提取局部描述子L和全局描述子 G,最终形成一个188维的联合描述子,在特征匹配 时,对 和G分别匹配。对于SIFT局部描述子,采用 欧氏距离作为相似性度量,如公式(5)所示。 对于SIFT全局描述子,采,Nx 统计量作为相似 性度量,如公式(6)所示。 DL=l 一L I= /E(L .V ill  一L , ) (5) 1 , , 、2 Dc: :÷艺 gⅡ.n十g口,n (6) 公式(5)中 和L 分别为第 和第 个局部描 述子,m为局部描述子维数,公式(6)中g 为第 个 全局描述子,/7,为全局描述子维数。 图4基于SITF联合描述子匹配流程图 计算出局部和全局描述子的匹配距离后,采用 D=wD +(1—09)D。计算联合描述子之间的距离, 为权重系数。 对于1幅图像中的某个特征点,在另一幅图像 中找出与之距离最近的2个特征点,其距离分别为 最小距离D 和次小距离D ,如果最小距离D枷与 次小距离D 之比小于某个闽值71,则将取得最小距 离的点作为匹配点。降低这个阈值,匹配点数目会减 少,但更加稳定,实验发现, 的值通常在0.4—0.6 之间较合理。 虽然基于SIFT联合描述子的图像匹配算法提 高了匹配的鲁棒性,但是对于复杂的真实场景,误匹 配问题仍是一个不能完全解决的问题。为此采用双 向匹配策略和基于匹配点主分量误差分布的方法进 一步去除伪匹配点,增强匹配算法的稳定性,算法过 程如下: (1)正向匹配:待匹配图像,1和,2,首先对, 上 的特征点,采用上面所提到的算法进行搜索,找到在 图像 ,上的匹配点。 (2)反向匹配:正向匹配结束后,对于,2上找到 的匹配点,按照与第(1)步中同样的方法,在,.中反 向寻找匹配特征点,若正反2次的匹配点对相同,则 西北工业大学学报 第28卷 认为匹配成功。 (3)匹配成功的特征点对记为( lJ ),i=l, 2,…,n,J=1,2,…,m, 和m分别为匹配点对数和 描述子维数。 (4)匹配点对的描述子向量之差记为e“,计算 e 的均值与方差 = /'2湘 式中///, ,i:1,2,…,6为仿射变换参数,( ,Y)和 ( ,Y )为待匹配图像间的对应点象素坐标。从方程 中可以看出求解仿射变换参数最少需要3对匹配 n 圣e刍Ji  点。设( ,Y )和( ,Y )分别代表图像,】和 上的 = 一 mni =U= I (e 一 )” ‘  (5)遍历n对匹配点,将主分量误差大于2.5 倍方差的匹配点对作为伪匹配去除。 4基于RANSAC算法和最小二乘法 的参数估计 航拍视频图像成像距离远大于焦距,可以近似 认为图像位于空间的同一平面上,这样图像间的变 换矩阵是单位矩阵,根据这一约束采用随机采样一 致性原理(RANSAC)去除伪匹配点。 RANSAC(Random Sample Consensus)算法假定 观测数据由符合某种模型的“内点(inliers)”和不符 合模型的“出格点”(outliers)组成,这些出格点可能 来自观测误差、错误匹配等。其算法的流程 如下 引: (1)随机选择Ⅳ个样本; (2)根据抽取样本估计模型参数; (3)用估计模型计算每一匹配点对之间的距 离,将距离小于阈值的匹配点作为内点; (4)将上述过程重复K次,选择一个包含内点 最多的点集,重新计算模型参数。这里重复次数K由 外点概率 ,采样点对数s和K次采样至少有一次全 部为内点的概率P得到 log 1( 一(1一占)  ) RANSAC算法能够有效去除误匹配点对,实现 简单,因此在图像处理、计算机视觉中到了广泛 应用。 用RANSAC去除误匹配对后,根据所有的“内 点”和选定的模型,用最小二乘估计求解最终2幅 图像间局部变换参数。由于仿射变换可以描述摄像 机的平移、旋转、缩放运动,因此,本文选择仿射模型 作为帧间变换模型。采用齐次坐标,图像间的仿射 1对匹配点,则可以得到关于参数的线性方程 f( ,Y ,1,0,0,0) (m1,m2,m3,m4,m5,m6) = : 【(0,0,0, ,Y ,1)%(m1,m2,m3,m4,m5,m6) =Y: 对凡对匹配点,由上式联立可得关于参数m (i=1, 2,…,6)的线性方程,其矩阵形式表示如下 1 ),1 1 0 0 0 0 0 0 1 Y】 1 m1 ● ● ● ● ● ● : : : : : : m2 l Yl 1 0 0 0 m3 O 0 0 1 Yl l m4 ● ● ● : : : m5 1 Y1 1 0 0 0 nl6 0 0 0 l Y1 1 简记为:AM=B,当n 3时,如A 可逆,则可用 最小二乘法计算仿射变换模型参数 M=(ATA) A 曰 ; ; 5 实验结果 图5给出只采用SIFT局部描述子、采用基于 SIKI"局部描述子的双向匹配法和采用本文SIFfII联 合描述子算法进行匹配的实验结果。图5(a)为待 匹配图像;图5(b)为运用SIFT局部描述子的匹配 结果,共有184对匹配点,但是其中包含一些错误的 匹配点;图5(e)为运用SIFT局部描述子双向匹配 的实验结果,获得的匹配点对数为161对,由于2幅 图像中的一些建筑物图具有局部相似性,使得匹配 结果仍然不完全准确,含有2对错误的匹配点;图5 (d)为运用联合描述子进行双向匹配的结果,共149 对,由于加入了描述子的全局信息,使得匹配结果更 鲁棒。 为了验证本文算法,首先构建了1组包含8个 航拍视频的测试数据集,如图6(a)一图6(e)所示, 其中包括自建数据、CMU无人机视频、影片中的航 第1期 程咏梅等:基于SIFT联合描述子的航拍视频网像锇嵌 55 拍视频等。视频内容种类丰富,包含平移(图6(a)、 图6(e)),旋转(图6(b)、图6(d)),模糊(图6 (C)),尺度变化、视角变化(图6(d))等情况。 (a) 待匹配图像 (b) 运用SIFT局部描述子匹配结果 (c) 运用SIFT局部描述子双向匹配结果 (d) 运用联合描述子进行双向匹配结果 (e) 影片中的航拍视频一平移 图5匹配结果 图6航拍视频测试数据集 图7为航拍视频测试数据集的镶嵌结果(为了 便于显示,对镶嵌图像进行了一定程度的缩放)。 (a)1 295帧的镶嵌结果 (b)700帧的镶嵌结果 (c)295帧的镶嵌结果 (d)215帧的镶嵌结果 (e)260帧的镶嵌结果 图7航拍视频镶嵌结果 ・56・ 西北工业大学学报 第28卷 从图7镶嵌结果可以看出,当图像具有旋转、缩 提取每一特征点的全局描述子,该描述子与局部描 放、模糊等变化时,基于SIFT联合描述子的图像镶 述子一样具有尺度、旋转、光照等不变性。把SIFT 嵌方法可获得较好的镶嵌结果。 局部描述子和全局描述子结合起来,构建SIFT联合 描述子,采用局部描述子与全局描述子分别匹配再 6 结 论 融合的方法进行图像匹配,实验结果表明本文提出 的SIFT联合描述子可获得较好的匹配结果,并在自 本文研究了基于SIFT联合描述子图像镶嵌问 建航拍视频数据库上实现了视频图像的自动拼接, 题,针对SIFT局部描述子不足,通过引入形状信息, 验证了算法的有效性。 参考文献 [1]Lowe D G.Distinctive Image Features from Scale—Invariant Keypoints.Intenrational Journal of Computer Vision,2004,60(2): 91~l10 [2]Lowe D G.Object Recognition fi'om Local Scale—lnvariant Features.Proc IEEE Int Colf Computer Vision,Kerkyra,Greece, 1999,2:l150一l1157 [3]Eric N M,Hongli D,Hnda G S.A SIH"Descriptor with Global Context.CVI’【{,2005,l:184~190 [4]Steger C.An Unbiased Detector ofCurvilinear Structures.PAMI,1998,20(3):l13~125 A Better Aerial Video Image Mosaic Algorithm Using SIFT Combined Deso’iptors Cheng Yongmei,Zhang Shaowu,Hua Yongqiang,Liu Dan,Let Baoquan (Department of Automatic Control,Northwestern Polyteehnical University,Xi an 710072,China) Abstract:Aim.The introduction of the full paper points out that:(1)Ref.1 uses local descriptors;(2)Refs.1 and 2,both by D.G.Lowe,mention the possibility of utilizing the similarity between consecutive frames to obtain global shape information.We believe that we have succeeded in utilizing the above—mentioned similarity to obtain actually global shape information.Section 1 explains the SITF(scale invarialtt feature transfonn)combined de— sefiptor;its core consists of:it firstly calcldates the classical features of local SIFT descriptor.receives the global descriptor of each featm’e point by introduci,lg the shape information of the image,and then obtains combined de— scriptors.Fig.3 in section 2 presents the flow chart of aerial video image mosaic algorithm using SIFT combined descriptors.Section 3 explains image matcbing;its core consists of:re,。bidirectiona1 matcbing,Euclidean distance is・utilized for local descriptor,Chi—square distance ofr the global one,and lhen,the matched distance of combined descriptors is obtained with the wetghted average integration method.Section 4 explains the parameter estimation obtained with the RANSAC(random sample consensus)algorithm and the least squares method.The experimental results,presented in Figs.5,6 and 7,show preliminarily that our algorithm has better robustness and is indeed better than that of Ref.1. Key words:image processing,algorithms,aerial video image mosaic,SIFT(scale invariant feature ̄ansform) combined descriptor,bidirectional matching 

因篇幅问题不能全部显示,请点此查看更多更全内容