加速鲁棒特征surf.docx

上传人:b****8 文档编号:9304544 上传时间:2023-02-04 格式:DOCX 页数:14 大小:637.43KB
下载 相关 举报
加速鲁棒特征surf.docx_第1页
第1页 / 共14页
加速鲁棒特征surf.docx_第2页
第2页 / 共14页
加速鲁棒特征surf.docx_第3页
第3页 / 共14页
加速鲁棒特征surf.docx_第4页
第4页 / 共14页
加速鲁棒特征surf.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

加速鲁棒特征surf.docx

《加速鲁棒特征surf.docx》由会员分享,可在线阅读,更多相关《加速鲁棒特征surf.docx(14页珍藏版)》请在冰豆网上搜索。

加速鲁棒特征surf.docx

加速鲁棒特征surf

本科毕业设计

 

英文翻译

专业名称信息工程

学生姓名周航远

指导教师赵春晖

完成时间2010.5

 

本科毕业设计英文翻译

指导教师评阅意见

学生姓名:

班级:

得分:

请指导教师用红笔在译文中直接进行批改,并就以下几方面填写评阅意见,给出综合得分(满分按15分计)。

1、专业术语、词汇翻译的准确性;

2、翻译材料是否与原文的内容一致;

3、翻译材料字数是否符合要求;

4、语句是否通顺,是否符合中文表达习惯。

 

指导教师(签名):

年月日

加速鲁棒特征(SURF)

HerbertBay,AndreasEss,TinneTuytelaars,和LucVanGool

摘要

本文提出了一种新颖的刻度旋转不变的检测器和描述器。

创造了SURF(加速鲁棒性特征)。

SURF甚至比以前被推荐的方案更具可重复性、特异性和鲁棒性,在计算和比较速度上也快很多。

这是通过以下方法完成的:

依赖于积分图像的图像卷积、建立在目前先进的探测器和描述器(特别是采用了Hessian矩阵方法的探测器和基于分布的描述器)的基础上、简化了这些手段使之更有效。

这产生了新颖的探测、描述和匹配步骤的结合。

这篇文章包含了对探测器、描述器探测最重要参数的影响的详细描述。

我们推测这篇关于SURF的应用面临两个挑战,虽然它们是相反的:

图像配准中的相机矫正以及目标识别。

我们的实验强调了SURF在一系列计算机视觉研究中的有效性。

关键词:

兴趣点,局部特征,特征描述相机矫正目标识别

1、引言

找出同一场景或物体的两张图像的对应点的工作是很多计算机视觉应用的一部分。

图像配准,相机矫正,目标识别以及图像检测只是很少的一部分。

寻找离散图像点的对应点可分为三大步骤。

第一,在图像中的特殊位置选择“兴趣点”,比如角落、斑点、T形结合处。

一个兴趣点探测器最有价值的特性是它的重复性。

重复性是一个探测器在不同可视条件下寻找同一个物理兴趣点的可靠性的表示。

第二,每个兴趣点的关系用一个特征向量表示。

这种描述器非常与众不同。

在相同时间对噪声、探测器位移及几何和光学上的形变具有很好的鲁棒性。

最后,对不同图像的描述器进行向量匹配。

进行这种匹配时给予矢量间的距离,例如马氏距离或欧氏距离。

描述器的维度对时间有影响,所以用较少的维度才有更快的兴趣点匹配。

然而,低维度特征向量在总体上与高维度相比区分度还是较差的。

把探测器和描述器合二为一已成为我们的目标。

相比最先进的方式,它需要更快比较而又不牺牲性能。

寻找一个既能简化探测方案又能保持准确性的平衡点以及在保证充分的特异性的基础上减小描述器的尺度是我们成功的关键。

很多文献中大量的探测器和描述器已经被提出。

同时,详细的比较和评估数据集已经开始执行。

我们的快速探测器和描述器SURF(加速鲁棒特征)在其他文献中介绍过。

它是建立在前期工作所增加的洞察力的基础上的。

在我们对这些标准数据集的实验中,SURF的探测器和描述器不仅更快,而且它的可重复性更高,区分度更明显。

我们关注在尺度上和面内的旋转不变的探测器和描述器。

这些似乎在特种通常发生的形变的复杂性和鲁棒性之间做了很好的平衡。

另外,各向异性的缩放和每个特殊效果被认为是二阶效应,即覆盖在一定程度上的整体稳健描述器。

需要注意的是描述器可以通过仿射正常化椭圆形这一手段扩展到仿射不变区域,虽然这会影响计算时间。

在另一方面,扩大探测器并不是那么简单。

关于光度变形,我们假设一个简单的线性模型的偏差(补偿)和对比度变化(比例系数)。

不管是探测器还是描述器都运用了颜色信息。

在第三节中,我们描述了快速鲁棒的兴趣点检测上的应用策略。

输入图像分析了不同尺度,以保证尺度不变性。

在第四节中检测到的兴趣点提供了一个旋转和尺度不变的描述。

此外,我们还对与周边的兴趣点对比的基础上提出了一个简单而有效的第一线索引技术。

2.相关工作

2.1兴趣点检测

最广泛使用的探测器可能是Harris角检测器,可以追溯到1988年。

它是基于二阶矩矩阵的特征值。

不过,Harris角落不是尺度不变的。

Lindeberg引入了自动规模选择的概念。

这可以判断图像中的兴趣点每个都有自己的特征尺度。

他同时与试验的Hessian矩阵以及Laplace(对应到跟踪的Hessian矩阵)来检测斑点状结构的决定因素。

Mikolajczyk和Schmid运用这种方法,创造了高重复性的鲁棒和规模不变的特征探测器。

他们被称为Harris-Laplace和Hessian-Laplace。

他们用(规模改变)Harris措施或Hessian矩阵行列式的选择位置,以及拉普拉斯算子选择规模。

在高速对焦中,Lowe运用高斯滤波差异(DoG)提出了高斯算法的拉普拉斯算子(LoG)。

另外几种尺度不变的兴趣点检测器也有人提出过。

比如由Kadir和Brady提出的通过放大区域熵突出区域特征。

以及Jurie和Schmid提出的基于边缘区域的检测器。

但它们似乎不太适合进行加速。

也有几个仿射不变特征探测器已经提出,可以应付更广泛的视角的变化。

不过,这已经超出了本文的范围之内。

从现有的探测器研究和已发布的比较,我们可以得出结论,基于Hessian的探测器比基于Harris的更加稳定、重复性更高。

此外,利用Hessian矩阵的行列式,而不是它的痕迹(拉普拉斯算子)更好,因为它更少考虑冗长的局部的结构。

我们还观察到近似像高斯滤波差异能在尽量不牺牲准确性的前提下提高速度。

2.2兴趣点描述

更大量的特征点描述已被提出,如高斯衍生物,不变量,复杂特征,可操纵过滤器,相位的本地特征,和描述符代表内的兴趣点附近分布的小尺度特征。

后者由Lowe介绍,已被证明优于其他。

这可以解释为他们获取了关于空间强度模式大量信息,但同时被鲁棒的小变形或ocalisation误差时间。

文献描述,简称筛选,面向计算的本地兴趣点周围的梯度直方图存储在128维向量集(8个方向4×4的位置方向集)。

在实际应用中SIFT描述似乎仍然是最引人瞩目的。

因此也是目前应用最为广泛的。

它很独特,也相对较快。

这是网络应用最为关键的。

最近实施现场可编程门阵列(FPGA)的筛选和[37]提高了一个数量级的速度。

与此同时,Grabner等也用积分图像来近似SIFT。

它们的探测步骤是建立在平均值差异的基础上(不进行插值)对整体直方图进行描述的。

他们获得的速度和我们大致相同,但和SIFT相比,他们牺牲了质量。

对于网络应用所涉及的普通电脑,这三个步骤(探测、描述、匹配)必须更快。

整个身体的工作正在逐步加快匹配可用。

他们为近似匹配付出了代价。

方法包括最好的首先由Lowe,balltrees,词汇树,地点敏感散列,或多余的位向量提出。

为了配合这一点,我们建议的Hessian矩阵的使用跟踪,大大提高匹配速度。

再加上描述的低维,任何匹配的算法,势必加快了速度。

2.3.兴趣点检测

我们的兴趣点检测方法使用了一个非常基本Hessian矩阵逼近。

这使它更适用于积分图像,大大减少了计算时间,因此更受欢迎。

Simard等人提出的积分图像在整体上更具框架性。

3.兴趣点检测

3.1积分图像

为了使文章更自成一体,我们简要地讨论了积分图像的概念。

可通过卷积的箱式过滤器的快速计算。

的位置输入的卷积图像

代表了包括原点和x的输入图像I的所有像素之和。

(1)

一旦积分图像被计算,需要额外计算垂直强度以及矩形区域(见图1)。

因此,计算时间是由它的大小所决定的。

在我们的方法中这是很重要的,因为我们使用大滤波器尺寸。

3.2.基于兴趣点的Hessian矩阵

我们立足于由于其良好的性能的准确性Hessian矩阵的探测器。

更确切地说,我们发现在位置一滴状结构的决定因素是最大的地方。

与此相反的由Mikolajczyk和Schmid拉普拉斯检测器,我们依靠的Hessian决定选择的规模也由林德伯格。

图1.运用积分图像,它只需要三个加法和四个记忆存取信息的总和强度计算矩形区域内任何尺寸。

在图片I中给定的点x=(x,y),Hessian矩阵H(x,σ)规模σ中的x定义如下

高斯第二命令衍生物

的卷积Lxx(X,σ)和图片I中的点x以及类似于Lxy(X,σ)和Lyy(X,σ)

Bay等人[16]提出用方框滤波近似代替二阶高斯滤波,用积分图像[17]来加速卷积以提高计算速度。

在原始图像上,通过扩大方框的大小形成不同尺度的图像金字塔,9×9的方框滤波模板值见图2,图中灰色部分模板值为0,对应二阶高斯滤波σ=1.2、相应的尺度值方框滤波模板同图像卷积后的值分别为Dxx,Dyy和Dxy,进一步求解得到Hessian矩阵的△表达式[16]:

判别式的值是H矩阵的特征值,可以利用判定结果的符号将所有点分类,根据判别式取值正负,来判别该点是或不是极值点。

在SURF算法中,用图像像素I(x,y)代替函数值f(x,y),选用二阶标准高斯函数作为滤波器,通过特定核间的卷积计算二阶偏导数,这样便能算出H矩阵的三个矩阵元素Lxx、Lyy、Lxy,从而计算出H:

H(X,t)=Lxx(X,t)Lxy(X,t)Lxy(X,t)Lyy(X,t)(3)L(X,t)=G(t)*I(X)Lxx(X,t)是一幅图像在不同解析度下的表示,可以利用高斯核G(t)与图像函数I(X)在点X=(x,y)的卷积来实现,核函数G(t)具体高斯函数,t为高斯方差,Lyy与Lxy同理。

通过这种方法可以为图像中每个像素计算出其H行列式的决定值,并用这个值来判别特征点。

为方便应用,HerbertBay提出用近似值Dxx代替Lxx,为平衡准确值与近似值间的误差引入权值w,权值w随尺度变化,则H矩阵判别式:

G(t)=2g(t)x2det(Hopprox)=DxxDyy-(wDxy)2

图2.从左至右:

高斯二阶偏导数在y-(Lyy)和xy-(Lxy)表示;我们的近似二阶高斯偏导数在y-(Dyy)和xy-(Dxy)。

灰色的区域,等于零。

3.3 构建尺度空间

图像的尺度空间是这幅图像在不同解析度下的表示,由式(4)知,一幅图像I(X)在不同解析度下的表示可以利用高斯核G(t)的卷积来实现,图像的尺度大小一般用高斯标准差σ(σ=t1/2)来表示[6]。

在计算视觉领域,尺度空间被象征性的表述为一个图像金字塔,其中,输入图像函数反复与高斯函数的核卷积并反复对其进行二次抽样,这种方法主要用于SIFT[7]算法的实现,但每层图像依赖于前一层图像,并且图像需要重设尺寸,因此,这种计算方法运算量较大,而SURF算法申请增加图像核的尺寸,这也是SIFT算法与SURF算法在使用金字塔原理方面的不同。

算法允许尺度空间多层图像同时被处理,不需对图像进行二次抽样,从而提高算法性能。

图1(a)是传统方式建立一个如图所示的金字塔结构,图像的尺寸是变化的,并且运算会反复使用高斯函数对子层进行平滑处理,图1说明SURF算法使原始图像保持不变而只改变滤波器大小。

图3.不用反覆地减少图像大小(左),允许使用积分图像滤波器的增加维数在固定损耗(右)。

3.4精确定位特征点

所有小于预设极值的取值都被丢弃,增加极值使检测到的特征点数量减少,最终只有几个特征最

图4.过滤器Dyy(顶部)和Dxy(底部)规模水平(9x9和15x15)。

黑叶的长度只能增加以及像素数字为了保证中心象素的存在(顶部)。

强点会被检测出来。

检测过程中使用与该尺度层图像解析度相对应大小的滤波器进行检测,以3×3的滤波器为例,该尺度层图像中9个像素点之一与自身尺度层中其余8个点和在其之上及之下的两个尺度层9个点进行比较,共26个点,图2中标记‘X’的像素点的特征值若大于周围像素则可确定该点为该区域的特征点。

4.兴趣点的匹配与描述

我们分布的描述符描述的内容与相邻兴趣点强度梯度信息上,经过筛选[24]和它的变体。

我们建立的分布模型的小波变换反应在第一秩序Haarx和y方向的梯度,而不是利用积分图像的速度,并且只使用64个维度。

这样就减少了计算时间和匹配特征,并已证明同时提高了鲁棒性。

此外,提出了一种新的基于索引一步标志的拉普拉斯,进而增加不仅具有较强的鲁棒性,但也算符的匹配速度(选两个因素中一个因素在最好的情况下)。

第一步是由固定可再生的定位信息来源于一个圆形区域周围的兴趣点。

然后,我们构建了一个区域对齐,选定区域定位与提取冲浪描述符。

最后,两幅图像之间的特征相匹配。

这三个步骤是解释在下面。

4.1取向作业

为了成为图像旋转不变,我们找出可再生的取向兴趣点。

为了这个目的,我们首先计算小波变换反应在Haarx和y方向的半径内一个圆形的邻里周围的兴趣点,6s和s规模的兴趣点检测。

抽样计划的第一步是规模依赖、选为s。

为了与其余的大小,也依赖、小尺度的长度将一侧4s。

因此,我们可以再次利用积分图像快速过滤。

所使用的过滤器如图9。

只有六名操作也是必须的,计算了反应的x或y方向在任何规模。

图5.Haar小波滤波器方程,计算了反应在x(左)和y方向(右)。

暗部重量-1和光明部分+1。

一旦小波响应进行了计算和加权和高斯(σ=两秒),主要集中在兴趣点,反应被表现为分在一个空间中与水平线反应强度沿横向和纵向响应强度沿纵坐标线绘制世界。

估计占统治地位的取向是通过计算反应的总和的滑动方向内所有窗口大小的π/3,见图6。

在水平和垂直窗口反应进行比较。

这两个总结然后产生局部方向响应向量。

最长的向量在所有的窗户为兴趣点的方向。

滑动窗口的大小是一个参数必须仔细挑选的。

小尺寸集中支配信号梯度,大尺寸在表示向量长度上的不明确,都会导致错误的兴趣点取向。

图6作业:

一种滑动方向取向窗口大小的π/3侦测的主导方向小波变换的高斯权重Haar反应在每个采样点在一个圆形的兴趣点附近。

注意,对许多应用程序、旋转不变性是没有必要的。

实验中使用垂直的SURF可以探测出目标在[3、4]。

U-SURF是更快的计算可以增加区分度,同时保持一个鲁棒性向旋转约+/-15度

4.2基于和的Haar小波反应描述器

对提取描述符,第一步是由构造一个广场周围地区的兴趣点集中选择沿取向和方向,在前一节。

这扇窗户的大小是20秒左右。

这样的例子阐述了空间地区图7。

图7.显示详细的涂鸦的场景表现了在不同规模下定向描述器窗口的大小。

这个区域被分成4x4的小块的子区域。

这样可保留重要的空间信息。

对每个子区域,我们计算Harr小波响应在5x5常规空间下的采样点。

简单的原因,我们叫dx的Haar水平方向小波响应,dy为的Haar垂直方向小波反应(滤波器尺寸两秒)注意图4。

“纵向”与“横向”这是定义在关系到所选择的兴趣点的定位(见图12)。

对提高系统的鲁棒性几何变形和选择位置的错误时,首先相应dx和dy加权和高斯(σ=3.3s)主要集中在兴趣。

图8.为了建立了描述,基于兴趣点的(左)一个面向二次网格镶嵌4x4平方子区域,每个方块,计算小波反应。

每个方块的2x2个子部分的实际领域相对应的描述符。

这是dx,│dx│,dy,│dy│的和,相对的,计算网格的方向(右)。

然后,每个子区域的小波响应dx和dy之和组成第一组特征向量。

为了把强度变换极性加入信息中,我们也取出响应的绝对值1dx1和1dy1。

因此,每个有一个四维描述的子区域都有向量v,其结构为:

图9.子区域的描述可表示了依赖于强度的部分。

左:

万一均匀的区域,所有的值也相对较低。

中:

在x方向存在固有频率,Σ│dx│很高,但其他部分依然很低。

如果强度逐渐在x方向增加,Σdx和Σ│dx│都高。

图9.显示性能的三个鲜明不同种类的形象描述符模式在一次区域强度。

人能想象的组合模式,造成局部强度等有独特的描述符。

SURF是,在某种意义上说,类似的概念,SIFT,,他们都把注意力集中在空间分布的梯度信息。

不过,SURF的几乎所有病例筛入优于如图所示,在第五部分。

我们相信这是由于这样的事实,即SURF集成在一个子区域的梯度信息,而SIFT取决于个人的方向的梯度。

这使得SURF较不敏感的噪音,如图所示的例子,图10。

图10.由于全球一体化的SURF的描述符,它对于各种图像扰动比本地操作的SIFT描述会具有更强的鲁棒性。

为了到达这些SURF描述符,我们试着用越来越多小波的特点、二阶衍生物、高阶小波,利用主成分分析法(PCA),平均价值,平均值等。

从全面的评估,该套原来的效果最好。

然后我们不同

样本点的数量和分区。

4x4次区域分工的解决方案提供了最好的结果。

考虑到更精细的分支机构似乎更少的鲁棒性和将增加匹配倍。

另一方面,短描述符与3x3子区域(SURF-36)略微糟糕,但允许非常快速的匹配与其他文献中描述符相比还是可以被接受的。

我们还测试了另一种版本的添加了几个类似的特点的SURF描述符(SURF-128)。

它和以前一样再一次使用相同和,但是现把这些值进一步分裂。

dx和│dx之和被分开计算为在dy<0和dy≥0的两种情况。

同样的,dy和│dy│和,是根据dx的标志,从而增加两倍数量的特点。

描述符更与众不同,而不是慢的多,但速度慢一些计算是由于其高维度。

4.3快速索引匹配

快速索引在匹配阶段,拉普拉斯的符号(如下,黑森矩阵的痕迹)的潜在利息点包括在内。

典型地,兴趣点,都存在于滴状结构。

拉普拉斯的符号区分明亮的斑点在深色的背景,从相反的情况。

此功能可在没有额外的计算代价,因为在检测阶段已计算出。

在匹配阶段,我们只比较功能是否有相同类型的对比,见图11。

因此,该最低限度的信息使你更快的匹配、不减低描述符的性能。

注意,这也是之优点为更先进的索引方法。

例如k-d树,这个额外的信息定义了一个有意义的数据、分裂平面相对于随机选择一个元素或采用特征统计。

图11.如果两个兴趣点的对比是不同的(白点在和背景上和黑点在白背景上),这不被认为是有价值的比较。

5.结语和工作展望

我们提出了一种快速、性能规模和旋转不变的兴趣点检测器和描述符。

重要的速度增益由于使用积分图像,这极大地降低了旋转所需的操作次数和度低的选择规模。

结果表明,我们的Hessian近似是很优秀的,有时甚至比最先进的兴趣点探测器更好。

高重复性利于摄像机自标定、一个精确的兴趣点探测对相机的自标定有直接影响,进而会影响到摄像机自标定的质量产生的三维模型。

最重要的改善是速度的检测器。

甚至没有任何可能的实时计算,现在让计算几乎没有损失是可能的,这代表了性能是一个重要的优势对许多在线计算机视觉应用。

总结我们的描述,基于小波组件之和,优于目前性能最优异的方法。

似乎自然的描述了潜在的图像强度模式与基于直方图的方法更独特的方法。

简洁又使我们使用积分图像描述符在速度方面更有竞争力。

此外,基于拉普拉斯变换的索引策略使匹配步骤更快而且不会引起的任何损失的性能。

通过实验对摄像机定标和目标识别突出SURF的潜力有着广泛的计算机视觉应用。

在前者中,兴趣点的准确性和显著性的描述符主要表现为主要因素为获得更准确的三维重建,甚至在困难的情况下得到任何三维重建。

在后者中,该性质描述符在一个简单的目标识别任务做得比它的竞争对手要好,。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1