图像融合技术外文翻译-中英对照（适用于毕业论文外文翻译+中英文对照）.docx

资源描述

图像融合技术外文翻译-中英对照（适用于毕业论文外文翻译+中英文对照）.docx

《图像融合技术外文翻译-中英对照（适用于毕业论文外文翻译+中英文对照）.docx》由会员分享，可在线阅读，更多相关《图像融合技术外文翻译-中英对照（适用于毕业论文外文翻译+中英文对照）.docx（38页珍藏版）》请在冰豆网上搜索。

图像融合技术外文翻译-中英对照（适用于毕业论文外文翻译+中英文对照）.docx

中英文资料对照外文翻译

使用不变特征的全景图像自动拼接

摘要

本文研究全自动全景图像的拼接问题，尽管一维问题（单一旋转轴）很好研究，但二维或多行拼接却比较困难。

以前的方法使用人工输入或限制图像序列，以建立匹配的图像，在这篇文章中，我们假定拼接是一个多图像匹配问题，并使用不变的局部特征来找到所有图像的匹配特征。

由于以上这些，该方法对输入图像的顺序、方向、尺度和亮度变化都不敏感；它也对不属于全景图一部分的噪声图像不敏感，并可以在一个无序的图像数据集中识别多个全景图。

此外，为了提供更多有关的细节，本文通过引入增益补偿和自动校直步骤延伸了我们以前在该领域的工作。

1. 简介

全景图像拼接已经有了大量的研究文献和一些商业应用。

这个问题的基本几何学很好理解，对于每个图像由一个估计的3×3的摄像机矩阵或对应矩阵组成。

估计处理通常由用户输入近似的校直图像或者一个固定的图像序列来初始化，例如，佳能数码相机内的图像拼接软件需要水平或垂直扫描，或图像的方阵。

在自动定位进行前，第4版的REALVIZ拼接软件有一个用户界面，用鼠标在图像大致定位，而我们的研究是有新意的，因为不需要提供这样的初始化。

根据研究文献，图像自动对齐和拼接的方法大致可分为两类——直接的和基于特征的。

直接的方法有这样的优点，它们使用所有可利用的图像数据，因此可以提供非常准确的定位，但是需要一个只有细微差别的初始化处理。

基于特征的配准不需要初始化，但是缺少不变性的传统的特征匹配方法（例如，Harris角点图像修补的相关性）需要实现任意全景图像序列的可靠匹配。

在本文中，我们描述了一个基于不变特征的方法实现全自动全景图像的拼接，相比以前的方法有以下几个优点。

第一，不变特征的使用实现全景图像序列的可靠匹配，尽管在输入图像中有旋转、缩放和光照变化。

第二，通过假定图像拼接是一个多图像匹配问题，我们可以自动发现这些图像间的匹配关系，并且在无序的数据集中识别出全景图。

第三，通过使用多波段融合呈现无缝输出的全景图，可以产生高质量的结果。

本文通过

引入增益补偿和自动校直步骤延伸了我们以前在该领域的工作，我们还描述了一个高效的捆绑调整实现并展示对任意数量波段的多个重叠图像如何进行多波段融合。

特征匹配

本文其余部分的结构如下。

第二部分说明所研究问题的几何学和我们选择不变特征的原因。

第三部分介绍了图像匹配方法（RANSAC）和验证图像匹配的概率模型。

第四部分中，我们描述了图像对准算法（捆绑调整），即共同优化每个摄像头的参数。

五到七部分描述了处理过程，包括自动校直、增益补偿和多波段融合。

第九部分中，我们给出了结论和对未来工作的展望。

全景识别算法的第一步是在所有图像之间提取和匹配SIFT特征检测点。

SIFT特征检测子位于不同尺度空间高斯插值函数的极值点处，对每一个特征点，特征尺度和方向被确定，这为测量提供了一个相似不变的结构。

尽管在这个结构中简单的采样强度值是相似不变的，但是不变描述子实际上是通过对方向直方图的局部梯度值进行累积计算得到的，这样就允许边缘有轻微的移动而不会改变描述子的矢量，对仿射变换提供了一定的鲁棒性。

空间累积计算对平移不变性同样重要，因为感兴趣点位置通常仅在0~3个像素的范围内是精确的。

为了实现亮度不变性可以使用梯度（消除偏差）和对描述子矢量归一化（消除增益）。

由于SIFT特征在旋转和尺度变化时是不变的，我们可以处理具有变化的方向和大

小的图像（见图8）。

值得注意的是，这是传统的特征匹配技术不能实现的，例如Harris角点图像修补的相关性。

传统的相关性在图像旋转时是变化的，Harris角点在改变图像尺度时也是变化的。

假设相机绕光学中心旋转，图像的变换群是一个对应矩阵的特殊群。

由一个旋转矢

~ ~

量q=[q1，q2，q3]和焦距f将每个摄像头参数化，就给出了成对的对应矩阵ui=Hijuj，

其中

Hij=KiRiRTK-1

（1）

j j

~ ~ ~

并且ui,uj是均匀的图像坐标（ui=si[ui,1]，其中ui是二维的图像坐标）。

4参数的相机

模型定义为：

对旋转使用指数表示：

éfi 0

Ki=ê0 fi

êë0 0

é0

0ùúú1úû

-qi3

qi2ù

（2）

i´

R=e[qi]´,[q]

=êqi3

0 -q

i1ú

（3）

êë-qi2

qi1

0úû

在这个变换群中，理想条件下将会使用不变的图像特征。

可是，在图像坐标中对于

小的变换表示如下：

~ ~

ui=ui0+

¶ui

¶uj

ui0

Duj

（4）

或者等价于ui=Aijuj，其中，

éa11

Aij=êa21

êë0

a12a22

a13ùaú

23ú

1úû

（5）

是通过一个关于ui0的对应线性化得到的仿射变换。

这意味着每个小的图像修补经过一次仿射变换，并且合理利用了在仿射变换下局部不变的SIFT特征。

一旦从所有n个图像中提取特征点后（线性时间内），需对特征点进行匹配。

由于多个图像可能重叠在一个单一的光线上，在特征空间内每个特征点需和它最近的k个领域点匹配（k=4），通过使用k-d树算法找到近似最近的领域点，时间复杂度为O（nlogn）。

k-d树是一种轴对齐的二进制空间划分，它在平均最高方差维递归划分特征空间。

图像匹配

图像匹配的目标是找到所有匹配（例如重叠）图像，稍后图像匹配连通集会成为全景图。

由于每个图像可能和任意其他一个匹配，这个问题一开始就呈现是出图像数的二次方。

为了得到一个好的拼接结果，对于图像几何而言，每个图像只需要和少数重叠的图像来匹配。

从特征匹配这个步骤中，我们已找出图像间有大量匹配点的图像。

对于当前图像，我们将m幅图像作为可能的匹配图像（m=6），这m幅图像与当前图像有最大数量的特征匹配点。

首先，使用RANSAC算法选择一系列和图像间对应矩阵兼容的内点，然后应用概率模型做进一步的验证。

3.1使用RANSAC算法的鲁棒对应矩阵估计

RANSAC（随机抽样一致性算法）算法是使用最少的一组随机采样匹配点的一种鲁棒估计过程，用来估计图像变换参数，并找到与数据具有最好一致性的解决方案。

在全景图的情况下，我们选择r=4对匹配特征点，使用直接线性变换（DLT）方法计算图像间的对应矩阵H。

重复500次试验，选择内点数最大的解决方案（在像素误差范围内，其预测和H是一致的）。

假设一对匹配图像间的特征匹配点是正确的概率（内点概率）为pi，

n次试验后找到正确变换的概率为：

p（Hiscorrect）=1-（1-（pi）r）n

经过大量试验后，找到正确对应矩阵的概率非常大。

例如，对于内点概率

500次试验后，未找到正确对应矩阵的概率为1´10-14。

（6）

pi=0.5，在

图像匹配关系验证的概率模型

RANSAC算法本质上是一种估计H的采样方法，如果用对数似然和的最大化代替内点数量的最大化，结果是最大似然估计（MLE）。

此外，如果变换参数的先验值是有效的，可以计算出最大后验概率（MAP）。

这些算法被分别称为MLESAC和MAPSAC。

3.2

对两两图像间是否存在匹配关系，我们使用一系列几何一致的特征匹配点

（RANSAC内点）和一系列在重叠区域内，但不一致的特征点（RANSAC外点）来验证。

验证模型通过比较这些正确匹配产生的一系列内点和错误匹配产生的一系列外点的概率来进行验证。

对于一幅给定的图像，重叠区域内总的匹配特征点数为nf，内点数为ni。

图像是否有效匹配通过二进制变量mÎ{0,1}表示。

第i个匹配特征点f（i）Î{0,1}是否为内点被假定

为独立的贝努力分布，以便于内点总数服从贝努力分布：

i f 1

p（f（1:

nf）m=1）=B（n;n,p）

i f 0

p（f（1:

nf）m=0）=B（n;n,p）

（7）

（8）

其中，p1是可以正确匹配图像时特征点为内点的概率，p0是不能实现图像匹配时特征

点为内点的概率；f（1:

nf）表示特征匹配点变量的集合{f（i）,i=1,2,...,n}，内点数

ni=

i=1

f（i），B（.）是贝努力分布，表示如下：

（n x!

）

B（x;n,p）= n!

px（1-p）n-x

（9）

p（f（1:

nf）m=1）p（m=1）

p（f（1:

nf））

我们选择p1=0.6，p0=0.1，则可以使用贝叶斯规则（式10、11）计算正确图像匹配的先验概率。

p（m=1f（1:

nf））=

p（f（1:

nf）m=0）p（m=0）

p（f（1:

nf）m=1）p（m=1）

= 1

（10）

（11）

如果满足p（m=1f（1:

nf））>p

min

B（ni;nf,p1）p（m=1）accept 1

B（ni;nf

,p0

）p（m=0）

reject

pmin-1

（12）

我们可以实现图像匹配。

假定p（m=1）=10-6，pmin=0.999，进一步得出正确图像匹配的判定条件：

ni>a+bnf

（13）

其中a=8.0，b=0.3。

尽管在这我们选择了p0，p1，p（m=0），p（m=1）和pmin的值，

但在原理上可以从数据中进一步确定这些值。

例如，可以通过在大的数据集中计算一部分匹配点和正确的对应矩阵相一致来估计p1。

一旦图像间的匹配点对确定，我们可以找到全景序列作为连接匹配图像集，它可以

识别图像集中的多个全景，拒绝不匹配的噪声图像（见图2）。

（a）图一（b）图二

（c）SIFT匹配点1 （d）SIFT匹配点2

（e）RANSAC内点1 （f）RANSAC内点2

（g）依据对应矩阵的图像对准

图1，从所有图像中提取SIFT特征点。

使用k-d树匹配所有特征点后，对于一个给定图像，用有最多特征匹配点的m幅图像进行图像匹配。

首先执行RANSAC算法计算出对应矩阵，然后调用概率模型验证基于内点数的图像匹配，在这个例子中，输入图像是517×374像素，有247个正确特征匹配点。

（a）图像匹配点

（b）图像匹配点的连接分量

（c）输出全景图

图2，可识别全景图。

考虑一个特征匹配点的噪声集，我们使用RANSAC算法和概率验证过程找到

一致的图像匹配（a），每个图像对间的箭头表示在图像对间找到一致的特征匹配点集，图像匹配连接分量被找到（b），拼接成全景图（c）；注意到该算法对不属于

展开阅读全文