非线性最小二乘平差.docx

资源描述

非线性最小二乘平差.docx

《非线性最小二乘平差.docx》由会员分享，可在线阅读，更多相关《非线性最小二乘平差.docx（29页珍藏版）》请在冰豆网上搜索。

非线性最小二乘平差.docx

非线性最小二乘平差

6-2非线性模型平...

6-3非线性模型平...

6-4非线性模型...

6-1问题的提出

非线性最小二乘平差

6-1问题的提出

经典平差是基于线性模型的平差方法。

然而在现实世界中，严格的线性模型并不多见。

测量上大量的数学模型也是非线性模型。

传统的线性模型平差中的很多理论在非线性模型平差中就不一定适用；线性模型平差中的很多结论在非线性模型平差中就不一定成立；线性模型平差中的很多优良统计性质在非线性模型平差中就不一定存在。

例如，在线性模型平差中，当随机误差服从正态分布时，未知参数X的最小二乘估计

具有一致无偏性和方差最小性。

但在非线性模型平差中，即使随机误差严格服从正态分布，未知参数X的非线性最小二乘估计

也是有偏的。

其方差一般都不能达到最小值。

对于测量中大量的非线性模型，在经典平差中总是进行线性近似（经典的测量平差中称之为线性化），即将其展开为台劳级数，并取至一次项，略去二次以上各项。

如此线性近似，必然会引起模型误差。

过去由于测量精度不高，线性近似所引起的模型误差往往小于观测误差，故可忽略不计。

随着科学技术的不断发展，现在的观测精度已大大提高，致使因线性近似所产生的模型误差与观测误差相当，有些甚至还会大于观测误差。

例如，GPS载波相位观测值的精度很高，往往小于因线性近似所产生的模型误差。

因此，用近似的理论、模型、方法去处理具有很高精度的观测结果，从而导致精度的损失，这显然是不合理的。

现代科学技术要求估计结果的精度尽可能高。

这样，传统线性近似的方法就不一定能满足当今科学技术的要求。

另外，有些非线性模型对参数的近似值十分敏感，若近似值精度较差，则线性化会产生较大的模型误差。

由于线性近似后，没有顾及因线性近似所引起的模型误差，而用线性模型的精度评定理论去评定估计结果的精度，从而得到一些虚假的优良统计性质，人为地拔高了估计结果的精度。

鉴于上述各种原因，对非线性模型平差进行深入的研究是很有必要的。

非线性模型的平差和精度估计以及相应的误差理论研究也是当前国内外测绘界研究的前沿课题之一。

电子教材 > 第六章非线性模型平差 > 6-2非线性模型平差原理

一、非线性误差方程

测量中大量的观测方程是非线性方程。

比如导线测量中，以待定点坐标为未知参数的角度观测方程和边长观测方程分别为：

（6-2-1）

式中：

为待定点坐标的真值，

分别为角度观测值

和边长观测值

的真误差。

角度观测值和边长观测值的观测方程（6-2-1）式是待定点坐标真值（

）的非线性函数。

又如在GPS伪距测量中，第j颗卫星至测站k的几何距离的观测方程为：

也是测站点k的待定坐标真值（

）的非线性函数。

一般地，用L表示

的观测向量，用

表示

的未知参数向量的真值，用△表示

的真误差向量，则非线性观测方程可写为：

（6-2-2）

式中:

，是由n个

的非线性函数组成的

的向量;。

（6-2-2）式就是我们所要讨论的一般的非线性模型。

在一般的非线性模型（6-2-2）式中，用未知参数向量和真误差向量的估计值代替其真值，得非线性误差方程如下：

（6-2-3）

式中：

V为观测值的改正数向量（残差向量）；

为参数向量的估值。

二、非线性模型平差

由非线性误差方程（6-2-3）式知，非线性误差方程（6-2-3）式中仅有n个方程，而有n+t个未知数（n个观测值的改正数和t个参数）。

因此非线性误差方程（6-2-3）式是非线性不定方程组，有无穷组解。

在这无穷组解中，必然有一组解能使

（6-2-4）

我们将满足（6-2-4）式的一组解作为最优解，并称（6-2-4）式所确定的

为

的一个非线性最小二乘[23]估计。

本书中将求解非线性最小二乘估计的过程称为非线性模型平差。

可见，非线性模型平差与线性模型平差的是完全一致的。

（6-2-4）式的几何意义就是观测空间至解空间的距离最短，或者说

是解轨迹π上离观测值L最近的点（见图6-1）。

L到π的距离就是‖V‖。

图6-1

在非线性模型（6-2-3）式中，若

存在一阶连续偏导数，且

的非线性最小二乘估计量

存在，则残差向量V在

处垂直于切空间T（见图6-1）[24]。

一、非线性最小二乘估计的近似解

当非线性模型（6-2-3）式的非线性强度[24]较弱时，可以将非线性模型在

处线性近似，并用线性模型的求解理论和方法来近似地求解非线性模型（6-2-3）式。

这也就是我们大家所熟悉的传统方法——线性化方法，即将非线性模型（6-2-3）式在

处用台劳级数展开，取至一次项，得：

（6-3-1）

令

（6-3-2）

（6-3-3）

则（6-3-1）式可写为：

（6-3-4）

（6-3-4）式就是我们熟悉的间接平差的误差方程。

由间接平差知，根据最小二乘原理可解得：

（6-3-5）

于是参数X的非线性平差结果为：

（6-3-6）

例6-1（本例取自参考文献[24]）已知非线性模型为

。

其中参数

和

的真值为

。

的5个真值（用参数的真值X算得）和相应的5个同精度独立观测值列于表6-1。

表6-1

的真值和相应的观测值

真值

4.202834

3.258924

2.527006

1.959469

1.519394

观测值

4.20

3.25

2.52

1.95

1.51

观测方程为：

取参数X的近似值为

。

将观测方程在

处线性近似，得误差方程：

由（6-3-5）式得：

于是，由（6-3-6）式得参数X的平差值为：

参数估值

的真误差为：

其范数为：

二、非线性最小二乘平差的迭代解

当非线性模型的非线性强度很强时，线性近似可能产生大于观测误差的模型误差，所以对于非线性模型，一般采用迭代的方法求解。

求解非线性误差方程（6-2-3）式的最小二乘平差值，就是求参数X的估值

，使

（6-3-7）

由于

是一常量，所以（6-3-7）式等价于目标函数为

（6-3-8）

的非线性无约束最优化问题。

因为

是

的非线性函数，所以对（6-3-8）式求一阶偏导数，并令其为零，得不到

的显表达式。

故求不出

的解析解。

因此，我们只能设法寻找某一近似解

，使

（6-3-9）

成立。

寻找使（6-3-9）式成立的近似解

，一般只有采用迭代的方法。

为此，下面介绍几种常用的迭代方法。

1．牛顿法

设

的极小值

的一个近似值为

，在

附近将

展为台劳级数，取至二次项得：

（6-3-10）

式中：

（6-3-11）

（6-3-12）

称为

处的Hessian矩阵。

（6-3-13）

是

在

处的梯度方向。

由于

是

的一个已知的近似值，故（6-3-10）式只是

的函数，为了求得使（6-3-10）式成立的

，将（6-3-10）式对

求偏导，并令其为零，得：

移项后两边转置，顾及（6-3-12）式，得

（6-3-14）

当Gk非奇异时，由（6-3-14）式可解得使（6-3-10）式成立的

：

（6-3-15）

当

充分小时，

能使（6-3-10）式成立。

但由于

未知，故

不能充分小，需不断迭代，直至

充分小，其迭代公式为：

（6-3-16）

（6-3-16）式就是牛顿迭代的基本公式，迭代终止条件：

（6-3-17）

或

=0（6-3-18）

由于

是一个绝对值较大的数，而

的各元素的绝对值都很小，因此，由于计算机有效数字的限制，以（6-3-17）式作为迭代收敛条件比（6-3-18）式作为迭代收敛条件收敛要快一些。

牛顿法的迭代步骤为：

（1）选取初值

，并令k=0。

（2）按（6-3-11）式计算梯度方向

，若

=0则转至（7）。

（3）计算Hessian矩阵

。

（4）解线性方程组（6-3-14）式，得

。

（5）按（6-3-16）式计算新的近似值

。

（6）计算目标函数值

，若

则转至

（2）继续迭代。

（7）终止迭代，输出

和

，结束。

例6-2在例6-1中，仍设

，用牛顿法求例6-1中非线性模型的非线性最小二乘平差值。

解：

由例6-1知P=I，故目标函数为：

将

代入计算

，G0后，按以上迭代程序迭代，结果列于表6-2。

表6-2牛顿法迭代计算

-1.205024908

0.3991833382

.028********

0.0001691624122

-3.9492×10-9

-2.4012×10-9

-17.1530503

7.037242713

0.4948407424

0.002938012264

2.4039×10-7

-1.5569×10-7

5.333013265

5.41719809

5.422708003

5.442744565

5.422744593

5.422744582

-0.2539145225

-0.2542573375

-025********

-0.2556720853

-0.2556720877

-0.2556720866

-40.21054702

-40.58524686

-40.63522342

-40.63549278

-40.63549281

迭代6次后，有

=-40.63549281，所以停止迭代，得X的非线性最小二乘解为

则，

由例6-1知，本迭代解与其真值的距离比线性近似解与其真值的距离要小一个数量级。

当初值取

时，迭代发散，这说明牛顿法对初值很敏感。

2．信赖域法

牛顿法具有很快的收敛速度，但它总是局部收敛的。

因为牛顿法的基本思想是用二次函数

去逼近

。

只有当

充分小时，

才能很好地逼近

。

既然只有当

充分小时，

才能逼近

，那么可以对dX加以限制，然后在限制条件下来寻求

的极小值。

这个思想相当于求解下列约束最优化问题：

目标函数：

（6-3-19）

约束条件：

式中：

为一正数，它随迭代而变化。

约束条件

限制了

，使

的长度不大于

，这样

总在一个给定的小区域中活动。

这个区域是可信赖的，所以称该方法为信赖域法。

常数

取决于

对

的逼近程度。

这个逼近程度可用下式来描述

（6-3-20）

越接近于1，

对

的逼近程度越好，于是

（6-3-21）

这样，可总结出信赖域法的迭代程序：

（1）选取初值

，

。

（2）按（6-3-11）式和（6-3-12）式计算梯度方向

和矩阵

，若

=0则转至（7）。

（3）按（6-3-15）式计算

，并检查

是否满足约束条件。

若不满足，则采取适当方法对

予以压缩。

然后在区域

内求使

=min的

。

（4）计算

的新的近似值

。

（5）按（6-3-20）式计算

，并按（6-3-21）式确定

。

（6）检查

是成立。

若不成立，则转

（2）继续迭代。

（7）终止迭代，输出

和

，结束。

例6-3，设

，

=0.08，用信赖域法求解例6-1中非线性模型的非线性最小二乘平差值。

、g和Gk的表达式同例6-2，用信赖域法迭代计算的结果列于表6

展开阅读全文