chapt6.docx - 冰豆网

资源描述

chapt6.docx

《chapt6.docx》由会员分享，可在线阅读，更多相关《chapt6.docx（17页珍藏版）》请在冰豆网上搜索。

chapt6.docx

chapt6

第六章广义逆矩阵

6.1投影矩阵

设Cn=LM,即Cn为L和M的直和。

定义6.1将任意xCn变为沿着M到L的投影的变换称为沿着M到L的投影算子,记为PL,M即PL,Mx=y

性质：

R（PL,M）=L,N（PL,M）=M

如图：

PL,Mx=y,注意xyM.

定义6.2投影算子PL,M在Cn的基e1,e2,…,en下的矩阵称为投影矩阵。

引理1设ACn×n是幂等矩阵,A2=A,则N（A）=R（IA）

证明：

任给xN（A）,则Ax=0,从而

x=Ax+（IA）x=（IA）xR（IA）

因此N（A）R（IA）,

反之,任给xR（IA）,则存在yCn使得

x=（IA）y.从而Ax=A（IA）y=（AA2）y=0

这样R（IA）N（A）。

从而N（A）=R（IA）.

定理6.1矩阵P为投影矩阵的充要条件是P为幂等矩阵。

证明:

由引理1,取M=R（IP）,L=R（P）则R（PL,M）=L,N（PL,M）=M。

投影矩阵计算：

取L的一个基q1,q2,…,qr和M的一个基qr+1,qr+2,…,qn。

这样任给向量xCn,则x可以表示为x=（q1,q2,…,qr,qr+1,qr+2,…,qn）y=Qy.PL,Mx=QIry=QIrQ1x从而PL,M=QIrQ1.其中Ir表示对角线前r个元素为1,其余矩阵的所有元素为0.

思考：

PL,M和线性空间L,M的基的选择无关。

即如果我们分别选择L,M的另外一个基q1,q2,…,qr和qr+1,qr+2,…,qn；不妨设（q1,q2,…,qr）=（q1,q2,…,qr）R1,R1为rr的可逆矩阵。

（qr+1,qr+2,…,qn）=（qr+1,qr+2,…,qn）R2,R2为（nr）（nr）的可逆矩阵。

因此Q=（q1,q2,…,qr,qr+1,qr+2,…,qn）=Qdiag（R1,R2）,

这样投影变换利用这组基的矩阵表示为

PL,M=QIrQ1=Qdiag（R1,R2）Irdiag（R1,R2）1Q1

=Qdiag（R1,R2）Irdiag（（R1）1,（R2）1）Q1

=QIrQ1

=PL,M

可见矩阵与表示L,M的基的选择无关。

定义6.3设L是Cn的子空间,则称沿着L到L

的投影算子

为正交投影算子,简记为PL。

PLxL

正交投影算子在Cn的基e1,e2,…,en下的矩阵称为正交投影矩阵,记为PL。

定理6.2矩阵P为正交投影矩阵的充要条件是P为幂等Hermite矩阵。

证明：

若矩阵P=PL,则P为幂等矩阵。

若R（P）和R（IP）正交,从而对任意x,yCn

xHPH（IP）y=0,即PH（IP）=0,

从而PH=PHP,这样P=PHP=PH。

反之,若P=PH,且P2=P。

由P2=P根据定理6.1有P=PR（P）,N（P）=PR（P）=

成立。

正交投影矩阵计算：

取L的一个标准正交基q1,q2,…,qr和M的一个标准正交基qr+1,qr+2,…,qn。

由于LM,因此Q=（q1,q2,…,qr,qr+1,qr+2,…,qn）为正交矩阵。

这样任给向量xCn,则x可以表示为

x=（q1,q2,…,qr,qr+1,qr+2,…,qn）y=Qy.

y=QHx

PL,Mx=QIry=QIrQ1x

从而PL,M=QIrQH类似于投影矩阵的讨论,正交投影算子的矩阵表示和L,M的正交基选择无关。

6.2广义逆矩阵的定义和性质

定义6.4设矩阵ACm×n,若矩阵XCn×m满足

如下四个Penrose方程

则称X为A的Moore-Penrose逆,记为A+。

Cm=R（A）N（X）V1,

定理6.3对任意ACm×n,A+存在并且惟一。

证明：

存在性由奇异值分解可得。

A=Udiag（1,2,...,r,0,...,0）VH

定义X=A+=Vdiag（1/1,1/2,...,1/r,0,...,0）HUH

显然易验证A+满足定义的4个条件。

唯一性：

设有两个不同的A+伪逆X和Y,则

Y=YAY=Y（AY）H=YYHAH=YYH（AXA）H

=YYHAH（AX）H=Y（AY）HAX=Y（AYA）X

=YAX=（YA）HX=AHYHX

=AHYHXAX=AHYH（XA）HX=AHYHAHXHX

=（AYA）HXHX=AHXHX=（XA）HX=XAX=X.

定理：

定义6.5对任意ACm×n,若XCn×m满足Penrose方程中的（i）,（j）,…,（l）等到方程,则称X为A

的{i,j,…,l}-逆,记为A（i,j,…,l）,其全体记为A{i,j,…,l}.

定理6.4矩阵ACm×n,有惟一{1}-逆的充要条件是A非奇异矩阵,且这个{1}-逆与A1一致。

（复习定理1.35）.

定理:

=Vn

定理1.35：

对任意矩阵ACmn,有

R（A）=N（AH）,R（A）N（AH）=CmR（AH）=N（A）,R（AH）N（A）=Cn

引理：

N（A）N（B）存在X,使得A=XB.

R（A）R（B）存在X,使得A=BX.

证明：

由N（A）,R（A）的定义,显然成立。

推论：

rank（AB）=rank（A）A=ABX

rank（BA）=rank（A）A=XBA

定理6.5设ACm×n,BCn×p,C,则

（1）（A

（1））HAH{1};

（2）+A

（1）（A）{1};

（3）若S和T非奇异,则T-1A

（1）S-1（SAT）{1}；

（4）rank（A

（1））rank（A）;

（5）AA

（1）和A

（1）A均为幂等矩阵且与A同秩；

（6）R（AA

（1））=R（A）,N（A

（1）A）=N（A）,R（（A

（1）A）H）=R（AH）;

（7）A

（1）A=In的充要条件是rankA=n,AA

（1）=Im的充要条件是rankA=m;

（8）AB（AB）

（1）A=A的充要条件是rank（AB）=rankA,

B（AB）

（1）AB=B的充要条件是rank（AB）=rankB.

证明

（1）至（5）由定义可得.

证明（6）.R（AA

（1））R（A）=R（AA

（1）A）R（AA

（1））

所以R（AA

（1））=R（A）

由引理N（A）N（A

（1）A）N（AA

（1）A）=N（A）

所以N（A）=N（A

（1）A）.

（7）利用（5）式显然可证。

（8）充分性：

由于R（AB）R（A）和rank（A）=rank（AB）

得到R（AB）=R（A）

即R（A）R（AB）,得到存在X使得

A=ABX=（AB（AB）

（1）AB）X

=AB（AB）

（1）[ABX]=AB（AB）

（1）A

必要性：

rank（A）rank（AB）rank（AB（AB）

（1）A）

=rank（A）.

第2个等式同样证明。

说明：

在这节的许多证明中反复应用（8）这种证明方法,即利用引理和矩阵广义逆的定义证明结论。

定理6.6设矩阵Y,ZA{1},又设X=YAZ,则XA{1,2}

证明：

XAX=YAZAYAZ=Y（AZA）YAZ=Y（AYA）Z=YAZ=X.

定理6.7给定矩阵A和XA{1},则XA{1,2}的充要条件是rank（X）=rank（A）.

证明：

充分性：

因XA{1},所以A=AXA

所以rank（X）rank（XA）rank（AXA）=rank（A）

这样rank（X）=rank（XA）,

又因为R（XA）R（X）,这样R（X）=R（XA）

这就得到存在Y使得X=XAY

即X=XAY=X（AXA）Y=XA（XAY）=XAX

从而XA{2}

必要性。

由定理6.5我们知道

因XA{1}可得

rank（A）=rank（AX）rank（XAX）=rank（X）

rank（X）rank（AX）

因此rank（A）=rank（X）.

引理2对任意矩阵A均有rank（AHA）=rankA=rank（AAH）

证明：

由AHAx=0Ax=0,即N（AHA）N（A）

由引理存在X使得A=XAHA.

这就可得rank（A）rank（AHA）rank（A）

即rank（AHA）=rankA。

余下的类推。

定理6.8设矩阵A给定,则Y=（AHA）

（1）AHA{1,2,3}Z=AH（AAH）

（1）A{1,2,4}

证明：

rank（AHA）=rank（A）=rank（AH）,

由定理6.5的（8）可得

A=A（AHA）

（1）AHA

AH=AHA（AHA）

（1）AH

从而AYA=A（AHA）

（1）AHA=A

YAY=（AHA）

（1）[AHA（AHA）

（1）AH]=（AHA）

（1）AH=Y.

由于存在X使得A=XAHA,所以

AY=A（AHA）

（1）AH=XAHA（AHA）

（1）（XAHA）H=X[AHA（AHA）

（1）AHA]XH=XAHAXH为Hermite矩阵。

定理6.9设矩阵A给定,则A+=A（1,4）AA（1,3）

证明：

记X=A（1,4）AA（1,3）,由定理6.6知XA（1,2）.

另外,AX=AA（1,4）AA（1,3）=AA（1,3）为Hermite矩阵

XA=A（1,4）AA（1,3）A=A（1,4）A为Hermite矩阵。

从而由A+得到结论。

定理6.10设矩阵A给定,则

（1）rankA+=rankA;

（2）（A+）+=A;

（3）（AH）+=（A+）H,（AT）+=（A+）T;

（4）（AHA）+=A+（AH）+,（AAH）+=（AH）+A+;

（5）A+=（AHA）+AH=AH（AAH）+;

（6）R（A+）=R（AH）,N（A+）=N（AH）.

证明：

（1）-（4）可应用前面的定义得到。

下面证明（5）和（6）.

（5）.设X=（AHA）+AH,由定理6.8可得XA{1,2,3}由于XA=（AHA）+AHA为Hermite矩阵。

（利用（AHA）+AHA{1,2,3,4}）

（6）.由于A+AA+=A+,可得rank（AH）=rank（A）=rank（A+）

由于（5）,A+=AH（AAH）+得到R（A+）R（AH）这样R（A+）=R（AH）.

同样由A+=（AHA）+AH,得到N（AH）N（A+）因此N（A+）=N（AH）。

推论1若ACnm×n,则A+=（AHA）1AH

若ACmm×n则A+=AH（AAH）1

推论2设为n维列向量,且0,则+=（H）1H

而（H）+=（+）H=（H）1

对于同阶可逆矩阵A,B有（AB）1=B1A1;

定理6.10之（4）表明对于特殊的矩阵A和AH,

Moore-Penrose逆有类似的性质。

定义6.6设矩阵ACm×n。

若矩阵XCn×m满足AX=PR（A）,XA=PR（X）,其中PL是空间L上的

正交投影矩阵,则称X为A的Moore广义逆矩阵。

定理6.11Moore的广义逆矩阵和Penrose的广义逆矩阵（定义6.4）是等价的。

定理6.12设ACm×n,若存在xCn×m和CCm×m,VCn×n满足AXA=A,X=AHU,X=VAH,

则X惟一确定,且X=A+。

定理6.13设ACm×n,若存在xCn×m和ZCm×n,满足AXA=A,X=AHZAH,则X=A+。

线性映射理论在广义逆中的应用

1）若XA{1},设ACmn,取N（A）的一个基xr+1,xr+2,…,xn,

扩充为Cn的一个基为x1,x2,…,xr,xr+1,xr+2,…,xn。

则Ax1,Ax2,…,Axr为R（A）的一个基,

扩充为Cm的一个基Ax1,Ax2,…,Axr,y1,y2,…,ymr.

显然A（x1,x2,…,xr,xr+1,xr+2,…,xn）=（Ax1,Ax2,…,Axr,y1,y2,…,ymr）

由AXA=A可推得

X（Ax1,Ax2,…,Axr,y1,y2,…,ymr）=（x1,x2,…,xr,xr+1,xr+2,…,xn）

记Q=（x1,x2,…,xr,xr+1,xr+2,…,xn）,P=（Ax1,Ax2,…,Axr,y1,y2,…,ymr）

由此有A=P

Q1,X=Q

2）.若XA{1,2},则由XAX=X，可以推得

D=CB.因此这时

X=Q

P1=Q

3）.若XA{1,3},则（AX）H=AX

这时我们选取x1,x2,…,xr,xr+1,xr+2,…,xn的为Cn一个正交基，选取y1,y2,…,ymr为R（A）的一个正交基。

这时

AX=P

P1而P1=

其中X1=（x1,x2,…,xr）为N（A）的一个标准正交基。

这样

AX=P

那么由AX为Hermite矩阵可得B=0。

从而X=Q

4）.若XA{1,4},则（XA）H=XA

类似地，由3）的假设可得

XA=Q

QH,

这时由XA为Hermite矩阵可得C=0。

从而X=Q

5）若XA{1,3,4},则

X=Q

P1=X1

X1HAH+X2DYH其中X2为N（A）的一个标准正交基,

Y为R（A）的一个标准正交基。

6）.若XA{1,2,3,4},则

A+=Q

P1=X1

X1HAH

联合3）.4）推得A+=A（1,4）AA（1,3）

7）.若A的满秩分解为A=FG,取X1=GH（GGH）1/2，这时X1为N（A）的一个标准正交基。

这样可以算得

A+=GH（GGH）1（FHF）1FH=GH（FHFGGH）1FH=GH（FHAGH）1FH

利用这些表达式，可以得到如下几个定理的证明

定理6.12设ACm×n,若存在XCn×m和UCm×m,VCn×n满足AXA=A,X=AHU,X=VAH,

则X惟一确定,且X=A+。

定理6.13设ACm×n,若存在xCn×m和ZCm×n,满足AXA=A,X=AHZAH,则X=A+。

6.3广义逆的计算方法（本节主要掌握计算矩阵1-逆和A+逆的一种计算方法）

1.利用Hermite标准形计算{1}和{2}逆

定理6.14设ACrm×n,又设QCmm×m和PCnn×n使得

成立,则对任意LC（n-r）（m-r）,n×m矩阵

是A的{1}-逆。

若令L=0则X是A的{1,2}-逆.

例

则存在矩阵P和Q使得

QAP=

此时Q=

对于任意的数a,b我们有

X=P

其中a,b为任意的数.这时X属于A{1}。

若令a=b=0

则X=

属于A{1,2}.

2.利用满秩分解求广义逆矩阵

定理6.15设ACrm×n（r>0）的满秩分解为式A=FG,则

（1）G（i）F

（1）A{i},i=1,2,4;

（2）G

（1）F（i）A{i},i=1,2,3;

（3）G

（1）F+A{1,2,3},G+F

（1）A{1,2,4};

（4）A+=G+F（1,3）=G（1,4）F+;

（5）A+=G+F+=GH（GGH）-1（FHF）-1FH=GH（FHAGH）-1FH.

证明：

由于G和F为满秩矩阵,因此F

（1）F=GG

（1）=Ir

由定义可直接验证

（1）和

（2）.

验证

（1）.AG

（1）F

（1）A=FGG

（1）F

（1）FG=FG=A.

（2）F

（1）AG

（2）F

（1）=G

（2）F

（1）FGG

（2）F

（1）=G

（2）GG

（2）F

（1）=G

（2）F

（1）

G（4）F

（1）A=G（4）F

（1）FG=G（4）G=（G（4）G）H=（G（4）F

（1）A）H

（2）类似可证。

（3）.由

（1）

（2）可得。

其中G+和F+换成G（1,2,4）和F（1,2,3）结论也成立。

（4）.由（3）知道G+F（1,3）A{1,2,4},证明G+F（1,3）A{3}

AG+F（1,3）=FGG+F（1,3）=FF（1,3）=（FF（1,3））H=（AG+F（1,3））H

从而G+F（1,3）A{3}成立。

（5）利用公式F+=（FHF）1FH,

G+=GH（GGH）1

可得结论。

由此我们得到了计算A+的方法。

例

=FG（FHF）1FH=

G1=G

则A+=G（FHF）1FH=

引理3设ACrm×n,UCn×p,VCq×m,又设X=U（VAU）

（1）V（6.3.5）

其中（VAU）

（1）（VAU）{1}.则

（1）XA{1}的充要条件是rank（VAU）=r；

（2）XA{2}且R（X）=R（U）的充要条件是rank（VAU）=rankU

（3）XA{2}且N（X）=N（V）的充要条件是rank（VAU）=rankV

（4）XA{1,2}且R（X）=R（U）,N（X）=N（V）的充要条件是rank（VAU）=rankU=rankV=r

引理4对任意给定的矩阵A满足XA{1,2}和

R（X）=R（AH）,N（X）=N（AH）的惟一矩阵为A+。

定理6.16给定矩阵A,则A+=AH（AHAAH）

（1）AH（6.3.6）

其中（AHAAH）

（1）（AHAAH）{1}

定理6.17（Greville）设ACm×n,记ak（k=1,…,n）为A的

第k列,Ak（k=1,…,n）为A的前k列构成的子矩阵；又记dk=A+k-1ak（6.3.7）

ck=ak-Ak-1dk=ak-Ak-1A+k-1ak=ak-

（6.3.8）则

（6.3.9）其中

（k=2,…,n）

6.4广义逆与线性方程组求解

（本节主要讨论利用广义逆表示一般线性方程组的解.对于线性方程组Ax=b,如果A非奇异，则x=A1b.对于一般的线性方程组，我们希望得到类似的结果。

这就是本节讨论的主要问题.）

定理6.26设ACm×n,BCp×q,DCm×q,则矩阵方程AXB=D（6.4.5）

相容的充要条件是AA

（1）DB

（1）B=D（6.4.6）

其中A

（1）A{1},B

（1）B{1}.当方程（6.4.5）相容时,其通解为

X=A

（1）DB

（1）+YA

（1）AYBB

（1）（6.4.7）这里YCn×p任意。

证明：

充分性.若AA

（1）DB

（1）B=D成立,取X=A

（1）DB

（1）结论

显然成立。

反之,若AXB=D有解,则D=AXB=AA

（1）AXBB

（1）B=AA

（1）DB

（1）B成立。

显然A

（1）DB

（1）+Y-A

（1）AYBB

（1）为AXB=D的解。

若X为其任意一个解,则

X=A

（1）DB

（1）+XA

（1）AXBB

（1）成立。

推论设ACm×n,A

（1）A{1}则A{1}={A

（1）+ZA

（1）AZAA

（1）|ZCn×m}（6.4.8）

定理6.27线性方程组Ax=b相容的充要条件是AA

（1）b=b（6.4.9）

且其通解为x=A

（1）b+（I-A

（1）A）y（6.4.10）其中yCn任意。

证明：

充分性显然。

必要性：

b=Ax=AA

（1）Ax=AA

（1）b.显然A

（1）b+（I-A

（1）A）y为它的解,反之若Ax=b

则x=A

（1）b+xA

（1）b=A

（1）b+xA

（1）Ax=A

（1）b+（IA

（1）A）x

定理6.28设ACm×n,bCm,XCn×m.若对于使得方程组（6.5.1）相容的所有b,x=Xb都是解,

则XA{1}。

证明：

由于对于A的每一列ai,则Ax=ai都是相容的。

因此AXai=ai,取i=1,2,...,n,则得到AXA=A成立。

2.相容线性方程组的最小范数解

引理6相容方程组Ax=b的极小范数解惟一,且这个惟一解在R（AH）中。

证明：

利用R（AH）=N（A）.

引理7集合A{1,4}由矩阵方程XA=A（1,4）A（6.4.11）的所有解X组成,其中A（1,4）A{1,4}。

证明：

显然

XA=XAA（1,4）A=（XA）H（A（1,4）A）H=AHXHAH（A（1,4））H=（AXA）H（A（1,4））H=AH（A（1,4））H=（A（1,4）A）H=A（1,4）A

这个定理说明对于任给的XA{1,4}XA为常数矩阵。

推论：

A（1,4）A=

AA（1,3）=PR（A）.

定理6.29设ACm×n,A（1,4）A{1,4},则A{1,4}={A（1,4）+Z（I-AA（1,4））|ZCn×m}（6.4.12）

定理6.30设方程组Ax=b相容,则x=A（1,4）b为最小范数解；反之,若对任何的bR（A）,Xb都是最小范数解,则XA{1,4}.

3.矛盾方程组的最小二乘解与{1,3}-逆Ax=b

引理8设ACm×n,集合A{1,3}由矩阵方程AX=AA（1,3）（6.4.13）的所有解X组成,其中

A（1,3）A{1,3}。

证明:

若XA{1,3},则AX=AA（1,3）AX=（AX）H（AA（1,3））H=AXAA（1,3）=AA（1,3）

反之，若AX=AA（1,3）,则首先由于AA（1,3）为Hermite矩阵,

从而AX为Hermite矩阵，即XA{3};

另外，AXA=AA（1,3）A=A,从而XA{1}.这样XA{1,3}。

证毕。

推论：

A（1,4）A=

AA（1,3）=PR（A）.

定理6.31设ACm×n,A（1,3）A{1,3}则A{1,3}={A（1,3）+（IA（1,3）A）Z|ZCn×m}（6.4.14）

证明：

由引理8和定理6.26可得

AX=AA（1,3）通解为X=A（1,3）AA（1,3）+YA（1,3）AY

令Y=A（1,3）+Z,代入可得

X=A（1,3）AA（1,3）+A（1,3）+ZA（1,3）A（A（1,3）+Z）

=A（1,3）AA（1,3）+A（1,3）+ZA（1,3）AA（1,3）A（1,3）AZ

=A（1,3）+（IA（1,3）A）Z证毕。

定理6.32设ACm×n,bCm,A（1,3）A{1,3}.则x=A（1,3）b（6.4.15）是方程组Ax=b的最小二乘解,反之,设XCm×n,若对所有bCm,x=Xb都是方程组Ax=b的最小二乘解,则XA{1,3}

证明:

显然Axb=AxPR（A）b+（PR（A）bb）由于AxPR（A）bR（A）,（PR（A）bb）R（A）=N（AH）

所以||Axb||2=||AxPR（A）b||2+||PR（A）bb||2

显然||Axb||2取得极小值的充要条件为AxPR（A）b=0.

任取A（1,3）A{1,3},欲证AA（1,3）=PR（A）需证明R（AA（1,3））=R（A）,且AA（1,3）为投影矩阵。

R（AA（1,3））=R（A）.

显然R（AA（1,3））R（A）=R（AA（1,3）A）R（AA（1,3））从而R（AA（1,3））=R（A）且AA（1,3）=AA（1,3）（AA（1,3））.

R（AA（1,3））=N（（AA（1,3））H）N（AH）=R（A）.反之，若yN（A

展开阅读全文