chapt6.docx
《chapt6.docx》由会员分享,可在线阅读,更多相关《chapt6.docx(17页珍藏版)》请在冰豆网上搜索。
chapt6
第六章广义逆矩阵
6.1投影矩阵
设Cn=LM,即Cn为L和M的直和。
定义6.1将任意xCn变为沿着M到L的投影的变换称为沿着M到L的投影算子,记为PL,M即PL,Mx=y
性质:
R(PL,M)=L,N(PL,M)=M
Mx
yL
如图:
PL,Mx=y,注意xyM.
定义6.2投影算子PL,M在Cn的基e1,e2,…,en下的矩阵称为投影矩阵。
引理1设ACn×n是幂等矩阵,A2=A,则N(A)=R(IA)
证明:
任给xN(A),则Ax=0,从而
x=Ax+(IA)x=(IA)xR(IA)
因此N(A)R(IA),
反之,任给xR(IA),则存在yCn使得
x=(IA)y.从而Ax=A(IA)y=(AA2)y=0
这样R(IA)N(A)。
从而N(A)=R(IA).
定理6.1矩阵P为投影矩阵的充要条件是P为幂等矩阵。
证明:
由引理1,取M=R(IP),L=R(P)则R(PL,M)=L,N(PL,M)=M。
投影矩阵计算:
取L的一个基q1,q2,…,qr和M的一个基qr+1,qr+2,…,qn。
这样任给向量xCn,则x可以表示为x=(q1,q2,…,qr,qr+1,qr+2,…,qn)y=Qy.PL,Mx=QIry=QIrQ1x从而PL,M=QIrQ1.其中Ir表示对角线前r个元素为1,其余矩阵的所有元素为0.
思考:
PL,M和线性空间L,M的基的选择无关。
即如果我们分别选择L,M的另外一个基q1,q2,…,qr和qr+1,qr+2,…,qn;不妨设(q1,q2,…,qr)=(q1,q2,…,qr)R1,R1为rr的可逆矩阵。
(qr+1,qr+2,…,qn)=(qr+1,qr+2,…,qn)R2,R2为(nr)(nr)的可逆矩阵。
因此Q=(q1,q2,…,qr,qr+1,qr+2,…,qn)=Qdiag(R1,R2),
这样投影变换利用这组基的矩阵表示为
PL,M=QIrQ1=Qdiag(R1,R2)Irdiag(R1,R2)1Q1
=Qdiag(R1,R2)Irdiag((R1)1,(R2)1)Q1
=QIrQ1
=PL,M
可见矩阵与表示L,M的基的选择无关。
定义6.3设L是Cn的子空间,则称沿着L到L
的投影算子
为正交投影算子,简记为PL。
Lx
PLxL
正交投影算子在Cn的基e1,e2,…,en下的矩阵称为正交投影矩阵,记为PL。
定理6.2矩阵P为正交投影矩阵的充要条件是P为幂等Hermite矩阵。
证明:
若矩阵P=PL,则P为幂等矩阵。
若R(P)和R(IP)正交,从而对任意x,yCn
xHPH(IP)y=0,即PH(IP)=0,
从而PH=PHP,这样P=PHP=PH。
反之,若P=PH,且P2=P。
由P2=P根据定理6.1有P=PR(P),N(P)=PR(P)=
=
成立。
正交投影矩阵计算:
取L的一个标准正交基q1,q2,…,qr和M的一个标准正交基qr+1,qr+2,…,qn。
由于LM,因此Q=(q1,q2,…,qr,qr+1,qr+2,…,qn)为正交矩阵。
这样任给向量xCn,则x可以表示为
x=(q1,q2,…,qr,qr+1,qr+2,…,qn)y=Qy.
y=QHx
PL,Mx=QIry=QIrQ1x
从而PL,M=QIrQH类似于投影矩阵的讨论,正交投影算子的矩阵表示和L,M的正交基选择无关。
6.2广义逆矩阵的定义和性质
定义6.4设矩阵ACm×n,若矩阵XCn×m满足
如下四个Penrose方程
则称X为A的Moore-Penrose逆,记为A+。
Cm=R(A)N(X)V1,
定理6.3对任意ACm×n,A+存在并且惟一。
证明:
存在性由奇异值分解可得。
A=Udiag(1,2,...,r,0,...,0)VH
定义X=A+=Vdiag(1/1,1/2,...,1/r,0,...,0)HUH
显然易验证A+满足定义的4个条件。
唯一性:
设有两个不同的A+伪逆X和Y,则
Y=YAY=Y(AY)H=YYHAH=YYH(AXA)H
=YYHAH(AX)H=Y(AY)HAX=Y(AYA)X
=YAX=(YA)HX=AHYHX
=AHYHXAX=AHYH(XA)HX=AHYHAHXHX
=(AYA)HXHX=AHXHX=(XA)HX=XAX=X.
定理:
定义6.5对任意ACm×n,若XCn×m满足Penrose方程中的(i),(j),…,(l)等到方程,则称X为A
的{i,j,…,l}-逆,记为A(i,j,…,l),其全体记为A{i,j,…,l}.
定理6.4矩阵ACm×n,有惟一{1}-逆的充要条件是A非奇异矩阵,且这个{1}-逆与A1一致。
(复习定理1.35).
定理:
V1
=Vn
定理1.35:
对任意矩阵ACmn,有
R(A)=N(AH),R(A)N(AH)=CmR(AH)=N(A),R(AH)N(A)=Cn
引理:
N(A)N(B)存在X,使得A=XB.
R(A)R(B)存在X,使得A=BX.
证明:
由N(A),R(A)的定义,显然成立。
推论:
rank(AB)=rank(A)A=ABX
rank(BA)=rank(A)A=XBA
定理6.5设ACm×n,BCn×p,C,则
(1)(A
(1))HAH{1};
(2)+A
(1)(A){1};
(3)若S和T非奇异,则T-1A
(1)S-1(SAT){1};
(4)rank(A
(1))rank(A);
(5)AA
(1)和A
(1)A均为幂等矩阵且与A同秩;
(6)R(AA
(1))=R(A),N(A
(1)A)=N(A),R((A
(1)A)H)=R(AH);
(7)A
(1)A=In的充要条件是rankA=n,AA
(1)=Im的充要条件是rankA=m;
(8)AB(AB)
(1)A=A的充要条件是rank(AB)=rankA,
B(AB)
(1)AB=B的充要条件是rank(AB)=rankB.
证明
(1)至(5)由定义可得.
证明(6).R(AA
(1))R(A)=R(AA
(1)A)R(AA
(1))
所以R(AA
(1))=R(A)
由引理N(A)N(A
(1)A)N(AA
(1)A)=N(A)
所以N(A)=N(A
(1)A).
(7)利用(5)式显然可证。
(8)充分性:
由于R(AB)R(A)和rank(A)=rank(AB)
得到R(AB)=R(A)
即R(A)R(AB),得到存在X使得
A=ABX=(AB(AB)
(1)AB)X
=AB(AB)
(1)[ABX]=AB(AB)
(1)A
必要性:
rank(A)rank(AB)rank(AB(AB)
(1)A)
=rank(A).
第2个等式同样证明。
说明:
在这节的许多证明中反复应用(8)这种证明方法,即利用引理和矩阵广义逆的定义证明结论。
定理6.6设矩阵Y,ZA{1},又设X=YAZ,则XA{1,2}
证明:
XAX=YAZAYAZ=Y(AZA)YAZ=Y(AYA)Z=YAZ=X.
定理6.7给定矩阵A和XA{1},则XA{1,2}的充要条件是rank(X)=rank(A).
证明:
充分性:
因XA{1},所以A=AXA
所以rank(X)rank(XA)rank(AXA)=rank(A)
这样rank(X)=rank(XA),
又因为R(XA)R(X),这样R(X)=R(XA)
这就得到存在Y使得X=XAY
即X=XAY=X(AXA)Y=XA(XAY)=XAX
从而XA{2}
必要性。
由定理6.5我们知道
因XA{1}可得
rank(A)=rank(AX)rank(XAX)=rank(X)
rank(X)rank(AX)
因此rank(A)=rank(X).
引理2对任意矩阵A均有rank(AHA)=rankA=rank(AAH)
证明:
由AHAx=0Ax=0,即N(AHA)N(A)
由引理存在X使得A=XAHA.
这就可得rank(A)rank(AHA)rank(A)
即rank(AHA)=rankA。
余下的类推。
定理6.8设矩阵A给定,则Y=(AHA)
(1)AHA{1,2,3}Z=AH(AAH)
(1)A{1,2,4}
证明:
rank(AHA)=rank(A)=rank(AH),
由定理6.5的(8)可得
A=A(AHA)
(1)AHA
AH=AHA(AHA)
(1)AH
从而AYA=A(AHA)
(1)AHA=A
YAY=(AHA)
(1)[AHA(AHA)
(1)AH]=(AHA)
(1)AH=Y.
由于存在X使得A=XAHA,所以
AY=A(AHA)
(1)AH=XAHA(AHA)
(1)(XAHA)H=X[AHA(AHA)
(1)AHA]XH=XAHAXH为Hermite矩阵。
定理6.9设矩阵A给定,则A+=A(1,4)AA(1,3)
证明:
记X=A(1,4)AA(1,3),由定理6.6知XA(1,2).
另外,AX=AA(1,4)AA(1,3)=AA(1,3)为Hermite矩阵
XA=A(1,4)AA(1,3)A=A(1,4)A为Hermite矩阵。
从而由A+得到结论。
定理6.10设矩阵A给定,则
(1)rankA+=rankA;
(2)(A+)+=A;
(3)(AH)+=(A+)H,(AT)+=(A+)T;
(4)(AHA)+=A+(AH)+,(AAH)+=(AH)+A+;
(5)A+=(AHA)+AH=AH(AAH)+;
(6)R(A+)=R(AH),N(A+)=N(AH).
证明:
(1)-(4)可应用前面的定义得到。
下面证明(5)和(6).
(5).设X=(AHA)+AH,由定理6.8可得XA{1,2,3}由于XA=(AHA)+AHA为Hermite矩阵。
(利用(AHA)+AHA{1,2,3,4})
(6).由于A+AA+=A+,可得rank(AH)=rank(A)=rank(A+)
由于(5),A+=AH(AAH)+得到R(A+)R(AH)这样R(A+)=R(AH).
同样由A+=(AHA)+AH,得到N(AH)N(A+)因此N(A+)=N(AH)。
推论1若ACnm×n,则A+=(AHA)1AH
若ACmm×n则A+=AH(AAH)1
推论2设为n维列向量,且0,则+=(H)1H
而(H)+=(+)H=(H)1
对于同阶可逆矩阵A,B有(AB)1=B1A1;
定理6.10之(4)表明对于特殊的矩阵A和AH,
Moore-Penrose逆有类似的性质。
定义6.6设矩阵ACm×n。
若矩阵XCn×m满足AX=PR(A),XA=PR(X),其中PL是空间L上的
正交投影矩阵,则称X为A的Moore广义逆矩阵。
定理6.11Moore的广义逆矩阵和Penrose的广义逆矩阵(定义6.4)是等价的。
定理6.12设ACm×n,若存在xCn×m和CCm×m,VCn×n满足AXA=A,X=AHU,X=VAH,
则X惟一确定,且X=A+。
定理6.13设ACm×n,若存在xCn×m和ZCm×n,满足AXA=A,X=AHZAH,则X=A+。
线性映射理论在广义逆中的应用
1)若XA{1},设ACmn,取N(A)的一个基xr+1,xr+2,…,xn,
扩充为Cn的一个基为x1,x2,…,xr,xr+1,xr+2,…,xn。
则Ax1,Ax2,…,Axr为R(A)的一个基,
扩充为Cm的一个基Ax1,Ax2,…,Axr,y1,y2,…,ymr.
显然A(x1,x2,…,xr,xr+1,xr+2,…,xn)=(Ax1,Ax2,…,Axr,y1,y2,…,ymr)
由AXA=A可推得
X(Ax1,Ax2,…,Axr,y1,y2,…,ymr)=(x1,x2,…,xr,xr+1,xr+2,…,xn)
记Q=(x1,x2,…,xr,xr+1,xr+2,…,xn),P=(Ax1,Ax2,…,Axr,y1,y2,…,ymr)
由此有A=P
Q1,X=Q
P1
2).若XA{1,2},则由XAX=X,可以推得
D=CB.因此这时
X=Q
P1=Q
P1
3).若XA{1,3},则(AX)H=AX
这时我们选取x1,x2,…,xr,xr+1,xr+2,…,xn的为Cn一个正交基,选取y1,y2,…,ymr为R(A)的一个正交基。
这时
AX=P
P1而P1=
PH
其中X1=(x1,x2,…,xr)为N(A)的一个标准正交基。
这样
AX=P
PH
那么由AX为Hermite矩阵可得B=0。
从而X=Q
P1
4).若XA{1,4},则(XA)H=XA
类似地,由3)的假设可得
XA=Q
QH,
这时由XA为Hermite矩阵可得C=0。
从而X=Q
P1
5)若XA{1,3,4},则
X=Q
P1=X1
X1HAH+X2DYH其中X2为N(A)的一个标准正交基,
Y为R(A)的一个标准正交基。
6).若XA{1,2,3,4},则
A+=Q
P1=X1
X1HAH
联合3).4)推得A+=A(1,4)AA(1,3)
7).若A的满秩分解为A=FG,取X1=GH(GGH)1/2,这时X1为N(A)的一个标准正交基。
这样可以算得
A+=GH(GGH)1(FHF)1FH=GH(FHFGGH)1FH=GH(FHAGH)1FH
利用这些表达式,可以得到如下几个定理的证明
定理6.12设ACm×n,若存在XCn×m和UCm×m,VCn×n满足AXA=A,X=AHU,X=VAH,
则X惟一确定,且X=A+。
定理6.13设ACm×n,若存在xCn×m和ZCm×n,满足AXA=A,X=AHZAH,则X=A+。
6.3广义逆的计算方法(本节主要掌握计算矩阵1-逆和A+逆的一种计算方法)
1.利用Hermite标准形计算{1}和{2}逆
定理6.14设ACrm×n,又设QCmm×m和PCnn×n使得
成立,则对任意LC(n-r)(m-r),n×m矩阵
是A的{1}-逆。
若令L=0则X是A的{1,2}-逆.
例
A=
则存在矩阵P和Q使得
QAP=
=E
此时Q=
P=
对于任意的数a,b我们有
X=P
Q
=
=
=
+a
+b
其中a,b为任意的数.这时X属于A{1}。
若令a=b=0
则X=
属于A{1,2}.
2.利用满秩分解求广义逆矩阵
定理6.15设ACrm×n(r>0)的满秩分解为式A=FG,则
(1)G(i)F
(1)A{i},i=1,2,4;
(2)G
(1)F(i)A{i},i=1,2,3;
(3)G
(1)F+A{1,2,3},G+F
(1)A{1,2,4};
(4)A+=G+F(1,3)=G(1,4)F+;
(5)A+=G+F+=GH(GGH)-1(FHF)-1FH=GH(FHAGH)-1FH.
证明:
由于G和F为满秩矩阵,因此F
(1)F=GG
(1)=Ir
由定义可直接验证
(1)和
(2).
验证
(1).AG
(1)F
(1)A=FGG
(1)F
(1)FG=FG=A.
G
(2)F
(1)AG
(2)F
(1)=G
(2)F
(1)FGG
(2)F
(1)=G
(2)GG
(2)F
(1)=G
(2)F
(1)
G(4)F
(1)A=G(4)F
(1)FG=G(4)G=(G(4)G)H=(G(4)F
(1)A)H
(2)类似可证。
(3).由
(1)
(2)可得。
其中G+和F+换成G(1,2,4)和F(1,2,3)结论也成立。
(4).由(3)知道G+F(1,3)A{1,2,4},证明G+F(1,3)A{3}
AG+F(1,3)=FGG+F(1,3)=FF(1,3)=(FF(1,3))H=(AG+F(1,3))H
从而G+F(1,3)A{3}成立。
(5)利用公式F+=(FHF)1FH,
G+=GH(GGH)1
可得结论。
由此我们得到了计算A+的方法。
例
A=
=FG(FHF)1FH=
G1=G
则A+=G(FHF)1FH=
.
引理3设ACrm×n,UCn×p,VCq×m,又设X=U(VAU)
(1)V(6.3.5)
其中(VAU)
(1)(VAU){1}.则
(1)XA{1}的充要条件是rank(VAU)=r;
(2)XA{2}且R(X)=R(U)的充要条件是rank(VAU)=rankU
(3)XA{2}且N(X)=N(V)的充要条件是rank(VAU)=rankV
(4)XA{1,2}且R(X)=R(U),N(X)=N(V)的充要条件是rank(VAU)=rankU=rankV=r
引理4对任意给定的矩阵A满足XA{1,2}和
R(X)=R(AH),N(X)=N(AH)的惟一矩阵为A+。
定理6.16给定矩阵A,则A+=AH(AHAAH)
(1)AH(6.3.6)
其中(AHAAH)
(1)(AHAAH){1}
定理6.17(Greville)设ACm×n,记ak(k=1,…,n)为A的
第k列,Ak(k=1,…,n)为A的前k列构成的子矩阵;又记dk=A+k-1ak(6.3.7)
ck=ak-Ak-1dk=ak-Ak-1A+k-1ak=ak-
(6.3.8)则
(6.3.9)其中
(k=2,…,n)
6.4广义逆与线性方程组求解
(本节主要讨论利用广义逆表示一般线性方程组的解.对于线性方程组Ax=b,如果A非奇异,则x=A1b.对于一般的线性方程组,我们希望得到类似的结果。
这就是本节讨论的主要问题.)
定理6.26设ACm×n,BCp×q,DCm×q,则矩阵方程AXB=D(6.4.5)
相容的充要条件是AA
(1)DB
(1)B=D(6.4.6)
其中A
(1)A{1},B
(1)B{1}.当方程(6.4.5)相容时,其通解为
X=A
(1)DB
(1)+YA
(1)AYBB
(1)(6.4.7)这里YCn×p任意。
证明:
充分性.若AA
(1)DB
(1)B=D成立,取X=A
(1)DB
(1)结论
显然成立。
反之,若AXB=D有解,则D=AXB=AA
(1)AXBB
(1)B=AA
(1)DB
(1)B成立。
显然A
(1)DB
(1)+Y-A
(1)AYBB
(1)为AXB=D的解。
若X为其任意一个解,则
X=A
(1)DB
(1)+XA
(1)AXBB
(1)成立。
推论设ACm×n,A
(1)A{1}则A{1}={A
(1)+ZA
(1)AZAA
(1)|ZCn×m}(6.4.8)
定理6.27线性方程组Ax=b相容的充要条件是AA
(1)b=b(6.4.9)
且其通解为x=A
(1)b+(I-A
(1)A)y(6.4.10)其中yCn任意。
证明:
充分性显然。
必要性:
b=Ax=AA
(1)Ax=AA
(1)b.显然A
(1)b+(I-A
(1)A)y为它的解,反之若Ax=b
则x=A
(1)b+xA
(1)b=A
(1)b+xA
(1)Ax=A
(1)b+(IA
(1)A)x
定理6.28设ACm×n,bCm,XCn×m.若对于使得方程组(6.5.1)相容的所有b,x=Xb都是解,
则XA{1}。
证明:
由于对于A的每一列ai,则Ax=ai都是相容的。
因此AXai=ai,取i=1,2,...,n,则得到AXA=A成立。
2.相容线性方程组的最小范数解
引理6相容方程组Ax=b的极小范数解惟一,且这个惟一解在R(AH)中。
证明:
利用R(AH)=N(A).
引理7集合A{1,4}由矩阵方程XA=A(1,4)A(6.4.11)的所有解X组成,其中A(1,4)A{1,4}。
证明:
显然
XA=XAA(1,4)A=(XA)H(A(1,4)A)H=AHXHAH(A(1,4))H=(AXA)H(A(1,4))H=AH(A(1,4))H=(A(1,4)A)H=A(1,4)A
这个定理说明对于任给的XA{1,4}XA为常数矩阵。
推论:
A(1,4)A=
AA(1,3)=PR(A).
定理6.29设ACm×n,A(1,4)A{1,4},则A{1,4}={A(1,4)+Z(I-AA(1,4))|ZCn×m}(6.4.12)
定理6.30设方程组Ax=b相容,则x=A(1,4)b为最小范数解;反之,若对任何的bR(A),Xb都是最小范数解,则XA{1,4}.
3.矛盾方程组的最小二乘解与{1,3}-逆Ax=b
引理8设ACm×n,集合A{1,3}由矩阵方程AX=AA(1,3)(6.4.13)的所有解X组成,其中
A(1,3)A{1,3}。
证明:
若XA{1,3},则AX=AA(1,3)AX=(AX)H(AA(1,3))H=AXAA(1,3)=AA(1,3)
反之,若AX=AA(1,3),则首先由于AA(1,3)为Hermite矩阵,
从而AX为Hermite矩阵,即XA{3};
另外,AXA=AA(1,3)A=A,从而XA{1}.这样XA{1,3}。
证毕。
推论:
A(1,4)A=
AA(1,3)=PR(A).
定理6.31设ACm×n,A(1,3)A{1,3}则A{1,3}={A(1,3)+(IA(1,3)A)Z|ZCn×m}(6.4.14)
证明:
由引理8和定理6.26可得
AX=AA(1,3)通解为X=A(1,3)AA(1,3)+YA(1,3)AY
令Y=A(1,3)+Z,代入可得
X=A(1,3)AA(1,3)+A(1,3)+ZA(1,3)A(A(1,3)+Z)
=A(1,3)AA(1,3)+A(1,3)+ZA(1,3)AA(1,3)A(1,3)AZ
=A(1,3)+(IA(1,3)A)Z证毕。
定理6.32设ACm×n,bCm,A(1,3)A{1,3}.则x=A(1,3)b(6.4.15)是方程组Ax=b的最小二乘解,反之,设XCm×n,若对所有bCm,x=Xb都是方程组Ax=b的最小二乘解,则XA{1,3}
证明:
显然Axb=AxPR(A)b+(PR(A)bb)由于AxPR(A)bR(A),(PR(A)bb)R(A)=N(AH)
所以||Axb||2=||AxPR(A)b||2+||PR(A)bb||2
显然||Axb||2取得极小值的充要条件为AxPR(A)b=0.
任取A(1,3)A{1,3},欲证AA(1,3)=PR(A)需证明R(AA(1,3))=R(A),且AA(1,3)为投影矩阵。
R(AA(1,3))=R(A).
显然R(AA(1,3))R(A)=R(AA(1,3)A)R(AA(1,3))从而R(AA(1,3))=R(A)且AA(1,3)=AA(1,3)(AA(1,3)).
R(AA(1,3))=N((AA(1,3))H)N(AH)=R(A).反之,若yN(A