第五专题 矩阵的数值特征行列式范数条件数迹秩相对特征根.docx
《第五专题 矩阵的数值特征行列式范数条件数迹秩相对特征根.docx》由会员分享,可在线阅读,更多相关《第五专题 矩阵的数值特征行列式范数条件数迹秩相对特征根.docx(13页珍藏版)》请在冰豆网上搜索。
第五专题矩阵的数值特征行列式范数条件数迹秩相对特征根
第五专题矩阵的数值特征
(行列式、迹、秩、相对特征根、范数、条件数)
一、行列式
已知Ap×q,Bq×p,则|Ip+AB|=|Iq+BA|
证明一:
参照课本194页,例4.3.
证明二:
利用AB和BA有相同的非零特征值的性质;从而Ip+AB,Iq+BA中不等于1的特征值的数目
相同,大小相同;其余特征值都等于1。
行列式是特征值的乘积,因此|Ip+AB|和|Iq+BA|等于特征值(不等于1)的乘积,所以二者相等。
二、矩阵的迹
矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。
下面讨论有关迹的一些性质和不等式。
定义:
,etrA=exp(trA)
性质:
1.,线性性质;
2.;
3.;
4.;
5.为向量;
6.;
从Schur定理(或Jordan标准形)和(4)证明;
7.,则,且等号成立的充要条件是A=0;
8.,则,且等号成立的充要条件是A=B();
9.对于n阶方阵A,若存在正整数k,使得Ak=0,则tr(A)=0(从Schur定理或Jordan标准形证明)。
若干基本不等式
对于两个m×n复矩阵A和B,tr(AHB)是m×n维酉空间上的内积,也就是将它们按列依次排成的两个mn维列向量的内积,利用Cauchy-schwarz不等式
[x,y]2≤[x,x]﹒[y,y]
得
定理:
对任意两个m×n复矩阵A和B
|tr(AHB)|2≤tr(AHA)﹒tr(BHB)
这里等号成立的充要条件是A=cB,c为一常数。
特别当A和B为实对称阵或Hermit矩阵时
0≤|tr(AB)|≤
定理:
设A和B为两个n阶Hermite阵,且A≥0,B≥0,则
0≤tr(AB)≤λ1(B)tr(A)≤tr(A)﹒tr(B)
λ1(B)表示B的最大特征值。
证明:
tr(AB)=tr(A1/2BA1/2)≥0,又因为
A1/2[λ1(B)I-B]A1/2≥0,所以λ1(B)tr(A)≥A1/2BA1/2,得
tr(AB)=tr(A1/2BA1/2)≤tr(λ1(B)A)
=λ1(B)tr(A)≤tr(A)﹒tr(B)
推论:
设A为Hermite矩阵,且A>0,则
tr(A)tr(A-1)≥n
另外,关于矩阵的迹的不等式还有很多,请参考《矩阵论中不等式》。
三、矩阵的秩
矩阵的秩的概念是由Sylvester于1861年引进的。
它是矩阵的最重要的数字特征之一。
下面讨论有关矩阵秩的一些性质和不等式。
定义:
矩阵A的秩定义为它的行(或列)向量的最大无关组所包含的向量的个数。
记为rank(A)
性质:
1.;
2.;
3.;
4.,其中X列满秩,Y行满秩(消去法则)。
定理(Sylvester):
设A和B分别为m×n和n×l矩阵,则
Sylveste定理是关于两个矩阵乘积的秩的不等式。
其等号成立的充要条件请参考王松桂编写的《矩阵论中不等式》,三个矩阵乘积的秩的不等式也一并参考上述文献。
四、相对特征根
定义:
设A和B均为P阶实对称阵,B>0,方程
|A-λB|=0的根称为A相对于B的特征根。
性质:
|A-λB|=0等价于|B-1/2AB-1/2-λI|=0
(因为B>0,所以B1/2>0)
注:
求A相对于B的特征根问题转化为求B-1/2AB-1/2的特征根问题或AB-1的特征根。
因B-1/2AB-1/2是实对称阵,所以特征根为实数。
定义:
使(A-λiB)li=0的非零向量li称为对应于λi的A相对于B的特征向量。
性质:
1设l是相对于λ的AB-1的特征向量,则
AB-1l=λl或A(B-1l)=λB(B-1l)
B-1l为对应λ的A相对于B的特征向量
(转化为求AB-1的特征向量问题)。
2设l是相对于λ的B-1/2AB-1/2的特征向量,则
B-1/2AB-1/2l=λl
可得
A(B-1/2l)=λB(B-1/2l)
则B-1/2l为对应λ的A相对于B的特征向量
(转化为求B-1/2AB-1/2对称阵的特征向量问题)。
五、向量范数与矩阵范数
向量与矩阵的范数是描述向量和矩阵“大小”的一种度量。
先讨论向量范数。
1.向量范数定义:
设V为数域F上的线性空间,若对于V的任一向量x,对应一个实值函数,并满足以下三个条件:
(1)非负性,等号当且仅当x=0时成立;
(2)齐次性
(3)三角不等式。
则称为V中向量x的范数,简称为向量范数。
定义了范数的线性空间定义称为赋范线性空间。
例1.,它可表示成,,
就是一种范数,称为欧氏范数或2-范数。
证明:
()非负性,
当且仅当时,即x=0时,=0
()齐次性
()三角不等式
,
根据Hölder不等式:
,
2.常用的向量范数(设向量为)
1-范数:
;
∞-范数:
;
P-范数:
(p>1,p=1,2,…,∞,);
2-范数:
;
椭圆范数(2-范数的推广):
,A为Hermite正定阵.
加权范数:
,
当,
证明:
显然满足非负性和齐次性
()
,,
应用Hölder不等式
即
3.向量范数的等价性
定理设、为的两种向量范数,则必定存在正数m、M,使得,(m、M与x无关),称此为向量范数的等价性。
同时有
注:
(1)对某一向量X而言,如果它的某一种范数小(或大),那么它的其它范数也小(或大)。
(2)不同的向量范数可能大小不同,但在考虑向量序列的收敛性问题时,却表现出明显的一致性。
4、矩阵范数
向量范数的概念推广到矩阵情况。
因为一个m×n阶矩阵可以看成一个mn维向量,所以中任何一种向量范数都可以认为是m×n阶矩阵的矩阵范数。
1.矩阵范数定义:
设表示数域C上全体阶矩阵的集合。
若对于中任一矩阵A,均对应一个实值函数,并满足以下四个条件:
(1)非负性:
,等号当且仅当A=0时成立;
(2)齐次性:
(3)三角不等式:
则称为广义矩阵范数;
(4)相容性:
则称为矩阵范数。
5.常用的矩阵范数
(1)Frobenius范数(F-范数)
F-范数:
==
矩阵和向量之间常以乘积的形式出现,因而需要考虑矩阵范数与向量范数的协调性。
定义:
如果矩阵范数和向量范数满足
则称这两种范数是相容的。
给一种向量范数后,我们总可以找到一个矩阵范数与之相容。
(2)诱导范数
设A∈Cm×n,x∈Cn,为x的某种向量范数,
记
则是矩阵A的且与相容的矩阵范数,也称之为A的诱导范数或算子范数。
(3)p-范数:
,
x为所有可能的向量,,
,
,,
可以证明下列矩阵范数都是诱导范数:
(1)列(和)范数;
(2)谱范数;
的最大特征值称为的谱半径。
当A是Hermite矩阵时,是A的谱半径。
注:
谱范数有许多良好的性质,因而经常用到。
(3)行(和)范数
(,)
定理矩阵A的任意一种范数是A的元素的连续函数;矩阵A的任意两种范数是等价的。
定理设A∈Cn×n,x∈Cn,则和是相容的
即
证明:
由于成立。
定理设A∈Cn×n,则是酉不变的,即对于任意酉矩阵U,V∈Cn×n,有
证明:
定义设A∈Cn×n,A的所有不同特征值组成的集合称为A的谱;特征值的模的最大值称为A的谱半径,记为ρ(A)。
定理ρ(A)不大于A的任何一种诱导范数,即
ρ(A)≤
证明:
设λ是A的任意特征值,x是相应的特征向量,即
Ax=λx
则
|λ|·||x||=||Ax||≤||A||·||x||,||x||≠0
即
|λ|≤||A||
试证:
设A是n阶方阵,||A||是诱导范数,当||A||<1时,I-A可逆,且有
||(I-A)-1||≤(1-||A||)-1
证明:
若I-A不可逆,则齐次线性方程组
(I-A)x=0
有非零解x,即x=Ax,因而有
||x||=||Ax||≤||A||﹒||x||<||x||
但这是不可能的,故I-A可逆。
于是(I-A)-1=[(I-A)+A](I-A)-1=I+A(I-A)-1
因此||(I-A)-1||≤||I||+||A(I-A)-1||=1+||A(I-A)-1||
≤1+||A||﹒||(I-A)-1||
即证
||(I-A)-1||≤(1-||A||)-1
补充证明||I||=1:
由相容性可知:
||A||﹒||A-1||≥||AA-1||=||I||
对于诱导范数()
。
六、条件数
条件数对研究方程的性态起着重要的作用。
定义:
设矩阵A是可逆方阵,称||A||﹒||A-1||为矩阵A的条件数,记为cond(A),即
cond(A)=||A||﹒||A-1||
性质:
(1)cond(A)≥1,并且A的条件数与所取的诱导范数的类型有关。
因cond(A)=||A||﹒||A-1||≥||AA-1||=||I||=1
(2)cond(kA)=cond(A)=cond(A-1),这里k为任意非零常数。
当选用不用的范数时,就得到不同的条件数,如:
cond1(A)=||A||1﹒||A-1||1
cond∞(A)=||A||∞﹒||A-1||∞
cond2(A)=||A||2﹒||A-1||2=,其中分别为AHA的特征值的模的最大值和最小值。
谱条件数
特别地,如果A为可逆的Hermite矩阵,则有
cond2(A)=
这里分别为A的特征值的模的最大值和最小值。
如果A为酉阵,则cond2(A)=1
例求矩阵A的条件数cond1(A),cond∞(A)
解:
||A||1=max{6;14;4}=14;
||A||∞=max{8;3;13}=14;
故
||A-1||1=17/4;
||A-1||∞=47/4;
cond1(A)=||A||1﹒||A-1||1=14×17/4=259/2;
cond∞(A)=||A||∞﹒||A-1||∞=611/4。
例设线性方程组Ax=b的系数矩阵A可逆。
讨论当b有误差δb时,解的相对误差δx的大小。
解:
因矩阵A可逆,所以Ax=b有唯一解x=A-1b,设解的误差为δx,由
A(x+δx)=b+δb
得
Aδx=δb或δx=A-1δb
得
(1)
又Ax=b,可得
,或
(2)
所以由
(1)和
(2),得
这说明相误差的大小与条件数cond(A)密切相关;当右端b的相对误差一定时,cond(A)越大,解的相对误差就可能越大;cond(A)越小,解的相对误差就可能越小。
因而条件数cond(A)可以反映A的特性。
一般来说:
条件数反映了误差放大的程度,条件数越大,矩阵越病态。
条件数在最小二乘估计的稳定性研究中有重要应用。
鉴于矩阵A的条件数范数cond(A)有多种,但最常用的条件数是由谱范数||A||2导出的,称为谱条件数。
在本章中,若无特别声明,讨论的条件数都是谱条件数。
谱条件数:
若A是m×n阶矩阵,且rank(A)=t≤n,则A的条件数定义为
即最大奇异值与最小非零奇异值的商。
(3)其它性质
对任意酉矩阵Q,cond(QAQH)=cond(A-1);
。
(因)