齐次线性方程组的解的结构问题,可以用基础解系来表示。
当齐次线性方程组有非零解时,基础解系所含向量个数等于n-r,用基础解系表示的方程组的解的集合称为通解。
通过对具体实例进行分析,可以看到求基础解系的方法还是在于用初等行变换化阶梯形。
非齐次线性方程组的解的结构,是由对应的齐次通解加上一个特解。
线性代数知识点框架(四)
在之前研究线性方程组的解的过程当中,注意到矩阵及其秩有着重要的地位和应用,故还有必要对矩阵及其运算进行专门探讨。
矩阵的加法和数乘,与向量的运算类同。
矩阵的另外一个重要应用:
线性变换(最典型例子是旋转变换)。
即可以把一个矩阵看作是一种线性变换在数学上的表述。
矩阵的乘法,反映的是线性变换的叠加。
如矩阵A对应的是旋转一个角度a,矩阵B对应的是旋转一个角度b,则矩阵AB对应的是旋转一个角度a+b。
矩阵乘法的特点:
若C=AB,则C的第i行、第j列的元素是A的第i行与B的第j列的元素对应乘积之和;A的列数要和B的行数相同;C的行数是A的行数,列数是B的列数。
需要主义的是矩阵乘法不满足交换律,满足结合律。
利用矩阵乘积的写法,线性方程组可更简单的表示为:
Ax=b。
对于C=AB,还可作如下分析:
将左边的矩阵A写成列向量组的形式,即意味着C的列向量组能由A的列向量组表示,从而推知C的列秩小于等于A的列秩;将右边的矩阵B写成行向量组的形式,即意味着C的行向量组能由B的行向量组表示,从而推知C的行秩小于等于B的行秩,再考虑到矩阵的行秩等于列秩等于矩阵的秩,最终可得到结论,C的秩小于等于A的秩,也小于等于B的秩,即矩阵乘积的秩总不超过任一个因子的秩。
关于矩阵乘积的另外一个重要结论:
矩阵乘积的行列式等于各因子的行列式的乘积。
一些特殊的矩阵:
单位阵、对角阵、初等矩阵。
尤其要注意,初等矩阵是单位阵经过一次初等变换得到的矩阵。
每一个初等矩阵对应一个初等变换,因为左乘的形式为PA(P为初等矩阵),将A写成行向量组的形式,PA意味着对A做了一次初等行变换;同理,AP意味着对A做了一次初等列变换,故左乘对应行变换,右乘对应列变换。
若AB=E,则称A为可逆矩阵,B是A的逆阵,同样,这时的B也是可逆矩阵,注意可逆矩阵一定是方阵。
第一种求逆阵的方法:
伴随阵。
这种方法的理论依据是行列式的按行(列)展开。
矩阵可逆,行列式不为零,行(列)向量组线性无关,满秩,要注意这些结论之间的充分必要性。
单位阵和初等矩阵都是可逆的。
若矩阵可逆,则一定可以通过初等变换化为单位阵,这是不难理解的,因为初等矩阵满秩,故最后化成的阶梯型(最简形)中非零行数目等于行数,主元数目等于列数,这即是单位阵。
进一步,既然可逆矩阵可以通过初等变换化为单位阵,而初等变换对应的是初等矩阵,即意味着:
可逆矩阵可以通过左(右)乘一系列初等矩阵化为单位阵,换言之可逆矩阵可看作是一系列初等矩阵的乘积,因为单位阵在乘积中可略去。
可逆矩阵作为因子不会改变被乘(无论左乘右乘)的矩阵的秩。
由于可逆矩阵可以看作是一系列初等矩阵的乘积,可以想象,同样的这一系列初等矩阵作用在单位阵上,结果是将这个单位阵变为原来矩阵的逆阵,由此引出求逆阵的第二种方法:
初等变换。
需要注意的是这个过程中不能混用行列变换,且同样是左乘对应行变换,右乘对应列变换。
矩阵分块,即可把矩阵中的某些行和列的元素看作一个整体,对这些被看作是整体的对象构成的新的矩阵,运算法则仍然适用。
将矩阵看成一些列行向量组或列向量组的形式,实际也就是一种最常见的对矩阵进行分块的方式。
线性代数知识点框架(五)
由矩阵乘法的特点可知,计算一个矩阵A的n次方,相对于数乘运算来说要繁琐得多。
我们注意到,如果存在可逆矩阵P和对角矩阵∧,使得A=P*∧*P逆,那么有:
A^n=(P*∧*P逆)^n=(P*∧*P逆)(P*∧*P逆)…(P*∧*P逆)=P*∧^n*P逆
由于对角矩阵的乘方容易计算,从而问题得到大幅简化。
对矩阵A、B来说,如果存在着可逆矩阵P,使得A=P*B*P逆,我们称A与B是相似的。
特别地,如果A与对角矩阵∧相似,则称A可对角化。
由此可见,如果矩阵A可对角化,那么A^n的计算将变得简单许多。
故可把相似的说法理解为一个在寻找矩阵乘方简便运算的过程中提出来的概念。
相似的矩阵有许多共同的性质,如有相同的秩和相同的行列式值,相似的矩阵或者都可逆,或者都不可逆,等等。
设矩阵A相似于对角矩阵∧,那么:
A=P*∧*P逆
<=>AP=P∧,其中P为可逆矩阵
<=>A*(a1,a2,…,an)=(a1,a2,…,an)*∧,其中a1,a2,…,an分别为可逆矩阵P的列向量,λ1,λ2,…,λn分别为对角矩阵∧的主对角线上元素
<=>A*a1=λ1*a1,A*a2=λ2*a2,…,A*an=λn*an
也就是说,矩阵A能对角化的关键,在于找到n个常数λ1,λ2,…,λn和n个线性无关的向量a1,a2,…,an(因为这些向量构成的矩阵可逆,这也决定了零向量不是特征向量),使得A*ai=λi*ai(i=1,2,3,…,n)。
我们把满足条件A*ai=λi*ai的λi称为矩阵A的特征值,ai称为矩阵A对应特征值λi的特征向量。
换句话说,一个矩阵能够相似于对角矩阵的充分必要条件是:
存在n个线性无关的特征向量。
接下来的问题是如何求矩阵的特征值和特征向量?
一个方案是从定义A*ai=λi*ai出发,直接寻找满足这样要求的λi和ai,但这一般是不容易做到的,故还有必要去建立一种更为普遍的方法。
设A*ai=λi*ai
<=>(A-λi*E)*ai=0
<=>对λi来说,ai是齐次线性方程组(A-λi*E)*X=0的一个非零解(因为ai构成的向量组线性无关)
<=>方程组的系数行列式det(A-λi*E)=0
由此可见,每一个特征值λi都是多项式det(A-λ*E)在指定数域(一般是实数域)上的根,我们称这个多项式为矩阵A的特征多项式,不难验证,它是一个λ的n次多项式。
依据特征方程det(A-λ*E)=0,即可求出矩阵A的全部特征值。
对矩阵A的每个特征值λi,求齐次线性方程组(A-λi*E)*X=0的解,得到的全部非零解(一般可用基础解系表示)就是A的属于特征值λi的全部特征向量。
由此可得到两点启示:
对同一个特征值来说,特征向量不唯一;对同一特征值来说,特征向量的线性组合仍为特征向量。
相似的矩阵有相同的特征多项式和特征值,但有相同特征多项式的两个矩阵不一定相似。
相似的矩阵有相同的秩,故一个可对角化矩阵的非零特征值的数目即为其秩。
在求出矩阵的全部特征值和全部特征向量以后,剩下的问题就是判断这些所有的特征向量中有没有n个是线性无关的?
如果有,意味着矩阵可对角化,如果没有,则矩阵不可对角化。
对一个矩阵A来说,考虑到其n个特征值可能相同也可能不同,故最一般的情况应该是把A的这n个特征值分为m组,分别为λ1,λ2,…,λm,每组的个数分别为j1,j2,…,jm(注意有j1+j2+…+jm=n),对每个λi(i=1,2,…,m),齐次线性方程组(A-λi*E)*X=0的基础解系解向量的个数分别为r1,r2,…,rm,这些基础解系各自当然都是A的线性无关的特征向量,自然会进一步联想,把这m组共r1+r2+…+rm个向量合在一起情况如何,是否仍线性无关?
经过考察发现,矩阵A的属于不同的特征值的特征向量一定线性无关。
故上述r1+r2+…+rm个来自不同特征值的特征向量构成的向量组确实是线性无关的。
于是不难有如下结论,若r1+r2+…+rm=n,则A有n个线性无关的特征向量,从而A可对角化,若r1+r2+…+rm若矩阵A具有n个不同的特征值,则A可对角化。
由此可见,要判断一个矩阵是否可对角化,通常需要求出其全部特征值(相当于解代数方程的问题),再求出每个特征值所对应的特征向量(相当于解齐次线性方程组的问题)并考察其相互之间的线性无关性。
亦即我们应当建立起这样的认识:
相似变换,尤其是相似对角变换,并不是对任何一个矩阵来说都可以进行的,这其中关键在于能否找到一个可逆矩阵P来为两者提供联系,换言之就是应当满足某些对应的条件。
当然,可以想象,也许对于具有某些特点的矩阵来说,它们本身就满足这种既定条件,从而必可以对角化。
实对称矩阵就是这样一种特殊的矩阵,它一定存在着n个线性无关的特征向量,即一定可对角化。
实对称矩阵属于不同特征值得特征向量是正交的,而之前已经提到过,对同一特征值来说,其特征向量的线性组合仍是其特征向量,故可利用施密特正交化方法(本质是线性组合)来构造出一组属于同一特征值的正交特征向量,这些正交化单位化后的特征向量就决定了实对称矩阵一定可以正交对角化。
要注意到正交矩阵当然是可逆的,正交的向量组当然是线性无关的,这是实对称矩阵对于一般矩阵来说在相似变换性质上更为优越的地方。
线性代数知识点框架(六)
在实际生活中,我们常常会遇到许多与n个变量x1,x2,…,xn构成的二次齐次多项式f(x1,x2,…,xn)相关的问题(如二次曲面问题、多元函数的极值问题等),我们将这种多项式称为一个n元二次型。
可以看到,与线性方程组类似,对二次型的性质起决定作用的是自变量的系数及其相对位置,这提示我们可以把这些系数排成的一个n阶矩阵A,用矩阵的工具来研究二次型,具体做法是:
令X=(x1,x2,…,xn)’,则二次型f(x1,x2,…,xn)可以写成:
f(x1,x2,…,xn)=X’AX
其中A称为二次型f(x1,x2,…,xn)的矩阵,它的特点是:
主对角线上的元素是完全平方项的系数,(i,j)位置上的元素是交叉项系数的一半,这决定了二次型矩阵的对称性和唯一性。
我们知道,矩阵的一个应用是线性变换,即关系式X=CY表示的是从变量x1,x2,…,xn到变量y1,y2,…,yn的一个线性变换,一般来说,我们还要求这种变换是可逆的(即C可逆)。
从坐标变换的角度来看,向量R在X坐标系下的分量x1,x2,…,xn与Y坐标系下的分量y1,y2,…,yn通过转换矩阵C相联系,这表明:
同一个向量实体在不同坐标系下可以有不同的表现形式,但本质上并无区别。
利用线性变换X=C*Y,变量X的一个二次型f(x1,x2,…,xn)=X’AX可以变成
(CY)’A(CY)=Y’C’ACY=Y’(C’AC)Y
设C’AC=B,则有Y’BY=f(y1,y2,…,yn),这是变量Y的一个二次型,不难验证,B正是二次型f(y1,y2,…,yn)的矩阵。
从坐标变换的角度来看,与向量类似,同一个二次型f在不同的坐标系下可以有不同的表现形式,两者通过关系式C’AC=B相联系,但本质上并无区别。
对矩阵A、B来说,如果存在着可逆矩阵C,使得C’AC=B,我们称A与B是合同的,不难推断,合同的矩阵有相同的秩,且对应着同一个二次型。
特别地,如果矩阵A与对角矩阵∧合同,那这个对角矩阵∧对应的就是一个只含完全平方项的二次型,称为标准型。
将二次型化为标准型来进行研究,因为不含交叉项,问题变得简单许多。
注意到二次型的矩阵总是对称矩阵,故对于实数域上的二次型X’AX来说,其矩阵A必可正交对角化,故必定存在一个正交矩阵Q,使得Q逆*A*Q=∧,同时考虑到Q’=Q逆,因此Q’AQ=∧,即A合同于对角矩阵。
也就是说,对实数域上的任意一个二次型,都能够通过合适的坐标变换化为标准型。
从坐标变换的角度来看,我们总可以找到一个合适的坐标系,在该坐标系中,二次型f以相对较为简单的,仅含完全平方项的形式表现出来,而这些完全平方项的系数(也就是矩阵A的特征值),就决定了该二次型具有的全部性质。
同一个实二次型X’AX,其标准型不唯一,但标准型中完全平方项的个数r是唯一的,同时r也就是二次型矩阵A的秩。
这里应该着重体会的是,正是利用实对称矩阵在相似变换上强有力的性质(必可正交对角化),我们才得以将二次型化标准型的问题转化为矩阵求特征值特征向量的问题,而后者是之前就已经探讨清楚了的。
在得到实二次型的标准型后,还可对标准型中所有平方项的系数进行归一化,即得到规范型,一个二次型的规范性是唯一的。
规范型只含平方项,且平方项的系数只有1,0,-1,实二次型的规范性由正惯性指数的个数p和负惯性指数的个数q决定,其中p+q=r为二次型矩阵的秩。
规范型在形式上更为简单,一般常通过研究二次型的规范型来对其作出一些定性的判断。
正定二次型是无论自变量如何取值都能保证结果恒正的二次型,即对于任意非零的X,都有X’AX>0。
判断一个二次型的正定性,一种选择是直接从定义出发,另一种方案可考虑利用规范型(因为无论正定负定都是一个定性而非定量的结论),而实际上正定二次型的许多性质也确实能通过其规范型相联系,这是值得注意的。
同济五版《线性代数》习题解读
(一)
1、利用对角线法则计算行列式,可以通过几道小题熟悉一下把行列式化成上(下)三角的过程,基本题。
2、3题涉及排列以及行列式的展开准则,不是太重要,了解即可。
4、5、6题是一些计算行列式的练习,不同特点的行列式通常有不同的方法,常见的就是化为上(下)三角,按行(列)展开,某一行(列)是和的形式可进行拆分,基本题,要通过这些练习来熟练行列式的运算这一块。
5题虽然是以方程形式给出,但考察点还是计算。
7、行列式性质的应用,比较重要的题型,重在对思维的训练,而且该题的结论很常用,最好掌握。
8、一些难度较高的行列式的计算题,涉及到不少技巧,而这些技巧通常初学者是想不到的,这时候可以看看答案,体会一下答案的做法,对这块内容的要求和不定积分是类似的。
9、设计巧妙的题目,隐含考点是行列式按行展开的性质:
若是相同行(列)的元素和代数余子式对应相乘求和,结果是行列式的值;若是不同行(列)的元素和代数余子式对应相乘求和,结果为0。
注意此题要求的结果是第三行的代数余子式的某种组合,而根据代数余子式的定义可知,这与题给的行列式中的第三行的元素是无关的,那就可以根据需要把第三行的元素替换为前面要求的式子中的那些系数,这样问题就简化为求一个新的行列式,而无需烦琐的进行四次求代数余子式的运算。
此题技巧性较强,但这个构思方法值得掌握。
10、克兰姆法则的应用,归根结底还是计算行列式。
11、12题是通过行列式来判断齐次方程组的解的情况,基本题,在已经复习完一遍线代后也可以用其它方法(化阶梯行、求秩)来做。
总的来说,第一章的习题大都非常基本,集中于计算层面的考察,没有理解上的难度。
同济五版《线性代数》习题解读
(二)
1、矩阵乘法的基本练习,简单题,但计算很容易出错,不可轻视,(5)小题实际上就是第五章要接触的二次型。
2、直接考察矩阵相关运算,基本题。
3、矩阵的乘法实际上是表示一个线性变换,题目给出了从y到x的变换,还给出了从z到y的变换,要求z到x的变换。
既然一个矩阵可以表示一个线性变换,两个矩阵的乘积即可理解为两个变换的叠加,这也是提供了一个侧面去理解矩阵相乘的意义。
4、5题实际上都是通过一些具体的例子来加深对矩阵运算的理解,比如矩阵乘法不能交换、不能像数乘那样约去因子,等等,这些例子是比较重要的,因为有时能在考场上派上用场,需要熟悉。
6、7题是求矩阵乘方的题目,基本题,但要注意些适当的技巧,比如拆成两个特殊矩阵的和,能简化运算。
8、9是关于对称阵概念的考查,不难但重要,因为这类题即是线代里证明题的代表:
几乎都要从定义出发证明。
所以从