线性代数的几何意义.docx

上传人:b****5 文档编号:6656376 上传时间:2023-01-08 格式:DOCX 页数:14 大小:427.74KB
下载 相关 举报
线性代数的几何意义.docx_第1页
第1页 / 共14页
线性代数的几何意义.docx_第2页
第2页 / 共14页
线性代数的几何意义.docx_第3页
第3页 / 共14页
线性代数的几何意义.docx_第4页
第4页 / 共14页
线性代数的几何意义.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

线性代数的几何意义.docx

《线性代数的几何意义.docx》由会员分享,可在线阅读,更多相关《线性代数的几何意义.docx(14页珍藏版)》请在冰豆网上搜索。

线性代数的几何意义.docx

线性代数的几何意义

线性代数的几何意义注解

线性代数是优雅和有趣的一门学科,应用也很多,只是目前多数线性代数教材似乎都偏重"代数"而较少涉及"线性"一词包含的几何意义,所以可能给人印象较抽象,不容易让同学产生兴趣,有幸在以前偶然一次看到一位工程师自编的一本小册子叫《线性代数的几何意义》,加上后来阅读matlab作者的书籍,才发现原来线性代数的几何含义真的印证了“数学之美”,的确很美,所以想借鉴这些零散的阅读,加上自己后来的理解,把它的部分几何意义注解一下,希望以前对线代没有很多兴趣的同学能喜欢上它,同时我也会保持更新,不断完善,一起体会数学无与伦比的美丽

矩阵的几何意义

1、一个矩阵是由若干向量组成的,矩阵可以看作是这些向量的集合或由这些向量为基张成的空间(在力学分析,向量空间应用时常取此几何含义,后文把此类几何含义称作矩阵的向量空间)如矩阵

按照行向量可表示为如下形式

2、一个矩阵是由若干向量组成的,矩阵可以看作是这些向量终点组成的图形(在计算机图形学中常取此几何表示,后文把此类几何含义称作矩阵的图形),如矩阵

按照列向量可表示为如下图形

如下图是在matlab中将z=sin(x)*cos(y)算得的离散点组成的矩阵表示成几何图形

注1:

如果单独查看一个矩阵

,可以有两种解读:

矩阵A由m个n维向量组成,或者由n个m维向量组成;在使用时会根据实际情或约定选择其中一种,而在参与变换或其他运算时,这两种解读一般不能混淆,一定要确定

注2:

当我们把矩阵表示成图形时,其作图没有固定标准,并不一定是把所有向量终点连接起来构成一个多边形,规则是使用者制定的,可以是网格,可以是离散面片等

行列式的几何意义

一个方阵

的行列式的绝对值是其行向量或列向量所张成的平行几何体的空间积,对于二阶行列式,就是向量张成的平行四边形的面积,对于三阶行列式,就是对应平行六面体的体积;如方阵

的行列式绝对值为27,它就是下图平行四边形的面积

注:

行列式其实是带有符号的,实际上,正负号表征了这些向量作为线性空间基的手性,正号表示右手系,负号表示左手系,在二阶矩阵的向量空间里,其判别方法是,伸出右手和矩阵的第一个列向量或行向量平行,然后调整手的正反使得能从此向量转过小于180度的角到达第二个向量,这时大拇指如果朝上(从纸面指向自己)则为右手系,矩阵的行列式为正,反之则为左手系,对应行列式为负;如果是三阶矩阵,则从第一个向量转向第二个向量时,如果大拇指指向第三个向量方向(不必重合),则为右手系,其行列式为正,反之为左手系,行列式为负;其实这一点上更广义的表述应是向量空间的基相对自然坐标系的顺序性(代数上可用逆序数表达)

克拉默法则的几何意义

以二维形式为例来说明其几何意义:

方程Ax=b,设A=

,b=

,待求的x=

将A的两个列向量分别表示为a1,a2,那么原方程可表示为

a1+

a2=b,这样可以把

看作是列向量a1,a2的伸缩因子,经过伸缩后再叠加即得到和向量b,故原方程可以看作已知列向量被伸缩并叠加后的向量b,求伸缩因子

我们已经知道行列式的几何意义,显然矩阵A对应的平行四边形的面积就是|A|(这里以带符号的有方向面积表示,因为伸缩因子也是有符号的),当某一个向量被伸缩后,如图将OB边伸长至OE,形成新的平行四边形OAFE,记其面积为

,这样a1的伸缩因子

可表示为

,显然只要求出

即可解出未知量;

图中OG即向量b,因为它是

a1,

a2的线性叠加,所以G点必在EF的延长线上,这样OG和OE相对OA边的高就是相同的,故OA与OG组成的平行四边形面积和OAFE相同,即

=|ba2|,所以可求得

=|ba2|/|A|,同理可得

=|a1b|/|A|,可以看出此表达式和克拉默法则等价

矩阵乘法的几何意义

我们知道矩阵是由若干向量组成的,因此可自然地把矩阵乘法看作是两个矩阵的同维向量之间做内积(或点乘),而内积的意义是两向量同向投影的乘积,但这只是一个表面的几何含义,比较抽象(也有应用之处,后面会提到);实际上,对于矩阵乘法C=AB,作用后得到的新矩阵C可以看作是矩阵A经过某种变换得到的,也可以看作是矩阵B经过某种变换后得到的,而这种变换显然就是乘以另一个矩阵的过程,结合前面提到的矩阵的几何意义,故可以把矩阵乘法C=AB看作是图形A(或B)经过变换B(或A)后得到新图形C,或者是向量空间A(或B)经过变换B(或A)后得到新的向量空间C,对于简单的变换矩阵这一点最容易感性体会到;例如变换矩阵

会把原3D图形向x-y面投影,变换矩阵

会把原图形对x轴镜像,变换矩阵

会把原2D图形相对原点逆时针旋转30度。

由于一些变换在复合作用时顺序不同会影响变换结果,所以在这种情况下矩阵乘法是不可以左右交换的(因为靠近被变换对象的矩阵总是优先作用),如下图所示,对向量OA进行剪切变换与旋转变换,OC是变换后的向量,可以看出两种变换的作用顺序不同则OC也不同,所以这两种变换矩阵相乘就不能交换左右顺序

初等变换的几何意义

由前面叙述的部分几何意义,我们很快就能看出初等变换的几何含义了

交换矩阵的两行(列):

改变向量在矩阵中的排列顺序,当矩阵表示图形时,此操作对图形没有影响,因而矩阵张成的空间维数(秩)不变,但是当矩阵代表向量空间时,会改变此坐标系的手性,当计算方阵的行列式时,会改变其符号;

以一个非零数k乘矩阵的某一行(列):

即对矩阵中某一向量进行伸缩变换,整个矩阵代表的图形对应发生变化,由于k不能为0,所以矩阵张成空间的维数(秩)不变,方阵张成的平行几何体的空间积(行列式)变成原来的k倍

把矩阵的某一行(列)的k倍加于另一行(列)上:

对矩阵中某一向量做线性叠加,且新向量终点总是在另一向量的平行线上,所以对任意矩阵,图形产生了剪切变形,由于剪切变形不会使向量重叠或缩为0,所以张成空间的维数也不变;对于方阵,由前面几何推导克拉默法则的过程知道,如果把某一向量加上矩阵内另一向量的k倍,由于新向量和原向量相对其余向量组成的平行体的高不变,所以方阵对应的平行几何体的空间积不变(行列式不变),

例如在matlab中用矩阵

作用下面左图对应的矩阵(第三行乘以0.2,即缩短z方向坐标5倍),得到的新图形如下右图所示

Matlab程序如下,可以动手试一试,还可修改其中的变换矩阵以得到不同效果

x=0:

0.1:

5;

y=x;

[xy]=meshgrid(x,y);%构造网格

z=sin(x).*cos(y).*x.*y;

surf(x,y,z);%绘制原图形

x=reshape(x,2601,1);

y=reshape(y,2601,1);

z=reshape(z,2601,1);

m=[xyz];%几何图形对应的n*3矩阵

t=[100;010;000.2];%变换矩阵

m=m*t;%进行变换

x=m(:

1);

y=m(:

2);

z=m(:

3);

x=reshape(x,51,51);

y=reshape(y,51,51);

z=reshape(z,51,51);

figure;

surf(x,y,z)%绘制变换后的图形

然后我们把变换矩阵修改为

,即把第二行乘以2加到第一行,由上述分析知道这样会把原图形的沿y方向剪切变形,剪切量为对应x坐标的二倍,实际效果如下图所示,这里我们取俯视角以观察x-y面的情形,从右图可以看出理论分析是正确的(注意观察变换前后的y向坐标值)

矩阵秩的几何意义

矩阵的秩即矩阵的各向量所张成空间的维数

不能说秩是矩阵对应图形的维数,因为矩阵的图形只取了各向量的终点,而不含有这些向量的之间的几何关系,故二者的维数不一定相等,而矩阵的秩按定义应取其向量空间维数。

如下图中的空间向量a,b,c可以张成一个三维空间,故矩阵(abc)的秩为3,但是其终点组成的图形是一平面,维数为2,显然和秩是不一样的

结合上面对初等变换的几何解释,正是因为三种初等变换都不改变矩阵向量空间的维数,所以对于复杂的难以观察维数的矩阵,我们可以先用初等变换作用于矩阵进行简化,然后到容易观察的形式时求出它的秩;

向量组线性相关/无关的几何意义

注:

在讨论向量张成的空间相关问题时,某种程度上我们可以把向量组和矩阵等价对待,二者都是一组向量的集合,只是向量组相对矩阵明确了向量的维数与向量个数,而矩阵有行与列两种选择,所以只要确定矩阵的向量取行还是列,就可以把矩阵当作向量组讨论;

线性相关在代数上就是一组向量中至少有一个向量能用其余向量线性表示,而几何意义是它们所张成的向量空间维数少于这些向量的个数,这样就至少存在一个向量落在其余向量形成的向量空间中,而向量空间实际上是一个坐标系统,所以处于其中的点(向量)都可以由这些向量定位出来(线性表示),在向量之间表现出一种相关性;而线性无关的几何意义就是一组向量张成空间的维数等于这些向量的个数,这样没有任何一个向量落在其余向量形成的空间里,每一个向量对其余向量来说都是超越自身空间维度的(独立的),因而无法被定位(线性表示),表现成一种相互无关性

以上图棱锥为例,因为HI处于GH和GI所形成的面里,所以HI必然可以由这两个向量表示,所以三者线性相关(三者形成的空间维数为2<3);而HI在IG和IF形成的平面之外,所以H点无论如何都不能被GI和IF定位到,同时IF也不在IG和HI形成的平面里,IG不在IH和IF形成的平面里,同理可知它们之间不能线性表示,所以三者线性无关(三者形成的空间维数为3=向量个数)

方程Ax=0的几何意义

由前面叙述容易看出此方程表示向量x与A的每一个行向量都垂直,或者说向量x垂直于矩阵A的行向量空间。

这样我们可以直接根据几何意义得到结论:

Ax=0有非零解的充要条件是矩阵A的秩要小于x的维数n;这是因为对于确定维度的向量空间M,如果我们可以找出独立于它的一维或多维空间N,则在空间N里的向量总是垂直于空间M;例如在直角坐标系O-xyz中,设A是x-y平面上的向量空间,x是空间向量,因为z维上的向量总是垂直于A,所以x在这一方向上存在无数非零解。

反之若矩阵A的秩等于n,且x非零,则由于x也在n维空间内,所以它和A中的行向量必然线性相关,无法独立于A的行向量空间,所以这时仅有零解。

当方程有非零解时,设A的向量空间维数为R(秩),由上叙述可知解向量x中存在n-R个分量取值自由,如果我们把这n-R个自由变量看作是一个n-R维空间中的向量坐标时,显然此空间中每一个向量都能确定原方程组的一个解,又因为每一个向量都可以用这个n-R维空间的一组单位正交基线性表示,所以这组单位正交向量所确定的一组解通过线性组合就可以表示出原方程的任意解,故这组解就是原方程的一个基础解系,上述叙述也正是基础解系的几何意义

方程Ax=b的几何意义

设A是m*n矩阵

,x是n维向量,由前述几何意义知道,如果b处于A的向量空间中(b和A的向量线性相关),则一定可以由A的向量线性表示,也即解存在,而b落在A的向量空间等价于b的维数小于等于向量空间A的维数,也可表述为R(A)=R(Ab)=R,即A的秩等于增广矩阵的秩,这种表达也是许多教科书中常用的。

当R=n时,n维向量x的每个分量都是线性表示的确定系数,故只有唯一解,而R

特征向量与特征值的几何意义

由于特征值较为抽象同时也很重要,所以这里会尽可能详细地分析其几何含义

探究几何含义

对于确定的方阵A,如果存在向量x与数值λ,使得Ax=λx,则定义λ为方阵A的特征值,称x为方阵A的特征向量;由前面矩阵以及矩阵乘法的几何含义知道,此等式说明向量x经过矩阵A的变换等价于经过因子λ的伸缩变换,所以特征向量和特征值可以如下概述:

一个矩阵在对任意向量进行变换时,可能会存在一种特殊情形,即一些方向上的向量在变换后还是在此方向(和原向量共线),这些向量就称为这个矩阵的特征向量,对这些特征向量来说,变换矩阵完全可以用一个伸缩因子代替,这个伸缩因子就称为对应的特征值;

注1:

之所以说是可能存在,是因为一些矩阵的确没有这类特殊情形,后文会介绍到

注2:

变换矩阵在这种情况下收缩为一个数值,如果用运动学思想类比,可以把向量的变换看作是其终点的运动(以原向量方向建系),矩阵作为运动约束,在特殊情况下,某些向量受到最大约束,这时只能在原向量方向上运动,终点的广义坐标就只有一个,矩阵蕴含的新位置坐标有冗余,所以特征值可以对特征向量上的问题进行简化,这在一些增长模型计算,系统分析中有很多实例

应用几何含义可以很容易理解一些性质,如定理:

设λ是A的特征值,则

的特征值;

因为对特征向量进行多次A变换后仍然和此向量共线,而每一次作用都等价于伸缩λ倍,故

x始终是和

对应的特征值和特征向量,同理可知

也是

对应的特征值。

具有实特征值矩阵的特点

对于单调变换矩阵,显然如果矩阵A是一个缩放变换,那么对于任意方向的向量,变换后都是和原向量共线的,故都存实特征值而且相同,所以缩放变换矩阵具有任意方向的特征向量(在代数解中表现为解系),有一个实特征值(在代数解中表现为重根);除此之外,变换一般会使原向量发生偏移,如旋转变换,当旋转角不是180度的整倍数时,显然它是不存在特征向量的,以90度逆时针旋转矩阵为例,它的特征值用代数解得到+i与-i,说明在实空间中的确是不存在的(注意如果在matlab中尽量不用普通角验证,因为存在浮点计算误差,哪怕数值误差很小,但可能改变矩阵性质,而mathematica在符号计算和表达上更好,所以对矩阵的精确研究建议使用mathematica)

对于复合变换矩阵,存在实特征值的可能性就很大了,例如把一个向量先剪切变换,再旋转某一角度,最后可能正好和原向量共线;再例如把一个向量先沿y方向剪切变换再沿x方向剪切变换,仍然存在一个方向的向量会在变换后保持方向不变;另外对各分量进行缩放,但缩放比例不同的变换矩阵也是存在实特征值的

如上图所示,原向量是OA,先沿y方向剪切变换得到OB,然后做旋转变换,顺时针旋转θ角(小于180度)得到OC,因为对于不同的向量剪切变换后与原向量的夹角一般是不同的,所以旋转θ角后一般也不会和原向量共线,但是由于剪切角可连续取值(变化范围为180度,不含剪切线位置)所以总可以找到一个方向,使得剪切角和旋转角相等,这时复合变换后的向量与原向量共线,所以此方向上的向量即此变换矩阵的特征向量;

按几何含义构造一个含实特征值的矩阵

如上两图所示,向量OB先沿y方向剪切变换变为OC,由几何含义可得到这一过程的变换矩阵为

,然后沿x方向剪切变换得到OD,这一过程的矩阵为

,总变换矩阵为二者乘积

*

=

=A,由于OD与原向量OB共线,故此方向的向量即矩阵A的特征向量,可表达为c

与c

,c为任意实数,对应特征值为

下面使用matlab与mathematica软件分别作验证,同时可以看出mathematica符号运算和表达的优点

matlab中:

虽然在这里也可以看出上图中的特征向量方向与特征值,但显然不精确(需要估计),而且表达不够美观

mathematica中:

显然这里的结果是很精确和清晰的,这也是前面推荐使用mathematica软件精确研究矩阵的原因

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1