转载-新理解矩阵(二)

转载这个系列文章的原因见新理解矩阵(一)
上一篇文章中我从纯代数运算的角度来讲述了我对矩阵的一个理解,可以看到,我们赋予了矩阵相应的运算法则,它就在代数、分析等领域显示出了巨大作用。但是纯粹的代数是不足够的,要想更加完美,最好是找到相应的几何对象能够与之对应,只有这样,我们才能够直
观地理解它,以达到得心应手的效果。

几何理解

我假设读者已经看过孟岩的《理解矩阵》三篇文章,所以更多的细节我就不重复了。我们知道,一个2*2矩阵 A事实上由两个向量$a_1$ 和$a_2$(这里的向量都是列向量)组成,它描述了一个平面(仿射)坐标系。换句话说,这两个向量其实是这个坐标系的两个基,而运算$y=Ax$,则是告诉我们,在 A 这个坐标系下的 x 向量,在 I 坐标系下是怎样的。这里的 I 坐标系就是我们最常用的直角坐标系,也就是说,任何向量(包括矩阵里边的向量),只要它前面没有矩阵作用于它,那么它都是在直角坐标系下度量出来的。(事实上,单位矩阵 I 是默认的直角坐标系,这一说法并非总是成立的,但是我们现在寻求直观的理解方式,我们就用最简单的东西来实行。)

为什么会有这样的特点?其实这源于我们对矩阵乘法的定义,反过来,如果我们用这样的几何方式来定义矩阵乘法,那么我们也将得到在书本上了解到的矩阵乘法计算公式。更高阶的矩阵也可以作同样的类比。推导过程只是一道很简单的练习题,读者不妨自己动笔尝试一下?

现在我们又回到孟岩文章上的说法了,对于矩阵作用于一个向量(对应的一个点),我们既可以看作点没有变,只不过是坐标系从直角坐标系变换为仿射坐标系而已;另一方面,我们也可以看做矩阵把直角坐标系的一个 A’点“运动”(变换)到了 A 点。这两种说法都行,正如孟岩所说的“运动是相对的”。更正确地讲,两种说法都要同时被提及,才算是最好的理解。

矩阵是一个点到另外一个点的变换,变换的方式就是坐标系的变换。当然,上面只讨论了矩阵乘以向量的乘法,那么矩阵乘以矩阵呢?比如 AB,我们就可以看作是矩阵 B 给出了一个坐标系,但是这个坐标系的各个分量是在A坐标系下测量得到的,而A是在直角坐标系下测量得到的,所以要把B的各个分量(列向量)与矩阵 A 作乘法后,才得到了这个仿射坐标系在直角坐标系下的“像”。这很直接地导致了矩阵乘以矩阵的计算公式,也很显然地回答了“为什么 n 阶方阵只有与 n 阶方阵相乘才有意义”,因为两者要在同一空间中测量,才能够完整而唯一地把测量值确定下来。正如,在 n+1 维的空间中讨论n个n维向量是没有意义的,因为在n+1维空间中的观测者看来,它们只不过是一个“面”,多出的一个维度可以随意变化;在n维空间中讨论n+1维向量就更没有意义了,因为维度根本就不够用。

有了这个直观的几何意义,很多问题看起来几乎都是显然的了,比如那些行列式问题,还有相似矩阵等等,这将在下回谈到。

张量介绍

我们已经大概了解到,数字的有序组合产生了向量,向量的有序组合产生了矩阵。这样两个新构造出来的对象,作用一个比一个大。那么有人会联想到:矩阵的有序组合,就可以产生一个“立方阵”,它的功能会不会更加强大?更一般的,n维立方阵呢?这种联想是有道理的,数学上也有这样的研究对象,它就是张量。最通俗的说法,n阶张量就是一个0维立方阵,所以0阶张量就对应一个数,向量、矩阵分别对应 1 阶和 2 阶张量,我们所说的三维立方阵,就是 3 阶张量啦。当然,张量属于很高深的数学理论,它的性质和作用不可能这么简单就说清楚了。回想当年,爱因斯坦就是用张量分析作为工具,建立起他那伟大的广义相对论的。如果有机会的话,我们一定会重新造访它。

接下来,我们还是回到矩阵问题,谈谈矩阵的行列式。

0%