自学内容网 自学内容网

第一讲 方程组的几何解释——以列向量线性组合的角度看方程组

第一讲主要分为以下几个部分:

(1)n个方程n个未知数(n equations with n unknowns)

(2)行图像(row picture)

(3)列图像(column picture)

(4)矩阵形式(matrix form)

一、n个方程n个未知数

结合小学和初中第一次接触方程的经历可知,我们把含有未知数的等式称为方程,而方程中含有未知数的个数称为元的个数,也就是说,每一个方程都提供了一条可以求解未知数的信息,当n个方程正好可以为n个元的求解提供n条信息时,那么这个情况我们是可以获得唯一解的,也是我们之前接触的最多,例如一元一次方程,二元一次方程等。

但是不知道大家有没有想过一个问题,为什么我们初高中接触的最高元到三元,而没有继续研究四元五元?当时笔者觉得可能是因为计算太难了吧。以笔者看来,也确实因为消元计算的复杂性,之前学过的方程和消元的思想都是为现在的线性代数打基础,一个方程组完全可以用矩阵形式来表示,而因为矩阵的简洁性可以更好地求解方程组的解。

回忆之前和方程打交道的经历,小学的时候我们把精力放在纯代数的求解上,初中的时候我们逐渐接触函数,开始引入图像和数形结合的思想,而到了高中数形结合已经大势所向,这就启示着我们方程和图像是密切相关的,因此下面我们将从图像的视角理解方程与方程的解。

二、行图像

对于二元一次方程组 \left\{\begin{matrix} 2x -y = 0 \\ -x + 2y =3 \end{matrix}\right.,我们从行的视角来看,显然一行是一个方程,一个方程对应着平面直角坐标系下一条直线,因此,这个方程组的解就是两条直线的交点。

通过作图很容易知道交点为(1,2),即方程的解为x=1,y=2,这是两个方程两个未知数的情况下,我们将其写成系数矩阵形式:

                            \begin{bmatrix} 2&-1\\ -1&2 \end{bmatrix}\cdot \begin{bmatrix} x\\ y \end{bmatrix}= \begin{bmatrix} 0\\ 3 \end{bmatrix}

我们令系数矩阵为A,\begin{bmatrix} x\\ y \end{bmatrix} 为\vec{x}\begin{bmatrix} 0\\ 3 \end{bmatrix} 为b,则上述可以表示为A\vec{x}=b。

三、列图像

上述行图像之前都有接触过,但是接下来要说的列图像的角度之前接触较少,但是尤其重要,随着对其理解的加深逐渐向着线性代数的核心开始靠拢。

我们还是重写A\vec{x}=b,即:

 \begin{bmatrix} 2&-1\\ -1&2 \end{bmatrix}\cdot \begin{bmatrix} x\\ y \end{bmatrix}= \begin{bmatrix} 0\\ 3 \end{bmatrix}

我们改写为:

x\cdot \begin{bmatrix} 2\\ -1 \end{bmatrix}+ y\cdot \begin{bmatrix} -1\\ 2 \end{bmatrix}=\begin{bmatrix} 0\\ 3 \end{bmatrix}

我们将原来的系数矩阵A看为两个列向量,而对应的未知数即为列向量的线性组合,也就是如何对这两个列向量进行线性组合可以得到等号右边的列向量(combinations of the columns of A),我们画图示意:

通过画图可以很直观看出,需要一份的 \begin{bmatrix} 2\\ -1 \end{bmatrix} 和两份的\begin{bmatrix} -1\\ 2 \end{bmatrix}可以组合得到,因此x=1,y=2。

四、矩阵形式

其实结合以上的分析,我们可以对于方程和矩阵有了更加清晰地认识,对于同一个方程组和矩阵表达式:

 \left\{\begin{matrix} 2x -y = 0 \\ -x + 2y =3 \end{matrix}\right.

 \begin{bmatrix} 2&-1\\ -1&2 \end{bmatrix}\cdot \begin{bmatrix} x\\ y \end{bmatrix}= \begin{bmatrix} 0\\ 3 \end{bmatrix}

我们通过不同的视角处理系数矩阵A提供的信息,都可以求解。

对于行图像而言,我们把系数矩阵A按照行看,也就是看成两个含有x和y的方程,找出这两条信息的重合点,也就是图像的交点,也就是最终的解。对应的运算为向量的点乘运算、

对于列图像而言,我们把系数矩阵A按照列看,看成一个含有所有x信息的列向量和一个含有所有y信息的列向量,思考如何对于这两个列向量进行线性组合,也就是求解这两个列向量的系数,即可以得到最终的结果。

总而言之,方程组对应着矩阵,矩阵和方程组可以互相表示,就像信号与系统的时域分析与频域分析一样,我们从行图像和列图像来看待矩阵只是不同的观察视角,最终的结果是一样的。对应的运算为向量的加减运算。

同理,我们从二维平面拓展到三维立体坐标系,我们写出类似的矩阵形式:

x\cdot \begin{bmatrix} 2\\ -1\\ 0 \end{bmatrix}+y\cdot \begin{bmatrix} -1\\ 2\\ -3 \end{bmatrix}+z\cdot \begin{bmatrix} 0\\ -1\\ 4 \end{bmatrix}=\begin{bmatrix} 0\\ -1\\ 4 \end{bmatrix}

在三维空间中行图像就是三个平面相交,列图像就是对三个列向量进行线性组合。

五、核心等式

我们始终把矩阵和方程的思想在对比学习,这种角度上矩阵只是简化解方程的一种形式,因此归根到底还是解方程,那么就会出现一个问题,

对于A\vec{x}=b,等式右边任意的b方程都有解吗?(Can I solve Ax=b for every b?)

从列图像线性组合的角度而言,这个问题也等价于:

列的线性组合是否能覆盖整个三维空间?(Do the combinations of the columns fill 3-D space?)

对于上述二维和三维的例子,我们都选择的是好的矩阵,但是实际上并不是都这样,比如对于三维空间,如果三个列向量都处于同一平面,显而易见,无论如何组合三个列向量,所张成的空间就是这个平面,不能产生其他的列向量。也就是说,只有当b取值到这个平面内,方程才有解,而大部分b取值在三维空间内却不在这个平面内方程就无解,这种情况成为奇异(singular case),因此上述问题不一定成立。


原文地址:https://blog.csdn.net/daviddou2022/article/details/145251931

免责声明:本站文章内容转载自网络资源,如侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!