Mengqi's blog

线性代数拾遗(二):线性方程组的解集及其几何意义


上一章我们讲到三种等价形式:线性方程组、向量方程和矩阵方程。由于这三者之间的等价关系,我们解决现实问题时可以自由选取其中任意一个作为模型。我个人认为,线性方程组是最「质朴」的形式;向量方程则是与几何建立了关系,这将方便我们进行更直观的推理;矩阵方程则是向量方程的一种「封装」,是向量方程的一种抽象,它将具体的向量形式隐藏,提供给我们一个简洁的 API 形式——矩阵。未来将要介绍的很多概念就是基于对这一层封装的研究,如果到时候我们发现某个概念理解有困难,不妨转换思路到向量方程或线性方程组的形式进行分析。

此外,我们之前还进行了关于线性方程组解集的讨论,在这章我们对其进一步探讨。

一、齐次线性方程组

形如 Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 的线性方程组称为齐次方程组。显然,x=0\mathbf{x}=\mathbf{0} 是方程的解,这个解太平凡了,以致于就叫平凡解。我们平常更关心的是它还有没有别的解,即非平凡解。下面以一个例子分析一下:

例:判断下列齐次方程组是否有非平凡解,表示其解集。

3x1+5x24x3=03x12x2+4x3=06x1+x28x3=0\begin{array}{cccl} 3x_1 &+& 5x_2 &-& 4x_3 &= 0 \\ -3x_1 &-& 2x_2 &+& 4x_3 &= 0 \\ 6x_1 &+& x_2 &-& 8x_3 &= 0 \end{array}

对于这类求解集的问题,我们可以直接对增广矩阵化简,得到

[A 0][354032406180][354003000000][1043001000000][\mathbf{A}\ \mathbf{0}] \sim \begin{bmatrix} 3 & 5 & -4 & 0 \\ -3 & -2 & 4 & 0 \\ 6 & 1 & -8 & 0 \end{bmatrix} \sim \begin{bmatrix} 3 & 5 & -4 & 0 \\ 0 & 3 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & -\frac{4}{3} & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix}

从最后的行最简形式,我们可以得到解:x1=43x3,x2=0x_1 = \frac{4}{3} x_3, x_2 =0,其中 x3x_3 是自由变量。所以 x\mathbf{x} 的通解就是 x=[x1x2x3]=x3[4301]=x3v\mathbf{x} = \begin{bmatrix}x_1\\ x_2\\ x_3\end{bmatrix} = x_3\begin{bmatrix}\frac{4}{3}\\ 0\\ 1\end{bmatrix} = x_3\mathbf{v}。也就是说,Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 的解是三维空间(因为向量 v\mathbf{v} 是三维的)中的一条直线(因为只有一个自由变量)。进一步推广,我们不难想象,如果解集中有 pp 个自由变量,则解集就是 mm 维空间(mmA\mathbf{A} 的行数)中,pp 个向量张成的空间。如果没有自由变量(也就是 A\mathbf{A} 各列线性无关),那么就有 0 个向量张成的空间,即 Span{0}\operatorname{Span}\{\mathbf{0}\}Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 也就只有平凡解。

二、非齐次线性方程组

非齐次线性方程组形如 Ax=b\mathbf{A}\mathbf{x}=\mathbf{b}, 为了方便对比,我们把上面那个例子改为一个非齐次方程组进行分析:

3x1+5x24x3=73x12x2+4x3=16x1+x28x3=4\begin{array}{cccl} 3x_1 &+& 5x_2 &-& 4x_3 &=& 7 \\ -3x_1 &-& 2x_2 &+& 4x_3 &=& -1 \\ 6x_1 &+& x_2 &-& 8x_3 &=& -4 \end{array}

老套路,我们对这个方程组的增广矩阵行化简:

[354732416184][354701020000][1043101020000]\begin{bmatrix} 3 & 5 & -4 & 7 \\ -3 & -2 & 4 & -1 \\ 6 & 1 & -8 & -4 \end{bmatrix} \sim \begin{bmatrix} 3 & 5 & -4 & 7 \\ 0 & 1 & 0 & 2 \\ 0 & 0 & 0 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & -\frac{4}{3} & -1 \\0 & 1 & 0 & 2 \\ 0 & 0 & 0 & 0 \end{bmatrix}

化简后可以得到方程组的解为:x1=1+43x3x2=2x_1 = -1 + \frac{4}{3}x_3,x_2 = 2,其中 x3x_3 是自由变量。 我们把这个解集用向量的形式表示出来就是:

x=[x1x2x3]=[1+43x32x3]=[120]+x3[4301]\mathbf{x} = \begin{bmatrix}x_1\\ x_2\\ x_3\end{bmatrix} = \begin{bmatrix}-1+\frac{4}{3}x_3\\ 2\\ x_3\end{bmatrix} = \begin{bmatrix}-1\\ 2\\ 0\end{bmatrix} + x_3 \begin{bmatrix}\frac{4}{3}\\ 0\\ 1\end{bmatrix}

注意到这个向量可分解为一个常数向量[120]\begin{bmatrix}-1\\ 2\\ 0\end{bmatrix}和一个可任意伸缩的向量x3[4301]x_3\begin{bmatrix}\frac{4}{3}\\ 0\\ 1\end{bmatrix},而且,常数向量就是行化简后矩阵的最后一列,而 [4301]\begin{bmatrix}\frac{4}{3}\\ 0\\ 1\end{bmatrix} 同样是齐次方程组的解。这是因为非齐次方程组只是最后一列由0\mathbf{0}换成了b\mathbf{b},而且最后一列不会影响前面三列,所以齐次和非齐次方程组行化简后,变量的对应系数是相同的(系数矩阵就是前三列),非齐次方程组的解仅仅只比齐次方程组的解多了一个常数向量。例如齐次方程组的解集为x=tv\mathbf{x}=t\mathbf{v},则非齐次方程组的解集就是 x=p+tv\mathbf{x}=\mathbf{p}+t\mathbf{v},其中 tt 为任意实数。从几何的角度来看,就是齐次方程组的解集经向量 p\mathbf{p} 平移得到非齐次方程组的解集。这个 p\mathbf{p} 的学名就叫做特解

注意,这里讲齐次方程组和非齐次方程组的解有一个前提,就是非齐次方程组首先要是有解的,如果0\mathbf{0}变成b\mathbf{b} 导致方程组没有解,那么也就不能用齐次方程组的解集平移了。

结合之前总结的齐次线性方程组解的性质,当方程组含有 pp 个自由变量时,齐次方程组的解集是 pp 个向量的张成空间,而非齐次方程组解集只是这个空间进行了平移(前提是非齐次方程组有解),并没有改变这个空间的基本性质(比如空间的维度)。

三、列空间

矩阵A=[a1a2an]\mathbf{A} = [\mathbf{a_1} \mathbf{a_2} \cdots \mathbf{a_n}]的各个列向量线性组合组成的集合,就是A\mathbf{A}的列空间。记作 ColA\operatorname{Col}\mathbf{A},即

ColA=Span{a1,a2,,an}\operatorname{Col} \mathbf{A} = \operatorname{Span}\{\mathbf{a_1}, \mathbf{a_2}, \cdots, \mathbf{a_n}\}

这个列空间,我们应该不陌生了,上一章中很多时候都是把矩阵看成列向量的排列,考虑 Ax=b\mathbf{A}\mathbf{x}=\mathbf{b} 的解的情况时其实就是在列向量中进行分析的。列空间在分析矩阵中各列向量的线性相关性时很有帮助:只有各列线性无关时,这 nn 个列才能张成 nn 维空间,这时就说这个矩阵的秩为 nn;而假如这里面有 1 列和其他某列线性相关,那么这 nn 个列就只能张成 n1n-1 维空间,这个矩阵的秩就是 n1n-1;也就是说,矩阵的秩说明了这个矩阵的列向量最多能张成多少维

如下图中,A=[a1 a2 a3]\mathbf{A} = [\mathbf{a_1}\ \mathbf{a_2}\ \mathbf{a_3}],由于有两个向量线性相关,导致 3 个列向量只能张成 2 维,因此 A\mathbf{A} 的秩为 2。所以 Ax\mathbf{A}\mathbf{x} 得不到任意三维向量 b\mathbf{b},也就是 Ax=b\mathbf{A}\mathbf{x}=\mathbf{b} 并不对所有 b\mathbf{b} 成立(只有b\mathbf{b}A\mathbf{A} 列空间中的向量时才成立)。

秩小于n的情况

更进一步,非齐次线性方程组 Ax=b\mathbf{A}\mathbf{x}=\mathbf{b} 中,如果 A\mathbf{A}已知,x\mathbf{x}b\mathbf{b} 未知,此时我们关注的问题是 A\mathbf{A} 的列向量能张成多少维;如果 A\mathbf{A}b\mathbf{b} 已知,我们关注的问题就是 A\mathbf{A}nn 个列向量如何线性表示能表示成 b\mathbf{b},这时候我们如果提前知道 A\mathbf{A} 的列空间达不到 b\mathbf{b} 的维数,那么这些列向量就一定无法线性组合出 b\mathbf{b}

四、零空间

齐次方程 Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 的全部解组成的集合,称为矩阵 A\mathbf{A} 的零空间,记作 NulA\operatorname{Nul} \mathbf{A}

A\mathbf{A} 中的列向量线性无关时,Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 只有零解,这时 A\mathbf{A} 的零空间就是 0\mathbf{0};而只要 A\mathbf{A} 中的列向量线性相关,Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 就存在非零解,这时 A\mathbf{A} 的零空间就是一个维度大于 0 的空间。

关于列空间和零空间的讨论先在这里打住,之后会进一步讨论它们之间的关系和各自的意义。目前只要知道列空间是由 A\mathbf{A} 的列向量张成的,而零空间的意义更隐晦一些,是 Ax=0\mathbf{A}\mathbf{x}=\mathbf{0} 的所有解组成的空间。从列空间能看出 A\mathbf{A} 各列的线性相关关系,列向量越相关,列空间维度越低。从零空间也能看出 A\mathbf{A} 各列的线性相关性,列向量越相关,零空间维度越高。而负责量化描述 A\mathbf{A} 列向量有多么线性相关的,是一个叫做的东西。

参考资料:

版权声明:

本文中所有文字、图片版权均属本人所有,如需转载请注明来源。