1. 矩阵乘法

如果矩阵 B B B 的列为 b 1 , b 2 , b 3 b_1, b_2, b_3 b1,b2,b3,那么 E B EB EB 的列就是 E b 1 , E b 2 , E b 3 Eb_1, Eb_2, Eb_3 Eb1,Eb2,Eb3

E B = E [ b 1 b 2 b 3 ] = [ E b 1 E b 2 E b 3 ] \boldsymbol{EB = E[b_1 \quad b_2 \quad b_3] = [Eb_1 \quad Eb_2 \quad Eb_3]} EB=E[b1b2b3]=[Eb1Eb2Eb3]

E <mtext>   </mtext> ( B <mtext>   </mtext> j <mtext>   </mtext> ) = E B <mtext>   </mtext> <mtext>   </mtext> j <mtext>   </mtext> E\space(B 的第\space j \space列) =EB \space的第 \space j \space列 E (B j )=EB  j 

  • 置换矩阵(permutation matrix)

在消元的过程中,如果遇到了某一行主元的位置为 0,而其下面一行对应的位置不为 0,我们就可以通过行交换来继续进行消元。

如下的矩阵 P 23 P_{23} P23 可以实现将向量或者矩阵的第 2 、 3 行进行交换。

P 23 = [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> ] P_{23} = \begin{bmatrix} 1&amp;0&amp;0 \\ 0&amp;0&amp;1\\0&amp;1&amp;0\end{bmatrix} P23=100001010

[ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 5 </mstyle> ] = [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 5 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> ] \begin{bmatrix} 1&amp;0&amp;0 \\ 0&amp;0&amp;1\\0&amp;1&amp;0\end{bmatrix} \begin{bmatrix} 1 \\ \boldsymbol 3\\\boldsymbol 5\end{bmatrix} = \begin{bmatrix} 1 \\ \boldsymbol 5\\\boldsymbol 3\end{bmatrix} 100001010135=153

[ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 6 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 5 </mstyle> ] = [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 6 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 5 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> ] \begin{bmatrix} 1&amp;0&amp;0 \\ 0&amp;0&amp;1\\0&amp;1&amp;0\end{bmatrix} \begin{bmatrix} 2&amp;4&amp;1 \\ \boldsymbol0&amp;\boldsymbol0&amp;\boldsymbol3\\0&amp;6&amp;5 \end{bmatrix} = \begin{bmatrix} 2&amp;4&amp;1 \\0&amp;6&amp;5 \\\boldsymbol0&amp;\boldsymbol0&amp;\boldsymbol3\end{bmatrix} 100001010200406135=200460153

置换矩阵 P i j P_{ij} Pij 就是将单位矩阵的第 i i i 行和第 j j j 行进行互换,当交换矩阵乘以另一个矩阵时,它的作用就是交换那个矩阵的第 i i i 行和第 j j j 行。

  • 增广矩阵(augmented matrix)

在消元的过程中,方程两边的系数 A A A b b b 都要进行同样的变换,这样,我们可以把 b b b 作为矩阵 A A A 的额外的一列,然后,就可以用消元矩阵 E E E 乘以这个增广的矩阵一次性完成左右两边的变换。

E [ A <mtext>   </mtext> b ] = [ E A <mtext>   </mtext> E b ] E[A \space \boldsymbol b] = [EA \space E \boldsymbol b] E[A b]=[EA Eb]

[ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 9 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 8 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 7 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 0 </mstyle> ] = [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 7 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 0 </mstyle> ] \begin{bmatrix} 1&amp;0&amp;0 \\ -2&amp;1&amp;0\\0&amp;0&amp;1\end{bmatrix} \begin{bmatrix} 2&amp;4&amp;-2&amp;\boldsymbol 2 \\ 4&amp;9&amp;-3&amp;\boldsymbol 8 \\-2&amp;-3&amp;7&amp;\boldsymbol 10 \end{bmatrix} = \begin{bmatrix} 2&amp;4&amp;-2&amp;\boldsymbol 2 \\ 0&amp;1&amp;1&amp;\boldsymbol 4 \\-2&amp;-3&amp;7&amp;\boldsymbol 10 \end{bmatrix} 1200100012424932372810=2024132172410

  • 矩阵乘法的四种理解

如果矩阵 A A A n n n 列, B B B n n n 行,那么我们可以进行矩阵乘法 A B AB AB

假设矩阵 A A A m m m n n n 列,矩阵 B B B n n n p p p 列,那么 A B AB AB m m m p p p 列的。

( m × n ) ( n × p ) ( m × p ) [ <mstyle displaystyle="false" scriptlevel="0"> m <mtext>   </mtext> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> n <mtext>   </mtext> </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> n <mtext>   </mtext> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> p <mtext>   </mtext> </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> m <mtext>   </mtext> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> p <mtext>   </mtext> </mstyle> ] (m×n)(n×p)(m×p) \quad \begin{bmatrix} \boldsymbol{m \space 行} \\{n \space 列} \end{bmatrix} \begin{bmatrix} n \space 行 \\\boldsymbol{p \space 列} \end{bmatrix} \begin{bmatrix} \boldsymbol{m \space 行} \\\boldsymbol{p \space 列}\end{bmatrix} (m×n)(n×p)(m×p)[m n ][n p ][m p ]

矩阵乘法的第一种理解方式就是一个一个求取矩阵 A B AB AB 位于 ( i , j ) (i, j) (i,j) 处的元素

( A B ) i j = A <mtext>   </mtext> <mtext>   </mtext> i <mtext>   </mtext> <mtext>   </mtext> B <mtext>   </mtext> <mtext>   </mtext> j <mtext>   </mtext> = a i k b k j (AB)_{ij} = A \space 的第 \space i \space 行与\space B \space的第\space j \space 列的内积 = \sum a_{ik}b_{kj} (AB)ij=A  i  B  j =aikbkj

第二种理解,矩阵 A B AB AB 的列是 A A A 的列的线性组合

A B = A [ b 1 b 2 b p ] = [ A b 1 A b 2 A b p ] {AB = A[b_1 \quad b_2 \cdots b_p] = [Ab_1 \quad Ab_2 \cdots Ab_p]} AB=A[b1b2bp]=[Ab1Ab2Abp]

第三种理解,矩阵 A B AB AB 的行是 B B B 的行的线性组合

A B = [ <mstyle displaystyle="false" scriptlevel="0"> a 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> a 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> a m </mstyle> ] B = [ <mstyle displaystyle="false" scriptlevel="0"> a 1 B </mstyle> <mstyle displaystyle="false" scriptlevel="0"> a 2 B </mstyle> <mstyle displaystyle="false" scriptlevel="0"> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> a m B </mstyle> ] AB = \begin{bmatrix}a_1 \\ a_2 \\ \vdots \\a_m\end{bmatrix}B = \begin{bmatrix}a_1 B \\ a_2B \\ \vdots \\a_m B\end{bmatrix} AB=a1a2amB=a1Ba2BamB

第四种理解,矩阵 A B AB AB 是所有 A A A 的列与 B B B 的行的乘积的和

A B = [ a 1 a 2 a n ] [ <mstyle displaystyle="false" scriptlevel="0"> b 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> b 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> </mstyle> <mstyle displaystyle="false" scriptlevel="0"> b n </mstyle> ] = <munderover> i = 1 n </munderover> a i b i AB = [a_1 \quad a_2 \cdots a_n] \begin{bmatrix}b_1 \\ b_2 \\ \vdots \\b_n\end{bmatrix} = \sum_{i=1}^{n} a_i b_i AB=[a1a2an]b1b2bn=i=1naibi

其中,一列乘以一行称为外积(outer product),(n×1)(1×n)=(n, n),结果为一个 n×n 的矩阵。
[ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 7 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 8 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 9 </mstyle> ] [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 6 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> ] = [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> ] [ 1 6 ] + [ <mstyle displaystyle="false" scriptlevel="0"> 7 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 8 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 9 </mstyle> ] [ 0 0 ] = [ <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 12 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 3 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 18 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 4 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 24 </mstyle> ] \begin{bmatrix}2&amp;7 \\ 3&amp;8 \\ 4&amp;9\end{bmatrix} \begin{bmatrix}1&amp;6 \\ 0&amp;0\end{bmatrix} = \begin{bmatrix}2 \\ 3 \\ 4\end{bmatrix}[1 \quad 6] + \begin{bmatrix}7 \\ 8 \\ 9\end{bmatrix}[0 \quad 0] = \begin{bmatrix}2&amp;12 \\ 3&amp;18 \\ 4&amp;24\end{bmatrix} 234789[1060]=234[16]+789[00]=234121824

  • 矩阵乘法的性质

结合律: A ( B C ) = ( A B ) C \boldsymbol{A(BC) = (AB)C} A(BC)=(AB)C
交换律: ( A + B ) C = A C + B C \boldsymbol{(A+B)C = AC+BC} (A+B)C=AC+BC
交换律: A ( B + C ) = A B + A C \boldsymbol{A(B+C) = AB+AC} A(B+C)=AB+AC

A p = <munder> <munder> A A A </munder> <mtext> p 个 </mtext> </munder> A^p = \underbrace{AA\cdots A}_{\text{p 个}} Ap= AAA
A p A q = A ( p + q ) A^pA^q = A^{(p+q)} ApAq=A(p+q)
( A p ) q = A p q (A^p)^q = A^{pq} (Ap)q=Apq
A 0 = I A^0=I A0=I

  • 分块矩阵

矩阵还可以被划分为小块,其中每个小块都是一个更小的矩阵。

如果对矩阵 A A A 的列的划分和对矩阵 B B B 的行的划分正好匹配,那么每个块之间就可以进行矩阵乘法。

一种特殊的划分就是矩阵 A A A 的每个小块都是 A A A 的一列,矩阵 B B B 的每个小块都是 B B B 的一行,这种情况就是我们上面说的矩阵相乘的第四种理解。

同样地,在消元的时候,我们也可以按块对系数矩阵进行消元。

2. 矩阵的逆

假设 A A A 是一个方阵,如果存在一个矩阵 A 1 A^{-1} A1,使得

A 1 A = I A A 1 = I A^{-1}A = I \quad 并且 \quad AA^{-1} = I A1A=IAA1=I

那么,矩阵 A A A 就是可逆的, A 1 A^{-1} A1 称为 A A A 的逆矩阵。

逆矩阵的逆就是进行和原矩阵相反的操作。消元矩阵 E 21 E_{21} E21 的作用是第二个方程减去第一个方程的 2 倍。

E 21 = [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> ] E_{21} = \begin{bmatrix} 1&amp;0&amp;0 \\ -2&amp;1&amp;0\\0&amp;0&amp;1\end{bmatrix} E21=120010001

其逆矩阵 E 21 1 E_{21}^{-1} E211 的作用则是第二个方程加上第一个方程的 2 倍。

E 21 1 = [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 2 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> ] E_{21}^{-1} = \begin{bmatrix} 1&amp;0&amp;0 \\ 2&amp;1&amp;0\\0&amp;0&amp;1\end{bmatrix} E211=120010001

  • 当且仅当在消元过程中产生 n n n 个主元的时候(允许行交换),矩阵 A A A 的逆才存在。

  • 矩阵 A A A 不可能有两个不同的逆矩阵,左逆等于右逆。假设 B A = I BA=I BA=I A C = I AC=I AC=I,那么一定有 B = C B=C B=C
    B ( A C ) = ( B A ) C B I = I C B = C B(AC) = (BA)C \to BI = IC \to B=C B(AC)=(BA)CBI=ICB=C

  • 如果矩阵 A A A 是可逆的,那么 A x = b Ax=b Ax=b 有唯一解 x = A 1 b x=A^{-1}b x=A1b

  • 如果存在一个非零向量 x x x 使得 A x = 0 Ax= \boldsymbol 0 Ax=0,那么 A A A 不可逆,因为没有矩阵可以将零向量变成一个非零向量。

<mtext>   </mtext> A 1 <mtext>   </mtext> <mtext>   </mtext> x = A 1 0 = 0 若 \space A^{-1} \space 存在,则\space x = A^{-1} \boldsymbol 0 = \boldsymbol 0  A1  x=A10=0

  • 一个 2×2 的矩阵是可逆的,当且仅当 a d b c ad-bc adbc 非零。

  • 一个对角化矩阵如果其对角线上元素非零,那么其有逆矩阵。

如果矩阵 A A A 和矩阵 B B B 都是可逆的,那么它们的乘积 A B AB AB 也是可逆的。

( A B ) 1 = B 1 A 1 (AB)^{-1} = B^{-1}A^{-1} (AB)1=B1A1
( A B ) 1 A B = B 1 A 1 A B = B 1 I B = I (AB)^{-1}AB = B^{-1}A^{-1}AB = B^{-1}IB = I (AB)1AB=B1A1AB=B1IB=I

同样地,针对三个或更多矩阵的乘积,有

( A B C ) 1 = C 1 B 1 A 1 (ABC)^{-1} = C^{-1}B^{-1}A^{-1} (ABC)1=C1B1A1

3. 高斯-若尔当消元法(Gauss-Jordan Elimination)求矩阵的逆

我们可以通过消元法来求解矩阵 A A A 的逆矩阵。思路是这样的,假设 A A A 是一个 3×3 的矩阵,那么我们可以建立三个方程来分别求出 A 1 A^{-1} A1 的三列。

A A 1 = A [ x 1 x 2 x 3 ] = [ e 1 e 2 e 3 ] = [ <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 0 </mstyle> <mstyle displaystyle="false" scriptlevel="0"> 1 </mstyle> ] AA^{-1} = A[x_1 \quad x_2 \quad x_3] = [e_1 \quad e_2 \quad e_3]=\begin{bmatrix} 1&amp;0&amp;0 \\ 0&amp;1&amp;0\\0&amp;0&amp;1\end{bmatrix} AA1=A[x1x2x3]=[e1e2e3]=100010001

<mstyle displaystyle="true" scriptlevel="0"> A x 1 = e 1 </mstyle> <mstyle displaystyle="true" scriptlevel="0"> A x 2 = e 2 </mstyle> <mstyle displaystyle="true" scriptlevel="0"> A x 3 = e 3 </mstyle> \begin{alignedat}{2} Ax_1 = e_1 \\ Ax_2 = e_2\\ Ax_3 = e_3 \end{alignedat} Ax1=e1Ax2=e2Ax3=e3

而高斯-若尔当消元法则是一次性求解出这些方程,之前我们求解一个方程的时候,将 b b b 作为 A A A 的一列组成增广矩阵,而现在我们则是把 e 1 e 2 e 3 e_1、e_2、e_3 e1e2e3 三列一起放入 A A A 中形成一个增广矩阵,然后进行消元。

到这里,我们已经得到了一个下三角矩阵 U U U,高斯就会停在这里然后用回带法求出方程的解,但若尔当将会继续进行消元,直到得到简化阶梯形式(reduced echelon form)

最后,我们将每行都除以主元得到新的主元都为 1,此时,增广矩阵的前一半矩阵就是 I I I,而后一半矩阵就是 A 1 A^{-1} A1

我们用分块矩阵就可以很容易地理解高斯-若尔当消元法,消元的过程就相当于乘以了一个 A 1 A^{-1} A1 A A A 变成了 I I I,将 I I I 变成了 A 1 A^{-1} A1

A 1 [ A I ] = [ I A 1 ] A^{-1}[A \quad I] = [I \quad A^{-1}] A1[AI]=[IA1]

获取更多精彩,请关注「seniusen」!