本文最后更新于 909 天前,其中的信息可能已经有所发展或是发生改变。
二阶行列式 :
∣ a 11 a 12 a 21 a 22 ∣ = a 11 × a 12 − a 21 × a 22 \left|\begin{matrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{matrix}\right| = a_{11}\times a_{12} - a_{21}\times a_{22} ∣ ∣ a 11 a 21 a 12 a 22 ∣ ∣ = a 11 × a 12 − a 21 × a 22
对于 a i j a_{ij} a ij :i i i 表示行标,j j j 表示列标。
对角线 a 11 a 22 a_{11}a_{22} a 11 a 22 为主对角线;a 12 a 21 a_{12}a_{21} a 12 a 21 为次对角线
三阶行列式 :
∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = a 11 × a 22 × a 33 + a 21 × a 32 × a 33 + a 12 × a 23 × a 31 − a 13 × a 22 × a 31 − a 23 × a 32 × a 11 − a 12 × a 21 × a 33 \left|\begin{matrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33} \end{matrix}\right| = \begin{aligned}&a_{11}\times a_{22}\times a_{33} + a_{21}\times a_{32}\times a_{33} + a_{12}\times a_{23}\times a_{31}\\&-a_{13}\times a_{22}\times a_{31} - a_{23}\times a_{32}\times a_{11} - a_{12}\times a_{21}\times a_{33}\end{aligned} ∣ ∣ a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33 ∣ ∣ = a 11 × a 22 × a 33 + a 21 × a 32 × a 33 + a 12 × a 23 × a 31 − a 13 × a 22 × a 31 − a 23 × a 32 × a 11 − a 12 × a 21 × a 33
n n n 元非齐次线性方程组 :
设有 n n n 个未知数 m m m 个方程的线性方程组,其中 a i j a_{ij} a ij 是第 i i i 个方程第 j j j 个未知数的系数,b i b_i b i 是第 i i i 个方程的常数项,且 b i b_i b i 不全为 0 0 0 。
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 … a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n
\begin{cases}
a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n=b_1\\\\
a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n=b_2\\\\
\dots\\\\
a_{n1}x_1+a_{n2}x_2+\dots+a_{nn}x_n=b_n\\
\end{cases}\\
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 … a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n
n n n 元齐次线性方程组 :
设有 n n n 个未知数 m m m 个方程的线性方程组,其中 a i j a_{ij} a ij 是第 i i i 个方程第 j j j 个未知数的系数,b i b_i b i 是第 i i i 个方程的常数项,且 b i = 0 b_i = 0 b i = 0 。
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = 0 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = 0 … a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = 0
\begin{cases}
a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n=0\\\\
a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n=0\\\\
\dots\\\\
a_{n1}x_1+a_{n2}x_2+\dots+a_{nn}x_n=0\\
\end{cases}\\
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = 0 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = 0 … a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = 0
线性方程组 :
二阶矩阵 :
[ a 11 a 12 a 21 a 22 ] \begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix} [ a 11 a 21 a 12 a 22 ]
三阶矩阵 :
[ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] \begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33} \end{bmatrix} ⎣ ⎡ a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33 ⎦ ⎤
m × n m\times n m × n 矩阵 :
由 m × n m\times n m × n 个数 a i j ( i = 1 , 2 , … , m , j = 1 , 2 , … , n ) a_{ij}(i = 1, 2, \dots, m, j = 1, 2, \dots,n) a ij ( i = 1 , 2 , … , m , j = 1 , 2 , … , n ) 排列成的 m m m 行 n n n 列的数表。
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ]
A =
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1 n} \\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m 1} & a_{m 2} & \cdots & a_{m n}
\end{bmatrix}
A = ⎣ ⎡ a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a mn ⎦ ⎤
与线性方程组相关的矩阵 :
对于非齐次线性方程组:
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 … a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n
\begin{cases}
a_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n=b_1\\\\
a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n=b_2\\\\
\dots\\\\
a_{n1}x_1+a_{n2}x_2+\dots+a_{nn}x_n=b_n\\
\end{cases}\\
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 … a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n
有如下矩阵:
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] , X = [ x 1 x 2 ⋮ x n ] , b = [ b 1 b 2 ⋮ b n ] , B = [ a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋱ ⋮ ⋮ a m 1 a m 2 ⋯ a m n b m ]
A = \begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1 n} \\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m 1} & a_{m 2} & \cdots & a_{m n}
\end{bmatrix},
X = \begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix},
b = \begin{bmatrix}b_1\\b_2\\\vdots\\b_n\end{bmatrix},
B = \begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1 n} &b_{1}\\
a_{21} & a_{22} & \cdots & a_{2 n} &b_{2}\\
\vdots & \vdots & \ddots & \vdots &\vdots\\
a_{m 1} & a_{m 2} & \cdots & a_{m n}&b_{m}\\
\end{bmatrix}
A = ⎣ ⎡ a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a mn ⎦ ⎤ , X = ⎣ ⎡ x 1 x 2 ⋮ x n ⎦ ⎤ , b = ⎣ ⎡ b 1 b 2 ⋮ b n ⎦ ⎤ , B = ⎣ ⎡ a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a mn b 1 b 2 ⋮ b m ⎦ ⎤
其中:
A A A 为系数矩阵。
X X X 为未知数矩阵。
b b b 为常数项矩阵。
B B B 为增广矩阵。
加减 :
两个矩阵相加或相减,需要满足两个矩阵的列数和行数一致。
满足交换律: A + B = B + A A + B = B + A A + B = B + A
乘法 :
两个矩阵 A A A 和 B B B 相乘,需要满足 A A A 的列数等于 B B B 的行数。
矩阵乘法不满足交换律:A B ≠ B A AB\ne BA A B = B A ,但仍然满足结合律和分配律:
零矩阵 :
元素都是 0 0 0 的矩阵称为零矩阵,记作 O O O 。
不同型的零矩阵是不同的。
单位矩阵 :
单位矩阵是一个 n × n n\times n n × n 矩阵,从左到右的对角线(主对角线)上的元素是 1 1 1 ,其余元素都为 0 0 0 。
下面是三个单位矩阵:
若矩阵 A A A 为 n × n n\times n n × n 的方阵,E E E 为单位矩阵,则:A E = A , E A = A AE=A,EA=A A E = A , E A = A
逆矩阵 :
矩阵 A A A 的逆矩阵记作 A − 1 A^{-1} A − 1 。
A A − 1 = E AA^{-1} = E A A − 1 = E ,其中 E E E 为单位矩阵。
奇异矩阵 :
当一个矩阵没有逆矩阵的时候,称该矩阵为奇异矩阵。
当且仅当一个矩阵的行列式为零时,该矩阵是奇异矩阵。
当 a × d − b × c = 0 a\times d-b\times c=0 a × d − b × c = 0 时 A A A 没有定义,A − 1 A^{-1} A − 1 不存在,则 A A A 是奇异矩阵。
如 :A = [ 1 1 2 2 ] A=\begin{bmatrix}1&1\\2&2\end{bmatrix} A = [ 1 2 1 2 ] 是奇异矩阵。
将矩阵 A A A 的行换成同序数的列得到的新的矩阵,叫做 A A A 的转置矩阵,记作: A T A^T A T 。
如果一个矩阵转置后等于原矩阵,那么这个矩阵称为对称矩阵。
设方程组有 2 2 2 个未知数,一共有 2 2 2 个方程:
则有方程组 { 2 x − y = 0 − x + 2 y = 3 \begin{cases}2x&-y&=0\\-x&+2y&=3\end{cases} { 2 x − x − y + 2 y = 0 = 3
写作矩阵形式有 [ 2 − 1 − 1 2 ] [ x y ] = [ 0 3 ] \begin{bmatrix}2&-1\\-1&2\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix} [ 2 − 1 − 1 2 ] [ x y ] = [ 0 3 ]
通常我们把第一个矩阵称为系数矩阵 A A A ,将第二个矩阵称为向量 x x x ,将第三个矩阵称为向量 b b b ,于是线性方程组可以表示为 A x = b Ax=b A x = b 。
行图像 :
解释 :
上图是直角坐标系中方程组中的两直线相交的情况。
接下来我们按列观察方程组:
x [ 2 − 1 ] + y [ − 1 2 ] = [ 0 3 ] x\begin{bmatrix}2\\-1\end{bmatrix}+y\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix} x [ 2 − 1 ] + y [ − 1 2 ] = [ 0 3 ]
我们把第一个向量称作 c o l 1 col_1 co l 1 ,第二个向量称作 c o l 2 col_2 co l 2 ,分别表示第一列的向量和第二列的向量。
要使得式子成立需要第一个向量加上两倍的第二个向量,即:
1 × c o l 1 + 2 × c o l 2 = 1 [ 2 − 1 ] + 2 [ − 1 2 ] = [ 0 3 ] 1\times col_1 + 2\times col_2 = 1\begin{bmatrix}2\\-1\end{bmatrix}+2\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix} 1 × co l 1 + 2 × co l 2 = 1 [ 2 − 1 ] + 2 [ − 1 2 ] = [ 0 3 ]
这和我们方程组的解 x = 1 , y = 2 x = 1,y = 2 x = 1 , y = 2 是对应的。
列图像 :
解释 :
绿向量 c o l 1 col_1 co l 1 与蓝向量(两倍的绿向量 c o l 2 col_2 co l 2 )合成红向量 b b b 。
接下来我们继续观察方程组:
x [ 2 − 1 ] + y [ − 1 2 ] = [ 0 3 ] x\begin{bmatrix}2\\-1\end{bmatrix}+y\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix} x [ 2 − 1 ] + y [ − 1 2 ] = [ 0 3 ]
显然地,c o l 1 col_1 co l 1 和 c o l 2 col_2 co l 2 通过某种线性组合得到了向量 b b b ,即:
1 × c o l 1 + 2 × c o l 2 = 1 [ 2 − 1 ] + 2 [ − 1 2 ] = [ 0 3 ] 1\times col_1 + 2\times col_2 = 1\begin{bmatrix}2\\-1\end{bmatrix}+2\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix} 1 × co l 1 + 2 × co l 2 = 1 [ 2 − 1 ] + 2 [ − 1 2 ] = [ 0 3 ]
那么推广来看, c o l 1 col_1 co l 1 和 c o l 2 col_2 co l 2 通过所有的线性组合所得到的向量 b i b_i b i 将能够铺满整个平面。
设方程组有 3 3 3 个未知数,一共有 3 3 3 个方程:
则有方程组 { 2 x − y = 0 − x + 2 y − z = − 1 − 3 y + 4 z = 4 \begin{cases}2x&-y&&=0\\-x&+2y&-z&=-1\\&-3y&+4z&=4\end{cases} ⎩ ⎨ ⎧ 2 x − x − y + 2 y − 3 y − z + 4 z = 0 = − 1 = 4
写作矩阵形式有 A = [ 2 − 1 0 − 1 2 − 1 0 − 3 4 ] , b = [ 0 − 1 4 ] A=\begin{bmatrix}2&-1&0\\-1&2&-1\\0&-3&4\end{bmatrix},\\ b=\begin{bmatrix}0\\-1\\4\end{bmatrix} A = ⎣ ⎡ 2 − 1 0 − 1 2 − 3 0 − 1 4 ⎦ ⎤ , b = ⎣ ⎡ 0 − 1 4 ⎦ ⎤
行图像的解释 :
在三维直角坐标系中,每一个方程将确定一个平面。
接下来我们按列观察方程组:
x [ 2 − 1 0 ] + y [ − 1 2 − 3 ] + z [ 0 − 1 4 ] = [ 0 − 1 4 ] x\begin{bmatrix}2\\-1\\0\end{bmatrix}+y\begin{bmatrix}-1\\2\\-3\end{bmatrix}+z\begin{bmatrix}0\\-1\\4\end{bmatrix}=\begin{bmatrix}0\\-1\\4\end{bmatrix} x ⎣ ⎡ 2 − 1 0 ⎦ ⎤ + y ⎣ ⎡ − 1 2 − 3 ⎦ ⎤ + z ⎣ ⎡ 0 − 1 4 ⎦ ⎤ = ⎣ ⎡ 0 − 1 4 ⎦ ⎤
该例子中的三个平面会相交于一点 ( 0 , 0 , 1 ) (0,0,1) ( 0 , 0 , 1 ) ,这个点就是方程组的解,且带入 x = 0 , y = 0 , z = 1 x = 0,y = 0,z = 1 x = 0 , y = 0 , z = 1 也可以使得上述式子成立。
列图像的解释 :
观察列图像的向量 c o l 1 , c o l 2 , c o l 3 col_1,col_2,col3 co l 1 , co l 2 , co l 3 的组合。
继续观察方程组:
x [ 2 − 1 0 ] + y [ − 1 2 − 3 ] + z [ 0 − 1 4 ] = [ 0 − 1 4 ] x\begin{bmatrix}2\\-1\\0\end{bmatrix}+y\begin{bmatrix}-1\\2\\-3\end{bmatrix}+z\begin{bmatrix}0\\-1\\4\end{bmatrix}=\begin{bmatrix}0\\-1\\4\end{bmatrix} x ⎣ ⎡ 2 − 1 0 ⎦ ⎤ + y ⎣ ⎡ − 1 2 − 3 ⎦ ⎤ + z ⎣ ⎡ 0 − 1 4 ⎦ ⎤ = ⎣ ⎡ 0 − 1 4 ⎦ ⎤
显然地,c o l 1 , c o l 2 , c o l 3 col_1,col_2,col_3 co l 1 , co l 2 , co l 3 也可以通过某种线性组合得到向量 b b b ,即:
0 × c o l 1 + 0 × c o l 2 + 1 × c o l 3 = 0 [ 2 − 1 0 ] + 0 [ − 1 2 − 3 ] + 1 [ 0 − 1 4 ] = [ 0 − 1 4 ] 0\times col_1 + 0\times col_2 + 1\times col_3= 0\begin{bmatrix}2\\-1\\0\end{bmatrix}+0\begin{bmatrix}-1\\2\\-3\end{bmatrix}+1\begin{bmatrix}0\\-1\\4\end{bmatrix}=\begin{bmatrix}0\\-1\\4\end{bmatrix} 0 × co l 1 + 0 × co l 2 + 1 × co l 3 = 0 ⎣ ⎡ 2 − 1 0 ⎦ ⎤ + 0 ⎣ ⎡ − 1 2 − 3 ⎦ ⎤ + 1 ⎣ ⎡ 0 − 1 4 ⎦ ⎤ = ⎣ ⎡ 0 − 1 4 ⎦ ⎤
那么推广来看,我们需要考虑,对于任意的 b b b ,是否都能求解 A x = b Ax=b A x = b ? 用列向量线性组合的观点阐述:c o l 1 , c o l 2 , c o l 3 col_1,col_2,col_3 co l 1 , co l 2 , co l 3 通过所有的线性组合所得到的向量 b i b_i b i ,是否能够铺满整个空间?
对上面这个例子,答案是肯定的。
如果三个向量在同一个平面上,则无法铺满整个空间。
推广的解释 :
当三个向量在同一个平面上时,那么他们的线性组合也一定都在这个平面上。
例如:c o l 3 = c o l 1 + c o l 2 col_3=col_1+col_2 co l 3 = co l 1 + co l 2 不管怎么组合,这三个向量的结果都逃不出其所在的平面。
因此当 b b b 在平面内,方程组有解,而当 b b b 不在平面内,这三个列向量就无法构造出 b b b 。
在后面的课程中,我们会了解到这种情形称为奇异 、矩阵不可逆 。
我们推广到九维空间,每个方程有九个未知数,共九个方程。
显然地,此时已经无法从坐标图像中描述问题了,但是我们依然可以从求九维列向量线性组合的角度解决问题,仍然是上面的问题。我们是否总能通过所有的线性组合所得到的向量 b i b_i b i ,来铺满整个九维空间?
当然这仍取决于这九个向量,如果我们取一些并不相互独立的向量,则答案是否定的,比如取了九列但其实只相当于八列,有一列毫无贡献(这一列是前面列的某种线性组合),则会有一部分b b b 无法求得。
对于任意的线性方程组,我们都可以将其化为矩阵的形式,得到系数矩阵 A A A ,向量 x x x 和向量 b b b ,接下来讲解其计算。
对于 A x = b Ax = b A x = b 是一种乘法运算:
例1 :
设 A = [ 2 5 1 3 ] , x = [ 1 2 ] A=\begin{bmatrix}2&5\\1&3\end{bmatrix},x=\begin{bmatrix}1\\2\end{bmatrix} A = [ 2 1 5 3 ] , x = [ 1 2 ] ,求 b b b 。
使用列向量线性组合的方式,一次计算一列,即把 A x Ax A x 看做 A A A 列向量的线性组合:
解 :
[ 2 5 1 3 ] [ 1 2 ] = 1 [ 2 1 ] + 2 [ 5 3 ] = [ 1 × 2 + 2 × 5 1 × 1 + 2 × 3 ] = [ 12 7 ]
\begin{aligned}
\begin{bmatrix}2&5\\1&3\end{bmatrix}\begin{bmatrix}1\\2\end{bmatrix}
&=
1\begin{bmatrix}2\\1\end{bmatrix}+2\begin{bmatrix}5\\3\end{bmatrix}\\\\
&=
\begin{bmatrix}1\times 2 + 2\times 5\\1\times 1 + 2\times 3\end{bmatrix}\\\\
&=
\begin{bmatrix}12\\7\end{bmatrix}
\end{aligned}
[ 2 1 5 3 ] [ 1 2 ] = 1 [ 2 1 ] + 2 [ 5 3 ] = [ 1 × 2 + 2 × 5 1 × 1 + 2 × 3 ] = [ 12 7 ]
例2 :
设 A = [ 2 − 1 0 − 1 2 1 0 3 4 ] , x = [ 0 0 1 ] A=\begin{bmatrix}2&-1&0\\-1&2&1\\0&3&4\end{bmatrix},x=\begin{bmatrix}0\\0\\1\end{bmatrix} A = ⎣ ⎡ 2 − 1 0 − 1 2 3 0 1 4 ⎦ ⎤ , x = ⎣ ⎡ 0 0 1 ⎦ ⎤ ,求 b b b 。
解 :
[ 2 − 1 0 − 1 2 1 0 3 4 ] [ 0 0 1 ] = 0 [ 2 − 1 0 ] + 0 [ − 1 2 − 3 ] + 1 [ 0 − 1 4 ] = [ 0 × 2 + 0 × − 1 + 1 × 0 0 × − 1 + 0 × 2 + 1 × − 1 0 × 0 + 0 × − 3 + 1 × 4 ] = [ 1 − 1 4 ]
\begin{aligned}
\begin{bmatrix}2&-1&0\\-1&2&1\\0&3&4\end{bmatrix}\begin{bmatrix}0\\0\\1\end{bmatrix}
~~&=~~
\begin{aligned}
0\begin{bmatrix}2\\-1\\0\end{bmatrix}+0\begin{bmatrix}-1\\2\\-3\end{bmatrix}+1\begin{bmatrix}0\\-1\\4\end{bmatrix}
\end{aligned}\\\\
&=
\begin{bmatrix}
0\times 2 + 0\times -1 + 1\times 0\\
0\times -1 + 0\times 2 + 1\times -1\\
0\times 0 + 0\times -3 + 1\times 4\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
1\\
-1\\
4
\end{bmatrix}
\end{aligned}
⎣ ⎡ 2 − 1 0 − 1 2 3 0 1 4 ⎦ ⎤ ⎣ ⎡ 0 0 1 ⎦ ⎤ = 0 ⎣ ⎡ 2 − 1 0 ⎦ ⎤ + 0 ⎣ ⎡ − 1 2 − 3 ⎦ ⎤ + 1 ⎣ ⎡ 0 − 1 4 ⎦ ⎤ = ⎣ ⎡ 0 × 2 + 0 × − 1 + 1 × 0 0 × − 1 + 0 × 2 + 1 × − 1 0 × 0 + 0 × − 3 + 1 × 4 ⎦ ⎤ = ⎣ ⎡ 1 − 1 4 ⎦ ⎤
这个方法最早由高斯 提出,我们以前解方程组的时候都会使用,现在来看如何使用矩阵实现消元法。
有三元方程组 { x + 2 y + z = 2 3 x + 8 y + z = 12 4 y + z = 2 \begin{cases}x&+2y&+z&=2\\3x&+8y&+z&=12\\&4y&+z&=2\end{cases} ⎩ ⎨ ⎧ x 3 x + 2 y + 8 y 4 y + z + z + z = 2 = 12 = 2 ,对应的矩阵形式 A x = b Ax=b A x = b 为 [ 1 2 1 3 8 1 0 4 1 ] [ x y z ] = [ 2 12 2 ] \begin{bmatrix}1&2&1\\3&8&1\\0&4&1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}2\\12\\2\end{bmatrix} ⎣ ⎡ 1 3 0 2 8 4 1 1 1 ⎦ ⎤ ⎣ ⎡ x y z ⎦ ⎤ = ⎣ ⎡ 2 12 2 ⎦ ⎤ 。
按照我们以前做消元法的思路:
第一步,我们希望在第二个方程中消去x x x 项,来操作系数矩阵 A = [ 1 ‾ 2 1 3 8 1 0 4 1 ] A=\begin{bmatrix}\underline{1}&2&1\\3&8&1\\0&4&1\end{bmatrix} A = ⎣ ⎡ 1 3 0 2 8 4 1 1 1 ⎦ ⎤ ,下划线的元素为第一步的主元(pivot):[ 1 ‾ 2 1 3 8 1 0 4 1 ] → r o w 2 − 3 r o w 1 [ 1 ‾ 2 1 0 2 − 2 0 4 1 ] \begin{bmatrix}\underline{1}&2&1\\3&8&1\\0&4&1\end{bmatrix}\xrightarrow{row_2-3row_1}\begin{bmatrix}\underline{1}&2&1\\0&2&-2\\0&4&1\end{bmatrix} ⎣ ⎡ 1 3 0 2 8 4 1 1 1 ⎦ ⎤ ro w 2 − 3 ro w 1 ⎣ ⎡ 1 0 0 2 2 4 1 − 2 1 ⎦ ⎤
这里我们先不管 b b b 向量,等做完 A A A 的消元可以再做 b b b 的消元。(这是MATLAB
等工具经常使用的算法。)
第二步,我们希望在第三个方程中消去 y y y 项,现在第二行第一个非零元素成为了第二个主元:[ 1 ‾ 2 1 0 2 ‾ − 2 0 4 1 ] → r o w 3 − 2 r o w 2 [ 1 ‾ 2 1 0 2 ‾ − 2 0 0 5 ‾ ] \begin{bmatrix}\underline{1}&2&1\\0&\underline{2}&-2\\0&4&1\end{bmatrix}\xrightarrow{row_3-2row_2}\begin{bmatrix}\underline{1}&2&1\\0&\underline{2}&-2\\0&0&\underline{5}\end{bmatrix} ⎣ ⎡ 1 0 0 2 2 4 1 − 2 1 ⎦ ⎤ ro w 3 − 2 ro w 2 ⎣ ⎡ 1 0 0 2 2 0 1 − 2 5 ⎦ ⎤
注意到第三行消元过后仅剩一个非零元素,所以它就成为第三个主元。做到这里就算消元完成了。
再来讨论一下消元失效的情形:
首先,主元不能为零;
其次,如果在消元时遇到主元位置为零,则需要交换行,使主元不为零。
如果我们把第三个方程 z z z 前的系数改成 − 4 -4 − 4 ,会导致第二步消元时最后一行全部为零,则第三个主元就不存在了,至此消元不能继续进行了,这就是下一讲中涉及的不可逆情况。
接下来就该回代(back substitution)了,这时我们在 A A A 矩阵后面加上 b b b 向量写成增广矩阵(augmented matrix)的形式:[ A b ] = [ 1 2 1 2 3 8 1 12 0 4 1 2 ] → [ 1 2 1 2 0 2 − 2 6 0 4 1 2 ] → [ 1 2 1 2 0 2 − 2 6 0 0 5 − 10 ] \left[\begin{array}{c|c}A&b\end{array}\right]=\left[\begin{array}{ccc|c}1&2&1&2\\3&8&1&12\\0&4&1&2\end{array}\right]\to\left[\begin{array}{ccc|c}1&2&1&2\\0&2&-2&6\\0&4&1&2\end{array}\right]\to\left[\begin{array}{ccc|c}1&2&1&2\\0&2&-2&6\\0&0&5&-10\end{array}\right] [ A b ] = ⎣ ⎡ 1 3 0 2 8 4 1 1 1 2 12 2 ⎦ ⎤ → ⎣ ⎡ 1 0 0 2 2 4 1 − 2 1 2 6 2 ⎦ ⎤ → ⎣ ⎡ 1 0 0 2 2 0 1 − 2 5 2 6 − 10 ⎦ ⎤
此时方程组变为{ x + 2 y + z = 2 2 y − 2 z = 6 5 z = − 10 \begin{cases}x&+2y&+z&=2\\&2y&-2z&=6\\&&5z&=-10\end{cases} ⎩ ⎨ ⎧ x + 2 y 2 y + z − 2 z 5 z = 2 = 6 = − 10 ,从第三个方程求出 z = − 2 z=-2 z = − 2 ,代入第二个方程求出 y = 1 y=1 y = 1 ,再代入第一个方程求出 x = 2 x=2 x = 2 。
2.4 2.4 2.4 讲我们学习了矩阵乘以向量的方法,现在有三个列向量的矩阵乘以另一个向量,按列的线性组合可以写作 [ v 1 v 2 v 3 ] [ 3 4 5 ] = 3 v 1 + 4 v 2 + 5 v 3 \Bigg[v_1\ v_2\ v_3\Bigg]\begin{bmatrix}3\\4\\5\end{bmatrix}=3v_1+4v_2+5v_3 [ v 1 v 2 v 3 ] ⎣ ⎡ 3 4 5 ⎦ ⎤ = 3 v 1 + 4 v 2 + 5 v 3 。
但现在我们希望用矩阵乘法表示行操作,则有[ 1 2 7 ] [ r o w 1 r o w 2 r o w 3 ] = 1 r o w 1 + 2 r o w 2 + 7 r o w 3 \begin{bmatrix}1&2&7\end{bmatrix}\begin{bmatrix}&row_1&\\&row_2&\\&row_3&\end{bmatrix}=1row_1+2row_2+7row_3 [ 1 2 7 ] ⎣ ⎡ ro w 1 ro w 2 ro w 3 ⎦ ⎤ = 1 ro w 1 + 2 ro w 2 + 7 ro w 3 。
易看出这里是一个行向量从左边乘以矩阵,这个行向量按行操作矩阵的行向量,并将其合成为一个矩阵行向量的线性组合。
介绍到这里,我们就可以将消元法所做的行操作写成向量乘以矩阵的形式了。
消元法第一步操作为将第二行改成 r o w 2 − 3 r o w 1 row_2-3row_1 ro w 2 − 3 ro w 1 ,其余两行不变,则有[ 1 0 0 − 3 1 0 0 0 1 ] [ 1 2 1 3 8 1 0 4 1 ] = [ 1 2 1 0 2 − 2 0 4 1 ] \begin{bmatrix}1&0&0\\-3&1&0\\0&0&1\end{bmatrix}\begin{bmatrix}1&2&1\\3&8&1\\0&4&1\end{bmatrix}=\begin{bmatrix}1&2&1\\0&2&-2\\0&4&1\end{bmatrix} ⎣ ⎡ 1 − 3 0 0 1 0 0 0 1 ⎦ ⎤ ⎣ ⎡ 1 3 0 2 8 4 1 1 1 ⎦ ⎤ = ⎣ ⎡ 1 0 0 2 2 4 1 − 2 1 ⎦ ⎤
对于第二行的计算 − 3 × [ 1 2 1 ] + 1 × [ 3 8 1 ] + 0 × [ 0 4 1 ] = [ − 3 + 3 + 0 − 3 × 2 + 1 × 8 + 0 − 3 × 1 + 1 × 1 + 0 ] = [ 0 2 − 2 ] \begin{aligned}&-3\times\begin{bmatrix}1&2&1\end{bmatrix} + 1\times\begin{bmatrix}3&8&1\end{bmatrix} + 0\times\begin{bmatrix}0&4&1\end{bmatrix} \\&= \begin{bmatrix} -3 + 3 + 0&-3\times 2 + 1\times 8 + 0&-3\times 1 + 1\times 1 + 0\end{bmatrix} \\&= \begin{bmatrix}0&2&-2\end{bmatrix}\end{aligned} − 3 × [ 1 2 1 ] + 1 × [ 3 8 1 ] + 0 × [ 0 4 1 ] = [ − 3 + 3 + 0 − 3 × 2 + 1 × 8 + 0 − 3 × 1 + 1 × 1 + 0 ] = [ 0 2 − 2 ]
另外,如果三行都不变,消元矩阵就是单位矩阵 I = [ 1 0 0 0 1 0 0 0 1 ] I=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix} I = ⎣ ⎡ 1 0 0 0 1 0 0 0 1 ⎦ ⎤ ,I I I 之于矩阵运算相当于 1 1 1 之于四则运算。
这个消元矩阵我们记作 E 21 E_{21} E 21 ,即将第二行第一个元素变为零。
接下来就是求 E 32 E_{32} E 32 消元矩阵了,即将第三行第二个元素变为零,则[ 1 0 0 0 1 0 0 − 2 1 ] [ 1 2 1 0 2 − 2 0 4 1 ] = [ 1 2 1 0 2 − 2 0 0 5 ] \begin{bmatrix}1&0&0\\0&1&0\\0&-2&1\end{bmatrix}\begin{bmatrix}1&2&1\\0&2&-2\\0&4&1\end{bmatrix}=\begin{bmatrix}1&2&1\\0&2&-2\\0&0&5\end{bmatrix} ⎣ ⎡ 1 0 0 0 1 − 2 0 0 1 ⎦ ⎤ ⎣ ⎡ 1 0 0 2 2 4 1 − 2 1 ⎦ ⎤ = ⎣ ⎡ 1 0 0 2 2 0 1 − 2 5 ⎦ ⎤ 。这就是消元所用的两个初等矩阵(elementary matrix)。
最后,我们将这两步综合起来,即 E 32 ( E 21 A ) = U E_{32}(E_{21}A)=U E 32 ( E 21 A ) = U ,也就是说如果我们想从 A A A 矩阵直接得到 U U U 矩阵的话,只需要 ( E 32 E 21 ) A (E_{32}E_{21})A ( E 32 E 21 ) A 即可。
注意,矩阵乘法虽然不能随意变动相乘次序,但是可以变动括号位置,也就是满足结合律(associative law),而结合律在矩阵运算中非常重要,很多定理的证明都需要巧妙的使用结合律。
补充 :
既然提到了消元用的初等矩阵,那我们再介绍一种用于置换两行的矩阵:置换矩阵(permutation matrix)。
例如:
[ 0 1 1 0 ] [ a b c d ] = [ c d a b ] \begin{bmatrix}0&1\\1&0\end{bmatrix}\begin{bmatrix}a&b\\c&d\end{bmatrix}=\begin{bmatrix}c&d\\a&b\end{bmatrix} [ 0 1 1 0 ] [ a c b d ] = [ c a d b ] ,置换矩阵将原矩阵的两行做了互换。
顺便提一下,如果我们希望交换两列,则有[ a b c d ] [ 0 1 1 0 ] = [ b a d c ] \begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}0&1\\1&0\end{bmatrix}=\begin{bmatrix}b&a\\d&c\end{bmatrix} [ a c b d ] [ 0 1 1 0 ] = [ b d a c ] 。
我们现在能够将 A A A 通过行变换写成 U U U ,那么如何从 U U U 再变回 A A A ,也就是求消元的逆运算。
对某些“坏”矩阵,并没有逆,而本讲的例子都是“好”矩阵。
现在,我们以 E 21 E_{21} E 21 为例,[ ? ] [ 1 0 0 − 3 1 0 0 0 1 ] = [ 1 0 0 0 1 0 0 0 1 ] \Bigg[\quad ?\quad \Bigg]\begin{bmatrix}1&0&0\\-3&1&0\\0&0&1\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix} [ ? ] ⎣ ⎡ 1 − 3 0 0 1 0 0 0 1 ⎦ ⎤ = ⎣ ⎡ 1 0 0 0 1 0 0 0 1 ⎦ ⎤ ,什么矩阵可以取消这次行变换?
这次变换是从第二行中减去三倍的第一行,那么其逆变换就是给第二行加上三倍的第一行,所以逆矩阵就是[ 1 0 0 3 1 0 0 0 1 ] \begin{bmatrix}1&0&0\\3&1&0\\0&0&1\end{bmatrix} ⎣ ⎡ 1 3 0 0 1 0 0 0 1 ⎦ ⎤ 。
我们把矩阵E E E 的逆记作 E − 1 E^{-1} E − 1 ,所以有 E − 1 E = I E^{-1}E=I E − 1 E = I 。
有 m × n m\times n m × n 矩阵 A A A 和 n × p n\times p n × p 矩阵 B B B (A A A 的总列数必须与 B B B 的总行数相等),两矩阵相乘有 A B = C AB=C A B = C ,C C C 是一个 m × p m\times p m × p 矩阵,对于 C C C 矩阵中的第 i i i 行第 j j j 列元素 c i j c_{ij} c ij ,有:
c i j = r o w i ⋅ c o l u m n j = ∑ k = i n a i k b k j c_{ij}=row_i\cdot column_j=\sum_{k=i}^na_{ik}b_{kj} c ij = ro w i ⋅ co l u m n j = ∑ k = i n a ik b kj
其中 $a{ik}是 是 是 A矩阵的第 矩阵的第 矩阵的第 i行第 行第 行第 k列元素, 列元素, 列元素, b {kj}是 是 是 B矩阵的第 矩阵的第 矩阵的第 k行第 行第 行第 j$ 列元素。
可以看出 c i j c_{ij} c ij 其实是 A A A 矩阵第 i i i 行点乘 B B B 矩阵第 j j j 列 [ ⋮ r o w i ⋮ ] [ ⋯ c o l u m n j ⋯ ] = [ ⋮ ⋯ c i j ⋯ ⋮ ] \begin{bmatrix}&\vdots&\\&row_i&\\&\vdots&\end{bmatrix}\begin{bmatrix}&&\\\cdots&column_j&\cdots\\&&\end{bmatrix}=\begin{bmatrix}&\vdots&\\\cdots&c_{ij}&\cdots\\&\vdots&\end{bmatrix} ⎣ ⎡ ⋮ ro w i ⋮ ⎦ ⎤ ⎣ ⎡ ⋯ co l u m n j ⋯ ⎦ ⎤ = ⎣ ⎡ ⋯ ⋮ c ij ⋮ ⋯ ⎦ ⎤
例 :
设 A = [ 1 3 2 4 5 6 ] , B = [ 7 8 9 10 11 12 ] A=\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix},\ B=\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix} A = ⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ , B = [ 7 10 8 11 9 12 ] ,求 C C C 。
解 :
[ 1 3 2 4 5 6 ] [ 7 8 9 10 11 12 ] = [ 1 × 7 + 3 × 10 1 × 8 + 3 × 11 1 × 9 + 3 × 12 2 × 7 + 4 × 10 2 × 8 + 4 × 11 2 × 9 + 4 × 12 5 × 7 + 6 × 10 5 × 8 + 6 × 11 5 × 9 + 6 × 12 ] = [ 37 41 45 54 60 66 95 106 117 ]
\begin{aligned}
\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix}\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix}
~~&=~~
\begin{bmatrix}
1\times 7+3\times 10 & 1\times 8 + 3\times 11 & 1\times9 + 3\times12\\
2\times 7+4\times 10 & 2\times 8 + 4\times 11 & 2\times9 + 4\times12\\
5\times 7+6\times 10 & 5\times 8 + 6\times 11 & 5\times9 +6\times12\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
37&41&45\\
54&60&66\\
95&106&117
\end{bmatrix}
\end{aligned}\begin{aligned}
\end{aligned}
⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ [ 7 10 8 11 9 12 ] = ⎣ ⎡ 1 × 7 + 3 × 10 2 × 7 + 4 × 10 5 × 7 + 6 × 10 1 × 8 + 3 × 11 2 × 8 + 4 × 11 5 × 8 + 6 × 11 1 × 9 + 3 × 12 2 × 9 + 4 × 12 5 × 9 + 6 × 12 ⎦ ⎤ = ⎣ ⎡ 37 54 95 41 60 106 45 66 117 ⎦ ⎤
上一讲我们知道了如何计算矩阵乘以向量,而整列相乘就是使用这种线性组合的思想:
[ A c o l 1 A c o l 2 ⋯ A c o l n ] [ ⋯ b 1 j ⋯ ⋯ b 2 j ⋯ ⋯ ⋮ ⋯ ⋯ b n j ⋯ ] = [ ⋯ ( b 1 j A c o l 1 + b 2 j A c o l 2 + ⋯ + b n j A c o l n ) ⋯ ] \begin{bmatrix}&&\\A_{col1}&A_{col2}&\cdots&A_{coln}\\&&\end{bmatrix}\begin{bmatrix}\cdots&b_{1j}&\cdots\\\cdots&b_{2j}&\cdots\\\cdots&\vdots&\cdots\\\cdots&b_{nj}&\cdots\\\end{bmatrix}=\begin{bmatrix}&&\\\cdots&\left(b_{1j}A_{col1}+b_{2j}A_{col2}+\cdots+b_{nj}A_{coln}\right)&\cdots\\&&\end{bmatrix} ⎣ ⎡ A co l 1 A co l 2 ⋯ A co l n ⎦ ⎤ ⎣ ⎡ ⋯ ⋯ ⋯ ⋯ b 1 j b 2 j ⋮ b nj ⋯ ⋯ ⋯ ⋯ ⎦ ⎤ = ⎣ ⎡ ⋯ ( b 1 j A co l 1 + b 2 j A co l 2 + ⋯ + b nj A co l n ) ⋯ ⎦ ⎤
上面的运算为B B B 的第j j j 个列向量右乘矩阵 A A A ,求得的结果就是 C C C 矩阵的第 j j j 列,即 C C C 的第 j j j 列是 A A A 的列向量以 B B B 的第 j j j 列作为系数所求得的线性组合,C j = b 1 j A c o l 1 + b 2 j A c o l 2 + ⋯ + b n j A c o l n C_j=b_{1j}A_{col1}+b_{2j}A_{col2}+\cdots+b_{nj}A_{coln} C j = b 1 j A co l 1 + b 2 j A co l 2 + ⋯ + b nj A co l n 。
例 :
设 A = [ 1 3 2 4 5 6 ] , B = [ 7 8 9 10 11 12 ] A=\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix},\ B=\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix} A = ⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ , B = [ 7 10 8 11 9 12 ] ,求 C C C 。
解 :
[ 1 3 2 4 5 6 ] [ 7 8 9 10 11 12 ] = [ 7 [ 1 2 5 ] + 10 [ 3 4 6 ] 8 [ 1 2 5 ] + 11 [ 3 4 6 ] 9 [ 1 2 5 ] + 12 [ 3 4 6 ] ] = [ 7 × 1 + 10 × 3 8 × 1 + 11 × 3 9 × 1 + 12 × 3 7 × 2 + 10 × 4 8 × 2 + 11 × 4 9 × 2 + 12 × 4 7 × 5 + 10 × 6 8 × 5 + 11 × 6 9 × 5 + 12 × 6 ] = [ 37 41 45 54 60 66 95 106 117 ]
\begin{aligned}
\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix}\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix}
~~&=~~
\begin{aligned}
\begin{bmatrix}
7\begin{bmatrix}1\\2\\5\end{bmatrix} + 10\begin{bmatrix}3\\4\\6\end{bmatrix}&
8\begin{bmatrix}1\\2\\5\end{bmatrix} + 11\begin{bmatrix}3\\4\\6\end{bmatrix}&
9\begin{bmatrix}1\\2\\5\end{bmatrix} + 12\begin{bmatrix}3\\4\\6\end{bmatrix}
\end{bmatrix}
\end{aligned}\\\\
&=
\begin{bmatrix}
7\times 1+10\times 3 & 8\times 1 + 11\times 3 & 9\times 1 + 12\times 3\\
7\times 2+10\times 4 & 8\times 2 + 11\times 4 & 9\times 2 + 12\times 4\\
7\times 5+10\times 6 & 8\times 5 + 11\times 6 & 9\times 5 + 12\times 6\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
37&41&45\\
54&60&66\\
95&106&117
\end{bmatrix}
\end{aligned}\begin{aligned}
\end{aligned}
⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ [ 7 10 8 11 9 12 ] = ⎣ ⎡ 7 ⎣ ⎡ 1 2 5 ⎦ ⎤ + 10 ⎣ ⎡ 3 4 6 ⎦ ⎤ 8 ⎣ ⎡ 1 2 5 ⎦ ⎤ + 11 ⎣ ⎡ 3 4 6 ⎦ ⎤ 9 ⎣ ⎡ 1 2 5 ⎦ ⎤ + 12 ⎣ ⎡ 3 4 6 ⎦ ⎤ ⎦ ⎤ = ⎣ ⎡ 7 × 1 + 10 × 3 7 × 2 + 10 × 4 7 × 5 + 10 × 6 8 × 1 + 11 × 3 8 × 2 + 11 × 4 8 × 5 + 11 × 6 9 × 1 + 12 × 3 9 × 2 + 12 × 4 9 × 5 + 12 × 6 ⎦ ⎤ = ⎣ ⎡ 37 54 95 41 60 106 45 66 117 ⎦ ⎤
同样的,也是利用行向量线性组合的思想:
[ ⋮ ⋮ ⋮ ⋮ a i 1 a i 2 ⋯ a i n ⋮ ⋮ ⋮ ⋮ ] [ B r o w 1 B r o w 2 ⋮ B r o w n ] = [ ⋮ ( a i 1 B r o w 1 + a i 2 B r o w 2 + ⋯ + a i n B r o w n ) ⋮ ] \begin{bmatrix}\vdots&\vdots&\vdots&\vdots\\a_{i1}&a_{i2}&\cdots&a_{in}\\\vdots&\vdots&\vdots&\vdots\end{bmatrix}\begin{bmatrix}&B_{row1}&\\&B_{row2}&\\&\vdots&\\&B_{rown}&\end{bmatrix}=\begin{bmatrix}\vdots\\\left(a_{i1}B_{row1}+a_{i2}B_{row2}+\cdots+a_{in}B_{rown}\right)\\\vdots\end{bmatrix} ⎣ ⎡ ⋮ a i 1 ⋮ ⋮ a i 2 ⋮ ⋮ ⋯ ⋮ ⋮ a in ⋮ ⎦ ⎤ ⎣ ⎡ B ro w 1 B ro w 2 ⋮ B ro w n ⎦ ⎤ = ⎣ ⎡ ⋮ ( a i 1 B ro w 1 + a i 2 B ro w 2 + ⋯ + a in B ro w n ) ⋮ ⎦ ⎤
上面的运算为A A A 的第i i i 个行向量左乘矩阵B B B ,求得的结果就是C C C 矩阵的第i i i 行,即C C C 的第i i i 行是B B B 的行向量以A A A 的第i i i 行作为系数所求的的线性组合,C i = a i 1 B r o w 1 + a i 2 B r o w 2 + ⋯ + a i n B r o w n C_i=a_{i1}B_{row1}+a_{i2}B_{row2}+\cdots+a_{in}B_{rown} C i = a i 1 B ro w 1 + a i 2 B ro w 2 + ⋯ + a in B ro w n 。
例 :
设 A = [ 1 3 2 4 5 6 ] , B = [ 7 8 9 10 11 12 ] A=\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix},\ B=\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix} A = ⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ , B = [ 7 10 8 11 9 12 ] ,求 C C C 。
解 :
[ 1 3 2 4 5 6 ] [ 7 8 9 10 11 12 ] = [ 1 [ 7 8 9 ] + 3 [ 10 11 12 ] 2 [ 7 8 9 ] + 4 [ 10 11 12 ] 5 [ 7 8 9 ] + 6 [ 10 11 12 ] ] = [ 1 × 7 + 3 × 10 1 × 8 + 3 × 11 1 × 9 + 3 × 12 2 × 7 + 4 × 10 2 × 8 + 4 × 11 2 × 9 + 4 × 12 5 × 7 + 6 × 10 5 × 8 + 6 × 11 5 × 9 + 6 × 12 ] = [ 37 41 45 54 60 66 95 106 117 ]
\begin{aligned}
\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix}\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix}
~~&=~~
\begin{aligned}
\begin{bmatrix}
1\begin{bmatrix}7&8&9\end{bmatrix}+3\begin{bmatrix}10&11&12\end{bmatrix}\\
2\begin{bmatrix}7&8&9\end{bmatrix}+4\begin{bmatrix}10&11&12\end{bmatrix}\\
5\begin{bmatrix}7&8&9\end{bmatrix}+6\begin{bmatrix}10&11&12\end{bmatrix}
\end{bmatrix}
\end{aligned}\\\\
&=
\begin{bmatrix}
1\times 7+3\times 10 & 1\times 8 + 3\times 11 & 1\times9 + 3\times12\\
2\times 7+4\times 10 & 2\times 8 + 4\times 11 & 2\times9 + 4\times12\\
5\times 7+6\times 10 & 5\times 8 + 6\times 11 & 5\times9 +6\times12\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
37&41&45\\
54&60&66\\
95&106&117
\end{bmatrix}
\end{aligned}
⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ [ 7 10 8 11 9 12 ] = ⎣ ⎡ 1 [ 7 8 9 ] + 3 [ 10 11 12 ] 2 [ 7 8 9 ] + 4 [ 10 11 12 ] 5 [ 7 8 9 ] + 6 [ 10 11 12 ] ⎦ ⎤ = ⎣ ⎡ 1 × 7 + 3 × 10 2 × 7 + 4 × 10 5 × 7 + 6 × 10 1 × 8 + 3 × 11 2 × 8 + 4 × 11 5 × 8 + 6 × 11 1 × 9 + 3 × 12 2 × 9 + 4 × 12 5 × 9 + 6 × 12 ⎦ ⎤ = ⎣ ⎡ 37 54 95 41 60 106 45 66 117 ⎦ ⎤
用A A A 矩阵的列乘以B B B 矩阵的行,得到的矩阵相加即可:
[ A c o l 1 A c o l 2 ⋯ A c o l n ] [ B r o w 1 B r o w 2 ⋮ B r o w n ] = A c o l 1 B r o w 1 + A c o l 2 B r o w 2 + ⋯ + A c o l n B r o w n \begin{bmatrix}&&\\A_{col1}&A_{col2}&\cdots&A_{coln}\\&&\end{bmatrix}\begin{bmatrix}&B_{row1}&\\&B_{row2}&\\&\vdots&\\&B_{rown}&\end{bmatrix}=A_{col1}B_{row1}+A_{col2}B_{row2}+\cdots+A_{coln}B_{rown} ⎣ ⎡ A co l 1 A co l 2 ⋯ A co l n ⎦ ⎤ ⎣ ⎡ B ro w 1 B ro w 2 ⋮ B ro w n ⎦ ⎤ = A co l 1 B ro w 1 + A co l 2 B ro w 2 + ⋯ + A co l n B ro w n
注意,$A{coli}B {rowi}是一个 是一个 是一个 m\times 1向量乘以一个 向量乘以一个 向量乘以一个 1\times p向量,其结果是一个 向量,其结果是一个 向量,其结果是一个 m\times p矩阵,而所有的 矩阵,而所有的 矩阵,而所有的 m\times p$矩阵之和就是计算结果。
例 :
设 A = [ 1 3 2 4 5 6 ] , B = [ 7 8 9 10 11 12 ] A=\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix},\ B=\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix} A = ⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ , B = [ 7 10 8 11 9 12 ] ,求 C C C 。
解 :
[ 1 3 2 4 5 6 ] [ 7 8 9 10 11 12 ] = [ 1 2 3 ] [ 7 8 9 ] + [ 3 4 6 ] [ 10 11 12 ] = [ 1 × 7 1 × 8 1 × 9 2 × 7 2 × 8 2 × 9 5 × 7 5 × 8 5 × 9 ] + [ 3 × 10 3 × 11 3 × 12 4 × 10 4 × 11 4 × 12 6 × 10 6 × 11 6 × 12 ] = [ 7 8 9 14 16 18 35 40 45 ] + [ 30 33 36 40 44 48 60 66 72 ] = [ 37 41 45 54 60 66 95 106 117 ]
\begin{aligned}
\begin{bmatrix}1&3\\2&4\\5&6\end{bmatrix}\begin{bmatrix}7&8&9\\10&11&12\end{bmatrix}
~~&=~~
\begin{aligned}
\begin{bmatrix}1\\2\\3\end{bmatrix}\begin{bmatrix}7&8&9\end{bmatrix} +
\begin{bmatrix}3\\4\\6\end{bmatrix}\begin{bmatrix}10&11&12\end{bmatrix}
\end{aligned}\\\\
&=
\begin{bmatrix}
1\times 7 & 1\times 8 & 1\times9\\
2\times 7 & 2\times 8 & 2\times9\\
5\times 7 & 5\times 8 & 5\times9
\end{bmatrix}+
\begin{bmatrix}
3\times 10 & 3\times 11 & 3\times12\\
4\times 10 & 4\times 11 & 4\times12\\
6\times 10 & 6\times 11 & 6\times12\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
7 & 8 & 9\\
14 & 16 & 18\\
35 & 40 & 45
\end{bmatrix}+
\begin{bmatrix}
30 & 33 & 36\\
40 & 44 & 48\\
60 & 66 & 72\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
37&41&45\\
54&60&66\\
95&106&117
\end{bmatrix}
\end{aligned}
⎣ ⎡ 1 2 5 3 4 6 ⎦ ⎤ [ 7 10 8 11 9 12 ] = ⎣ ⎡ 1 2 3 ⎦ ⎤ [ 7 8 9 ] + ⎣ ⎡ 3 4 6 ⎦ ⎤ [ 10 11 12 ] = ⎣ ⎡ 1 × 7 2 × 7 5 × 7 1 × 8 2 × 8 5 × 8 1 × 9 2 × 9 5 × 9 ⎦ ⎤ + ⎣ ⎡ 3 × 10 4 × 10 6 × 10 3 × 11 4 × 11 6 × 11 3 × 12 4 × 12 6 × 12 ⎦ ⎤ = ⎣ ⎡ 7 14 35 8 16 40 9 18 45 ⎦ ⎤ + ⎣ ⎡ 30 40 60 33 44 66 36 48 72 ⎦ ⎤ = ⎣ ⎡ 37 54 95 41 60 106 45 66 117 ⎦ ⎤
[ A 1 A 2 A 3 A 4 ] [ B 1 B 2 B 3 B 4 ] = [ A 1 B 1 + A 2 B 3 A 1 B 2 + A 2 B 4 A 3 B 1 + A 4 B 3 A 3 B 2 + A 4 B 4 ] \left[\begin{array}{c|c}A_1&A_2\\\hline A_3&A_4\end{array}\right]\left[\begin{array}{c|c}B_1&B_2\\\hline B_3&B_4\end{array}\right]=\left[\begin{array}{c|c}A_1B_1+A_2B_3&A_1B_2+A_2B_4\\\hline A_3B_1+A_4B_3&A_3B_2+A_4B_4\end{array}\right] [ A 1 A 3 A 2 A 4 ] [ B 1 B 3 B 2 B 4 ] = [ A 1 B 1 + A 2 B 3 A 3 B 1 + A 4 B 3 A 1 B 2 + A 2 B 4 A 3 B 2 + A 4 B 4 ]
在分块合适的情况下,可以简化运算。
首先,并不是所有的方阵都有逆;而如果逆存在,则有 A − 1 A = I = A A − 1 A^{-1}A=I=AA^{-1} A − 1 A = I = A A − 1 。
对于方阵,左逆和右逆是相等的,但是对于非方阵(长方形矩阵),其左逆不等于右逆。
对于这些有逆的矩阵,我们称其为可逆的或非奇异的。
我们先来看看奇异矩阵(不可逆的):A = [ 1 2 3 6 ] A=\begin{bmatrix}1&2\\3&6\end{bmatrix} A = [ 1 3 2 6 ] ,在后面将要学习的行列式中,会发现这个矩阵的行列式为 0 0 0 。
观察这个方阵,我们如果用另一个矩阵乘 A A A ,则得到的结果矩阵中的每一列应该都是 [ 1 2 ] \begin{bmatrix}1\\2\end{bmatrix} [ 1 2 ] 的倍数,所以我们不可能从 A B AB A B 的乘积中得到单位矩阵 I I I 。
另一种判定方法,如果存在非零向量 x x x ,使得 A x = 0 Ax=0 A x = 0 ,则矩阵 A A A 不可逆。
我们来用上面的矩阵为例:[ 1 2 3 6 ] [ 3 − 1 ] = [ 0 0 ] \begin{bmatrix}1&2\\3&6\end{bmatrix}\begin{bmatrix}3\\-1\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix} [ 1 3 2 6 ] [ 3 − 1 ] = [ 0 0 ] 。
证明:如果对于非零的 x x x 仍有 A x = 0 Ax=0 A x = 0 ,而 A A A 有逆 A − 1 A^{-1} A − 1 ,则 A − 1 A x = 0 A^{-1}Ax=0 A − 1 A x = 0 ,即 x = 0 x=0 x = 0 ,与题设矛盾,得证。
现在来看看什么矩阵有逆,设 A = [ 1 3 2 7 ] A=\begin{bmatrix}1&3\\2&7\end{bmatrix} A = [ 1 2 3 7 ] ,我们来求 A − 1 A^{-1} A − 1 。[ 1 3 2 7 ] [ a b c d ] = [ 1 0 0 1 ] \begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}a&b\\c&d\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix} [ 1 2 3 7 ] [ a c b d ] = [ 1 0 0 1 ] ,使用列向量线性组合的思想,我们可以说 A A A 乘以 A − 1 A^{-1} A − 1 的第 j j j 列,能够得到 I I I 的第 j j j 列,这时我们会得到一个关于列的方程组。
接下来介绍(Gauss-Jordan)方法,该方法可以一次处理所有的方程:
这个方程组为{ [ 1 3 2 7 ] [ a b ] = [ 1 0 ] [ 1 3 2 7 ] [ c d ] = [ 0 1 ] \begin{cases}\begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}a\\b\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix}\\\\\begin{bmatrix}1&3\\2&7\end{bmatrix}\begin{bmatrix}c\\d\end{bmatrix}=\begin{bmatrix}0\\1\end{bmatrix}\end{cases} ⎩ ⎨ ⎧ [ 1 2 3 7 ] [ a b ] = [ 1 0 ] [ 1 2 3 7 ] [ c d ] = [ 0 1 ] ,我们想要同时解这两个方程;
构造这样一个矩阵[ 1 3 1 0 2 7 0 1 ] \left[\begin{array}{cc|cc}1&3&1&0\\2&7&0&1\end{array}\right] [ 1 2 3 7 1 0 0 1 ] ,接下来用消元法将左侧变为单位矩阵;
[ 1 3 1 0 2 7 0 1 ] → r o w 2 − 2 r o w 1 [ 1 3 1 0 0 1 − 2 1 ] → r o w 1 − 3 r o w 2 [ 1 0 7 − 3 0 1 − 2 1 ] \left[\begin{array}{cc|cc}1&3&1&0\\2&7&0&1\end{array}\right]\xrightarrow{row_2-2row_1}\left[\begin{array}{cc|cc}1&3&1&0\\0&1&-2&1\end{array}\right]\xrightarrow{row_1-3row_2}\left[\begin{array}{cc|cc}1&0&7&-3\\0&1&-2&1\end{array}\right] [ 1 2 3 7 1 0 0 1 ] ro w 2 − 2 ro w 1 [ 1 0 3 1 1 − 2 0 1 ] ro w 1 − 3 ro w 2 [ 1 0 0 1 7 − 2 − 3 1 ]
于是,我们就将矩阵从[ A I ] \left[\begin{array}{c|c}A&I\end{array}\right] [ A I ] 变为 [ I A − 1 ] \left[\begin{array}{c|c}I&A^{-1}\end{array}\right] [ I A − 1 ]
该方法的本质是使用消元矩阵 E E E ,对 A A A 进行操作,E [ A I ] E\left[\begin{array}{c|c}A&I\end{array}\right] E [ A I ] ,利用一步步消元有 E A = I EA=I E A = I ,进而得到 [ I E ] \left[\begin{array}{c|c}I&E\end{array}\right] [ I E ] ,其实这个消元矩阵 E E E 就是 A − 1 A^{-1} A − 1 ,而 I I I 只是负责记录消元的每一步操作,待消元完成,逆矩阵就自然出现了。