线性代数
|
data:image/s3,"s3://crabby-images/32e40/32e4088982f61c016844260de99dc12fc8ad1a61" alt="{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}"
|
向量 · 向量空间 · 基底 · 行列式 · 矩阵
|
|
|
「横向的一条线(row)」的各地常用名稱 |
---|
中国大陸 | 行 |
---|
臺灣 | 列 |
---|
「纵向的一条线(column)」的各地常用名稱 |
---|
中国大陸 | 列 |
---|
臺灣 | 行 |
---|
数学中,矩阵乘法(英語:matrix multiplication)是一种根据两个矩阵得到第三个矩阵的二元运算,第三个矩阵即前两者的乘积,称为矩阵积(英語:matrix product)。设
是
的矩阵,
是
的矩阵,则它们的矩阵积
是
的矩阵。
中每一行的
个元素都与
中对应列的
个元素对应相乘,这些乘积的和就是
中的一个元素。
矩阵可以用来表示线性映射,矩阵积则可以用来表示线性映射的复合。因此,矩阵乘法是线性代数的基础工具,不仅在数学中有大量应用,在应用数学、物理学、工程学等领域也有广泛使用。[1][2]
矩陣相乘最重要的方法是一般矩陣乘積。它只有在第一個矩陣的列数(column,台湾作行數)和第二個矩陣的行数(row,台湾作列數)相同時才有定義。一般單指矩陣乘積時,指的便是一般矩陣乘積。若
為
矩陣,
為
矩陣,則他們的乘積
(有時記做
)會是一個
矩陣。其乘積矩陣的元素如下面式子得出:
data:image/s3,"s3://crabby-images/37c1e/37c1ed4d7ffc04566a8015a4508d5611cb28dd80" alt="{\displaystyle (AB)_{ij}=\sum _{r=1}^{n}a_{ir}b_{rj}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots +a_{in}b_{nj}}"
以上是用矩陣單元的代數系統來說明這類乘法的抽象性質。本節以下各種運算法都是這個公式的不同角度理解,運算結果相等:
左邊的圖表示出要如何計算
的
和
元素,當
是個
矩陣和B是個
矩陣時。分別來自兩個矩陣的元素都依箭頭方向而兩兩配對,把每一對中的兩個元素相乘,再把這些乘積加總起來,最後得到的值即為箭頭相交位置的值。
data:image/s3,"s3://crabby-images/eee51/eee51e8068075401bfa49aea167c3965f1ff065d" alt="{\displaystyle (AB)_{1,2}=\sum _{r=1}^{2}a_{1,r}b_{r,2}=a_{1,1}b_{1,2}+a_{1,2}b_{2,2}}"
data:image/s3,"s3://crabby-images/935e1/935e13d1814d8e84d39e62083ac8b20855ca0f26" alt="{\displaystyle (AB)_{3,3}=\sum _{r=1}^{2}a_{3,r}b_{r,3}=a_{3,1}b_{1,3}+a_{3,2}b_{2,3}}"
這種矩陣乘積亦可由稍微不同的觀點來思考:把向量和各係數相乘後相加起來。設
和
是兩個給定如下的矩陣:
data:image/s3,"s3://crabby-images/3f898/3f898f3be1c861bf822689dcefb8cf137d56ec32" alt="{\displaystyle \mathbf {B} ={\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \\b_{2,1}&b_{2,2}&\dots \\\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}B_{1}\\B_{2}\\\vdots \end{bmatrix}}}"
其中
是由所有
元素所组成的向量(column),
是由所有
元素所组成的向量,以此类推。
是由所有
元素所组成的向量(row),
是由所有
元素所组成的向量,以此类推。
則
data:image/s3,"s3://crabby-images/50b32/50b32bf864de3737224f197ab0312f692cca52a6" alt="{\displaystyle \mathbf {AB} ={\begin{bmatrix}a_{1,1}{\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \end{bmatrix}}+a_{1,2}{\begin{bmatrix}b_{2,1}&b_{2,2}&\dots \end{bmatrix}}+\cdots \\\\a_{2,1}{\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \end{bmatrix}}+a_{2,2}{\begin{bmatrix}b_{2,1}&b_{2,2}&\dots \end{bmatrix}}+\cdots \\\vdots \end{bmatrix}}=A_{1}B_{1}+A_{2}B_{2}+\dots }"
舉個例子來說:
data:image/s3,"s3://crabby-images/bfbe0/bfbe042876793a96c35003a9a5f5f24d8bb14146" alt="{\displaystyle {\begin{bmatrix}1&0&2\\-1&3&1\end{bmatrix}}\cdot {\begin{bmatrix}3&1\\2&1\\1&0\end{bmatrix}}={\begin{bmatrix}1{\begin{bmatrix}3&1\end{bmatrix}}+0{\begin{bmatrix}2&1\end{bmatrix}}+2{\begin{bmatrix}1&0\end{bmatrix}}\\-1{\begin{bmatrix}3&1\end{bmatrix}}+3{\begin{bmatrix}2&1\end{bmatrix}}+1{\begin{bmatrix}1&0\end{bmatrix}}\end{bmatrix}}={\begin{bmatrix}{\begin{bmatrix}3&1\end{bmatrix}}+{\begin{bmatrix}0&0\end{bmatrix}}+{\begin{bmatrix}2&0\end{bmatrix}}\\{\begin{bmatrix}-3&-1\end{bmatrix}}+{\begin{bmatrix}6&3\end{bmatrix}}+{\begin{bmatrix}1&0\end{bmatrix}}\end{bmatrix}}}"
data:image/s3,"s3://crabby-images/1ddcb/1ddcb33e782b3651397d3c0343f769adbd7d700b" alt="{\displaystyle ={\begin{bmatrix}5&1\\4&2\end{bmatrix}}}"
左面矩陣的列為為係數表,右邊矩陣為向量表。例如,第一行是[1 0 2],因此將1乘上第一個向量,0乘上第二個向量,2則乘上第三個向量。
一般矩陣乘積也可以想為是行向量和列向量的內積。若
和
為給定如下的矩陣:
且data:image/s3,"s3://crabby-images/cc50c/cc50cdbe8834cc361149e193e98a7bba22217dd7" alt="{\displaystyle \mathbf {B} ={\begin{bmatrix}b_{1,1}&b_{1,2}&b_{1,3}&\dots \\b_{2,1}&b_{2,2}&b_{2,3}&\dots \\b_{3,1}&b_{3,2}&b_{3,3}&\dots \\\vdots &\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}B_{1}&B_{2}&B_{3}&\dots \end{bmatrix}}}"
其中,这里
是由所有
元素所組成的向量,
是由所有
元素所組成的向量,以此類推。
是由所有
元素所組成的向量,
是由所有
元素所組成的向量,以此類推。
则
data:image/s3,"s3://crabby-images/8fcb8/8fcb8c791d946cd2be7c3fcc37dcd80ba33a4b6e" alt="{\displaystyle \mathbf {AB} ={\begin{bmatrix}A_{1}\\A_{2}\\A_{3}\\\vdots \end{bmatrix}}\times {\begin{bmatrix}B_{1}&B_{2}&B_{3}&\dots \end{bmatrix}}={\begin{bmatrix}(A_{1}\cdot B_{1})&(A_{1}\cdot B_{2})&(A_{1}\cdot B_{3})&\dots \\(A_{2}\cdot B_{1})&(A_{2}\cdot B_{2})&(A_{2}\cdot B_{3})&\dots \\(A_{3}\cdot B_{1})&(A_{3}\cdot B_{2})&(A_{3}\cdot B_{3})&\dots \\\vdots &\vdots &\vdots &\ddots \end{bmatrix}}}"
即
data:image/s3,"s3://crabby-images/92512/92512d44862604fe4de60f2a92133513be3906f1" alt="{\displaystyle \left(\mathbf {AB} \right)_{ij}=A_{i}B_{j}}"
矩陣乘法是不可交換的(即
),除了一些較特別的情況。很清楚可以知道,不可能預期說在改變向量的部份後還能得到相同的結果,而且第一個矩陣的列數必須要和第二個矩陣的行數相同,也可以看出為什麼矩陣相乘的順序會影響其結果。
雖然矩陣乘法是不可交換的,但
和
的行列式總會是一樣的(當
、
是同樣大小的方陣時)。
當
、
可以被解釋為線性算子,其矩陣乘積
會對應為兩個線性算子的複合函數,其中B先作用。
以 Google Sheet 為例,選取儲存格範圍或者使用陣列,在儲存格輸入
=MMULT({1,0,2;-1,3,1},{3,1;2,1;1,0})
在某些試算表軟體中必須必須按Ctrl+⇧ Shift+↵ Enter 將儲存格內的變數轉換為陣列
矩陣
和純量
的純量乘積
的矩陣大小和
一樣,
的各元素定義如下:
data:image/s3,"s3://crabby-images/48543/48543452c18547bde26c9a046b7f723407836096" alt="{\displaystyle (rA)_{ij}=r\cdot a_{ij}\ }"
若我們考慮於一個環的矩陣時,上述的乘積有時會稱做左乘積,而右乘積的則定義為
data:image/s3,"s3://crabby-images/471ed/471ed4c9f499d0bc1a2a6ec33c3f0435b9b9083d" alt="{\displaystyle (Ar)_{ij}=a_{ij}\cdot r\ }"
當環是可交換時,例如實數體或複數體,這兩個乘積是相同的。但無論如何,若環是不可交換的話,如四元數,他們可能會是不同的。例如,
data:image/s3,"s3://crabby-images/f5497/f5497c8908840019c777d4253708e13283a72502" alt="{\displaystyle i{\begin{bmatrix}i&0\\0&j\\\end{bmatrix}}={\begin{bmatrix}-1&0\\0&k\\\end{bmatrix}}\neq {\begin{bmatrix}-1&0\\0&-k\\\end{bmatrix}}={\begin{bmatrix}i&0\\0&j\\\end{bmatrix}}i}"
給定兩個相同維度的矩陣可計算有阿達馬乘積(Hadamard product),或稱做逐項乘積、分素乘積(element-wise product, entrywise product)。兩個
矩陣
、
的阿達馬乘積標記為
,定義為
的
矩陣。例如,
data:image/s3,"s3://crabby-images/db8f7/db8f76c9705848c48602e2e1b07fabc7efa2d98b" alt="{\displaystyle {\begin{bmatrix}1&3&2\\1&0&0\\1&2&2\end{bmatrix}}\circ {\begin{bmatrix}0&0&2\\7&5&0\\2&1&1\end{bmatrix}}={\begin{bmatrix}1\cdot 0&3\cdot 0&2\cdot 2\\1\cdot 7&0\cdot 5&0\cdot 0\\1\cdot 2&2\cdot 1&2\cdot 1\end{bmatrix}}={\begin{bmatrix}0&0&4\\7&0&0\\2&2&2\end{bmatrix}}}"
需注意的是,阿達馬乘積是克羅內克乘積的子矩陣。
給定任兩個矩陣
和
,可以得到兩個矩陣的直積,或稱為克羅內克乘積
,其定義如下
data:image/s3,"s3://crabby-images/dac9c/dac9c91faf4322c0356088bfb9a0a96ab282e7fa" alt="{\displaystyle {\begin{bmatrix}a_{11}B&a_{12}B&\cdots &a_{1n}B\\\vdots &\vdots &\ddots &\vdots \\a_{m1}B&a_{m2}B&\cdots &a_{mn}B\end{bmatrix}}}"
當
是一
矩陣和
是一
矩陣時,
會是一
矩陣,而且此一乘積也是不可交換的。
舉個例子,
data:image/s3,"s3://crabby-images/c973a/c973a4f4cda812efb1a7cb92b33f65b0b88dc0ff" alt="{\displaystyle {\begin{bmatrix}1&2\\3&1\\\end{bmatrix}}\otimes {\begin{bmatrix}0&3\\2&1\\\end{bmatrix}}={\begin{bmatrix}1\cdot 0&1\cdot 3&2\cdot 0&2\cdot 3\\1\cdot 2&1\cdot 1&2\cdot 2&2\cdot 1\\3\cdot 0&3\cdot 3&1\cdot 0&1\cdot 3\\3\cdot 2&3\cdot 1&1\cdot 2&1\cdot 1\\\end{bmatrix}}={\begin{bmatrix}0&3&0&6\\2&1&4&2\\0&9&0&3\\6&3&2&1\end{bmatrix}}}"
若
和
分別表示兩個線性算子
和
,
便為其映射的張量乘積,
上述三種乘積都符合結合律:
data:image/s3,"s3://crabby-images/f1943/f1943a4a61b4a5ad7d5f5b689fb3bc99ed7db06b" alt="{\displaystyle A(BC)=(AB)C}"
以及分配律:
data:image/s3,"s3://crabby-images/0cf6c/0cf6c2e96ff0331cb246d24f59812b2ca6f6ff55" alt="{\displaystyle A(B+C)=AB+AC}"
data:image/s3,"s3://crabby-images/864bc/864bc861766d59e8197fe9469d5657ebd4913cb5" alt="{\displaystyle (A+B)C=AC+BC}"
而且和純量乘積相容:
data:image/s3,"s3://crabby-images/90989/90989f3a4a7881de14a6e697f79f288f34cf3a9c" alt="{\displaystyle c(AB)=(cA)B}"
data:image/s3,"s3://crabby-images/f1e34/f1e34510ea5bc52c94039ed54b2df2c2743a90ad" alt="{\displaystyle (Ac)B=A(cB)}"
data:image/s3,"s3://crabby-images/42ea9/42ea9ee76fe4f30d8019ac05fdd86c437ce08fff" alt="{\displaystyle (AB)c=A(Bc)}"
注意上述三個分開的表示式只有在純量體的乘法及加法是可交換(即純量體為一可交換環)時會相同。
其它参考文献包括:
- Strassen, Volker, Gaussian Elimination is not Optimal, Numer. Math. 13, p. 354-356, 1969.
- Coppersmith, D., Winograd S., Matrix multiplication via arithmetic progressions, J. Symbolic Comput. 9, p. 251-280, 1990.
- Horn, Roger; Johnson, Charles: "Topics in Matrix Analysis", Cambridge, 1994.
- Robinson, Sara, Toward an Optimal Algorithm for Matrix Multiplication, SIAM News 38(9), November 2005.