線性代數
|
![{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a31efc33ac33577d719a3ccd162a9bf21e4847ea)
|
向量 · 向量空間 · 基底 · 行列式 · 矩陣
|
|
|
在線性代數中,一個
的矩陣
的跡(或跡數),是指
的主對角線(從左上方至右下方的對角線)上各個元素的總和,一般記作
或
:
![{\displaystyle \operatorname {tr} (\mathbf {A} )=\mathbf {A} _{1,1}+\mathbf {A} _{2,2}+\cdots +\mathbf {A} _{n,n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/65a2ef1ccb54d9843b2b184da72eda8a3d006ad7)
其中
代表矩陣的第i行j列上的元素的值[1]。一個矩陣的跡是其特徵值的總和(按代數重數計算)。
跡的英文為trace,是來自德文中的Spur這個單字(與英文中的Spoor是同源詞),在數學中,通常簡寫為「Sp」或「tr」。
設有矩陣:
它的跡是:
= 3 + 9 + 4 = 16
線性函數[編輯]
給定一個環
,跡是一個從係數在環中的
矩陣的空間
射到環
之上的線性算子。也就是說,對於任兩個
的矩陣
、
和純量
,都有:
![{\displaystyle \mathrm {tr} (\mathbf {A} +\mathbf {B} )=\mathrm {tr} (\mathbf {A} )+\mathrm {tr} (\mathbf {B} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2589420538d5746970badaef05035683842af139)
[2]
更進一步來說,當
是一個域時,跡數函數
是
矩陣的空間
上的一個線性泛函。
由於一個矩陣
的轉置矩陣
的主對角線元素和原來矩陣的主對角線元素是一樣的,所以任意一個矩陣和其轉置矩陣都會有相同的跡[2]:
![{\displaystyle \mathrm {tr} (\mathbf {A} )=\mathrm {tr} \left(\mathbf {A} ^{T}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/84b2d41072ab5e5bc2106148968e45ff36c29c5f)
矩陣乘積的跡數[編輯]
設A是一個
矩陣,B是個
矩陣,則:
[2]
其中
是一個
矩陣,而
是一個
矩陣。
上述的性質可以由矩陣乘法的定義證明:
![{\displaystyle \mathrm {tr} (\mathbf {AB} )=\sum _{i=1}^{n}(\mathbf {AB} )_{ii}=\sum _{i=1}^{n}\sum _{j=1}^{m}\mathbf {A} _{ij}\mathbf {B} _{ji}=\sum _{j=1}^{m}\sum _{i=1}^{n}\mathbf {B} _{ji}\mathbf {A} _{ij}=\sum _{j=1}^{m}(\mathbf {BA} )_{jj}=\mathrm {tr} (\mathbf {BA} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e2538ac3bc664b320c552039cad4b4e276a71082)
如果
和
都是
的方形矩陣,那麼它們的乘積
和
也會是方形矩陣。因此,利用這個結果,可以推導出:計算若干個同樣大小的方形矩陣的乘積的跡數時,可以循環改變乘積中方形矩陣相乘的順序,而最終的結果不變[2]。例如,有三個方形矩陣
、
和
,則:
[3]
但是要注意:
[3]
更一般地,乘積中的矩陣不一定要是方形矩陣,只要某一個循環改變後的乘積依然存在,那麼得到的跡數依然會和原來的跡數相同[2]。
另外,如果
、
和
是同樣大小的方陣而且還是對稱矩陣的話,那麼其乘積的跡數不只在循環置換下不會改變,而且在所有的置換下都不會改變:
![{\displaystyle \mathrm {tr} (\mathbf {ABC} )=\mathrm {tr} (\mathbf {BCA} )=\mathrm {tr} (\mathbf {CAB} )=\mathrm {tr} (\mathbf {ACB} )=\mathrm {tr} (\mathbf {CBA} )=\mathrm {tr} (\mathbf {BAC} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/270f4a69b572c4f8ecf8975a355c645113168626)
跡數的相似不變性[編輯]
跡數擁有相似不變性。如果矩陣
和
相似的話,它們會有相同的跡。這一性質可使上面講過的循環性質來證明:
- 矩陣
和
相似也就是說存在可逆矩陣
,使得![{\displaystyle \mathbf {B} =\mathbf {P} \mathbf {A} \mathbf {P} ^{-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2bca96618df3a29334886d1b792bf6ba232f5751)
- 因此
![{\displaystyle \mathrm {tr} (\mathbf {B} )=\mathrm {tr} (\mathbf {P} \mathbf {A} \mathbf {P} ^{-1})=\mathrm {tr} (\mathbf {P} ^{-1}\mathbf {P} \mathbf {A} )=\mathrm {tr} (\mathbf {A} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9f524cf26a92e2f30e139962fcc1dd04a87c4a8b)
矩陣跡數和特徵多項式[編輯]
一個
的方形矩陣
的特徵多項式
定義為
減去
倍的單位矩陣後所得到的矩陣的行列式:
特徵多項式是一個關於
的n次多項式,它的常數項是
的行列式的值,最高次項是
,而接下來的n-1次項就是
,也就是說:
矩陣跡數與特徵值[編輯]
當係數域是代數閉域時(否則可以將係數域擴展到其代數閉包上來看),特徵多項式
有n個根,它可以表達成:
其中的
是特徵多項式的不同的根,而
是這些根在特徵多項式裡的重數,稱為代數重數。顯然,所有代數重數加起來等於n。一方面,特徵多項式的根就是矩陣的特徵值,而另一方面,藉由根與多項式係數的關係可以知道:特徵多項式的所有的根加起來等於矩陣的跡數。所以矩陣的跡數是矩陣的所有特徵值(按照代數重數計算)的和[4]。
如果將矩陣寫成它的若爾當標準型的話,也可以看出這一點,因為若爾當標準型的特徵多項式的所有的根(包括重根)就是對角線上的所有元素。
如果不區分相同或不同的特徵值的話,上述關係也可以寫成:
其中的
是矩陣的特徵值。
而且有:
線性映射的跡數[編輯]
設係數域為
的
是一個有限維的向量空間,維數是n。給定任一線性映射
,可以定義此一映射的跡數為其變換矩陣的跡,即選定
的一個基底並用對應於此基底的一個方形矩陣描述
,再定義這個方形矩陣的跡數為
的跡數。這個定義下
的跡數和所選取的基無關:只需要注意到不同的基底的選取實際上等價於對變換矩陣做一次相似變換,而兩個相似的矩陣的跡數是一樣的。因此這樣的定義是自洽的。
另外一種定義涉及到行列式的性質。考慮
的一個基底
,以及函數:
根據行列式理論,這個函數也是一個行列式型的函數,也就是說存在一個只取決於
的量
,使得
[5]
可以證明,這個純量
就等於之前定義的
的跡數[6]。
跡的梯度[編輯]
由跡的定義可知跡可以看作是矩陣的實標量函數,所以我們可以通過求實標量函數的梯度來求跡的梯度。
單個矩陣[編輯]
- A是m×m矩陣時,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} )}{\partial \mathbf {A} }}={\mathbf {I} }_{m}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4b6e611b9cd15d54ebade6549cbe3cb801f01a21)
- m×m矩陣A可逆時,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-2})^{T}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/defd84e3dd597378eeedf44b72bf547c72d04095)
- 對於兩個向量x和y的外積,有
![{\displaystyle {\frac {\partial \mathrm {tr} ({\boldsymbol {xy}}^{T})}{\partial {\boldsymbol {x}}}}={\frac {\partial \mathrm {tr} ({\boldsymbol {yx}}^{T})}{\partial {\boldsymbol {x}}}}={\boldsymbol {y}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4983a0535affe6188dd69eb490e9e635a5cfb479)
兩個矩陣[編輯]
- 若A為m×n矩陣,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} ^{T})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6e3338b99eb70cccd688184607c3e9aad456fc33)
- 若A為m×m矩陣,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{2})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} ^{T}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3fc9c01216a95b936444fecfb1708f01cd4cc135)
- 若A為m×n矩陣,B是m×n矩陣,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{T})}{\partial \mathbf {A} }}=\mathbf {B} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/b15d0d17c325a54360973700d9bb707c3b7cbed2)
- 若A為m×n矩陣,B是n×m矩陣,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} ^{T}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d21bbe875c75cf2ea42cdecaf994835215e977be)
- 當A和B均為對稱矩陣時,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} +\mathbf {B} ^{T}-diag(\mathbf {B} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/963e689d879a8da3708885e4c6a3b533897aa77a)
- 若A和B都是m×m矩陣,並且A是非奇異矩陣,有
![{\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-1}\mathbf {B} ^{T}\mathbf {A} ^{-1})^{T}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/205f8b8e19f6646d49b0ebe2070fe2df28542c62)
參考來源[編輯]
- ^ 張賢達,《矩陣分析與應用》,第54頁
- ^ 2.0 2.1 2.2 2.3 2.4 張賢達,《矩陣分析與應用》,第55頁
- ^ 3.0 3.1 Carl Dean Meyer, Matrix Analysis and Applied Linear Algebra,第110頁
- ^ Karim M. Abadir,Jan R. Magnus, Matrix algebra,第168頁
- ^ Werner, Linear Algebra,第126頁
- ^ Werner, Linear Algebra,第127-128頁
參考書籍[編輯]
- (英文)Karim M. Abadir,Jan R. Magnus. Matrix algebra. Cambridge University Press. 2005. ISBN 978-0521537469.