若爾當(dāng)標(biāo)準(zhǔn)型
簡(jiǎn)介
一個(gè)n × n的矩陣M{\displaystyle M}是可對(duì)角化的,當(dāng)且僅當(dāng)M{\displaystyle M}滿足下列條件之一:
M{\displaystyle M}有n個(gè)線性無關(guān)的特征向量?;蛘哒f,M{\displaystyle M}有一個(gè)由特征向量組成的基。(稱作極大無關(guān)條件)
M{\displaystyle M}的所有特征值的幾何重?cái)?shù)(即相應(yīng)特征子空間的維數(shù))等于相應(yīng)的代數(shù)重?cái)?shù)(即特征多項(xiàng)式中(x? ? -->λ λ -->){\displaystyle (x-\lambda )}項(xiàng)的次數(shù))?;蛘哒f,M{\displaystyle M}的所有幾何重?cái)?shù)之和等于n。(稱作重?cái)?shù)相等條件)
M{\displaystyle M}的極小多項(xiàng)式經(jīng)標(biāo)準(zhǔn)分解后,每一項(xiàng)都是一次項(xiàng),且重?cái)?shù)都是1。(稱作互異單根條件)
矩陣的對(duì)角化使得研究其性質(zhì)變?yōu)檠芯肯鄳?yīng)的對(duì)角矩陣的性質(zhì),而后者顯然簡(jiǎn)單得多。由于不是所有矩陣都滿足上述三個(gè)條件之一,有的矩陣是不可對(duì)角化的,例如以下的:
計(jì)入重?cái)?shù)的話,M{\displaystyle M}的特征值為1, 2, 4, 4。M? ? -->4I{\displaystyle M-4I}的核的維數(shù)是1,因此M{\displaystyle M}不可對(duì)角化。但經(jīng)過基底變換,M{\displaystyle M}相似于下面的矩陣:
矩陣J{\displaystyle J}近乎對(duì)角矩陣,除了第三列第四行系數(shù)是1。如果將后兩行和后兩列的部分作為一塊的話,矩陣J{\displaystyle J}就是一個(gè)分塊對(duì)角矩陣。若爾當(dāng)標(biāo)準(zhǔn)型的目標(biāo)就是將更多的矩陣化簡(jiǎn)到一類只比對(duì)角矩陣稍微復(fù)雜的矩陣:若爾當(dāng)標(biāo)準(zhǔn)型。實(shí)際上這是一種簡(jiǎn)單的分塊對(duì)角矩陣。
這里的“簡(jiǎn)單”是指每小塊矩陣都具備一種很簡(jiǎn)單的形狀:
其中主對(duì)角線上都是同一個(gè)系數(shù),而對(duì)角線上方一排全是1。形同以上Ji{\displaystyle J_{i}}的矩陣稱為若爾當(dāng)矩陣。而矩陣J{\displaystyle J}中每一個(gè)這樣的小塊被稱為若爾當(dāng)塊。
線性代數(shù)中有如下的結(jié)果:
對(duì)任意系數(shù)域?yàn)镵{\displaystyle \mathbb {K} }的矩陣M{\displaystyle M},只要其特征值都在K{\displaystyle \mathbb {K} }中,就存在一個(gè)與之相似的若爾當(dāng)標(biāo)準(zhǔn)型J{\displaystyle J}:M=PJP? ? -->1{\displaystyle M=PJP^{-1}},其中P{\displaystyle P}是一個(gè)可逆矩陣。并且滿足:
矩陣J{\displaystyle J}的特征值(計(jì)入重?cái)?shù))就是主對(duì)角線上的系數(shù)。
對(duì)于J{\displaystyle J}的一個(gè)特征值λ λ -->i{\displaystyle \lambda _{i}},它的幾何重?cái)?shù)就是屬于特征值λ λ -->i{\displaystyle \lambda _{i}}的若爾當(dāng)塊的個(gè)數(shù)。
所有屬于特征值λ λ -->i{\displaystyle \lambda _{i}}的若爾當(dāng)塊的維數(shù)之和是特征值λ λ -->i{\displaystyle \lambda _{i}}的代數(shù)重?cái)?shù)。
證明
廣義特征向量
考慮前面例子中的矩陣M。M的若爾當(dāng)標(biāo)準(zhǔn)型可以寫成PMP = J,即
其中變換矩陣P的四個(gè)列向量為:pi, i = 1, ..., 4,于是
也就是:
對(duì)于i = 1、2、3,pi{\displaystyle p_{i}}都是某個(gè)特征值所對(duì)應(yīng)的特征向量:pi∈ ∈ -->Ker? ? -->(M? ? -->λ λ -->I){\displaystyle p_{i}\in \operatorname {Ker} (M-\lambda I)}。然而,當(dāng)i=4時(shí),p4{\displaystyle p_{4}}并不是特征值4所對(duì)應(yīng)的特征向量。盡管如此:
于是p4∈ ∈ -->Ker? ? -->(M? ? -->λ λ -->I)2{\displaystyle p_{4}\in \operatorname {Ker} (M-\lambda I)^{2}}。像p4{\displaystyle p_{4}}這樣的向量被稱為M的廣義特征向量。
給定一個(gè)特征值λ λ -->{\displaystyle \scriptstyle \lambda },它對(duì)應(yīng)的若爾當(dāng)塊Jλ λ -->,m{\displaystyle \displaystyle J_{\lambda ,m}}:
對(duì)應(yīng)著一個(gè)由廣義特征向量所張成的子空間,因?yàn)閷?duì)應(yīng)的基底eλ λ -->,1,eλ λ -->,2,? ? -->,eλ λ -->,m{\displaystyle \displaystyle e_{\lambda ,1},e_{\lambda ,2},\cdots ,e_{\lambda ,m}}滿足:
因此,“所有特征值在K{\displaystyle \mathbb {K} }中的矩陣都相似于某個(gè)若爾當(dāng)標(biāo)準(zhǔn)型”這個(gè)命題等價(jià)于存在一個(gè)由這個(gè)矩陣的特征向量和廣義特征向量構(gòu)成的全空間的基底。
冪零矩陣的情況
當(dāng)矩陣A為冪零矩陣(即存在m使得Am=0{\displaystyle A^{m}=0})時(shí),可以證明整個(gè)空間總是可以分解為若干個(gè)A-循環(huán)子空間的直和。所謂的A-循環(huán)子空間就是由某個(gè)向量v以及基底:Bv={v,Av,A2v,? ? -->}{\displaystyle {\mathit {B}}_{v}=\left\{v,Av,A^{2}v,\cdots \right\}}線性張成的子空間。顯然,這樣的子空間是A-不變子空間。同時(shí),注意到Bv{\displaystyle {\mathit {B}}_{v}}是由A的特征向量和廣義特征向量構(gòu)成的(? ? -->j≥ ≥ -->0,Ajv∈ ∈ -->Ker? ? -->Am{\displaystyle \forall j\geq 0,A^{j}v\in \operatorname {Ker} A^{m}})。因此在這個(gè)循環(huán)子空間里,A在基底Bv{\displaystyle \displaystyle {\mathit {B}}_{v}}下表示為若爾當(dāng)塊:
因此A在所有這樣的基底下可以表示為由若爾當(dāng)塊組成的分塊對(duì)角矩陣,即若爾當(dāng)標(biāo)準(zhǔn)型:
一般情況
下面用數(shù)學(xué)歸納法證明:所有特征值在K{\displaystyle \mathbb {K} }中的n × n的矩陣都相似于某個(gè)若爾當(dāng)標(biāo)準(zhǔn)型。
n= 1的情況顯然。對(duì)于n>1{\displaystyle n>1}考慮n × n矩陣A。對(duì)于A的一個(gè)特征值λ,設(shè)s為λ的幾何重?cái)?shù)。設(shè)線性變換(A? ? -->λ λ -->I)s{\displaystyle (A-\lambda I)^{s}} 的像空間為Im(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Im} (A-\lambda I)^{s}},這是關(guān)于A的一個(gè)不變子空間。因?yàn)棣耸翘卣髦担琁m(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Im} (A-\lambda I)^{s}}的空間維數(shù)r嚴(yán)格小于n。記A′ ′ -->{\displaystyle \scriptstyle A^{\prime }}為A在子空間限制Im(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Im} (A-\lambda I)^{s}}上的部分。根據(jù)歸納假設(shè)存在一個(gè)基底:{p1, ..., pr}使得A′ ′ -->{\displaystyle \scriptstyle A^{\prime }}在這個(gè)基底上為若爾當(dāng)標(biāo)準(zhǔn)型。
接下來考慮子空間Ker? ? -->(A? ? -->λ λ -->I)s{\displaystyle \operatorname {Ker} (A-\lambda I)^{s}},只要能夠證明整個(gè)空間可以分為:
由于Ker(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Ker} (A-\lambda I)^{s}}是一個(gè)A-不變子空間,在上面A? ? -->λ λ -->I{\displaystyle A-\lambda I}是冪零矩陣,因此可以寫成若爾當(dāng)標(biāo)準(zhǔn)型:
而加上λ λ -->I{\displaystyle \displaystyle \lambda I}后還是若爾當(dāng)標(biāo)準(zhǔn)型。因此,A在Ker(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Ker} (A-\lambda I)^{s}}和Im(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Im} (A-\lambda I)^{s}}上都能寫成若爾當(dāng)標(biāo)準(zhǔn)型,從而A相似于某個(gè)若爾當(dāng)標(biāo)準(zhǔn)型。
有歸納法可知所有的n × n的矩陣都相似于某個(gè)若爾當(dāng)標(biāo)準(zhǔn)型。
下面證明:
設(shè)A的最小多項(xiàng)式為π π -->A{\displaystyle \pi _{A}},并將其寫成π π -->A=(X? ? -->λ λ -->I)s? ? -->Q{\displaystyle \pi _{A}=(X-\lambda I)^{s}\cdot Q}。于是Q{\displaystyle Q}和(X? ? -->λ λ -->I)s{\displaystyle (X-\lambda I)^{s}}互素。于是根據(jù)裴蜀定理,存在多項(xiàng)式:a和b使得a(X? ? -->λ λ -->I)s+bQ=1{\displaystyle a(X-\lambda I)^{s}+bQ=1}。每個(gè)向量u都可以寫成:
并且Q(A)(a(A? ? -->λ λ -->I)s(u))=(Q(A? ? -->λ λ -->I)s)(a(u))=π π -->A(u)=0{\displaystyle \displaystyle Q(A)(a(A-\lambda I)^{s}(u))=(Q(A-\lambda I)^{s})(a(u))=\pi _{A}(u)=0},同樣地(A? ? -->λ λ -->I)s(bQ(A)(u))=((A? ? -->λ λ -->I)sQ)(b(u))=π π -->A(u)=0{\displaystyle \displaystyle (A-\lambda I)^{s}(bQ(A)(u))=((A-\lambda I)^{s}Q)(b(u))=\pi _{A}(u)=0},因此a(A? ? -->λ λ -->I)s(u)∈ ∈ -->Ker(Q(A)),bQ(A)(u)∈ ∈ -->Ker(A? ? -->λ λ -->I)s{\displaystyle a(A-\lambda I)^{s}(u)\in \mathrm {Ker} (Q(A)),\;bQ(A)(u)\in \mathrm {Ker} (A-\lambda I)^{s}},也就是說:
另一方面,任意v∈ ∈ -->Ker(A? ? -->λ λ -->I)s∩ ∩ -->Ker(Q(A)){\displaystyle v\in \mathrm {Ker} (A-\lambda I)^{s}\cap \mathrm {Ker} (Q(A))},v=a(A? ? -->λ λ -->I)s(v)+bQ(A)(v)=0+0=0{\displaystyle \displaystyle v=a(A-\lambda I)^{s}(v)+bQ(A)(v)=0+0=0}。也就是說:Ker(A? ? -->λ λ -->I)s∩ ∩ -->Ker(Q(A))=0{\displaystyle \mathrm {Ker} (A-\lambda I)^{s}\cap \mathrm {Ker} (Q(A))={0}}。綜上所述,
然而? ? -->u∈ ∈ -->Im(A? ? -->λ λ -->I)s{\displaystyle \forall u\in \mathrm {Im} (A-\lambda I)^{s}},Q(A)(u)=0{\displaystyle \displaystyle Q(A)(u)=0},從而Im(A? ? -->λ λ -->I)s? ? -->Ker(Q(A)){\displaystyle \mathrm {Im} (A-\lambda I)^{s}\subset \mathrm {Ker} (Q(A))}。而根據(jù)秩-零化度定理,Ker(Q(A)){\displaystyle \mathrm {Ker} (Q(A))}和Im(A? ? -->λ λ -->I)s{\displaystyle \mathrm {Im} (A-\lambda I)^{s}}維數(shù)相等,所以兩者完全相等。于是
從而命題得證。
推論
如果矩陣的系數(shù)域是一個(gè)代數(shù)閉域,那么由于其特征值是特征多項(xiàng)式的根,所以也在系數(shù)域中。于是只要系數(shù)域是一個(gè)代數(shù)閉域,所有的矩陣都相似于若爾當(dāng)標(biāo)準(zhǔn)型。特別的,所有復(fù)系數(shù)矩陣都可以簡(jiǎn)化為若爾當(dāng)標(biāo)準(zhǔn)型,因?yàn)閺?fù)數(shù)域是代數(shù)封閉的。
所有的若爾當(dāng)標(biāo)準(zhǔn)型都可以分解成一個(gè)對(duì)角矩陣D和一個(gè)只有對(duì)角線上一排為1的矩陣N的和。這兩個(gè)矩陣是可交換的,因?yàn)槠渲幸粋€(gè)是對(duì)角矩陣。不僅如此,矩陣N是一個(gè)冪零矩陣。因此,每個(gè)相似于若爾當(dāng)標(biāo)準(zhǔn)型的矩陣都可以寫成可交換的一個(gè)對(duì)角矩陣和一個(gè)冪零矩陣的和。因?yàn)榕c對(duì)角矩陣和冪零矩陣相似的矩陣仍然是對(duì)角矩陣和冪零矩陣。換句話說,只要一個(gè)矩陣的特征值都在它的系數(shù)域里(或者說它的最小多項(xiàng)式或特征多項(xiàng)式可以分解成一次項(xiàng)的乘積),就可以將這個(gè)矩陣分解成一個(gè)對(duì)角矩陣和一個(gè)冪零矩陣的和,而這兩個(gè)矩陣可以交換。這個(gè)結(jié)果被稱為丹佛分解(Dunford分解),在計(jì)算矩陣的指數(shù)時(shí)很有用。
譜映射定理
用若爾當(dāng)標(biāo)準(zhǔn)型以及直接的計(jì)算可以得出:如果n × n矩陣A的特征值為:λ1, ..., λn,那么對(duì)于多項(xiàng)式:p,矩陣p(A)的特征值是:p(λ1), ..., p(λn)。
凱萊-哈密爾頓定理
凱萊-哈密爾頓定理斷言任意矩陣A都是特征方程的根:如果p是A的特征多項(xiàng)式,那么p(A) = 0。這個(gè)定理一樣可以用若爾當(dāng)標(biāo)準(zhǔn)型直接計(jì)算得出。
最小多項(xiàng)式
方塊矩陣A的最小多項(xiàng)式是使得m(A) = 0的非常數(shù)首一多項(xiàng)式中次數(shù)最小者。另一種定義是:所有使得m(A) = 0的多項(xiàng)式構(gòu)成主理想環(huán)C[x]的一個(gè)理想I,而m則是這個(gè)理想的產(chǎn)生子。
對(duì)于有若爾當(dāng)標(biāo)準(zhǔn)型的矩陣A,其最小多項(xiàng)式以其特征值為根,并且由若爾當(dāng)標(biāo)準(zhǔn)型的形狀可以看出,每個(gè)特征值的重?cái)?shù)是若爾當(dāng)標(biāo)準(zhǔn)型中屬于這個(gè)特征值的最大的若爾當(dāng)塊的維數(shù)。
反之已知矩陣A的最小多項(xiàng)式并不能知道其若爾當(dāng)標(biāo)準(zhǔn)型。要確定矩陣A的標(biāo)準(zhǔn)型需要用到所謂的初等因子。矩陣A的一個(gè)初等因子是它的某一個(gè)若爾當(dāng)塊的特征多項(xiàng)式(或最小多項(xiàng)式,對(duì)于若爾當(dāng)塊兩者一樣)。如果所有的初等因子都是一次多項(xiàng)式,那么A可對(duì)角化。
不變子空間分解
一個(gè)n × n的矩陣A的若爾當(dāng)標(biāo)準(zhǔn)型是分塊對(duì)角矩陣,因此給出了一個(gè)將n維歐幾里得空間分解為矩陣A的不變子空間的具體方法。每個(gè)若爾當(dāng)塊Ji都對(duì)應(yīng)著一個(gè)不變子空間:Xi??梢院?jiǎn)記為:
其中的每個(gè)Xi都是由若爾當(dāng)塊Ji對(duì)應(yīng)的廣義特征向量張成的子空間。
注意到這里的k并不是不同的特征值的個(gè)數(shù),因?yàn)閷儆谕粋€(gè)特征值的若爾當(dāng)塊可以不止一個(gè)。如果要將Cn{\displaystyle \mathbb {C} ^{n}}分解為l個(gè)不變子空間,其中l(wèi)是不同特征值的個(gè)數(shù)的話,可以將屬于同一個(gè)特征值,比如說λ λ -->i{\displaystyle \scriptstyle \lambda _{i}}的若爾當(dāng)塊合并:只需使用A的最小多項(xiàng)式π π -->A{\displaystyle \pi _{A}}中關(guān)于λ λ -->i{\displaystyle \scriptstyle \lambda _{i}}的重根數(shù)(幾何重?cái)?shù))ν ν -->(λ λ -->i){\displaystyle \scriptstyle \nu (\lambda _{i})},考慮空間:
這就是所有的屬于同一個(gè)特征值λ λ -->i{\displaystyle \scriptstyle \lambda _{i}}的若爾當(dāng)塊所對(duì)應(yīng)的Xi,p所合并后的空間,因?yàn)樗怂惺沟媒?jīng)過ν ν -->(λ λ -->i){\displaystyle \scriptstyle \nu (\lambda _{i})}次λ λ -->i? ? -->A{\displaystyle \scriptstyle \lambda _{i}-A}操作后會(huì)清零的向量集合。如果某個(gè)Xi中向量沒有被清零,那么由于這個(gè)向量也不會(huì)被其他的特征值λ λ -->j? ? -->A{\displaystyle \scriptstyle \lambda _{j}-A}清零,它將不會(huì)被π π -->A{\displaystyle \scriptstyle \pi _{A}}清零,這與π π -->A(A)=0{\displaystyle \pi _{A}(A)=0}矛盾。
于是n維歐幾里得空間也可以被分解為
其中l(wèi)是矩陣A的不同的特征值的個(gè)數(shù)。
值得注意的是,這里的指標(biāo)ν(λ)是使得特征零空間Ker? ? -->(λ λ -->? ? -->A)m{\displaystyle \operatorname {Ker} (\lambda -A)^{m}}“穩(wěn)定”下來的最小次數(shù):
這也可以作為代數(shù)重?cái)?shù)的另一個(gè)定義。
參見
矩陣分解
若爾當(dāng)矩陣
參考來源
N.丹佛,J.T.施瓦茨,《線性算子》第一章:一般理論(Linear Operators, Part I: General Theory), Interscience, 1958.
Daniel.T. Finkbeiner II,《矩陣與線性變換導(dǎo)論》第三版(Introduction to Matrices and Linear Transformations, Third Edition), Freeman, 1978.
Gene H. Golub,Charles F. van Loan,《矩陣計(jì)算》第三版(Matrix Computations), Johns Hopkins University Press, Baltimore, 1996.
Gene H. Golub,J. H. Wilkinson,《病態(tài)特征系統(tǒng)以及若爾當(dāng)標(biāo)準(zhǔn)型計(jì)算》(Ill-conditiones Eigensystems and the computation of the Jordan normal form), SIAM Review, vol. 18, nr. 4, pp. 578–619, 1976.
Horn, Roger A.; Johnson, Charles R., 矩陣分析(Matrix Analysis), Cambridge University Press, 1985, ISBN 978-0-521-38632-6 .
Glenn James,Robert C. James,《數(shù)學(xué)辭典》第四版(Mathematics Dictionary, Fourth Edition), Van Nostrand Reinhold, 1976.
Saunders MacLane,Garrett Birkhoff,《代數(shù)學(xué)》(Algebra), MacMillan, 1967.
Anthony N. Michel,Charles J. Herget,《應(yīng)用代數(shù)和泛函分析》(Applied Algebra and Functional Analysis), Dover, 1993.
Georgi E. Shilov,《線性代數(shù)》(Linear Algebra), Dover, 1977.
若爾當(dāng)正規(guī)型
外部鏈接
免責(zé)聲明:以上內(nèi)容版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。感謝每一位辛勤著寫的作者,感謝每一位的分享。
- 有價(jià)值
- 一般般
- 沒價(jià)值
{{item.userName}} 舉報(bào)
{{item.time}} {{item.replyListShow ? '收起' : '展開'}}評(píng)論 {{curReplyId == item.id ? '取消回復(fù)' : '回復(fù)'}}
{{_reply.userName}} 舉報(bào)
{{_reply.time}}