矩陣
發(fā)展
作為解決線性方程的工具,矩陣也有不短的歷史。成書(shū)最遲在東漢前期的《九章算術(shù)》中,已經(jīng)出現(xiàn)過(guò)以矩陣形式表示線性方程組系數(shù)以解方程的圖例,可算作是矩陣的雛形 。矩陣正式作為數(shù)學(xué)中的研究對(duì)象出現(xiàn),則是在行列式的研究發(fā)展起來(lái)后。邏輯上,矩陣的概念先于行列式,但在實(shí)際的歷史上則恰好相反。日本數(shù)學(xué)家關(guān)孝和(1683年)與微積分的發(fā)現(xiàn)者之一戈特弗里德·威廉·萊布尼茨(1693年)近乎同時(shí)地獨(dú)立建立了行列式論。其后行列式作為解線性方程組的工具逐步發(fā)展。1750年,加布里爾·克拉默發(fā)現(xiàn)了克萊姆法則 。
阿瑟·凱萊被認(rèn)為是矩陣論的奠基人
進(jìn)入十九世紀(jì)后,行列式的研究進(jìn)一步發(fā)展,矩陣的概念也應(yīng)運(yùn)而生。奧古斯丁·路易·柯西是最早將行列式排成方陣并將其元素用雙重下標(biāo)表示的數(shù)學(xué)家。他還在1829年就在行列式的框架中證明了實(shí)對(duì)稱(chēng)矩陣特征根為實(shí)數(shù)的結(jié)論 。其后,詹姆斯·約瑟夫·西爾維斯特注意到,在作為行列式的計(jì)算形式以外,將數(shù)以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用數(shù)的矩形陣列而又不能用行列式來(lái)形容的時(shí)候,就用“matrix”一詞來(lái)形容 。而在此之前,數(shù)學(xué)家已經(jīng)開(kāi)始將增廣矩陣作為獨(dú)立的對(duì)象引用了。西爾維斯特使用“matrix”一詞是因?yàn)樗M懻撔辛惺降淖邮?,即將矩陣的某幾行和某幾列的共同元素取出?lái)排成的矩陣的行列式,所以實(shí)際上“matrix”被他看做是生成各種子式的“母體”:
阿瑟·凱萊被公認(rèn)為矩陣論的奠基人 。他開(kāi)始將矩陣作為獨(dú)立的數(shù)學(xué)對(duì)象研究時(shí),許多與矩陣有關(guān)的性質(zhì)已經(jīng)在行列式的研究中被發(fā)現(xiàn)了,這也使得凱萊認(rèn)為矩陣的引進(jìn)是十分自然的。他說(shuō):“我決然不是通過(guò)四元數(shù)而獲得矩陣概念的;它或是直接從行列式的概念而來(lái),或是作為一個(gè)表達(dá)線性方程組的方便方法而來(lái)的。 ”他從1858年開(kāi)始,發(fā)表了《矩陣論的研究報(bào)告》等一系列關(guān)于矩陣的專(zhuān)門(mén)論文 ,研究了矩陣的運(yùn)算律、矩陣的逆以及轉(zhuǎn)置和特征多項(xiàng)式方程。凱萊還提出了凱萊-哈密爾頓定理,并驗(yàn)證了3×3矩陣的情況,又說(shuō)進(jìn)一步的證明是不必要的。哈密爾頓證明了4×4矩陣的情況,而一般情況下的證明是弗羅貝尼烏斯于1898年給出的 。
此后更多的數(shù)學(xué)家開(kāi)始對(duì)矩陣進(jìn)行研究。埃爾米特證明了如果矩陣等于其復(fù)共軛轉(zhuǎn)置,則特征根為實(shí)數(shù)。這種矩陣后來(lái)被稱(chēng)為埃爾米特矩陣 。弗羅貝尼烏斯對(duì)矩陣的特征方程、特征根、矩陣的秩、正交矩陣、矩陣方程等方面做了大量工作。1878年,在引進(jìn)了不變因子、初等因子等概念的同時(shí),弗羅貝尼烏斯給出了正交矩陣、相似矩陣和合同矩陣的概念。同年,他探討了矩陣的最小多項(xiàng)式(最小方程)問(wèn)題。1894年的論文中,他討論了矩陣?yán)碚摵退脑獢?shù)理論的關(guān)系。1896年,他給出了凱萊-哈密爾頓定理的完整證明 。矩陣?yán)碚撛?9世紀(jì)沿著兩個(gè)方向發(fā)展,分別是作為抽象代數(shù)結(jié)構(gòu)和作為代數(shù)工具描述幾何空間的線性變換。矩陣?yán)碚摓槿赫摵筒蛔兞坷碚摰陌l(fā)展。
無(wú)限維矩陣的研究始于1884年。龐加萊在兩篇不嚴(yán)謹(jǐn)?shù)厥褂昧藷o(wú)限維矩陣和行列式理論的文章后開(kāi)始了對(duì)這一方面的專(zhuān)門(mén)研究 。1906年,希爾伯特引入無(wú)限二次型(相當(dāng)于無(wú)限維矩陣)對(duì)積分方程進(jìn)行研究,極大地促進(jìn)了無(wú)限維矩陣的研究。在此基礎(chǔ)上,施密茨、赫林格和特普利茨發(fā)展出算子理論,而無(wú)限維矩陣成為了研究函數(shù)空間算子的有力工具 。
定義
將一些元素排列成若干行,每行放上相同數(shù)量的元素,就是一個(gè)矩陣。這里說(shuō)的元素可以是數(shù)字,例如以下的矩陣:
排列成的形狀是矩形,所以稱(chēng)為矩陣。在中國(guó),橫向的元素組稱(chēng)為“行”,縱向稱(chēng)為“列”。矩陣一般用大寫(xiě)拉丁字母表示,需要具體寫(xiě)出其中元素時(shí),一般用方括號(hào)或圓括號(hào)括起。以上的矩陣 A 是一個(gè)4行3列的矩陣。
行數(shù)是1或列數(shù)是1的矩陣又可分別稱(chēng)為行向量和列向量。這是因?yàn)橐粋€(gè)向量可以表示成行數(shù)或列數(shù)是1的矩陣形式。矩陣的任一行(列)都是一個(gè)行(列)向量,例如矩陣 A 的第一行 [ 9 13 5 ] {\displaystyle {\begin{bmatrix}9&13&5\end{bmatrix}}} 就是一個(gè)行向量。行(列)向量可以看成一個(gè)向量,因此可以稱(chēng)矩陣的兩行(列)相等,或者某一行等于某一列,表示其對(duì)應(yīng)的向量相等。
標(biāo)記
一個(gè)矩陣 A 從左上角數(shù)起的第 i 行第 j 列上的元素稱(chēng)為第 i , j 項(xiàng),通常記為 A i , j 、 A ij 、 a i , j 或 A [ i , j ] 。在上述例子中 A [ 4 , 3 ] = {\displaystyle =} 7。如果不知道矩陣 A 的具體元素,通常也會(huì)將它記成 A = [ a i j ] m × × --> n {\displaystyle \scriptstyle \mathbf {A} =\left[\mathbf {a} _{ij}\right]_{m\times n}} 或 A = [ a i , j ] m × × --> n {\displaystyle \scriptstyle \mathbf {A} =\left[\mathbf {a} _{i,j}\right]_{m\times n}} 。反之,如果 A 的元素可以寫(xiě)成只與其行數(shù) i 和列數(shù) j 有關(guān)的統(tǒng)一函數(shù) f ,那么也可以用 A = [ f ( i , j ) ] m × × --> n {\displaystyle \scriptstyle \mathbf {A} =\left[f(i,j)\right]_{m\times n}} 作為 A 的簡(jiǎn)寫(xiě)。例如 B = [ i + 2 j ] 2 × × --> 3 {\displaystyle \scriptstyle \mathbf {B} =\left[i+2j\right]_{2\times 3}} 是矩陣
的簡(jiǎn)寫(xiě)。要注意的是,一些計(jì)算機(jī)編程語(yǔ)言中,會(huì)將第1行(列)稱(chēng)為第0行(列),從而對(duì)矩陣的寫(xiě)法產(chǎn)生影響,比如矩陣 B 就要改寫(xiě)成 B = [ i + 2 j + 3 ] 2 × × --> 3 {\displaystyle \scriptstyle \mathbf {B} =\left[i+2j+3\right]_{2\times 3}} 。
矩陣的元素可以是數(shù)字、符號(hào)或數(shù)學(xué)表達(dá)式。一般為了支持矩陣的運(yùn)算,矩陣的元素之間應(yīng)當(dāng)能做加減法和乘法,所以是某個(gè)環(huán)里的元素。最常見(jiàn)的是元素屬于實(shí)數(shù)域或復(fù)數(shù)域的矩陣,簡(jiǎn)稱(chēng)為實(shí)矩陣和復(fù)矩陣。更一般的情況下,矩陣的元素可以是由一個(gè)環(huán)中的元素排成。給定一個(gè)環(huán) R ,所有由 R 中元素排成的 m × n 矩陣的集合寫(xiě)作 M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbf {R} )} 或 M m × × --> n ( R ) {\displaystyle {\mathcal {M}}_{m\times n}(\mathbf {R} )} 。若 m = {\displaystyle =} n ,則通常記以 M ( m , R ) {\displaystyle {\mathcal {M}}(m,\mathbf {R} )} 或 M m ( R ) {\displaystyle {\mathcal {M}}_{m}(\mathbf {R} )} ,稱(chēng)其為 n 維方陣或方陣。
矩陣的基本運(yùn)算
矩陣的最基本運(yùn)算包括矩陣加(減)法,數(shù)乘和轉(zhuǎn)置運(yùn)算。被稱(chēng)為“矩陣加法”、“數(shù)乘”和“轉(zhuǎn)置”的運(yùn)算不止一種 ,其中最基本最常用的定義如下:
矩陣的加法運(yùn)算滿換律: A + B = B + A 。矩陣的轉(zhuǎn)置和數(shù)乘運(yùn)算對(duì)加法滿足分配律:
矩陣加法和數(shù)乘兩種運(yùn)算使得 M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbb {R} )} 成為一個(gè) mn 維的實(shí)數(shù)線性空間。而轉(zhuǎn)置和數(shù)乘運(yùn)算滿足類(lèi)似于結(jié)合律的規(guī)律:
矩陣也有類(lèi)似行列式的初等變換,即對(duì)矩陣的某些行和某些列進(jìn)行三類(lèi)操作:交換兩行(列),將一行(列)的每個(gè)元素都乘以一個(gè)固定的量,以及將一行(列)的每個(gè)元素乘以一個(gè)固定的量之后加到另一行(列)的相應(yīng)元素上。這些操作在求其逆矩陣時(shí)有用。
矩陣乘法
矩陣 A 和 B 相乘得到 AB 的示意圖
兩個(gè)矩陣的乘法僅當(dāng)?shù)谝粋€(gè)矩陣 A 的列數(shù)和另一個(gè)矩陣 B 的行數(shù)相等時(shí)才能定義。如 A 是 m × n 矩陣和 B 是 n × p 矩陣,它們的 乘積 AB 是一個(gè) m × p 矩陣,它的一個(gè)元素
其中 1 ≤ i ≤ m , 1 ≤ j ≤ p" " 。
例如
矩陣的乘法滿足結(jié)合律和對(duì)矩陣加法的分配律(左分配律和右分配律):
結(jié)合律: ( AB ) C = {\displaystyle =} A ( BC ),
左分配律: ( A + B ) C = {\displaystyle =} AC + BC ,
右分配律: C ( A + B ) = {\displaystyle =} CA + CB .
矩陣的乘法與數(shù)乘運(yùn)算之間也滿足類(lèi)似結(jié)合律的規(guī)律;與轉(zhuǎn)置之間則滿足倒置的分配律。
矩陣乘法 不滿足 交換律。一般來(lái)說(shuō),矩陣 A 及 B 的乘積 AB 存在,但 BA 不一定存在,即使存在,大多數(shù)時(shí)候 AB ≠ BA 。比如下面的例子:
這一特性使得矩陣代數(shù)與常見(jiàn)的一些數(shù)域(有理數(shù)、實(shí)數(shù)、復(fù)數(shù))以及環(huán)(多項(xiàng)式環(huán)、整數(shù)環(huán))都不同。給定一個(gè) n 維的方塊矩陣 A ,與 A 交換的所有方塊矩陣構(gòu)成一個(gè)環(huán),稱(chēng)為 A 的交換子環(huán)。這些矩陣也構(gòu)成 M ( n , R ) {\displaystyle {\mathcal {M}}(n,\mathbb {R} )} 的一個(gè)子空間,稱(chēng)為 A 的可交換空間 。與 M ( n , R ) {\displaystyle {\mathcal {M}}(n,\mathbb {R} )} 中所有矩陣交換的矩陣只有形如 λ λ --> I n , λ λ --> ∈ ∈ --> R {\displaystyle \lambda {\mathsf {I}}_{n},\,\lambda \in \mathbb {R} } 的矩陣(稱(chēng)為數(shù)乘矩陣)。其中的 I n {\displaystyle {\mathsf {I}}_{n}} 是單位矩陣,也就是主對(duì)角線上的元素為1,其它元素為0的矩陣。任意矩陣 M 乘以單位矩陣都得到自身: M I n = M = I n M {\displaystyle \mathbf {M} {\mathsf {I}}_{n}=\mathbf {M} ={\mathsf {I}}_{n}\mathbf {M} } 。
除了最常見(jiàn)的矩陣乘法定義以外,也有一些較不常見(jiàn)的矩陣乘法,比如阿達(dá)馬乘積和克羅內(nèi)克乘積 。
線性方程組
矩陣乘法的一個(gè)基本應(yīng)用是在線性方程組上。線性方程組是方程組的一種,它符合以下的形式:
其中的 a 1 , 1 , a 1 , 2 {\displaystyle a_{1,1},\,a_{1,2}} 以及 b 1 , b 2 {\displaystyle b_{1},\,b_{2}} 等等是已知的常數(shù),而 x 1 , x 2 {\displaystyle x_{1},\,x_{2}} 等等則是要求的未知數(shù)。運(yùn)用矩陣的方式,可以將線性方程組寫(xiě)成一個(gè)向量方程:
其中, A 是由方程組里未知量的系數(shù)排成的 m × n 矩陣, x 是含有 n 個(gè)元素的行向量, b 是含有 m 個(gè)元素的行向量 。
這個(gè)寫(xiě)法下,將原來(lái)的多個(gè)方程轉(zhuǎn)化成一個(gè)向量方程,在已知矩陣 A 和向量 b 的情況下,求未知向量 x 。
線性變換
矩陣是線性變換的便利表達(dá)法。矩陣乘法的本質(zhì)在聯(lián)系到線性變換的時(shí)候最能體現(xiàn),因?yàn)榫仃嚦朔ê途€性變換的合成有以下的聯(lián)系: 以 R n {\displaystyle \mathbb {R} ^{n}} 表示所有長(zhǎng)度為 n 的行向量的集合。每個(gè) m × n 的矩陣 A 都代表了一個(gè)從 R n {\displaystyle \mathbb {R} ^{n}} 射到 R m {\displaystyle \mathbb {R} ^{m}} 的線性變換。反過(guò)來(lái),對(duì)每個(gè)線性變換 f : R n → → --> R m {\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{m}} ,都存在唯一 m × n 矩陣 A f 使得對(duì)所有 R n {\displaystyle \mathbb {R} ^{n}} 中的元素 x , f ( x ) = A f x {\displaystyle f(x)=A_{f}x} 。這個(gè)矩陣 A f 第 i 行第 j 列上的元素是正則基向量 e j = ( 0 , ? ? --> , 0 , 1 , 0 , ? ? --> 0 ) T {\displaystyle \mathbf {e} _{j}=(0,\cdots ,0,1,0,\cdots 0)^{T}} (第 j 個(gè)元素是1,其余元素是0的向量)在 f 映射后的向量 f ( e j ) {\displaystyle f(\mathbf {e} _{j})} 的第 i 個(gè)元素。
也就是說(shuō),從 R n {\displaystyle \mathbb {R} ^{n}} 射到 R m {\displaystyle \mathbb {R} ^{m}} 的線性變換構(gòu)成的向量空間 L ( R n , R m ) {\displaystyle {\mathcal {L}}\left(\mathbb {R} ^{n},\mathbb {R} ^{m}\right)} 上存在一個(gè)到 M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbb {R} )} 的一一映射: f ? ? --> A f {\displaystyle f\mapsto A_{f}}
以下是一些典型的2維實(shí)平面上的線性變換對(duì)平面向量(圖形)造成的效果,以及它們對(duì)應(yīng)的2維矩陣。其中每個(gè)線性變換將藍(lán)色圖形映射成綠色圖形;平面的原點(diǎn)(0, 0)用黑點(diǎn)表示。
設(shè)有 k × m 的矩陣 B 代表線性變換 g : R -> R ,則矩陣積 BA 代表了線性變換的復(fù)合 g o f ,因?yàn)?/span>
矩陣的秩是指矩陣中線性無(wú)關(guān)的行(列)向量的最大個(gè)數(shù) ,同時(shí)也是矩陣對(duì)應(yīng)的線性變換的像空間的維度 。秩-零化度定理說(shuō)明矩陣的列數(shù)量等于矩陣的秩與零空間維度之和 。
方塊矩陣
行數(shù)與列數(shù)相同的矩陣稱(chēng)為 方塊矩陣 ,簡(jiǎn)稱(chēng)方陣。所有 n 維的方塊矩陣構(gòu)成一個(gè)線性空間,這個(gè)空間對(duì)矩陣乘法也是封閉的,因此也是一個(gè)代數(shù)。方陣 A 稱(chēng)為可逆或非奇異的,如果存在另一個(gè)方陣 B ,使得
成立。這時(shí)候可以證明也有 BA = {\displaystyle =} I n 成立 ,可將矩陣 B 稱(chēng)為 A 的逆矩陣 。一個(gè)矩陣 A 的逆矩陣如果存在的話,就是唯一的,通常記作 A 。
矩陣 A 的元素 A i , i 稱(chēng)為其主對(duì)角線上的元素。方塊矩陣 A 的所有主對(duì)角線元素之和稱(chēng)為它的跡,寫(xiě)作 tr( A ) 。盡管矩陣的乘法不滿換律,方陣相乘時(shí)交換順序會(huì)導(dǎo)致乘積變化,但它們的跡不會(huì)變,即 tr( AB ) = {\displaystyle =} tr( BA ) 。除此以外,矩陣轉(zhuǎn)置的跡等于其自身的跡, tr( A ) = {\displaystyle =} tr( A ) 。
如果一個(gè)方陣只有主對(duì)角線上的元素不是0,其它都是0,那么稱(chēng)其為對(duì)角矩陣。如果主對(duì)角線上方的元素都是0,那么稱(chēng)為下三角矩陣;反之如果主對(duì)角線下方的元素都是0,那么稱(chēng)為上三角矩陣。例如 n = {\displaystyle =} 3的時(shí)候,這些矩陣分別寫(xiě)作:
行列式
R 里的一個(gè)線性變換f將藍(lán)色圖形變成綠色圖形,面積不變,而順時(shí)針排布的向量 x 1和 x 2的變成了逆時(shí)針排布。對(duì)應(yīng)的矩陣行列式是-1.
方塊矩陣 A 的行列式是一個(gè)將其映射到標(biāo)量的函數(shù),記作 det( A ) 或,反映了矩陣自身的一定特性。一個(gè)方陣的行列式等于0當(dāng)且僅當(dāng)該方陣不可逆。系數(shù)是實(shí)數(shù)的時(shí)候,二維(三維)方陣 A 的行列式的絕對(duì)值表示單位面積(體積)的圖形經(jīng)過(guò) A 對(duì)應(yīng)的線性變換后得到的圖形的面積(體積),而它的正負(fù)則代表了對(duì)應(yīng)的線性變換是否改變空間的定向:行列式為正說(shuō)明它保持空間定向,行列式為負(fù)則說(shuō)明它逆轉(zhuǎn)空間定向。
2×2矩陣的行列式是
3×3矩陣的行列式由6項(xiàng)組成。更高維矩陣的行列式則可以使用萊布尼茲公式寫(xiě)出 ,或使用拉普拉斯展開(kāi)由低一維的矩陣行列式遞推得出 。
兩個(gè)矩陣相乘,乘積的行列式等于它們的行列式的乘積: det( AB ) = {\displaystyle =} det( A )·det( B ) 。將矩陣的一行(列)乘以某個(gè)系數(shù)加到另一行(列)上不改變矩陣的行列式,將矩陣的兩行(列)互換則使得其行列式變號(hào) 。用這兩種操作可以將矩陣變成一個(gè)上三角矩陣或下三角矩陣,而后兩種矩陣的行列式就是主對(duì)角線上元素的乘積,因此能方便地計(jì)算。運(yùn)用行列式可以計(jì)算線性方程組的解(見(jiàn)克萊姆法則) 。
特征值與特征向量
n × n 的方塊矩陣 A 的一個(gè)特征值和對(duì)應(yīng)特征向量是滿足
其中的 x λ λ --> i {\displaystyle \mathbf {x} _{\lambda _{i}}} 表示此向量對(duì)應(yīng)的特征值是 λ λ --> i {\displaystyle \lambda _{i}} ,那么向量 x 經(jīng)過(guò)線性變換后會(huì)變成:
可以清楚地知道變換后向量的結(jié)構(gòu)。
另一個(gè)等價(jià)的特征值定義是:標(biāo)量 λ λ --> {\displaystyle \lambda } 為特征值,如果矩陣 A ? ? --> λ λ --> I n {\displaystyle \mathbf {A} -\lambda {\mathsf {I}}_{n}} 是不可逆矩陣。根據(jù)不可逆矩陣的性質(zhì),這個(gè)定義也可以用行列式方程描述: λ λ --> {\displaystyle \lambda } 為特征值,如果
對(duì)稱(chēng)
轉(zhuǎn)置等于自己的矩陣,即滿足 A = {\displaystyle =} A 的方塊矩陣 A 叫做對(duì)稱(chēng)矩陣。滿足 A = {\displaystyle =} - A 的矩陣稱(chēng)為反對(duì)稱(chēng)矩陣。在復(fù)系數(shù)矩陣中,則有埃爾米特矩陣的概念:滿足 A = {\displaystyle =} A 的方塊矩陣稱(chēng)為埃爾米特矩陣,其中的 A 表示 A 的共軛轉(zhuǎn)置矩陣。
根據(jù)譜定理,實(shí)對(duì)稱(chēng)矩陣和復(fù)埃爾米特矩陣擁有特征基,即由矩陣的特征向量組成的基底。因此任何向量都能表示成矩陣特征向量的線性組合。此外,這兩類(lèi)矩陣的特征值都是實(shí)數(shù) 。
正定性
n × n 的實(shí)對(duì)稱(chēng)矩陣 A 如果滿足對(duì)所有非零向量 x ∈ R ,對(duì)應(yīng)的二次型
函數(shù)值都是正數(shù),就稱(chēng) A 為正定矩陣。類(lèi)似地還有半正定矩陣、負(fù)定矩陣、不定矩陣等概念 。對(duì)稱(chēng)矩陣的正定性與其特征值密切相關(guān)。矩陣是正定的當(dāng)且僅當(dāng)其特征值都是正數(shù) 。
矩陣的計(jì)算
矩陣在許多學(xué)科領(lǐng)域中都有應(yīng)用,在很多時(shí)候,除了需要知道矩陣的理論性質(zhì)以外,還需要計(jì)算矩陣的數(shù)值。為了矩陣的計(jì)算能夠足夠精確與快捷,數(shù)值線性代數(shù)中專(zhuān)門(mén)有研究矩陣的數(shù)值計(jì)算方法 。與其它的數(shù)值計(jì)算一樣,矩陣的數(shù)值計(jì)算注重的主要也是算法的復(fù)雜度和數(shù)值穩(wěn)定性。矩陣的數(shù)值計(jì)算可以使用直接計(jì)算,也可以用迭代算法,例如在計(jì)算方塊矩陣的特征值時(shí),可以從一個(gè)非零向量 x 0 開(kāi)始,通過(guò)特定迭代方法得到一個(gè)逼近某個(gè)特征向量的向量序列 。
測(cè)量一個(gè)算法的復(fù)雜度是指估計(jì)此算法需要的基本運(yùn)算如數(shù)字的加法和乘法的次數(shù),或者找出它的一個(gè)上界。例如按照定義計(jì)算的話,兩個(gè) n 階方陣的乘法需要 n 次數(shù)字乘法計(jì)算,因?yàn)槠涑朔e是一個(gè) n 階方陣,有 n 個(gè)元素,計(jì)算每個(gè)元素需要 n 次數(shù)字乘法。如果使用施特拉森算法的話,可以將數(shù)字乘法的次數(shù)減低到大約 n 次 。此外,編程語(yǔ)言或環(huán)境本身對(duì)算法的復(fù)雜度也會(huì)有影響。
某些特殊類(lèi)型的矩陣攜帶的數(shù)據(jù)量比一般矩陣要少,同時(shí)帶來(lái)的信息量比一般矩陣多。一個(gè)重要的例子是稀疏矩陣,這類(lèi)矩陣中絕大部分的元素是零。有關(guān)稀疏矩陣的計(jì)算,如計(jì)算稀疏矩陣 A 的線性方程組 Ax = {\displaystyle =} b 時(shí),可以使用一些專(zhuān)用于稀疏矩陣的特殊算法(比如共軛梯度法 ),減低計(jì)算復(fù)雜度。
算法的數(shù)值穩(wěn)定性是指輸入值的不會(huì)讓計(jì)算結(jié)果產(chǎn)生很大偏差。例如計(jì)算矩陣的逆時(shí),可以用以下的算法(其中 adj( A ) 表示 A 的伴隨矩陣)
這個(gè)算法在 A 的行列式接近0的時(shí)候會(huì)引起很大的舍入誤差 。而如果使用全選主元的高斯消去法求逆,則在復(fù)雜度降低的同時(shí)能夠避免舍入誤差,保證數(shù)值穩(wěn)定性。
矩陣分解
矩陣研究的一大方向是將一般的矩陣用一些比較“簡(jiǎn)單”的矩陣來(lái)表示。這種表示方式稱(chēng)為矩陣的變換與分解。矩陣變換與分解的方法有很多,它們的目的都是希望化簡(jiǎn)后的矩陣保持原矩陣的某些性質(zhì),比如行列式、秩或逆矩陣,而形式相對(duì)簡(jiǎn)單,因而能用容易地進(jìn)行討論和計(jì)算,或者能使得某些算法更易執(zhí)行。
LU分解將矩陣分解為一個(gè)下三角矩陣 L 和一個(gè)上三角矩陣 U 的乘積 。分解后的矩陣可以方便某些問(wèn)題的解決。例如解線性方程組時(shí),如果將系數(shù)矩陣 A 分解成 A = {\displaystyle =} LU 的形式,那么方程的求解可以分解為求解 Ly = {\displaystyle =} b 和 Ux = {\displaystyle =} y 兩步,而后兩個(gè)方程可以十分簡(jiǎn)潔地求解(詳見(jiàn)三角矩陣中“向前與向后替換”一節(jié))。又例如在求矩陣的行列式時(shí),如果直接計(jì)算一個(gè)矩陣 A 的行列式,需要計(jì)算大約 ( n + 1)! 次加法和乘法;而如果先對(duì)矩陣做 LU 分解,再求行列式,就只需要大約 n 次加法和乘法,大大降低了計(jì)算次數(shù)。這是因?yàn)樽?LU 分解的復(fù)雜度大約是 n 次,而后注意到 L 和 U 是三角矩陣,所以求它們的行列式只需要將主對(duì)角線上元素相乘即可。
若爾當(dāng)矩陣,其中灰色框內(nèi)的是若爾當(dāng)塊
高斯消去法也是一種矩陣分解方法。通過(guò)初等變換操作,可以將任何矩陣變?yōu)殡A梯形矩陣,而每個(gè)操作可以看做是將矩陣乘上一個(gè)特定的初等矩陣 。奇異值分解則是另一種分解方法,將一個(gè)矩陣表示成3個(gè)矩陣的乘積: A = {\displaystyle =} UDV 。其中 U 和 V 是酉矩陣, D 是對(duì)角矩陣。
特征分解是將一個(gè)矩陣 A 寫(xiě)成 PDP 的形式,其中 P 是一個(gè)可逆矩陣, D 是對(duì)角矩陣 。如果 A 的特征分解存在,就稱(chēng)它是可對(duì)角化的矩陣。不能對(duì)角化的矩陣,也有類(lèi)似的分解方式。任意的矩陣 A 都可以寫(xiě)成 PJP 的形式,其中的矩陣 J 是若爾當(dāng)標(biāo)準(zhǔn)型。若爾當(dāng)標(biāo)準(zhǔn)型是矩陣的一種,它與對(duì)角矩陣類(lèi)似,只不過(guò)主對(duì)角線上的元素不是數(shù)值,而是若爾當(dāng)塊:主對(duì)角線上為同一元素 λ λ --> i {\displaystyle \lambda _{i}} ,主對(duì)角線右上一行的次對(duì)角線上都是1,其它元素都是0的矩陣(見(jiàn)右圖) 。特征分解可以方便計(jì)算矩陣的冪次和多項(xiàng)式,如要計(jì)算 A :
而其中對(duì)角矩陣的冪次 D 要比 A 容易計(jì)算得多。同理還可計(jì)算矩陣指數(shù): e (在線性微分方程中有應(yīng)用)、矩陣對(duì)數(shù)和矩陣的平方根 。為了提高算法的數(shù)值穩(wěn)定性,還有舒爾分解等矩陣分解方法 。
矩陣的推廣
矩陣的元素除了可以是實(shí)數(shù)和復(fù)數(shù)以外,也可以任意環(huán)或域中元素。在線性代數(shù)中,矩陣的性質(zhì)可以經(jīng)由有限維的線性空間中的線性變換定義。更廣泛的,無(wú)限維空間中的線性算子,則可以定義更廣泛的無(wú)窮維矩陣。矩陣的另一種推廣是張量。標(biāo)量可以看成零維方式排列的數(shù)據(jù)(只有一個(gè)“點(diǎn)”),向量可以看成是一維方式排列的數(shù)據(jù)(若干個(gè)“點(diǎn)”排成的“線段”),矩陣可以看成是二維方式排列的數(shù)據(jù)(若干個(gè)“線段”排成的“矩形”),而張量的概念則包括了這幾種排列方式。在張量的概念中,標(biāo)量是零維張量,向量是一維張量,矩陣是二維張量,而更高維方式排列的數(shù)據(jù)方式就是高維張量 。
一般域和環(huán)上的矩陣
矩陣的元素除了可以是實(shí)數(shù)和復(fù)數(shù)以外,還可以是任何能夠使得矩陣的運(yùn)算律成立的元素。首先,矩陣的元素可以是任意一個(gè)域(即能夠進(jìn)行“加減乘除”運(yùn)算的集合)中元素。例如編碼理論中會(huì)出現(xiàn)系數(shù)為有限域中元素的矩陣,以及有理數(shù)系數(shù)的矩陣。如果矩陣的系數(shù)所在域 K 不是代數(shù)閉域,那么在求矩陣的特征值時(shí),由于特征值是相應(yīng)的特征多項(xiàng)式的根,可能不在系數(shù)域 K 中,而是在系數(shù)域的某個(gè)擴(kuò)域 L 中。反過(guò)來(lái),如果考慮擴(kuò)域 L/K ,以及 L 中的一個(gè)元素 α α --> {\displaystyle \alpha } ,以及 L 中線性變換 m α α --> : x ? ? --> α α --> x {\displaystyle m_{\alpha }:\,x\mapsto \alpha x} ,那么由于 m α α --> {\displaystyle m_{\alpha }} 也是一個(gè) K -線性變換,它可以表示成一個(gè) n × n 的 K 系數(shù)矩陣 X α α --> {\displaystyle X_{\alpha }} ,其中的 n 是擴(kuò)域 L/K 的階數(shù)。 α α --> {\displaystyle \alpha } 是這個(gè)矩陣的特征值,這個(gè)矩陣的特征多項(xiàng)式 p X α α --> {\displaystyle p_{X_{\alpha }}} 是 α α --> {\displaystyle \alpha } 在 K 中的最小多項(xiàng)式 min K ? ? --> ( α α --> ) {\displaystyle \operatorname {min} _{\mathbf {K} }(\alpha )} 的冪次:
更一般的情況是矩陣的元素屬于某個(gè)環(huán) R 。環(huán)是比域更廣泛的概念,只要求其中元素能夠進(jìn)行加減法和乘法運(yùn)算(不一定能定義除法)。給定一個(gè)環(huán) R , M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbf {R} )} 中的矩陣之間可以相互加減以及相乘,所以 M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbf {R} )} 關(guān)于矩陣的加法和乘法也構(gòu)成一個(gè)環(huán),稱(chēng)為矩陣環(huán)。 n 維方陣的環(huán) M ( n , R ) {\displaystyle {\mathcal {M}}(n,\mathbf {R} )} 與左 R -模 R 的自同態(tài)環(huán)同構(gòu) 。
若 R 是交換環(huán),則 M ( m , R ) {\displaystyle {\mathcal {M}}(m,\mathbf {R} )} 是一個(gè)帶單位元的 R -代數(shù),滿足結(jié)合律,但不滿換律。其中的矩陣仍然可以用萊布尼茲公式定義行列式。一個(gè)矩陣可逆當(dāng)且僅當(dāng)其行列式為環(huán) R 中的可逆元(域上的矩陣可逆只需行列式不等于0) 。
矩陣與線性變換
前面已經(jīng)提到,所有 R → R 的線性變換都對(duì)應(yīng)著一個(gè) M ( m , n , R ) {\displaystyle {\mathcal {M}}(m,n,\mathbf {R} )} 中的矩陣。更一般地,給定了基底后,任意兩個(gè)有限維線性空間之間的線性映射 f : V → W 也對(duì)應(yīng)著一個(gè)矩陣 A f = ( a ij )。設(shè)空間 V 和 W 的基底分別是 v 1 , ..., v n 和 w 1 , ..., w m ,那么
矩陣 A f 實(shí)際上“記錄”了 V 中每個(gè)基底向量經(jīng)過(guò)變換后得到的 W 中的像在基底( w 1 , ..., w m )下的形式。要注意矩陣的內(nèi)容取決于基底的選擇??梢哉f(shuō),矩陣是線性變換 f 在特定“角度”(基底)下的“素描”。不同的“角度”下,描述 f 的矩陣是不同的,但這些矩陣都是相似矩陣 。與矩陣有關(guān)的基本概念都可以用線性變換的層面來(lái)解釋?zhuān)热缫粋€(gè)矩陣的轉(zhuǎn)置可以用 f 的對(duì)偶變換 f : W → V 來(lái)表示 。
當(dāng)矩陣的元素是帶單位元的環(huán) R 中的元素時(shí), m × n 的 R -矩陣對(duì)應(yīng)的則是 R -自由模 R 和 R 之間的 R -線性變換。 n = m 的時(shí)候,這些 R -線性變換可以相互復(fù)合,因此 n 維的 R -矩陣環(huán)能夠與 R -自同態(tài)環(huán) R 同構(gòu)。
矩陣群
群是比環(huán)更寬泛的代數(shù)結(jié)構(gòu),只需要集合配備一個(gè)滿足結(jié)合律的二元運(yùn)算,即將兩個(gè)群內(nèi)元素映射到群內(nèi)一元素的運(yùn)算。矩陣群是指矩陣關(guān)于矩陣乘法組成的群 。顯然,只有方塊矩陣才能構(gòu)成乘法群。所有 n 維的可逆方陣構(gòu)成一個(gè)群,稱(chēng)為 n 階一般線性群。由于群內(nèi)每個(gè)元素都必須是可逆的,任意的矩陣群都必然是一般線性群的子群。
能夠在矩陣乘法和求逆矩陣運(yùn)算下保持的性質(zhì)都可以用來(lái)刻畫(huà)一定的矩陣群。例如所有行列式為1的矩陣可以構(gòu)成一個(gè)群,稱(chēng)為 n 階特殊線性群 。所有 n 維的正交矩陣,即滿足:
的矩陣 M 也構(gòu)成一個(gè)群,稱(chēng)為 n 階正交群 。正交矩陣得名于它在 R 中對(duì)應(yīng)的線性變換具有保角性,也就是說(shuō)對(duì)基本的點(diǎn)積,滿足
每個(gè)有限群都同構(gòu)于一個(gè)矩陣群。實(shí)際上,每個(gè)有限群都同構(gòu)于某個(gè)置換群的子群,而每個(gè)置換群都同構(gòu)于一個(gè)矩陣群(見(jiàn)置換群的正則群表示 )鑒于矩陣群的性質(zhì)可以通過(guò)與矩陣相關(guān)的更多手段更好地理解,常常通過(guò)研究矩陣群來(lái)研究一個(gè)有限群。相關(guān)的理論稱(chēng)為群表示論。
無(wú)限維矩陣
無(wú)窮維矩陣可以指行數(shù)或列數(shù)無(wú)窮大,或兩者都是無(wú)窮大的矩陣 。盡管這樣的矩陣無(wú)法完整寫(xiě)出,但只要知道每行每列的元素的值,仍然可以對(duì)它進(jìn)行矩陣操作和運(yùn)算。這里矩陣的行數(shù)和列數(shù)甚至不一定需要是可數(shù)集。需要注意的是,無(wú)窮維矩陣的乘法涉及到無(wú)窮級(jí)數(shù)求和,因此只有在相關(guān)的無(wú)窮級(jí)數(shù)收斂的時(shí)候,才能定義矩陣的乘積 。無(wú)限維矩陣也可以是方塊矩陣,定義為行標(biāo)記集合與列標(biāo)記集合相同的矩陣(如 N × × --> N {\displaystyle \mathbb {N} \times \mathbb {N} } ) 。
無(wú)限矩陣無(wú)法定義通常意義上的行列式,因此可逆矩陣不一定是方塊矩陣,同理,酉矩陣也不一定要是方塊矩陣 。
空矩陣
空矩陣是指行數(shù)或列數(shù)為零的矩陣??站仃嚨亩x可以完善一些關(guān)于零維空間的約定。包括約定一個(gè)矩陣與空矩陣相乘得到的也是空矩陣,兩個(gè) n ×0和0× p 的空矩陣相乘是一個(gè) n × p 的零矩陣(所有元素都是零的矩陣)。0×0的空矩陣的行列式約定為1,所以它也可以有逆矩陣,約定為它自己 。
分塊矩陣
分塊矩陣 是指一個(gè)大矩陣分割成“矩陣的矩陣”。舉例,以下的矩陣
可分割成4個(gè)2×2的矩陣
應(yīng)用
矩陣在許多領(lǐng)域都應(yīng)用廣泛。有些時(shí)候用到矩陣是因?yàn)槠浔磉_(dá)方式緊湊,例如在博弈論和經(jīng)濟(jì)學(xué)中,會(huì)用收益矩陣來(lái)表示兩個(gè)博弈對(duì)象在各種決策方式下的收益 。文本挖掘和索引典匯編的時(shí)候,比如在TF-IDF方法中,也會(huì)用到文件項(xiàng)矩陣來(lái)追蹤特定詞匯在多個(gè)文件中的出現(xiàn)頻率 。
復(fù)數(shù)可以用實(shí)系數(shù)的2×2矩陣表示:
這種表示法與復(fù)數(shù)的加減法、乘法都相兼容。比如,2×2的旋轉(zhuǎn)矩陣可以用來(lái)表示模長(zhǎng)為1的復(fù)數(shù),一個(gè)向量乘以此旋轉(zhuǎn)矩陣可以視作一個(gè)復(fù)數(shù)乘以該模長(zhǎng)為1的復(fù)數(shù)。對(duì)四元數(shù)也有類(lèi)似的矩陣表達(dá) 。
早期的密碼技術(shù)如希爾密碼也用到矩陣。然而,矩陣的線性性質(zhì)使這類(lèi)密碼相對(duì)容易破解 。計(jì)算機(jī)圖像處理也會(huì)用到矩陣來(lái)表示處理對(duì)象,并且用放射旋轉(zhuǎn)矩陣來(lái)計(jì)算對(duì)象的變換,實(shí)現(xiàn)三維對(duì)象在特定二維屏幕上的投影 。多項(xiàng)式環(huán)上的矩陣在控制論中有重要作用。
化學(xué)中也有矩陣的應(yīng)用,特別在使用量子理論討論分子鍵和光譜的時(shí)候。具體例子有解羅特漢方程時(shí)用重疊矩陣和??戮仃噥?lái)得到哈特里-福克方法中的分子軌道。
圖論
一個(gè)無(wú)向圖的鄰接矩陣 [ 1 1 0 1 0 1 0 1 0 ] {\displaystyle {\begin{bmatrix}1&1&0\\1&0&1\\0&1&0\end{bmatrix}}} 。
圖論中可以用矩陣描述一個(gè)有限圖 。這個(gè)矩陣叫做相關(guān)矩陣的鄰接矩陣,記錄了圖的每?jī)蓚€(gè)頂點(diǎn)之間是否有邊連接。對(duì)簡(jiǎn)單圖來(lái)說(shuō),鄰接矩陣的元素只取兩個(gè)值:0和1,第 i 行第 j 列上取值為0,表示沒(méi)有從第 i 個(gè)頂點(diǎn)連到第 j 個(gè)頂點(diǎn)的邊,取值為1則說(shuō)明有。如果是一般情況的話,第 i 行第 j 列上的取值是從第 i 個(gè)頂點(diǎn)連到第 j 個(gè)頂點(diǎn)的邊的數(shù)目。距離矩陣則是表示圖中各頂點(diǎn)之間距離的矩陣 。在研究互聯(lián)網(wǎng)等復(fù)雜網(wǎng)絡(luò)的時(shí)候,鄰接矩陣常常會(huì)是稀疏矩陣。因此網(wǎng)絡(luò)理論中有專(zhuān)門(mén)研究稀疏矩陣的方面。
數(shù)學(xué)分析
在多元函數(shù)微積分學(xué)中,對(duì)二階偏導(dǎo)數(shù)存在的函數(shù) f : R → R ,可以定義其海森矩陣 :
n=2時(shí),海森矩陣 [ 2 0 0 ? ? --> 2 ] {\displaystyle {\begin{bmatrix}2&0\\0&-2\end{bmatrix}}} 的特征值一正一負(fù),說(shuō)明函數(shù) f ( x , y ) = x ? y 在 ( x = 0, y = 0)處有一個(gè)鞍點(diǎn)(紅色點(diǎn))
嚴(yán)格來(lái)說(shuō),僅當(dāng)函數(shù)在某一點(diǎn)上的二階偏導(dǎo)數(shù)存在,才能定義這一點(diǎn)上的海森矩陣。海森矩陣給出了函數(shù)在這一點(diǎn)的變化率方面的信息。當(dāng)給定的點(diǎn) x = ( x 1 , ..., x n )是函數(shù)平穩(wěn)點(diǎn)(即函數(shù) f 在這一點(diǎn)上的一階偏導(dǎo)數(shù) ? ? --> f ? ? --> x i {\displaystyle \scriptstyle {\frac {\partial f}{\partial x_{i}}}} 都是0)時(shí),就需要利用海森矩陣來(lái)查看函數(shù)在這一點(diǎn)周?chē)脑鲩L(zhǎng)特性。多元函數(shù)在點(diǎn)泰勒x 的泰勒展開(kāi)是:
如果函數(shù)在點(diǎn) x 的一階偏導(dǎo)數(shù)都是0,那么 ? ? --> f = 0 {\displaystyle \nabla f=0} ,所以函數(shù)在 x 附近的變化于海決于海森矩陣 H ( f ) ( x ) {\displaystyle H(f)(x)} 的性質(zhì)。如果 H ( f ) ( x ) {\displaystyle H(f)(x)} 是正定矩陣,那么函數(shù)在點(diǎn) x 取得局部最小值,如果是負(fù)定矩陣,則函數(shù)在 x 取得局部最大值。在這類(lèi)情況下,關(guān)于函數(shù) f 的條件最優(yōu)化問(wèn)題可以轉(zhuǎn)變?yōu)殛P(guān)于海森二次規(guī)劃次規(guī)劃問(wèn)題 。
矩陣在多元函數(shù)微積分中的另一個(gè)應(yīng)用是雅可比矩陣。函數(shù) f : R → R 在某一點(diǎn) x 上的一階偏導(dǎo)數(shù)存在時(shí),可以定義它在這點(diǎn)上的雅可比矩陣 :
偏微分方程理論中,二階擬線性偏微分方程可以根據(jù)最高次偏導(dǎo)項(xiàng)系數(shù)構(gòu)成的矩陣的正定性分類(lèi)。假設(shè)有一個(gè)二階擬線性偏微分方程:
記矩陣 A = [ a i j ] 1 ? ? --> i , j ? ? --> n {\displaystyle \mathbf {A} =\left[a_{ij}\right]_{1\leqslant i,j\leqslant n}} 。如果矩陣 A 是正定或負(fù)定矩陣,那么就稱(chēng)方程( E )為橢圓形偏微分方程;如果 A 不可逆,就稱(chēng)( E )為拋物形偏微分方程,如果 A 可逆而且恰有 n - 1個(gè)特征值同號(hào),就稱(chēng)( E )為雙曲型偏微分方程。其它情況下也稱(chēng)( E )為超雙曲形偏微分方程。不同類(lèi)型的方程解的形式也不一樣 。
用數(shù)值方法解偏微分方程時(shí)更需要用到矩陣。一個(gè)重要的方法是有限元方法,在求解各種物理中遇到的偏微分方程時(shí)廣泛使用。有限元方法的基本思想是用一系列“簡(jiǎn)單”函數(shù)的線性組合來(lái)“逼近”偏微分方程的精確解。這些“簡(jiǎn)單”函數(shù)通常是指將求解區(qū)域分割成一定數(shù)量的“小塊”后,僅在某一“小塊”上非零的分段線性函數(shù)。選定了網(wǎng)格和“簡(jiǎn)單”函數(shù)后,可以求解關(guān)于剛度矩陣的方程得到近似解。有限元理論中證明了在滿足一定的條件下,近似解將隨著網(wǎng)格趨于精細(xì)而弱收斂到精確解 。
概率論與統(tǒng)計(jì)
概率論中常用到隨機(jī)矩陣,即行向量是概率向量(即所有的元素都在0和1之間,并且加起來(lái)等于1的向量)的矩陣。隨機(jī)矩陣可用來(lái)定義有限概率空間中的馬爾可夫鏈。設(shè)隨機(jī)變量 X n {\displaystyle X_{n}} 是某個(gè)馬爾可夫鏈在 t = n {\displaystyle t=n} 時(shí)刻的狀態(tài),所有可能的狀態(tài) S = { s 1 , s 2 , ? ? --> , s m } {\displaystyle S=\left\{s_{1},s_{2},\cdots ,s_{m}\right\}} 稱(chēng)為狀態(tài)空間,那么隨機(jī)矩陣 M n n + 1 {\displaystyle M_{n}^{n+1}} 則記錄了假設(shè)已知 X n {\displaystyle X_{n}} 的可能情況下 X n + 1 {\displaystyle X_{n+1}} 做各種取值的可能性 。 M n n + 1 {\displaystyle M_{n}^{n+1}} 的第 i 行第 j 列上的元素表示當(dāng) X n = s j {\displaystyle X_{n}=s_{j}} 的時(shí)候, X n + 1 = s i {\displaystyle X_{n+1}=s_{i}} 的可能性。 M n n + 1 {\displaystyle M_{n}^{n+1}} 的第 j 行記錄了從 X n = s j {\displaystyle X_{n}=s_{j}} 轉(zhuǎn)移到 X n + 1 {\displaystyle X_{n+1}} 各種狀態(tài)的可能性。所以 M n n + 1 {\displaystyle M_{n}^{n+1}} 叫做 t = n {\displaystyle t=n} 時(shí)刻的轉(zhuǎn)移矩陣。如果馬爾可夫鏈的轉(zhuǎn)移矩陣不隨時(shí)刻變化,則稱(chēng)為齊次馬爾可夫鏈。這時(shí)馬爾可夫鏈的吸引態(tài)可以通過(guò)計(jì)算轉(zhuǎn)移矩陣的特征向量得到 。
統(tǒng)計(jì)學(xué)中也會(huì)用到各種不同的矩陣。描述統(tǒng)計(jì)學(xué)中常常需要用矩陣的形式來(lái)描述數(shù)據(jù)樣本,顯得更為緊湊。幾個(gè)隨機(jī)變量的協(xié)方差矩陣表示它們之間的協(xié)方差關(guān)系,在某種程度上表示了它們相互間的關(guān)聯(lián)程度(但不絕對(duì)) 。
統(tǒng)計(jì)學(xué)中用到矩陣的另一個(gè)地方是線性回歸中的最小二乘法分析。當(dāng)觀測(cè)到隨機(jī)樣本 ( Y i , X i 1 , … … --> , X i p ) , i = 1 , … … --> , n {\displaystyle (Y_{i},X_{i1},\ldots ,X_{ip}),\,i=1,\ldots ,n} 時(shí),線性回歸法的目標(biāo)是希望找到以下的線性關(guān)系:
即將變量 Y 表示成 X 的分量的線性組合與一個(gè)已知的隨機(jī)誤差的和。這個(gè)表示可以寫(xiě)成矩陣的形式,并利用矩陣的奇異值分解來(lái)分析 。
另一種隨機(jī)矩陣( random matrix )是指每個(gè)元素都是隨機(jī)變量的矩陣,這些隨機(jī)變量可以都遵循同一個(gè)分布,或各自遵循不同的分布。一個(gè)常見(jiàn)的例子是全部元素都是相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量的隨機(jī)矩陣。這種隨機(jī)矩陣在數(shù)論和物理中也有應(yīng)用 。
物理學(xué)上的對(duì)稱(chēng)性及線性變換
更多資料:對(duì)稱(chēng)性 (物理學(xué))
線性變換及其所對(duì)應(yīng)的對(duì)稱(chēng),在現(xiàn)代物理學(xué)中有著重要的角色。例如,在量子場(chǎng)論中,基本粒子是由狹義相對(duì)論的洛倫茲群所表示,具體來(lái)說(shuō),即它們?cè)谛咳合碌谋憩F(xiàn)。內(nèi)含泡利矩陣及更通用的狄拉克矩陣的具體表示,在費(fèi)米子的物理描述中,是一項(xiàng)不可或缺的構(gòu)成部分,而費(fèi)米子的表現(xiàn)可以用旋量來(lái)表述 。描述最輕的三種夸克時(shí),需要用到一種內(nèi)含特殊酉群SU(3)的群論表示;物理學(xué)家在計(jì)算時(shí)會(huì)用一種更簡(jiǎn)便的矩陣表示,叫蓋爾曼矩陣,這種矩陣也被用作SU(3)規(guī)范群,而強(qiáng)核力的現(xiàn)代描述──量子色動(dòng)力學(xué)的基礎(chǔ)正是SU(3)。還有卡比博-小林-益川矩陣(CKM矩陣):在弱相互作用中重要的基本夸克態(tài),與指定粒子間不同質(zhì)量的夸克態(tài)不一樣,但兩者卻是成線性關(guān)系,而CKM矩陣所表達(dá)的就是這一點(diǎn) 。
量子態(tài)的線性組合
1925年海森堡提出第一個(gè)量子力學(xué)模型時(shí),使用了無(wú)限維矩陣來(lái)表示理論中作用在量子態(tài)上的算子 。這種做法在矩陣力學(xué)中也能見(jiàn)到。例如密度矩陣就是用來(lái)刻畫(huà)量子系統(tǒng)中“純”量子態(tài)的線性組合表示的“混合”量子態(tài) 。
另一種矩陣是用來(lái)描述構(gòu)成實(shí)驗(yàn)粒子物理基石的散射實(shí)驗(yàn)的重要工具。當(dāng)粒子在加速器中發(fā)生碰撞,原本沒(méi)有相互作用的粒子在高速運(yùn)動(dòng)中進(jìn)入其它粒子的作用區(qū),動(dòng)量改變,形成一系列新的粒子。這種碰撞可以解釋為結(jié)果粒子狀態(tài)和入射粒子狀態(tài)線性組合的標(biāo)量積。其中的線性組合可以表達(dá)為一個(gè)矩陣,稱(chēng)為S矩陣,其中記錄了所有可能的粒子間相互作用 。
簡(jiǎn)正模式
矩陣在物理學(xué)中的另一類(lèi)泛應(yīng)用是描述線性耦合調(diào)和系統(tǒng)。這類(lèi)系統(tǒng)的運(yùn)動(dòng)方程可以用矩陣的形式來(lái)表示,即用一個(gè)質(zhì)量矩陣乘以一個(gè)廣義速度來(lái)給出運(yùn)動(dòng)項(xiàng),用力矩陣乘以位移向量來(lái)刻畫(huà)相互作用。求系統(tǒng)的解的最優(yōu)方法是將矩陣的特征向量求出(通過(guò)對(duì)角化等方式),稱(chēng)為系統(tǒng)的簡(jiǎn)正模式。這種求解方式在研究分子內(nèi)部動(dòng)力學(xué)模式時(shí)十分重要:系統(tǒng)內(nèi)部由化學(xué)鍵結(jié)合的原子的振動(dòng)可以表示成簡(jiǎn)正振動(dòng)模式的疊加 。描述力學(xué)振動(dòng)或電路振蕩時(shí),也需要使用簡(jiǎn)正模式求解 。
幾何光學(xué)
在幾何光學(xué)里,可以找到很多需要用到矩陣的地方。幾何光學(xué)是一種忽略了光波波動(dòng)性的近似理論,這理論的模型將光線視為幾何射線。采用近軸近似,假若光線與光軸之間的夾角很小,則透鏡或反射元件對(duì)于光線的作用,可以表達(dá)為2×2矩陣與向量的乘積。這向量的兩個(gè)分量是光線的幾何性質(zhì)(光線的斜率、光線跟光軸之間在 主平面 ( 英語(yǔ) : principal plane ) 的垂直距離)。這矩陣稱(chēng)為光線傳輸矩陣,內(nèi)中元素編碼了光學(xué)元件的性質(zhì)。對(duì)于折射,這矩陣又細(xì)分為兩種:“折射矩陣”與“平移矩陣”。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個(gè)主平面?zhèn)鞑サ搅硪粋€(gè)主平面的平移行為。
由一系列透鏡或反射元件組成的光學(xué)系統(tǒng),可以很簡(jiǎn)單地以對(duì)應(yīng)的矩陣組合來(lái)描述其光線傳播路徑。
電子學(xué)
在電子學(xué)里,傳統(tǒng)的 網(wǎng)目分析 ( 英語(yǔ) : mesh analysis ) 或節(jié)點(diǎn)分析會(huì)獲得一個(gè)線性方程組,這可以以矩陣來(lái)表示與計(jì)算。
很多種電子元件的電路行為可以用矩陣來(lái)描述。設(shè)定 A {\displaystyle A} 為輸入向量,其兩個(gè)分量為輸入電壓 v 1 {\displaystyle v_{1}} 與輸入電流 i 1 {\displaystyle i_{1}} 。設(shè)定 B {\displaystyle B} 為輸出向量,其兩個(gè)分量為輸出電壓 v 2 {\displaystyle v_{2}} 與輸出電流 i 2 {\displaystyle i_{2}} 。這電子元件的電路行為可以描述為 B = H ? ? --> A {\displaystyle B=H\cdot A} ;其中, H {\displaystyle H} 是2×2矩陣,內(nèi)阻抗個(gè)阻抗元素 h 12 {\displaystyle h_{12}} 、一個(gè)導(dǎo)納元素 h 21 {\displaystyle h_{21}} 、兩個(gè)無(wú)量綱元素 h 11 {\displaystyle h_{11}} 與 h 22 {\displaystyle h_{22}} 。這樣,電路的計(jì)算可以約化為矩陣計(jì)算。
參見(jiàn)
矩陣論專(zhuān)有名詞表:有關(guān)矩陣論所用到的名詞的定義
方塊矩陣
矩陣范數(shù)
雅可比矩陣
注釋與參考
腳注
參考文獻(xiàn)
Arnold, Vladimir I.; Cooke, Roger, Ordinary differential equations, Berlin, DE; New York, NY: Springer-Verlag, 1992, ISBN 978-3-540-54813-3
Artin, Michael, Algebra, Prentice Hall, 1991, ISBN 978-0-89871-510-1
Association for Computing Machinery, Computer Graphics, Tata McGraw–Hill, 1979, ISBN 978-0-07-059376-3
Baker, Andrew J., Matrix Groups: An Introduction to Lie Group Theory, Berlin, DE; New York, NY: Springer-Verlag, 2003, ISBN 978-1-85233-470-3
Bau III, David; Trefethen, Lloyd N., Numerical linear algebra, Philadelphia, PA: Society for Industrial and Applied Mathematics, 1997, ISBN 978-0-89871-361-9
Bretscher, Otto, Linear Algebra with Applications 3rd, Prentice Hall, 2005
王萼芳, 高等代數(shù)教程 第1版, 清華大學(xué)出版社, 1997, ISBN 9787302024521
Bronson, Richard, Schaum"s outline of theory and problems of matrix operations, New York: McGraw–Hill, 1989, ISBN 978-0-07-007978-6
Brown, William A., Matrices and vector spaces, New York, NY: M. Dekker, 1991, ISBN 978-0-8247-8419-5
Coburn, Nathaniel, Vector and tensor analysis, New York, NY: Macmillan, 1955, OCLC 1029828
Conrey, J. Brian, Ranks of elliptic curves and random matrix theory, Cambridge University Press, 2007, ISBN 978-0-521-69964-8
Fudenberg, Drew; Tirole, Jean, Game Theory, MIT Press, 1983
Gilbarg, David; Trudinger, Neil S., Elliptic partial differential equations of second order 2nd, Berlin, DE; New York, NY: Springer-Verlag, 2001, ISBN 978-3-540-41160-4
Godsil, Chris; Royle, Gordon, Algebraic Graph Theory, Graduate Texts in Mathematics 207 , Berlin, DE; New York, NY: Springer-Verlag, 2004, ISBN 978-0-387-95220-8
Golub, Gene H.; Van Loan, Charles F., Matrix Computations 3rd, Johns Hopkins, 1996, ISBN 978-0-8018-5414-9
Greub, Werner Hildbert, Linear algebra, Graduate Texts in Mathematics, Berlin, DE; New York, NY: Springer-Verlag, 1975, ISBN 978-0-387-90110-7
Guenther, Robert D., Modern Optics, John Wiley, 1990, ISBN 0-471-60538-7
Halmos, Paul Richard, A Hilbert space problem book, Graduate Texts in Mathematics 19 2nd, Berlin, DE; New York, NY: Springer-Verlag, 1982, ISBN 978-0-387-90685-0, MR 675952
Horn, Roger A.; Johnson, Charles R., Matrix Analysis, Cambridge University Press, 1985, ISBN 978-0-521-38632-6
Householder, Alston S., The theory of matrices in numerical analysis, New York, NY: Dover Publications, 1975, MR 0378371
Krzanowski, Wojtek J., Principles of multivariate analysis, Oxford Statistical Science Series 3 , The Clarendon Press Oxford University Press, 1988, ISBN 978-0-19-852211-9, MR 969370
It?, Kiyosi (編), Encyclopedic dictionary of mathematics. Vol. I-IV 2nd, MIT Press, 1987, ISBN 978-0-262-09026-1, MR 901762
Ash, Robert B.,A Course In Algebraic Number Theory (PDF) , Dept. of Mathematics, University of Illinois
Lang, Serge, Analysis II, Addison-Wesley, 1969
Lang, Serge, Calculus of several variables 3rd, Berlin, DE; New York, NY: Springer-Verlag, 1987a, ISBN 978-0-387-96405-8
Lang, Serge, Linear algebra, Berlin, DE; New York, NY: Springer-Verlag, 1987b, ISBN 978-0-387-96412-6
Latouche, Guy; Ramaswami, Vaidyanathan, Introduction to matrix analytic methods in stochastic modeling t, Philadelphia, PA: Society for Industrial and Applied Mathematics, 1999, ISBN 978-0-89871-425-8
Manning, Christopher D.; Schütze, Hinrich, Foundations of statistical natural language processing, MIT Press, 1999, ISBN 978-0-262-13360-9
Mehata, K. M.; Srinivasan, S. K., Stochastic processes, New York, NY: McGraw–Hill, 1978, ISBN 978-0-07-096612-3
Mirsky, Leonid,An Introduction to Linear Algebra, Courier Dover Publications, 1990, ISBN 978-0-486-66434-7
Nocedal, Jorge; Wright, Stephen J., Numerical Optimization 2nd, Berlin, DE; New York, NY: Springer-Verlag: 449, 2006, ISBN 978-0-387-30303-1
Bohm, Arno, Quantum Mechanics: Foundations and Applications, Springer, 2001, ISBN 0-387-95330-2
Burgess, Cliff; Moore, Guy, The Standard Model. A Primer, Cambridge University Press, 2007, ISBN 0-521-86036-9
Guenther, Robert D., Modern Optics, John Wiley, 1990, ISBN 0-471-60538-7
Itzykson, Claude; Zuber, Jean-Bernard, Quantum Field Theory, McGraw–Hill, 1980, ISBN 0-07-032071-3
Riley, Kenneth F.; Hobson, Michael P.; Bence, Stephen J., Mathematical methods for physics and engineering, Cambridge University Press, 1997, ISBN 0-521-55506-X
Schiff, Leonard I., Quantum Mechanics 3rd, McGraw–Hill, 1968
Weinberg, Steven, The Quantum Theory of Fields. Volume I: Foundations, Cambridge University Press, 1995, ISBN 0-521-55001-7
Wherrett, Brian S., Group Theory for Atoms, Molecules and Solids, Prentice–Hall International, 1987, ISBN 0-13-365461-3
Zabrodin, Anton; Brezin, édouard; Kazakov, Vladimir; Serban, Didina; Wiegmann, Paul, Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry), Berlin, DE; New York, NY: Springer-Verlag, 2006, ISBN 978-1-4020-4530-1
林志興; 楊忠鵬, 與給定矩陣A的可交換子環(huán)C(A)的一些探討, 莆田學(xué)院學(xué)報(bào),2010年, 17(2), 2010
Oualline, Steve, Practical C++ programming, O"Reilly, 2003, ISBN 978-0-596-00419-4
Press, William H.; Flannery, Brian P.; Teukolsky, Saul A.; Vetterling, William T., LU Decomposition and Its Applications,Numerical Recipes in FORTRAN: The Art of Scientific Computing (PDF) 2nd, Cambridge University Press: 34–42, 1992
Punnen, Abraham P.; Gutin, Gregory, The traveling salesman problem and its variations, Boston, MA: Kluwer Academic Publishers, 2002, ISBN 978-1-4020-0664-7
Reichl, Linda E., The transition to chaos: conservative classical systems and quantum manifestations, Berlin, DE; New York, NY: Springer-Verlag, 2004, ISBN 978-0-387-98788-0
Rowen, Louis Halle, Graduate Algebra: noncommutative view, Providence, RI: American Mathematical Society, 2008, ISBN 978-0-8218-4153-2
?olin, Pavel, Partial Differential Equations and the Finite Element Method, Wiley-Interscience, 2005, ISBN 978-0-471-76409-0
Stinson, Douglas R., Cryptography, Discrete Mathematics and its Applications, Chapman & Hall/CRC, 2005, ISBN 978-1-58488-508-5
Stoer, Josef; Bulirsch, Roland, Introduction to Numerical Analysis 3rd, Berlin, DE; New York, NY: Springer-Verlag, 2002, ISBN 978-0-387-95452-3
Ward, J. P., Quaternions and Cayley numbers, Mathematics and its Applications 403 , Dordrecht, NL: Kluwer Academic Publishers Group, 1997, ISBN 978-0-7923-4513-8, MR 1458894
(中文) 居余馬; 林翠琴, 線性代數(shù), 清華大學(xué)出版社, 2002, ISBN 978-7-302-06507-4
(中文) 克萊因, 莫里斯; 著,張理京、張錦炎、江澤涵譯, 《古今數(shù)學(xué)思想》第三卷, 上??茖W(xué)技術(shù)出版社, 2002, ISBN 7-5323-6172-1
Wolfram, Stephen, The Mathematica Book 5th, Champaign, IL: Wolfram Media, 2003, ISBN 978-1-57955-022-6
Thankappan, V. K., Quantum Mechanics 2nd, New Age International, 1993, ISBN 9788122405262
Faliva, Mario; Zoia, Maria Grazia, Dynamic Model Analysis: Advanced Matrix Methods and Unit-Root Econometrics Representation Theorems 2nd, Berlin, DE; New York, NY: Springer-Verlag: 218, 2008, ISBN 9783540859956
伊澤爾萊斯, 劉曉艷,劉學(xué)深譯, 微分方程數(shù)值分析基礎(chǔ)教程, 清華大學(xué)出版社, 2005, ISBN 9787302106524
董可榮, 矩陣?yán)碚摰臍v史研究, 《山東大學(xué)》, 2007
B?cher, Maxime, Introduction to higher algebra, New York, NY: Dover Publications, 2004, ISBN 978-0-486-49570-5
Cayley, Arthur,The collected mathematical papers of Arthur Cayley, I (1841–1853), Cambridge University Press: 123–126, 1889
Dieudonné, Jean (編), Abrégé d"histoire des mathématiques 1700-1900, Paris, FR: Hermann, 1978
Hawkins, Thomas, Cauchy and the spectral theory of matrices, Historia Mathematica, 1975, 2 : 1–29, ISSN 0315-0860 , MR 0469635 , doi:10.1016/0315-0860(75)90032-4
Knobloch, Eberhard, From Gauss to Weierstrass: determinant theory and its historical evaluations, The intersection of history and mathematics, Science Networks Historical Studies 15 , Basel, Boston, Berlin: Birkh?user: 51–66, 1994, MR 1308079
Kronecker, Leopold, Hensel, Kurt, 編,Leopold Kronecker"s Werke, Teubner, 1897
Mehra, Jagdish; Rechenberg, Helmut, The Historical Development of Quantum Theory t, Berlin, DE; New York, NY: Springer-Verlag, 1987, ISBN 978-0-387-96284-9
Shen, Kangshen; Crossley, John N.; Lun, Anthony Wah-Cheung, Nine Chapters of the Mathematical Art, Companion and Commentary 2nd, Oxford University Press, 1999, ISBN 978-0-19-853936-0
Weierstrass, Karl,Collected works 3 , 1915
MacTutor: Matrices and determinants
Matrices and Linear Algebra on the Earliest Uses Pages
Earliest Uses of Symbols for Matrices and Vectors
Kaw, Autar K.,Introduction to Matrix Algebra, ISBN 978-0-615-25126-4
The Matrix Cookbook (PDF) , [ 2014-93-24 ]
Brookes, Mike,The Matrix Reference Manual, London: Imperial College, 2005 [ 2008-12-10 ]
SimplyMath (Matrix Calculator)
Matrix Calculator (DotNumerics)
Xiao, Gang,Matrix calculator, [ 2008-12-10 ]
Online matrix calculator, [ 2008-12-10 ]
Online matrix calculator (ZK framework), [ 2009-11-26 ]
Oehlert, Gary W.; Bingham, Christopher,MacAnova,University of Minnesota, School of Statistics, [ 2008-12-10 ] , a freeware package for matrix algebra and statistics
Online matrix calculator, [ 2009-12-14 ]
Operation with matrices in R (determinant, track, inverse, adjoint, transpose)
免責(zé)聲明:以上內(nèi)容版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。感謝每一位辛勤著寫(xiě)的作者,感謝每一位的分享。
相關(guān)資料
- 有價(jià)值
- 一般般
- 沒(méi)價(jià)值
{{item.userName}} 舉報(bào)
{{item.time}} {{item.replyListShow ? '收起' : '展開(kāi)'}}評(píng)論 {{curReplyId == item.id ? '取消回復(fù)' : '回復(fù)'}}
{{_reply.userName}} 舉報(bào)
{{_reply.time}}