謝啟鴻
(復旦大學 數學科學學院,上海200433)
矩陣或線性變換的可對角化判定是高等代數的重要知識點. 由于判定準則多, 技巧性強, 故可對角化判定一直是教學和考試中的難點(參考[1]的例4和例5). 一般來說, 判定n維復線性空間V上的線性變換φ或n階復矩陣A可對角化, 通常有以下六種方法(參考[2]的第六章和第七章以及[3]的第6.2.2節(jié)和第7.2.3節(jié)):
(D1)φ可對角化的充要條件是φ有n個線性無關的特征向量;
(D2) 若φ有n個不同的特征值, 則φ可對角化;
(D3)φ可對角化的充要條件是V是φ的特征子空間的直和;
(D4)φ可對角化的充要條件是φ有完全的特征向量系, 即對φ的任一特征值, 其幾何重數等于其代數重數;
(D5)φ可對角化的充要條件是φ的極小多項式無重根;
(D6)φ可對角化的充要條件是φ的Jordan塊都是一階的, 或等價地,φ的初等因子都是一次多項式.
在內積空間的框架下, 可以證明復正規(guī)陣可酉對角化以及實對稱陣可正交對角化,因此可以自然地問: 能否利用可對角化的判定準則直接證明復正規(guī)陣可對角化以及實對稱陣可實對角化呢? 通過探索發(fā)現, 現有的判定準則(D1)-(D6)很難實現這一目標. 因此, 本文的主要目的即是給出可對角化的其他判定準則(E1)-(E9)(定理1), 并且作為應用, 給出復正規(guī)陣可對角化以及實對稱陣可實對角化的直接證明(推論3和推論4).
以下總是以線性變換作為對象來闡述和證明結論, 其對應的矩陣版本, 留給讀者自己補充完整. 首先, 我們來證明一個具有良好性質的線性變換的大型引理.
引理1設V是數域上的n維線性空間,φ是V上的線性變換, 則以下九個結論等價:
(i)V=Kerφ⊕Imφ;
(ii)V=Kerφ+Imφ;
(iii) Kerφ∩Imφ=0;
(iv) Kerφ=Kerφ2, 或等價地, dimKerφ=dimKerφ2;
(v) Kerφ=Kerφ2=Kerφ3=…,或等價地, dimKerφ=dimKerφ2=dimKerφ3=…;
(vi) Imφ=Imφ2, 或等價地, r(φ)=r(φ2);
(vii) Imφ=Imφ2=Imφ3=…, 或等價地, r(φ)=r(φ2)=r(φ3)=…;
(viii) Kerφ存在φ-不變補空間, 即存在φ-不變子空間U, 使得V=Kerφ⊕U;
(ix) Imφ存在φ-不變補空間, 即存在φ-不變子空間W, 使得V=Imφ⊕W.
證由直和的定義可知(i)?(ii)+(iii), 于是(i)?(ii)和(i)?(iii)都是顯然的. 根據交和空間維數公式和線性映射維數公式可知
dim(Kerφ+Imφ)=dimKerφ+dimImφ-dim(Kerφ∩Imφ)
=dimV-dim(Kerφ∩Imφ),
于是(ii)?(iii)成立, 從而前三個結論兩兩等價.
(iii)?(iv) 顯然Kerφ?Kerφ2成立. 任取α∈Kerφ2, 則
φ(α)∈Kerφ∩Imφ=0,
于是φ(α)=0, 即α∈Kerφ, 從而Kerφ2?Kerφ也成立, 于是(iv)成立.
(iv)?(iii) 任取α∈Kerφ∩Imφ, 則存在β∈V, 使得α=φ(β), 于是
0=φ(α)=φ2(β),
即β∈Kerφ2=Kerφ, 從而α=φ(β)=0, 即(iii)成立.
(v)?(iv) 顯然成立.
(iv)?(v) 設Kerφk=Kerφk+1已對正整數k成立, 先證Kerφk+1=Kerφk+2也成立, 然后用歸納法即得結論. Kerφk+1?Kerφk+2是顯然的. 任取α∈Kerφk+2, 即
0=φk+2(α)=φk+1(φ(α)),
于是φ(α)∈Kerφk+1=Kerφk, 從而φk+1(α)=φk(φ(α))=0, 即α∈Kerφk+1, 于是Kerφk+2?Kerφk+1也成立.
(iii)?(vi) 考慮φ在不變子空間Imφ上的限制變換φ|Imφ∶Imφ→Imφ, 由限制的定義可知它的核等于Kerφ∩Imφ, 它的像等于Imφ2. 由于有限維線性空間上的線性變換是單射當且僅當它是滿射, 當且僅當它是同構, 故(iii)?(vi)成立.
(vii)?(vi) 顯然成立.
(vi)?(vii) 設Imφk=Imφk+1已對正整數k成立, 先證Imφk+1=Imφk+2也成立, 然后用歸納法即得結論. Imφk+2?Imφk+1是顯然的. 任取α∈Imφk+1, 即存在β∈V, 使得α=φk+1(β). 由于φk(β)∈Imφk=Imφk+1, 故存在γ∈V, 使得φk(β)=φk+1(γ), 于是
α=φk+1(β)=φ(φk(β))=φ(φk+1(γ))=φk+2(γ)∈Imφk+2,
從而Imφk+1?Imφk+2也成立.
(i)?(viii) 顯然成立.
(viii)?(i) 先證Imφ?U: 任取φ(v)∈Imφ, 由直和分解可設v=v1+u, 其中v1∈Kerφ,u∈U, 則由U的φ-不變性可得
φ(v)=φ(v1)+φ(u)=φ(u)∈U.
考慮不等式
dimV=dim(Kerφ⊕U)=dimKerφ+dimU≥dimKerφ+dimImφ=dimV,
從而只能是U=Imφ, 于是(i)成立.
(i)?(ix) 顯然成立.
(ix)?(i) 先證W?Kerφ: 任取w∈W, 則由W的φ-不變性可得φ(w)∈Imφ∩W=0, 即有w∈Kerφ. 考慮不等式
dimV=dim(Imφ⊕W)=dimImφ+dimW≤dimImφ+dimKerφ=dimV,
從而只能是W=Kerφ, 于是(i)成立.
有了引理1做鋪墊, 可以證明一系列的可對角化判定準則.
定理1設φ是n維復線性空間V上的線性變換, 則φ可對角化的充要條件是對φ的任一特征值λ0, 下列條件之一成立:
(E1)V=Ker(φ-λ0IV)⊕Im(φ-λ0IV);
(E2)V=Ker(φ-λ0IV)+Im(φ-λ0IV);
(E3) Ker(φ-λ0IV)∩Im(φ-λ0IV)=0;
(E4) Ker(φ-λ0IV)=Ker(φ-λ0IV)2, 或等價地, dimKer(φ-λ0IV)=dimKer(φ-λ0IV)2;
(E5) Ker(φ-λ0IV)=Ker(φ-λ0IV)2=Ker(φ-λ0IV)3=…, 或等價地, dimKer(φ-λ0IV)=dimKer(φ-λ0IV)2=dimKer(φ-λ0IV)3=…;
(E6) Im(φ-λ0IV)=Im(φ-λ0IV)2, 或等價地, r(φ-λ0IV)=r((φ-λ0IV)2);
(E7) Im(φ-λ0IV)=Im(φ-λ0IV)2=Im(φ-λ0IV)3=…, 或等價地, r(φ-λ0IV)=r((φ-λ0IV)2)=r((φ-λ0IV)3)=…;
(E8) Ker(φ-λ0IV)存在φ-不變補空間, 即存在φ-不變子空間U, 使得V=Ker(φ-λ0IV)⊕U;
(E9) Im(φ-λ0IV)存在φ-不變補空間, 即存在φ-不變子空間W, 使得V=Im(φ-λ0IV)⊕W.
證由引理1可知, 無論是充分性還是必要性, 只要選取(E1)-(E9)中的一個等價條件來證明即可.
必要性 設φ可對角化, 即存在V的一組基{e1,e2,…,en}, 使得φ在這組基下的表示矩陣為對角陣diag{λ1,λ2,…,λn}, 不妨設λ1=…=λr=λ0,λj≠λ0(r Ker(φ-λ0IV)=L(e1,…,er), Im(φ-λ0IV)=L(er+1,…,en), 于是(E1)成立. 充分性 對應于不同的等價條件, 給出幾種不同的證法. 從(E3)出發(fā): 用反證法, 設φ不可對角化, 則由(D6)可知, 存在V的一組基 {e1,e2,…,en}, 使得φ在這組基下的表示矩陣為Jordan標準形 diag{Jr1(λ1),Jr2(λ2),…,Jrk(λk)}, 且至少有一個Jordan塊的階數大于1. 不妨設r1>1, 則由表示矩陣的定義可知 φ(e1)=λ1e1,φ(e2)=e1+λ1e2. 于是(φ-λ1IV)e1=0, (φ-λ1IV)e2=e1, 從而 0≠e1∈Ker(φ-λ1IV)∩Im(φ-λ1IV), 這與已知矛盾. 從(E5)出發(fā): 由Ker(φ-λ0IV)=…=Ker(φ-λ0IV)n可知,λ0的根子空間等于其特征子空間. 因為全空間V可以分解為根子空間的直和, 故全空間V也是特征子空間的直和, 從而由判定準則(D3)即得結論. 從(E5)出發(fā): 由dimKer(φ-λ0IV)=…=dimKer(φ-λ0IV)n可知,λ0的幾何重數dimKer(φ-λ0IV)等于其代數重數dimKer(φ-λ0IV)n, 從而由判定準則(D4)即得結論. 從(E5)出發(fā): 設φ的全體不同特征值為λ1,λ2,…,λk,φ的特征多項式為 f(λ)=(λ-λ1)m1(λ-λ2)m2…(λ-λk)mk, 則對任意的α∈V, 由Cayley-Hamilton定理可知 (φ-λ1IV)m1(φ-λ2IV)m2…(φ-λkIV)mk(α)=0, 即(φ-λ2IV)m2…(φ-λkIV)mk(α)∈Ker(φ-λ1IV)m1=Ker(φ-λ1IV), 從而 (φ-λ1IV)(φ-λ2IV)m2…(φ-λkIV)mk(α)=0. 不斷這樣做下去, 最終可得對任意的α∈V, 總有 (φ-λ1IV)(φ-λ2IV)…(φ-λkIV)(α)=0, 即φ適合多項式g(λ)=(λ-λ1)(λ-λ2)…(λ-λk), 從而由極小多項式的性質可知m(λ)|g(λ). 又由特征值的性質可知g(λ)|m(λ), 于是m(λ)=g(λ)無重根, 從而由判定準則(D5)即得結論. 從(E6)出發(fā): 用反證法, 設φ不可對角化, 則由(D6)可知,φ的Jordan標準形 J=diag{Jr1(λ1),Jr2(λ2),…,Jrk(λk)} 中至少有一個Jordan塊的階數大于1. 不妨設r1>1, 則有r(Jr1(λ1)-λ1Ir1)=r1-1,而r((Jr1(λ1)-λ1Ir1)2)=r1-2. 由矩陣秩的基本不等式可知, r(J-λ1In)>r((J-λ1In)2), 即有r(φ-λ1IV)>r((φ-λ1IV)2), 這與已知矛盾. 推論1設φ是n維復線性空間V上的線性變換, 則φ可對角化的充要條件是V的任一φ-不變子空間都存在φ-不變補空間, 即對任一φ-不變子空間U, 都存在φ-不變子空間W, 使得V=U⊕W. 證充分性可由定理1的(E8)或(E9)得到. 再證必要性, 因為φ可對角化, 故由(D1)可知, 存在V的一組基{e1,e2,…,en}, 它們都是φ的特征向量. 由[2]的推論7.6.3可知,φ在不變子空間U上的限制φ|U也可對角化, 故同理存在U的一組基{α1,…,αr}, 它們也都是φ的特征向量. 由[2]的定理3.5.4(基擴張定理)的證明可知, 可從{e1,e2,…,en}中取出n-r個向量, 不妨設為er+1,…,en, 使得{α1,…,αr,er+1,…,en}成為V的一組新基. 令W=L(er+1,…,en), 則W是φ-不變子空間且滿足V=U⊕W. 推論2設φ是數域上n維線性空間V上的線性變換(或A是數域上的n階方陣), 并且φ(或A)的所有特征值都在中, 則φ(或A)可對角化的判定準則(D1)-(D6)以及(E1)-(E9)在數域上也成立. 證與復數域上的證明完全類似, 具體細節(jié)留給讀者自己完成. 注1 定理1中的(E3)和(E6)分別是[3]的例7.13和例7.14, 推論1是[3]的例7.15. 將不利用酉相似標準形理論和正交相似標準形理論, 而利用定理1直接證明復正規(guī)陣可對角化以及實對稱陣可實對角化這兩個重要結論. 證這是[3]的例3.72的復版本, 其證明完全類似. 結論得證. 引理4設A為n階復正規(guī)陣,λ0是A的特征值, 則A-λ0In也是復正規(guī)陣. 證由復正規(guī)陣的定義驗證即得. 推論3復正規(guī)陣可對角化. 特別地, 實對稱陣、實反對稱陣、Hermite陣、斜Hermite陣、正交陣、酉陣均可復對角化. 證由引理4, 引理3以及定理1的(E6)即得結論. 引理5實對稱陣的特征值全為實數. 證設A為n階實對稱陣,λ0∈是A的任一特征值,α=(a1,a2,…,an)′∈n是對應的特征向量, 即Aα=λ0α.上式兩邊同時左乘則有注意到α是非零向量, 故注意到A為實對稱陣, 故的共軛轉置等于它自己, 從而是一個實數, 于是也是實數. 推論4實對稱陣在實數域上可對角化. 證1設A為實對稱陣, 由[3]的例3.72可得r(A)=r(A2). 再由引理5可知,A的特征值全為實數, 于是根據推論2可得A在實數域上可對角化. 證2由推論3可知實對稱陣可復對角化, 又其特征值全為實數, 故實對稱陣復相似于實對角陣. 再由[2]的推論7.3.4(相似關系在基域擴張下的不變性)或[4]的定理1可知, 實對稱陣可實對角化. 將推論3和推論4合并起來, 可補充如下的可對角化判定準則: (D7) 若復方陣相似于復正規(guī)陣, 則可對角化; 若實方陣實相似于實對稱陣, 則可實對角化. 先給出一個相似于復正規(guī)陣的例子. 證設P為非異陣, 使得P-1AP=Λ為對角陣. 考慮相似變換 再給出一個相似于實對稱陣的例子. 例2設a,b,c為實數且bc>0, 證明下列三對角矩陣可實對角化: 因為T(0,1,1)是實對稱陣, 故由判定準則(D7)可知T(a,b,c)可實對角化. 本文給出的矩陣或線性變換可對角化的其他判定準則(E1)-(E9)更側重于可對角化性質在幾何層面上的理解, 由此給出了復正規(guī)陣可對角化以及實對稱陣可實對角化的直接證明, 這些都是通常的可對角化判定準則(D1)-(D6)及其應用的有益補充. 致謝在本文的修改過程中, 得到了審稿人中肯的意見和建議, 在此表示衷心的感謝!3 應 用
4 結 論