陳 亮,馬昌鳳
(福建師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,福建 福州 350117)
考慮如下的非線性矩陣方程組:
(1)
(2)
則方程組 (1) 等價于方程
T+M*T-1M+N*T-1N=I.
(3)
方程組(1)可視為如下方程組的特殊形式, 其中P,Q,R為已知的n階 Hermite 正定矩陣:
(4)
(5)
就得到了形如 (1) 的方程組.
近年來,形如(3)的方程(組)解的存在性及高效數(shù)值算法得到了廣泛的研究.例如, 邢婷等[1]研究了非線性矩陣方程X+ATX-1A=Q, 給出了該方程有正定解的條件.程可欣等[2]提出了非線性矩陣方程X-ATX-1A=Q的一種牛頓迭代法.Erfanifar 等[3]研究了非線性矩陣方程X+A*X-1A=Q,并給出了一種新式無逆迭代法. Huang 和Ma[4]研究了求解矩陣方程組
(6)
正定解的一種保結(jié)構(gòu)加倍算法.Dong、 Yu和Meng[5]給出了非線性矩陣方程組
(7)
的一種動態(tài)參數(shù)化無逆迭代法. Liu等[6]研究了非線性矩陣方程Xs+A*X-tA=Q有Hermite 正定解的條件. Al-Dubiban[7]給出了求解非線性矩陣方程組
(8)
縱觀上述文獻(xiàn)及成果,都是一個或兩個方程, 很少有人研究三個以上方程的情形.筆者將討論含有三個方程的方程組(1)及其等價形式(3).
眾所周知, 求一個矩陣的逆(尤其是大型矩陣)的計(jì)算代價往往是昂貴的. 為了避免這一點(diǎn), 可以用一個矩陣多項(xiàng)式來近似逼近其逆矩陣. 受文獻(xiàn)[11]的啟發(fā), 這里用矩陣多項(xiàng)式f(Y)=2Y-YXY來近似矩陣X-1.具體地, 設(shè)x=X-1,y=Y-1,z=Z-1, 則有
(9)
等號兩邊分別左右同乘x,y,z, 則有
(10)
從而得到了求解方程組(1)的數(shù)值算法.
算法1 (求解方程組(1)的數(shù)值算法)
1) 輸入矩陣A,B,C,D,E,F,初始矩陣x0=y0=z0=I, 誤差≥0,置k=0.
2) 迭代計(jì)算
Uk=I-A*ykA-D*zkD,Vk=I-B*zkB-E*xkE,Wk=I-C*xkC-F*ykF.
xk+1=2xk-xkUkxk,yk+1=2yk-ykVkyk,zk+1=2zk-zkWkzk.
(11)
為便于理論分析, 下面給出方程(3)的數(shù)值算法, 作為輔助算法.
算法2 (求解方程 (3)的數(shù)值算法)
2) 迭代計(jì)算
Sk=I-M*TkM-N*TkN,Tk+1=2Tk-TkSkTk.
(12)
容易看出, 在算法1中,令Sk=diag(Uk,Vk,Wk), 就得到了算法2.
引理1 在算法2的迭代過程中, 矩陣Tk和Sk始終保持形如Tk=diag(xk,yk,zk)和Sk=diag(Uk,Vk,Wk)的塊對角形式.
證明當(dāng)k=0時,T0=I3n顯然成立.S0=I-M*T0M-N*T0N=I-M*M-N*N=diag(I-A*A-D*D,I-B*B-E*E,I-C*C-F*F)也滿足分塊對角形式.假設(shè)結(jié)論對任何k≤m的整數(shù)都成立,即Tm=diag(xm,ym,zm),Sm=diag(Um,Vm,Wm), 則有
Tm+1=2Tm-TmSmTm=2diag(xm,ym,zm)-diag(xm,ym,zm)diag(Um,Vm,Wm)diag(xm,ym,zm)=
diag(2xm-xmUmxm,2ym-ymVmym,2zm-zmWmzm)=diag(xm+1,ym+1,zm+1).
(13)
Sm+1=I-M*Tm+1M-N*Tm+1N=diag(I-A*ym+1A-D*zm+1D,I-B*zm+1B-E*xm+1E,
I-C*xm+1C-F*ym+1F)=diag(Um+1,Vm+1,Wm+1),
(14)
即k=m+1時也成立.由歸納法, 對任何整數(shù)k結(jié)論都成立.
由于
(15)
可得如下結(jié)論.
(16)
這個引理保證了兩個算法的等價性.下面討論算法2的收斂性.
定理1[11]假設(shè)方程(3)存在正定解T,矩陣序列{Tk}由算法2生成,給定初值T0=I, 則T是適定的,且{Tk}單增收斂于T-1.
定理2 設(shè)方程(3)的精確解為T,則有
‖Tk+1-T-1‖≤(1+‖T‖‖T-1‖+‖T-1‖(‖M‖2+‖N2‖))‖Tk-T-1‖.
(17)
‖Sk+1-T‖≤(‖M‖2+‖N‖2)(1+‖T‖‖T-1‖+‖T-1‖(‖M‖2+‖N‖2))‖Tk-T-1‖.
(18)
證明由于
Tk+1-T-1=2Tk-TkSkTk-T-1=2Tk-Tk(I-M*TkM-N*TkN)Tk-T-1=
TkM*(Tk-T-1)MTk+TkN*(Tk-T-1)NTk+2Tk-TkTTk-T-1=
TkM*(Tk-T-1)MTk+TkN*(Tk-T-1)NTk-TkT(Tk-T-1)+(Tk-T-1).
(19)
‖Tk+1-T-1‖≤(1+‖T‖‖T-1‖+‖T-1‖(‖M‖2+‖N‖2)+τ)‖Tk-T-1‖.
(20)
由τ的任意性,第一個不等式得證.注意到
Sk+1-T=(I-M*Tk+1M-N*Tk+1N)-(I-M*T-1M-N*T-1N)=
-M*(Tk+1-T-1)M-N*(Tk+1-T-1)N,
(21)
兩邊取范數(shù),并結(jié)合第一個不等式,就得到了第二個不等式.
由定理2可推出:
‖Tk+1-T-1‖≤(1+‖T‖‖T-1‖+‖T-1‖(‖M‖2+‖N‖2))k‖T0-T-1‖.
(22)
‖Sk+1-T‖≤((‖M‖2+‖N‖2)(1+‖T‖‖T-1‖+
‖T-1‖(‖M‖2+‖N‖2)))k‖T0-T-1‖.
(23)
兩邊開k次方, 并令k→∞,就得到了推論1.
推論1 若算法2收斂, 則有
(24)
(25)
由于兩個算法的等價性, 以及正定矩陣的性質(zhì), 不難推出對于算法1 也有類似的結(jié)論.
定理3 若方程組(1)存在正定解X,Y,Z,{xk},{yk},{zk} 是算法1生成的矩陣序列, 初值x0=y0=z0=I,則X,Y,Z是適定的,且{xk},{yk},{zk}單增收斂于X-1,Y-1,Z-1.
定理4 設(shè)方程組(1)的精確解為X,Y,Z,則有:
(26)
(27)
其中,Ω=‖A‖2+‖B‖2+‖C‖2+‖D‖2+‖E‖2+‖F(xiàn)‖2.
由于算法2將小矩陣合并為大矩陣,勢必增加計(jì)算量,且算法2的系數(shù)矩陣十分稀疏,算法2的效果明顯不如算法1, 故我們只需考慮算法1即可.
例1 令
(28)
則方程組(1)的解為
(29)
算法1的數(shù)值結(jié)果為Iter=8,CPU=0.153 4,Res=5.066 5e-09. 殘差下降如圖 1 所示.
圖1 例1的殘差下降圖
例2 令
(30)
則方程組(1)的解為
(31)
算法1的結(jié)果為Iter=14,CPU=0.165 5,Res=2.407 7e-09.殘差下降如圖2所示.由此可見該算法對復(fù)矩陣也是有效的.
圖2 例2的殘差下降圖
例3 令
(32)
則方程組(1)的解為
(33)
算法1的結(jié)果為Iter=14,CPU=0.244 4,Res=7.346 9e-09.殘差下降如圖3所示.
圖3 例3的殘差下降圖
由例3可以猜想,若A=B=C,D=E=F,并且方程組(1)有解,則必有滿足X=Y=Z的解.
討論了非線性矩陣方程組(1)的正定解問題, 提出了求解其正定解的一種迭代法, 并通過將方程組合并為一個大型矩陣方程的方法, 對該迭代法作出了收斂性分析和誤差估計(jì). 此外,還通過一系列數(shù)值實(shí)驗(yàn)證實(shí)了該算法的有效性. 這個有效性說明, 這一類無逆迭代法很可能適用于更多個方程的方程組情形, 這有待進(jìn)一步討論.