楊衍婷
(咸陽(yáng)師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西咸陽(yáng) 712000)
近年來(lái),伴隨著計(jì)算機(jī)和信息科學(xué)的飛速發(fā)展,矩陣分析理論的應(yīng)用日益廣泛,而矩陣求導(dǎo)是矩陣分析理論中的重要問(wèn)題,特別是常見(jiàn)的數(shù)量函數(shù)對(duì)矩陣變量的求導(dǎo)問(wèn)題,在研究?jī)?yōu)化等問(wèn)題時(shí)起到關(guān)鍵作用。文獻(xiàn)[1-4]討論了矩陣求導(dǎo)的一些方法。在文獻(xiàn)[4]的基礎(chǔ)上,具體分析了利用矩陣微分的性質(zhì)以及微分和導(dǎo)數(shù)的關(guān)系求數(shù)量函數(shù)對(duì)矩陣變量的導(dǎo)數(shù),與按照矩陣導(dǎo)數(shù)的定義求導(dǎo)相比較,運(yùn)算更加簡(jiǎn)單,可操作性更強(qiáng)。
定義1設(shè)f(X)是以矩陣X=(xij)m×n為自變量的元mn函數(shù),且
定義2設(shè)矩陣F(X)=(fij(X))s×t的元素fij(X)(i=1,2,…,s;j=1,2,…,t)都是矩陣變量X=(xij)m×n的函數(shù),規(guī)定F(X)對(duì)矩陣變量X的導(dǎo)數(shù)為
由于矩陣可以拉伸成向量,即若
X=(xij)m×n,則
在文獻(xiàn)[4]中,矩陣值函數(shù)的微分定義是將函數(shù)矩陣和自變量矩陣?yán)鞛橄蛄俊?/p>
定義3設(shè)矩陣值函數(shù)f(X)=(fij(X))s×t,
以向量X=(ξ1,ξ2,…,ξn)T為自變量,f可微,則
當(dāng)函數(shù)自變量為矩陣時(shí),繼續(xù)采用文獻(xiàn)[4]中的方法,將自變量矩陣?yán)鞛橄蛄?,而?dāng)函數(shù)值為矩陣時(shí),采用定義3,函數(shù)矩陣各個(gè)分量元素分別微分,而不將其拉伸為向量,便于數(shù)量函數(shù)對(duì)矩陣變量求導(dǎo)計(jì)算。
根據(jù)矩陣微分的定義,若是U,V矩陣值函數(shù),A是常量矩陣,則
基于文獻(xiàn)[4],按照定義3,總結(jié)出以下結(jié)論。
命題1設(shè)矩陣A=(aij)m×n,n維列向量X=(ξ1,ξ2,…,ξn)T,微分df=AdX,則
從而根據(jù)定義2可得。
命題2矩陣A=(aij)m×n,X=(xij)m×n,若微分
常用的以矩陣作為自變量的數(shù)量函數(shù)主要有3種:(1)二次函數(shù);(2)跡函數(shù);(3)行列式函數(shù)。為了對(duì)這3 種數(shù)量函數(shù)關(guān)于矩陣變量求導(dǎo),給出以下命題。
命題3F是非奇異矩陣函數(shù),則微分
證明 根據(jù)
可得dF-1=-F-1(dF)F-1。
命題4是非奇異矩陣函數(shù),則微分,
其中,|F|是F的行列式。
證明參閱文獻(xiàn)[4],根據(jù)定義1,定義3可得。
例1設(shè)列向量x∈Rn,若A∈Rn×n,則
分析總結(jié)了利用矩陣微分的性質(zhì)以及矩陣微分和導(dǎo)數(shù)的關(guān)系求數(shù)量函數(shù)對(duì)矩陣變量的導(dǎo)數(shù),大大簡(jiǎn)化了按照矩陣定義求導(dǎo)的過(guò)程,降低了矩陣求導(dǎo)的難度,并且使得矩陣求導(dǎo)具有了較強(qiáng)的可操作性。