白雪一,郭炳暉,李佳輝,鄭志明
(北京航空航天大學(xué) a.數(shù)學(xué)、信息與行為教育部重點(diǎn)實(shí)驗(yàn)室; b.大數(shù)據(jù)科學(xué)與腦機(jī)智能高精尖創(chuàng)新中心,北京 100191)
1969年用于研究基因調(diào)控網(wǎng)絡(luò)的隨機(jī)布爾網(wǎng)絡(luò)模型被提出[1-2],其利用布爾邏輯和簡單的“0”“1”二值構(gòu)建基因網(wǎng)絡(luò)的抽象模型,用布爾函數(shù)來描述基因之間的促進(jìn)或抑制關(guān)系。1990年,隨著“人類基因組計(jì)劃”的正式啟動(dòng),系統(tǒng)生物學(xué)的時(shí)代正式到來,利用布爾網(wǎng)絡(luò)在分子水平上研究基因和基因調(diào)控網(wǎng)絡(luò),對(duì)于探索生命的遺傳秘密、推進(jìn)人類的疾病診斷和治療都具有重大的意義。
隨機(jī)布爾網(wǎng)絡(luò)能夠很好地反映基因網(wǎng)絡(luò)運(yùn)行過程中的復(fù)雜動(dòng)態(tài)行為[3],特別是基因間的控制關(guān)系。基因調(diào)控網(wǎng)絡(luò)的可控性[4]是對(duì)基因可能出現(xiàn)的表達(dá)形態(tài)的一種狀態(tài)可達(dá)屬性,布爾網(wǎng)絡(luò)的可控性是將基因調(diào)控網(wǎng)絡(luò)中基因作用通過布爾函數(shù)描述后,根據(jù)是否滿足Kalman可控性秩條件[5]確定最小驅(qū)動(dòng)節(jié)點(diǎn)集,進(jìn)而確定控制基因的模型化表示。
在布爾網(wǎng)絡(luò)的可控性方面,目前已經(jīng)有較多研究成果。例如:文獻(xiàn)[6]定義了線性時(shí)變控制系統(tǒng)的結(jié)構(gòu)可控性概念;文獻(xiàn)[7]將經(jīng)典的結(jié)構(gòu)可控性理論運(yùn)用到有向網(wǎng)絡(luò)的可控性研究中,提出了搜索最小驅(qū)動(dòng)節(jié)點(diǎn)集的方法;文獻(xiàn)[8]提出了矩陣半張量積方法用于研究布爾網(wǎng)絡(luò)可控性;文獻(xiàn)[9]研究了控制網(wǎng)絡(luò)的能量需求及能量范圍的上下限;文獻(xiàn)[10]提出了精確可控性框架;文獻(xiàn)[11]研究表明,在一定條件下,無標(biāo)度網(wǎng)絡(luò)的實(shí)際控制能量服從冪律分布,且與目標(biāo)狀態(tài)選擇的不確定性有關(guān);文獻(xiàn)[12]提出了最長控制鏈理論?,F(xiàn)有對(duì)于布爾網(wǎng)絡(luò)的控制研究,基本是從布爾網(wǎng)絡(luò)動(dòng)力學(xué)過程角度出發(fā),通過改變節(jié)點(diǎn)狀態(tài),同時(shí)觀察動(dòng)力學(xué)傳播過程中節(jié)點(diǎn)狀態(tài)的改變對(duì)整個(gè)網(wǎng)絡(luò)狀態(tài)的影響,以及計(jì)算網(wǎng)絡(luò)的魯棒性等方法進(jìn)行的。
本文將布爾網(wǎng)絡(luò)的結(jié)構(gòu)及動(dòng)力學(xué)過程相結(jié)合研究布爾網(wǎng)絡(luò)的控制問題,主要研究對(duì)象是一個(gè)由6個(gè)基因節(jié)點(diǎn)構(gòu)成的實(shí)際基因調(diào)控網(wǎng)絡(luò),其中每個(gè)節(jié)點(diǎn)的狀態(tài)由固定的布爾函數(shù)決定。由于布爾函數(shù)由邏輯表達(dá)式構(gòu)成,當(dāng)節(jié)點(diǎn)的狀態(tài)取不同值時(shí),網(wǎng)絡(luò)的控制信號(hào)在傳遞路徑上就會(huì)有所不同,因此本文分別分析基因網(wǎng)絡(luò)結(jié)構(gòu)不同時(shí)達(dá)到結(jié)構(gòu)可控性的最小驅(qū)動(dòng)節(jié)點(diǎn)集,并從控制能量最少的角度研究其最長控制鏈(Longest Control Chain,LCC)。
本文研究的基因網(wǎng)絡(luò)包含6個(gè)節(jié)點(diǎn):CyclinD1(節(jié)點(diǎn)1),CyclinE(節(jié)點(diǎn)2),E2F1(節(jié)點(diǎn)3),Myc(節(jié)點(diǎn)4),p27Kip1(節(jié)點(diǎn)5),RB(節(jié)點(diǎn)6)[13]。
CyclinD1是一個(gè)由人類CCND1基因所編碼的蛋白質(zhì),其基因?qū)儆诟叨缺J氐募?xì)胞周期家族,該家族在整個(gè)細(xì)胞周期中蛋白豐度具有周期性變化的特點(diǎn);CyclinE節(jié)點(diǎn)表示活性細(xì)胞周期蛋白復(fù)合物;E2F1是細(xì)胞內(nèi)重要的轉(zhuǎn)錄因子,對(duì)細(xì)胞的增殖、分化和凋亡都發(fā)揮著關(guān)鍵性的作用;Myc基因家族及其產(chǎn)物可促進(jìn)細(xì)胞增殖,在多種腫瘤形成過程中處于重要地位;p27Kipl蛋白為細(xì)胞周期素依賴性蛋白激酶抑制因子(CDKI),在調(diào)控細(xì)胞周期中具有十分重要的作用;RB是一種腫瘤抑制基因,是最早發(fā)現(xiàn)的抑癌基因。
在文獻(xiàn)[13]研究中,這6個(gè)基因之間的相互關(guān)系是已知的。在沒有活性細(xì)胞周期蛋白CyclinD1的情況下,Myc和E2F1都會(huì)促進(jìn)CyclinD1的生成。相反地,當(dāng)細(xì)胞周期蛋白CyclinD1已經(jīng)存在時(shí),Myc或者E2F1都可以維持高于閾值的細(xì)胞周期蛋白Cyclin D1的量。當(dāng)不存在RB(阻斷其轉(zhuǎn)錄)和p27Kip1(阻斷其活性)且E2F1轉(zhuǎn)錄時(shí),CyclinE處于激活狀態(tài)。在沒有RB的情況下,活化的E2F1或Myc可以誘導(dǎo)E2F1轉(zhuǎn)錄。當(dāng)RB存在時(shí),E2F1無效。E2F1能激活Myc轉(zhuǎn)錄。CyclinD1或CyclinE可抑制p27Kip1的活性。RB在沒有細(xì)胞周期蛋白Cyclin D1,并且當(dāng)存在活性p27Kip1或沒有活性細(xì)胞周期蛋白復(fù)合物CyclinE的情況下是活躍的?;诖?該基因網(wǎng)絡(luò)各節(jié)點(diǎn)的布爾函數(shù)如表1所示。
表1 各節(jié)點(diǎn)的布爾函數(shù)
本文做的所有實(shí)驗(yàn)都是基于上述網(wǎng)絡(luò)進(jìn)行的,基因網(wǎng)絡(luò)及其基本結(jié)構(gòu)如圖1所示。
網(wǎng)絡(luò)的結(jié)構(gòu)一般是不會(huì)發(fā)生變化的,本文討論的網(wǎng)絡(luò)結(jié)構(gòu)變化是在網(wǎng)絡(luò)信息傳遞的角度下進(jìn)行的,如果信息無法從一個(gè)節(jié)點(diǎn)沿著邊傳遞到另一個(gè)節(jié)點(diǎn),則認(rèn)為這條邊在這種情況下無法傳遞信息,在整個(gè)網(wǎng)絡(luò)中,無法傳遞信息的邊可以視為不存在的。
邊無法傳遞信息,一般是由于布爾函數(shù)是一個(gè)渠化函數(shù)[14],即一個(gè)節(jié)點(diǎn)的布爾函數(shù)的取值完全由一個(gè)鄰居節(jié)點(diǎn)的狀態(tài)決定,其他鄰居節(jié)點(diǎn)的狀態(tài)對(duì)布爾函數(shù)的取值完全沒有影響。在這種情況下,沒有影響的鄰居節(jié)點(diǎn)與該節(jié)點(diǎn)之間的邊無法傳遞鄰居節(jié)點(diǎn)對(duì)該節(jié)點(diǎn)的影響。
假設(shè)布爾網(wǎng)絡(luò)中存在如圖1(b)所示的結(jié)構(gòu),且節(jié)點(diǎn)0的布爾函數(shù)為f(x1,x2)=x1ANDx2,則節(jié)點(diǎn)0的真值表如表2所示。
表2 節(jié)點(diǎn)0真值表
由表2可見:當(dāng)x1、x2的取值中存在0時(shí),f(x1,x2)的取值為0;當(dāng)x1取值為0時(shí),無論x2的取值是多少,f(x1,x2)的取值都為0,即此時(shí)x2的取值無法影響到f(x1,x2)的取值。從能量傳遞的角度分析,節(jié)點(diǎn)2上所攜帶的能量無法傳到節(jié)點(diǎn)0上,在能量傳遞上,節(jié)點(diǎn)0和節(jié)點(diǎn)2之間的邊相當(dāng)于不存在。同理,當(dāng)節(jié)點(diǎn)2的取值為0時(shí),節(jié)點(diǎn)1與節(jié)點(diǎn)0之間的連邊從能量傳遞的角度而言是不存在的。
基于上述規(guī)則,在某些網(wǎng)絡(luò)狀態(tài)下布爾網(wǎng)絡(luò)的某些邊可以忽略不計(jì),因此,布爾網(wǎng)絡(luò)的結(jié)構(gòu)就發(fā)生了變化。
根據(jù)控制理論,如果一個(gè)系統(tǒng)在適當(dāng)?shù)妮斎霔l件下,能夠在有限時(shí)間內(nèi)從任意初始狀態(tài)到達(dá)任何期望的最終狀態(tài),則這個(gè)系統(tǒng)是可控的。這個(gè)定義與直觀的控制概念相一致,即通過適當(dāng)?shù)夭倏v幾個(gè)輸入變量將系統(tǒng)的狀態(tài)引導(dǎo)到所需狀態(tài),例如駕駛員通過操縱踏板和方向盤引導(dǎo)汽車以期望的速度向期望的方向移動(dòng)。
文獻(xiàn)[7]將經(jīng)典的控制理論運(yùn)用到解決復(fù)雜網(wǎng)絡(luò)可控性的問題上,建立復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)可控性分析框架,提出一種搜索使網(wǎng)絡(luò)滿足Kalman可控性秩條件的最小驅(qū)動(dòng)節(jié)點(diǎn)集的方法,從理論上證明了網(wǎng)絡(luò)的最大匹配決定了控制整個(gè)網(wǎng)絡(luò)所需的最少控制節(jié)點(diǎn),解決了大型復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)可控性問題。
在圖論中,一個(gè)匹配是網(wǎng)絡(luò)的一個(gè)邊的集合,其中任意2條邊都不相鄰,即沒有公共節(jié)點(diǎn),最大匹配即網(wǎng)絡(luò)中包含邊數(shù)最多的匹配[15]。給定一個(gè)有向網(wǎng)絡(luò),為了找到其最大匹配,需要先將其轉(zhuǎn)換為二分網(wǎng)絡(luò),即將網(wǎng)絡(luò)中的節(jié)點(diǎn)分為2個(gè)互不相交的子集,網(wǎng)絡(luò)中所有的邊都可以由一條二分網(wǎng)絡(luò)中左邊節(jié)點(diǎn)指向右邊節(jié)點(diǎn)的邊表示,同一邊的節(jié)點(diǎn)中不存在連邊。二分網(wǎng)絡(luò)中找最大匹配的經(jīng)典算法是匈牙利算法[15],其核心就是尋找增廣路徑,通過增廣路徑來求二分網(wǎng)絡(luò)的最大匹配。匈牙利算法的具體流程如圖2所示。
圖2 匈牙利算法流程
定義最大匹配中邊指向的節(jié)點(diǎn)為匹配節(jié)點(diǎn),網(wǎng)絡(luò)中除了匹配節(jié)點(diǎn)外都是非匹配節(jié)點(diǎn),而非匹配節(jié)點(diǎn)就是復(fù)雜網(wǎng)絡(luò)通過最大匹配算法找到的最小驅(qū)動(dòng)節(jié)點(diǎn)集。
圖3為網(wǎng)絡(luò)狀態(tài)為[0,0,0,0,0,0]時(shí)基因網(wǎng)絡(luò)的二分圖,以及最大匹配算法找到的驅(qū)動(dòng)節(jié)點(diǎn)集,其中虛線框節(jié)點(diǎn)為驅(qū)動(dòng)節(jié)點(diǎn),虛線的邊為最大匹配。
圖3 基因網(wǎng)絡(luò)的二分圖
最小驅(qū)動(dòng)節(jié)點(diǎn)集旨在用最少的輸入信號(hào)控制整個(gè)網(wǎng)絡(luò),但從能量角度而言,輸入信號(hào)數(shù)量最少并不一定代表著控制網(wǎng)絡(luò)所需的能量是收斂的。文獻(xiàn)[12]提出了一種基于網(wǎng)絡(luò)結(jié)構(gòu)特性解釋網(wǎng)絡(luò)中標(biāo)度行為的理論,即最長控制鏈,并從理論上證明網(wǎng)絡(luò)的最長控制鏈的長度與控制整個(gè)網(wǎng)絡(luò)所需的能量處于同一數(shù)量級(jí),基于此,給出一種切實(shí)減少網(wǎng)絡(luò)控制能量的方法。
在網(wǎng)絡(luò)中,控制能量是從外部信號(hào)通過驅(qū)動(dòng)節(jié)點(diǎn)傳遞到非驅(qū)動(dòng)節(jié)點(diǎn)的,因此,需要先對(duì)網(wǎng)絡(luò)進(jìn)行最大匹配算法,找到網(wǎng)絡(luò)的n個(gè)驅(qū)動(dòng)節(jié)點(diǎn)。根據(jù)最大匹配算法,可以將網(wǎng)絡(luò)分為n個(gè)分支,每個(gè)分支為一個(gè)驅(qū)動(dòng)節(jié)點(diǎn)開始的一維鏈條,可以認(rèn)為控制信號(hào)就是沿著分支進(jìn)行傳遞的。但是在能量傳遞方面,由于節(jié)點(diǎn)之間的耦合,一個(gè)節(jié)點(diǎn)的狀態(tài)變化會(huì)影響到其所有鄰居節(jié)點(diǎn),因此,能量并不只沿著分支傳播,分支之間也可以傳播。基于此,任意非驅(qū)動(dòng)節(jié)點(diǎn)都可以由所有與其之間有路徑的驅(qū)動(dòng)節(jié)點(diǎn)的能量控制,由驅(qū)動(dòng)節(jié)點(diǎn)開始、由非驅(qū)動(dòng)節(jié)點(diǎn)結(jié)束的鏈條稱為控制鏈。
直觀上,控制節(jié)點(diǎn)所需的能量隨著節(jié)點(diǎn)的增加呈指數(shù)級(jí)增長,因此,要控制一個(gè)非驅(qū)動(dòng)節(jié)點(diǎn)所需最少的能量,可以由其最短控制鏈決定。而控制整個(gè)網(wǎng)絡(luò)的能量,即控制網(wǎng)絡(luò)中所有節(jié)點(diǎn)的能量,由控制所有非驅(qū)動(dòng)節(jié)點(diǎn)所需的最大能量決定,即所有非驅(qū)動(dòng)節(jié)點(diǎn)的最短控制鏈中的最長者決定,這就是網(wǎng)絡(luò)的最長控制鏈。網(wǎng)絡(luò)最長控制鏈搜索算法如下:
算法最長控制鏈搜索算法
輸入網(wǎng)絡(luò)G,驅(qū)動(dòng)節(jié)點(diǎn)集,驅(qū)動(dòng)節(jié)點(diǎn)數(shù)n,非驅(qū)動(dòng)節(jié)點(diǎn)集,非驅(qū)動(dòng)節(jié)點(diǎn)數(shù)m
輸出最長控制鏈
for i=1:m
for j=1:n
計(jì)算非驅(qū)動(dòng)節(jié)點(diǎn)i與驅(qū)動(dòng)節(jié)點(diǎn)j之間的最短路徑
將該最短路徑存入變量DL中
End
將變量DL中長度最短的路徑存入變量NDL中
End
輸出NDL中長度最長的路徑,即為最長控制鏈
通過上述算法得到基因網(wǎng)絡(luò)在網(wǎng)絡(luò)狀態(tài)為[0,0,0,0,0,0]時(shí)的最長控制鏈,如圖4所示。其中,最上排3個(gè)基因?yàn)轵?qū)動(dòng)節(jié)點(diǎn),虛線邊即為最長控制鏈,灰色基因?yàn)樽铋L控制鏈終點(diǎn)。
圖4 基因網(wǎng)絡(luò)在網(wǎng)絡(luò)狀態(tài)為[0,0,0,0,0,0]時(shí)的最長控制鏈
本文對(duì)上述基因網(wǎng)絡(luò)所有可能的狀態(tài)都進(jìn)行實(shí)驗(yàn),即對(duì)每一種網(wǎng)絡(luò)狀態(tài),根據(jù)節(jié)點(diǎn)的布爾函數(shù)重構(gòu)其網(wǎng)絡(luò)結(jié)構(gòu),由最大匹配算法發(fā)現(xiàn)驅(qū)動(dòng)節(jié)點(diǎn)集,找到最長控制鏈。其中節(jié)點(diǎn)被選為驅(qū)動(dòng)節(jié)點(diǎn)的頻次分布如圖5所示。從中可以看出:節(jié)點(diǎn)2、節(jié)點(diǎn)3、節(jié)點(diǎn)5被選為驅(qū)動(dòng)節(jié)點(diǎn)的次數(shù)較少,即在進(jìn)行網(wǎng)絡(luò)的最大匹配時(shí),指向這3個(gè)節(jié)點(diǎn)的邊在較多最大匹配中存在;節(jié)點(diǎn)1、節(jié)點(diǎn)4、節(jié)點(diǎn)6被選為驅(qū)動(dòng)節(jié)點(diǎn)的次數(shù)較多,其中節(jié)點(diǎn)6次數(shù)最多,節(jié)點(diǎn)1和節(jié)點(diǎn)4次數(shù)持平,稍少一些,但頻次仍遠(yuǎn)超其他節(jié)點(diǎn)。
圖5 所有網(wǎng)絡(luò)狀態(tài)下節(jié)點(diǎn)被選為驅(qū)動(dòng)節(jié)點(diǎn)的頻次分布
各節(jié)點(diǎn)取值為0和1時(shí),節(jié)點(diǎn)被選為驅(qū)動(dòng)節(jié)點(diǎn)的頻次比較如圖6所示。從中可以看出:當(dāng)節(jié)點(diǎn)1取0時(shí),節(jié)點(diǎn)1和節(jié)點(diǎn)4有更大的概率被選為驅(qū)動(dòng)節(jié)點(diǎn),節(jié)點(diǎn)2、節(jié)點(diǎn)5沒有被選為驅(qū)動(dòng)節(jié)點(diǎn)過;而當(dāng)節(jié)點(diǎn)1取1時(shí),節(jié)點(diǎn)6以較大的概率被選為驅(qū)動(dòng)節(jié)點(diǎn);當(dāng)節(jié)點(diǎn)3的狀態(tài)取0時(shí),節(jié)點(diǎn)3和5沒有被選為驅(qū)動(dòng)節(jié)點(diǎn)過,節(jié)點(diǎn)4被選為驅(qū)動(dòng)節(jié)點(diǎn)的次數(shù)最多;而當(dāng)節(jié)點(diǎn)3狀態(tài)取1時(shí),節(jié)點(diǎn)2和4沒有被選為驅(qū)動(dòng)節(jié)點(diǎn)過,節(jié)點(diǎn)1、節(jié)點(diǎn)5、節(jié)點(diǎn)6被選為驅(qū)動(dòng)節(jié)點(diǎn)的次數(shù)最多且相差不大;每個(gè)節(jié)點(diǎn)被選為驅(qū)動(dòng)節(jié)點(diǎn)的情況在節(jié)點(diǎn)2、節(jié)點(diǎn)4、節(jié)點(diǎn)5、節(jié)點(diǎn)6的狀態(tài)取0或1時(shí)差別不大,只有個(gè)別節(jié)點(diǎn)稍有差別。
圖6 各節(jié)點(diǎn)在不同狀態(tài)取值時(shí)被選為驅(qū)動(dòng)節(jié)點(diǎn)的頻次分布
通過比較可以發(fā)現(xiàn),節(jié)點(diǎn)1、節(jié)點(diǎn)4和節(jié)點(diǎn)6被選為驅(qū)動(dòng)節(jié)點(diǎn)的次數(shù)在任何情況下都是最高的,這與圖5結(jié)果是一致的。因此,從結(jié)構(gòu)可控性的角度出發(fā),可以認(rèn)為節(jié)點(diǎn)1、節(jié)點(diǎn)4、節(jié)點(diǎn)6更適合作為控制信號(hào)輸入的節(jié)點(diǎn)。結(jié)合實(shí)際基于網(wǎng)絡(luò),在多數(shù)狀態(tài)下,控制基因CyclinD1、Myc、RB,基本可以保證網(wǎng)絡(luò)的結(jié)構(gòu)可控性。
所有網(wǎng)絡(luò)狀態(tài)下LCC長度及各節(jié)點(diǎn)成為終點(diǎn)的頻數(shù)分布如圖7所示,其中,None表示網(wǎng)絡(luò)中不存在驅(qū)動(dòng)節(jié)點(diǎn),即網(wǎng)絡(luò)本身為結(jié)構(gòu)可控,inf表示驅(qū)動(dòng)節(jié)點(diǎn)與非驅(qū)動(dòng)節(jié)點(diǎn)間無路徑可以到達(dá),距離為無窮大。
圖7 LLC長度及各節(jié)點(diǎn)成為終點(diǎn)的頻次分布
由圖7(a)可以看出,最長控制鏈的長度為2的情況占大部分。因此,在多數(shù)情況下,控制基因網(wǎng)絡(luò)的能量與控制由3個(gè)節(jié)點(diǎn)組成的鏈?zhǔn)骄W(wǎng)絡(luò)的能量為同一數(shù)量級(jí)。通過分析可知,最長控制鏈的終點(diǎn)是網(wǎng)絡(luò)中最難控制的節(jié)點(diǎn),由最長控制鏈理論可知控制網(wǎng)絡(luò)的能量實(shí)際為控制LCC終點(diǎn)的能量。圖7(b)所示為各個(gè)節(jié)點(diǎn)成為最長控制鏈終點(diǎn)頻次分布,從中可以看出,節(jié)點(diǎn)1、節(jié)點(diǎn)3和節(jié)點(diǎn)6在任何情況下都不是LCC終點(diǎn),而節(jié)點(diǎn)2和節(jié)點(diǎn)5為LCC終點(diǎn)的次數(shù)明顯超過節(jié)點(diǎn)4。在基因網(wǎng)絡(luò)中,基因CyclinE和p27Kip1更難控制。
圖8所示為各節(jié)點(diǎn)在不同狀態(tài)取值時(shí)最長控制鏈長度的頻次統(tǒng)計(jì)。從中可以看出:在節(jié)點(diǎn)1狀態(tài)為0時(shí),最長控制鏈長度為2的頻次不是最高的;在節(jié)點(diǎn)3狀態(tài)為1時(shí),最長控制鏈長度為2和為None的頻次幾乎相等;在其余情況下,長度為2的最長控制鏈頻次都是最高的。節(jié)點(diǎn)1狀態(tài)為1時(shí),最長控制鏈的長度只有2種可能,即1和2;節(jié)點(diǎn)3狀態(tài)為0時(shí),最長控制鏈的長度為2、3、4,即基因E2F1處于抑制狀態(tài)時(shí),控制網(wǎng)絡(luò)所需的能量要高于普通情況。
圖8 各節(jié)點(diǎn)在不同狀態(tài)取值時(shí)的LLC長度頻次分布
通過比較可以發(fā)現(xiàn),網(wǎng)絡(luò)最長控制鏈的長度在各節(jié)點(diǎn)狀態(tài)改變時(shí)變化不是很大,基本長度為2的最長控制鏈的次數(shù)遠(yuǎn)超其他長度出現(xiàn)的次數(shù),由此可以推斷網(wǎng)絡(luò)最長控制鏈的長度即控制網(wǎng)絡(luò)所需的能量與網(wǎng)絡(luò)的狀態(tài)關(guān)系不是很大,主要由網(wǎng)絡(luò)的結(jié)構(gòu)控制。
由于網(wǎng)絡(luò)狀態(tài)的不同,能量傳輸角度上網(wǎng)絡(luò)結(jié)構(gòu)會(huì)發(fā)生變化,筆者對(duì)所有可能的網(wǎng)絡(luò)狀態(tài)的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行研究發(fā)現(xiàn),網(wǎng)絡(luò)的最長控制鏈的長度可能和網(wǎng)絡(luò)的平均聚類系數(shù)、強(qiáng)連通分支數(shù)、平均連通性有關(guān)。圖9和圖10分別展現(xiàn)了最長控制鏈長度與網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)系以及各節(jié)點(diǎn)特征向量中心性。其中,ac表示網(wǎng)絡(luò)的平均聚類系數(shù),nscc表示網(wǎng)絡(luò)的強(qiáng)連通分支數(shù),anc表示網(wǎng)絡(luò)的平均連通性??梢钥闯?隨著最長控制鏈長度的增加,網(wǎng)絡(luò)的平均聚類系數(shù)增加,平均連通性增加,強(qiáng)連通分支數(shù)下降。
圖9 LLC長度與網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)系
圖10 各節(jié)點(diǎn)特征向量中心性
各節(jié)點(diǎn)在不同狀態(tài)取值時(shí)成為最長控制鏈終點(diǎn)的頻次分布如圖11所示。
圖11 各節(jié)點(diǎn)在不同狀態(tài)取值時(shí)成為LLC終點(diǎn)的頻次分布
從圖11可以看出,每個(gè)圖中都是只有節(jié)點(diǎn)2、節(jié)點(diǎn)4和節(jié)點(diǎn)5的數(shù)據(jù),而節(jié)點(diǎn)2和節(jié)點(diǎn)5的頻次普遍高于節(jié)點(diǎn)4的頻次,但節(jié)點(diǎn)3的狀態(tài)為1時(shí),節(jié)點(diǎn)4為LCC終點(diǎn)的頻次高于節(jié)點(diǎn)2和節(jié)點(diǎn)5,即當(dāng)基因E2F1處于激活狀態(tài)時(shí),基因Myc決定者控制網(wǎng)絡(luò)的能量。
結(jié)合驅(qū)動(dòng)節(jié)點(diǎn)的統(tǒng)計(jì)情況可以發(fā)現(xiàn),節(jié)點(diǎn)3以小概率被選為驅(qū)動(dòng)節(jié)點(diǎn),且不會(huì)成為最長控制鏈的終點(diǎn),即節(jié)點(diǎn)3到驅(qū)動(dòng)節(jié)點(diǎn)的最小距離基本上為1。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu),對(duì)比節(jié)點(diǎn)3和節(jié)點(diǎn)2、節(jié)點(diǎn)5,可以發(fā)現(xiàn):在被高概率驅(qū)動(dòng)節(jié)點(diǎn)1、節(jié)點(diǎn)4、節(jié)點(diǎn)6指向方面,節(jié)點(diǎn)3被節(jié)點(diǎn)4和節(jié)點(diǎn)6指向,而節(jié)點(diǎn)2和節(jié)點(diǎn)5分別被節(jié)點(diǎn)6和節(jié)點(diǎn)1指向;節(jié)點(diǎn)4既能以較高的概率被選為驅(qū)動(dòng)節(jié)點(diǎn),又能以一定的概率作為最長控制鏈的終點(diǎn)。實(shí)驗(yàn)數(shù)據(jù)表明,除了網(wǎng)絡(luò)自身結(jié)構(gòu)可控的情況之外,節(jié)點(diǎn)4或者是網(wǎng)絡(luò)的驅(qū)動(dòng)節(jié)點(diǎn),或者是網(wǎng)絡(luò)最長控制鏈的終點(diǎn),這可能是由于節(jié)點(diǎn)4只被節(jié)點(diǎn)3指向,而節(jié)點(diǎn)2和節(jié)點(diǎn)5以高概率作為網(wǎng)絡(luò)最長控制鏈的終點(diǎn),小概率被選為驅(qū)動(dòng)節(jié)點(diǎn),可能與節(jié)點(diǎn)的特性有關(guān)系。對(duì)所有網(wǎng)絡(luò)進(jìn)行研究后發(fā)現(xiàn),這可能與節(jié)點(diǎn)的特征向量中心性有關(guān),如圖10所示,節(jié)點(diǎn)2和節(jié)點(diǎn)5的特征向量中心性均低于其他節(jié)點(diǎn)。
本文針對(duì)人類細(xì)胞周期中的基因調(diào)控網(wǎng)絡(luò),基于節(jié)點(diǎn)的布爾函數(shù),根據(jù)網(wǎng)絡(luò)狀態(tài)對(duì)基因網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行重構(gòu),并利用最大匹配算法和最長控制鏈理論,從結(jié)構(gòu)可控性和控制能量的角度對(duì)其進(jìn)行分析。分析結(jié)果表明:在多數(shù)狀態(tài)下,控制基因CyclinD1、Myc、RB可以保證網(wǎng)絡(luò)的結(jié)構(gòu)可控性;控制基因網(wǎng)絡(luò)的能量與控制由3個(gè)節(jié)點(diǎn)組成的鏈?zhǔn)骄W(wǎng)絡(luò)的能量為同一數(shù)量級(jí);基因CyclinE和p27Kip1較難控制;網(wǎng)絡(luò)的最長控制鏈的長度可能與網(wǎng)絡(luò)的平均聚類系數(shù)、強(qiáng)連通分支數(shù)、平均連通性有關(guān);當(dāng)基因E2F1處于激活狀態(tài)時(shí),基因Myc決定者控制網(wǎng)絡(luò)的能量;節(jié)點(diǎn)作為最長控制鏈的終點(diǎn)的概率可能與節(jié)點(diǎn)的特征向量中心性有關(guān)。
由于本文研究的基因網(wǎng)絡(luò)只有6個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)規(guī)模較小,代表性較弱,網(wǎng)絡(luò)最長控制鏈的長度及終點(diǎn)與網(wǎng)絡(luò)結(jié)構(gòu)的具體關(guān)系并沒有明確找出,因此后續(xù)將對(duì)各種類型的網(wǎng)絡(luò)進(jìn)行研究,從理論上探索網(wǎng)絡(luò)的能量傳輸路徑與網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)系。