王 恒,紀 紅,李 曦
(北京郵電大學泛網(wǎng)無線通信教育部重點實驗室,北京 100876)
近年來,中繼協(xié)作技術發(fā)展十分迅速。由于中繼協(xié)同通信對于抵抗信道衰落和提升傳輸性能方面具備很強的優(yōu)勢。因此,吸引了越來越多的學者對其進行深入研究。文獻[1]和文獻[2]分別提出了基于最大合并比(MRC)的正交傳輸機制和應用分布空時碼(DSTC)的協(xié)作傳輸機制。在文獻[3]中,作者提出了一種機會中繼選擇機制,該機制利用簡易的分布式算法得到了與應用分布空時碼等高復雜度的中繼機制一樣的分集增益,被中繼領域的研究人員廣泛討論。文獻[4]在此基礎上,進一步將確認和退避機制引入到機會中繼選擇機制中,減少了沖突帶來的時延增加等問題。作為另一種改進方案,作者在文獻[5]中提出了一種結(jié)合中繼間監(jiān)聽和機會中繼選擇的機會監(jiān)聽中繼選擇機制。作者通過理論推導以及仿真實現(xiàn)證明該方案能夠充分利用重傳機制有效降低誤包率。但是,文獻[5]并沒有考慮到監(jiān)聽信道對于系統(tǒng)的影響,同時,由于該機制中算法參數(shù)的簡化,使得系統(tǒng)的適應性降低。
針對以上問題,本文提出了基于分布估計算法(Estimation of Distribution Algorithms,EDAs)的改進方案。在考慮到監(jiān)聽信道影響的同時,也給予了中繼節(jié)點不斷進行參數(shù)優(yōu)化的學習功能。理論分析和仿真證明,該機制可以進一步提升系統(tǒng)的性能,并使得中繼系統(tǒng)可以根據(jù)環(huán)境持續(xù)地做出改進。
系統(tǒng)模型如圖1所示,所考慮的無線通信系統(tǒng)有n個中繼器R1,R2,…,Rn,其中第i個中繼器Ri對應的與源節(jié)點的信道增益和與目的節(jié)點的信道增益分別為hS,i與hi,D,第i個中繼器與第j個中繼器之間的信道增益為hi,j。假設所有的中繼設備工作在半雙工模式下,同時各個節(jié)點間的前向信道和反向信道條件相同。場景處在一個緩慢變化的信道環(huán)境下(即數(shù)據(jù)重傳時的信道增益變化可忽略不計)。
通過監(jiān)聽源節(jié)點與目的節(jié)點之間傳輸?shù)腞TS和CTS分組,中繼節(jié)點可以獲得自己與源節(jié)點和目的節(jié)點之間的信道增益,同時,通過監(jiān)聽各個中繼參與源節(jié)點和目的節(jié)點的協(xié)同通信時發(fā)送的分組包,中繼節(jié)點Ri也可以獲得自身與其他中繼節(jié)點Rj的中繼間信道增益hi,j,其中,i,j={1,2,…,n}。
圖1 基于中繼間監(jiān)聽的機會中繼系統(tǒng)模型
中繼節(jié)點判定自己正確接收源節(jié)點發(fā)送的信息后(設正確接收源節(jié)點發(fā)送信息的中繼數(shù)量為K1),便可以參與競爭源節(jié)點與目的節(jié)點間的協(xié)同通信。該競爭機制是一種基于分布式計算的計時器機制。中繼Ri對應的計時器初始值Ti為
式中:λ是一個以時間為單位的常數(shù),因此Ti的大小完全由ai確定。各個中繼分別根據(jù)自己采集到的信道增益啟動自己的計時器進行倒計時,初始值Ti最小的中繼節(jié)點將競爭到并參與進行源節(jié)點與目的節(jié)點的協(xié)同通信。在協(xié)同通信過程中,被選擇進行協(xié)同通信的中繼節(jié)點進行數(shù)據(jù)傳輸?shù)耐瑫r,其他未正確接收源節(jié)點發(fā)送信息的中繼節(jié)點(數(shù)量為n-K1)對其進行監(jiān)聽,并將監(jiān)聽到的數(shù)據(jù)與自己從源節(jié)點接收到的數(shù)據(jù)利用CC(simple Chase Combining)方式進行合并,這樣,就會有中繼節(jié)點通過監(jiān)聽機制帶來的空間分集更正自己的錯誤信息。之前沒有正確接收信息的中繼節(jié)點可以重新利用CRC判定自己是否更正成功。設此時得到正確信息的中繼節(jié)點為K2,則有K1≤K2≤n。這樣做的好處在于:在協(xié)同通信時,當目的節(jié)點沒有正確接收到數(shù)據(jù)后再進行中繼節(jié)點的計時器競爭機制的時候,會有更多的中繼節(jié)點參與競爭(K1≤K2),這樣,在重傳的時候就會有更大的機會成功傳送數(shù)據(jù)。
在原始的機會中繼選擇機制(無中繼間監(jiān)聽機制)中,ai由以下兩種方式得到:1)=(文獻[5]在討論原機會機制時默認的方式);2)ai(文獻[6]使用的方式)。然而根據(jù)文獻[5]的分析,各中繼節(jié)點考慮的因素中,源節(jié)點到自身的信道增益對于協(xié)同增益的影響減弱了。該機制中,從中繼節(jié)點發(fā)送到目的節(jié)點的信道增益是認真考慮的重點。在文獻[5]中,定義中繼間監(jiān)聽的機會中繼機制中的中繼節(jié)點Ri對應的ai為
由式(1),(2)可知,在所有得到正確信息的中繼節(jié)點中,自身到目的節(jié)點的信道增益最好的中繼節(jié)點會優(yōu)先競爭成為參與協(xié)同通信的節(jié)點。同時,不失一般性,將新轉(zhuǎn)化為可參與競爭的K2-K1個中繼標號為{K1+1,K1+2,…,K2}。由于信道環(huán)境是緩慢變化的,所以對于各個中繼Ri的信道增益hi,D不變。因此,對于所有第一次參與競爭的中繼來說,競爭的結(jié)果是不變的,只需要比較RK1+1,RK1+2,…,RK2中最小的定時器初始值與第一次成功參與協(xié)同通信的中繼節(jié)點(設為RK)的定時器初始值。這樣,在該機制中,數(shù)據(jù)重發(fā)時參與競爭的中繼為 RK,RK1+1,RK1+2,…,RK2。
根據(jù)上面的討論,通過中繼間監(jiān)聽機制的引入使得數(shù)據(jù)傳送的誤包率降低,從而提升了信息傳輸?shù)目煽啃?。然而,這種監(jiān)聽機制的引入將機會選擇機制的優(yōu)化范疇進行了一定的擴展,對于原機會中繼機制的調(diào)整僅僅減少一個參量hS,j的考量是不夠的。
例如這樣的一個場景,如圖2所示,目的節(jié)點與源節(jié)點之間有3個備選中繼節(jié)點,設為R1,R2和R3。其中,表示信道條件的直線中,為實線的直線說明該條信道質(zhì)量滿足要求(即在該信道傳輸?shù)臄?shù)據(jù)可達),為虛線的直線說明該信道質(zhì)量不滿足要求(即在該信道傳輸?shù)臄?shù)據(jù)不可達)。同時由圖可見,從R2到Destination的信道由于建筑物或其他環(huán)境因素的干擾使得該信道質(zhì)量非常不好,即滿足。
圖2 假設場景
按照在上一部分對于原監(jiān)聽機會中繼機制的描述,可以得出:在成功接收源節(jié)點發(fā)送的中繼R1和R2中,R1會在計時器競爭機制中勝出(因為)。而在協(xié)作通信中,很有可能Destination沒有正確接收信息而要求重傳。此時,只有R2能夠正確監(jiān)聽到R1傳送時的數(shù)據(jù)(從R1到R3的信道為虛線),所以在第2次競爭中,仍然是R1與R2的競爭,排除其他因素,下一次參與協(xié)作通信的仍將是R1??梢园l(fā)現(xiàn):在假設場景中,協(xié)作通信的誤包率將急劇增加。
此外,當場景環(huán)境的信道平均質(zhì)量不佳時,重傳的可能性將大大增加,因此應該更注重于選擇一個能使更多中繼監(jiān)聽到自己的中繼節(jié)點。這樣,類似于假設場景中的問題就可以很好地解決。
2.2.1 分布估計算法
分布估計算法(Estimation of Distribution Algorithms,EDAs)是近些年來在進化計算領域興起的一類新型算法,由于它在群體模型構(gòu)建和演化的高適應性以及該算法的高收斂速度,使得它吸引了很多的研究人員的注意并迅速成為進化計算領域的研究熱點,應用于多個方面的優(yōu)化機制中。分布估計算法不同于傳統(tǒng)的進化算法,它直接描述整個群體的進化趨勢,取代了傳統(tǒng)進化算法中對于個體的交叉變異操作,是統(tǒng)計學習理論與隨機優(yōu)化算法的結(jié)合。
作為快速發(fā)展的優(yōu)化算法,分布估計算法不僅能夠有效解決很多髙維非線性的優(yōu)化問題,同時它對于進化算法提供了一個新的思路,使得該算法在科學研究和工程應用等領域有著很大的利用價值和發(fā)展前景。本文中,將利用它提出一個改進的中繼選擇方案。
2.2.2 改進的機會監(jiān)聽選擇方案
在提出的改進方案中,仍以圖1所示的模型作為中繼選擇改進機制的系統(tǒng)模型。在改進方案中假設,中繼節(jié)點可以通過監(jiān)聽機制感知得到自身與其他中繼節(jié)點間的信道增益hi,j,同時也可以通過目的節(jié)點發(fā)送的ACK,得到這次通信是否成功的信息(從而記錄統(tǒng)計一次通信完成需要的重傳次數(shù))。本文提出的改進主要體現(xiàn)在兩個方面:1)對于計時器初始值的計算增加了其他必要的參數(shù);2)中繼節(jié)點的競爭參量的確定加入了可以不斷改善自身的學習特性。
原機會監(jiān)聽中繼選擇機制中,僅僅將|hi,D|2作為ai的計算方式是不夠的。還應該考慮到其他的信道質(zhì)量。因此,將原的計算方式擴展為
這樣,計算ai值的時候,中繼節(jié)點會考慮自身與其他中繼節(jié)點的信道質(zhì)量,可以讓更多中繼監(jiān)聽到自己的中繼節(jié)點的競爭力,從而避免了類似于在假設場景中出現(xiàn)的現(xiàn)象。由于引入了更多的參數(shù),因此,能否合理地確定這些參數(shù)的取值,以及這些數(shù)值的算法復雜度是否可以接受便成為了下一步要解決的問題。
為了解決這個問題,本文提出了基于分布估計算法的參數(shù)學習機制。選用屬于分布估計算法之一的貝葉斯優(yōu)化算法[7],該算法具體步驟如下:1)以隨機的形式產(chǎn)生各個個體,組成初始種群;2)按照一定的原則在種群中選擇優(yōu)勢的個體;3)根據(jù)選擇出來的個體構(gòu)建符合要求的貝葉斯網(wǎng)絡;4)利用貝葉斯網(wǎng)絡的聯(lián)合分布函數(shù)生成新的個體組成新的種群;5)將新的種群替換掉(部分)原種群,從而產(chǎn)生下一代種群;6)看算法終止條件是否滿足,若滿足,算法終止;若不滿足,重新從第二步開始該算法。
在該算法中,貝葉斯網(wǎng)絡內(nèi)的連續(xù)型數(shù)據(jù)的實際意義往往無法明確,同時,也為使該算法的執(zhí)行效率更高,因此將對應于每個中繼Ri的計時器參數(shù)αi(j=1,2,…,i-1,i,i+1,…,n),β 和 γ 進行離散化處理。將它們的取值范圍變?yōu)閺?到1最短步長為2-m的離散值。在上面的前提下,提出了具有學習特征的改進策略,針對于中繼Ri,改進方案如下:
1)一次通信結(jié)束后,立即由概率模型(第一次則為全隨機模型)生成對應于下一次通信的各個參數(shù)αi,β和γ準備參與下一次通信的計時器計算,從而最大限度地保證Ti的計算不受改進方案影響而降低效率。
2)在一次通信完成前(無論是否有重傳或重傳多少次),αi,β和γ不會改變(避免影響學習能力)并且當通信結(jié)束時記錄本次通信的αi,β和γ的取值以及本次通信的重傳次數(shù)。
3)對通信次數(shù)進行記錄,當通信次數(shù)達到N時,對所有記錄的αi,β和γ,以其所對應的通信的重傳次數(shù)為判定規(guī)則選取重傳次數(shù)少的N1組αi,β和γ作為優(yōu)勢個體組成新種群,并依據(jù)該種群構(gòu)建貝葉斯網(wǎng)絡,然后將通信次數(shù)歸零,同時對每次通信的參數(shù)αi,β和γ記錄清零。構(gòu)建的貝葉斯網(wǎng)絡的聯(lián)合分布函數(shù)替換原概率模型作為生成αi,β和γ的新概率模型。
此方案的好處在于,它考慮到了其他信道質(zhì)量對于協(xié)同通信可能產(chǎn)生的影響,并且當環(huán)境更符合原機會監(jiān)聽機制的計算方法時,提出的方案仍可通過學習產(chǎn)生一樣的結(jié)果(αj=β=0,γ=1),同時它的不斷自我優(yōu)化的特性,使該中繼通信系統(tǒng)的性能不斷改善,達到較小的重傳次數(shù)期望值和誤包率。
為了進一步驗證本文提出的基于分布估計算法的改進方案的優(yōu)勢,采用蒙特卡洛方法對改進的方案和原機制進行仿真與比較。利用工具Matlab和Mathematics,從誤包率和重傳次數(shù)兩方面對其進行仿真實現(xiàn)。在仿真過程中,選取 n=3,m=6,N=50。
圖3給出了本文提出的新的機會監(jiān)聽機制與原監(jiān)聽機制和機會選擇機制的誤包率比較,通過16QAM和QPSK兩種調(diào)制方式的仿真實現(xiàn),可以看到,本文提出的新方案對于誤包率的減小有著很好的改善。能夠更加充分地利用監(jiān)聽機制所具有的提升數(shù)據(jù)傳輸成功率的性能。
圖3 本文的改進機制與原機制的誤包率比較
在信道質(zhì)量很差的條件下,各個中繼機制的重傳期望隨時間變化的直方圖如圖4所示。通過圖4可以發(fā)現(xiàn),本文提出的改進方案有著自我改善的學習性能,通過不斷的以N為周期的學習,新方案使得中繼節(jié)點可以根據(jù)統(tǒng)計數(shù)據(jù)對自身參數(shù)進行優(yōu)化,從而改善整個系統(tǒng)的傳送效率,使傳輸?shù)挠行缘靡蕴嵘?。該方案可以不斷適應環(huán)境變化并提升整個系統(tǒng)的通信性能。通過EDA算法以及相對應的新機制的引入,不僅可以使中繼在優(yōu)化參數(shù)取值的能力上得到提升,同時也使得中繼節(jié)點具備了一定的自適應能力。
本文在原機會監(jiān)聽中繼選擇機制的基礎上,通過分布估計算法的引入提出了一個更適于在中繼間監(jiān)聽機制中執(zhí)行的方案。通過理論分析表明,利用分布估計算法的高收斂性和對于解決非線性、變量耦合等優(yōu)化問題的優(yōu)勢,本文提出的方案不僅可以幫助中繼節(jié)點根據(jù)環(huán)境具體情況在統(tǒng)計意義上選擇出更適應的計算參數(shù),以實現(xiàn)整體性能的優(yōu)化,提高整個系統(tǒng)通信的可靠性,同時還使得整個中繼系統(tǒng)具備了一定的自適應學習能力。仿真結(jié)果顯示,該方案使得各個中繼節(jié)點經(jīng)過周期性的學習,可以不斷改進自身的參數(shù),使得系統(tǒng)的整體機制持續(xù)地自我改善。
圖4 新的改進機制自我改善的學習性能比較
[1] SENDONARIS A,ERKIP E,AAZHANG B.User cooperative diversitypart ii:implementation aspects and performance analysis[J].IEEE Transactions on Communications,2003,51(11):1939-1948.
[2] LANEMAN J N,WORNELL G W.Distributed space-time-coded protocols for exploiting cooperative diversity in wireless networks[J].IEEE Trans.Information Theory,2003,49(10):2415-2425.
[3] BLETSAS A,KHISTI A,REED D,et al.A simple cooperative diversity method based on network path selection[J].IEEE Journal on Selected Areas in Communications,2006,24(3):659-672.
[4]劉丹譜,郝建軍,樂光新.用于機會中繼的一種最佳中繼選擇算法[J].中國電子科學研究院學報,2008,3(5):483-487.
[5] LYNN N,TAKYU O,ADACHI K,et al.Cooperative ARQ using distributed relay selection and inter-relay opportunistic listening[C]//Proc.IEEE 21st International Symposium on PIMRC Workshops.Istanbul,Turkey:IEEE Press,2010:467-472.
[6] BLETSAS A,LIPPMAN A,REED D P.A simple distributed method for relay selection in cooperative diversity wireless networks based on reciprocity and channel measurements[C]//Proc.61st IEEE Semiannu.Vech. Technol. Conf. Stockholm, Sweden:IEEE Press,2005:1484-1488.
[7] HAUSCHILD M,PELIKAN M,SASTRY K,et al.Analyzing probabilistic models in hierarchical BOA[J].IEEE Trans.Evolutionary Computation,2009,13(6):1199-1217.