孫徑舟,王樂涵,孫宇璇,周盛,牛志升
(清華大學(xué)電子工程系,北京 100084)
過去幾十年,音/視頻業(yè)務(wù)以其大帶寬需求成為無線網(wǎng)絡(luò)發(fā)展的主要推動(dòng)力。而隨著通信技術(shù)的發(fā)展,機(jī)器型通信、低時(shí)延高可靠通信成為新的焦點(diǎn),通信網(wǎng)絡(luò)承載的主要內(nèi)容將從人與人之間的通信擴(kuò)展至人與物、物與物之間的通信。這一轉(zhuǎn)變催生了大量的垂直行業(yè)應(yīng)用:借助V2X(vehicle-to-everything)通信,車與車之間可以通過交互信息增強(qiáng)感知能力[1-2];工業(yè)物聯(lián)網(wǎng)中,機(jī)器通過無線連接降低部署成本[3];虛擬現(xiàn)實(shí)及增強(qiáng)現(xiàn)實(shí)應(yīng)用中,頭戴式設(shè)備可以通過無線網(wǎng)絡(luò)與服務(wù)器連接[4]。但由于機(jī)器感知速度遠(yuǎn)高于人類反應(yīng)速度,對(duì)此類垂直行業(yè)應(yīng)用通常也有著較高的時(shí)延要求,如車聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)中時(shí)延通常要求在10 ms。盡管5G相關(guān)研究已經(jīng)達(dá)到了1 ms的用戶面時(shí)延和少于20 ms的控制面時(shí)延[5],但這些實(shí)驗(yàn)通常是在輕負(fù)載的情況下完成的。事實(shí)上,在通信資源非常寬裕情況下,通過分配專用的通信資源以實(shí)現(xiàn)超可靠低時(shí)延通信(ultra reliable low latency communication,uRLLC)并不困難。因此,對(duì)于大量機(jī)器類型業(yè)務(wù),僅提供低時(shí)延服務(wù)并不夠。在B5G及6G中,應(yīng)聯(lián)合考慮信息產(chǎn)生、傳輸以及信道狀態(tài)進(jìn)行系統(tǒng)設(shè)計(jì)。
針對(duì)這一問題,近年來興起了對(duì)信息時(shí)效性的研究。為了解釋信息時(shí)效性概念,考慮如圖1所示的狀態(tài)更新系統(tǒng):發(fā)送端對(duì)某個(gè)過程進(jìn)行采樣,通過無線信道發(fā)送給接收方,由接收方做出決策并返回。在這個(gè)系統(tǒng)中,接收方做出決策時(shí)所利用的信息與真實(shí)信息之間的差距將影響決策質(zhì)量。信息偏差越小,決策質(zhì)量越好,信息時(shí)效性越高??梢钥闯觯畔r(shí)效性與時(shí)延有著明顯的差別。時(shí)延是基于單一數(shù)據(jù)包所定義的度量,而信息時(shí)效性則針對(duì)信息流。提高信息時(shí)效性需要低時(shí)延通信,但低時(shí)延并不意味著高信息時(shí)效性。仍以圖1中的系統(tǒng)為例,為了提高信息時(shí)效性,發(fā)送端希望提高自己的采樣頻率,但通信信道缺會(huì)因?yàn)樾枰獋鬏敶罅繑?shù)據(jù)包而擁塞,反而導(dǎo)致接收端信息時(shí)效性降低。因此提高信息時(shí)效性需要綜合考慮信息的產(chǎn)生、傳輸以及處理的全過程。
圖1 狀態(tài)更新系統(tǒng)示意圖
基于信息時(shí)效性的研究需要定義信息時(shí)效性的度量。按照對(duì)于發(fā)送端過程具體狀態(tài)不同的利用程度,研究者們提出了不同的度量指標(biāo),見表1。本文將對(duì)這些信息時(shí)效性度量進(jìn)行介紹、比較,并討論相關(guān)研究工作。
表1 信息時(shí)效性度量對(duì)比
信息年齡(age of information)最早由參考文獻(xiàn)[6]提出,接收端Rx在t時(shí)刻的信息年齡h(t)定義為Rx所接收的最新數(shù)據(jù)包的產(chǎn)生時(shí)刻與當(dāng)前時(shí)刻的偏差值,即:
其中,Si為第i個(gè)成功接收到的數(shù)據(jù)的產(chǎn)生時(shí)間,而Di為該數(shù)據(jù)的接收時(shí)間。信息年齡演化曲線如圖2所示,S1時(shí)刻采樣產(chǎn)生的數(shù)據(jù)在D1時(shí)刻被成功接收,那么D1的信息年齡從D1下降為D1-S1。現(xiàn)有研究大多關(guān)注兩個(gè)性能指標(biāo):平均信息年齡和峰值信息年齡。平均信息年齡指在一段時(shí)間內(nèi)的信息年齡累加并除以時(shí)長,即圖2中著色區(qū)域面積比上時(shí)間長度。而峰值信息年齡,即在接收端收到新的數(shù)據(jù)包之前時(shí)刻的信息年齡,即圖2中圈出的區(qū)域,如D2時(shí)刻的峰值信息年齡為D2-S1。
圖2 信息年齡演化曲線
以車聯(lián)網(wǎng)的典型場景編隊(duì)駕駛(platooning)和路口調(diào)度為例,進(jìn)一步說明信息年齡的物理意義。在編隊(duì)駕駛中,頭車(leader)需要將自身狀態(tài)信息(包括但不限于車輛的速度、加速度、位置等)頻繁地發(fā)送給編隊(duì)中的跟隨車輛(follower),從而保證整個(gè)編隊(duì)系統(tǒng)的穩(wěn)定性和安全。在編隊(duì)駕駛中,跟隨車輛收到的來自頭車的狀態(tài)信息的信息年齡越大,說明跟隨車輛對(duì)頭車當(dāng)前狀態(tài)的認(rèn)知越不及時(shí),信息時(shí)效性越低。信息年齡較大時(shí),跟隨車輛僅能根據(jù)來自頭車的過時(shí)信息控制自身的運(yùn)動(dòng),無法對(duì)突發(fā)的緊急情況做出及時(shí)的應(yīng)對(duì),從而產(chǎn)生危險(xiǎn)。同理,在路口調(diào)度中,路側(cè)單元(road side unit)也需要盡可能地基于路口附近車輛最新的、信息年齡最小的狀態(tài)信息實(shí)時(shí)地得出調(diào)度策略,從而保證車輛安全高效地通過路口。
可見,信息年齡的定義有著明確的物理意義,但并未涉及信息的內(nèi)容。信息年齡本身隨著時(shí)間線性增長,但有研究工作指出,所關(guān)心的系統(tǒng)性能有時(shí)可表示為信息年齡的函數(shù)形式,如參考文獻(xiàn)[7]中,對(duì)于高斯-馬爾可夫塊衰落信道,信道容量表達(dá)可以被表示成信道狀態(tài)信息(channel state information,CSI)的信息年齡的函數(shù)。
在典型的狀態(tài)更新系統(tǒng)中,將有多個(gè)傳感器分別向控制中心上傳狀態(tài)信息。IEEE 802.11協(xié)議、LTE以及5G NR的隨機(jī)接入信道均采用CSMA(carrier-sense multiple access)、ALOHA等經(jīng)典的MAC(medium access control)層接入機(jī)制,但此類機(jī)制主要以吞吐量最優(yōu)為目標(biāo),并未考慮信息年齡的需求。因此,有大量工作研究如何設(shè)計(jì)調(diào)度與接入機(jī)制以優(yōu)化信息年齡。筆者將從調(diào)度機(jī)制、網(wǎng)絡(luò)拓?fù)?、?yōu)化目標(biāo)等幾個(gè)角度分別介紹相關(guān)進(jìn)展。
在參考文獻(xiàn)[8-11]中,研究者們考慮集中式調(diào)度機(jī)制,即假設(shè)存在一個(gè)掌握全局信息的中心控制節(jié)點(diǎn),并由其選擇當(dāng)前時(shí)刻應(yīng)該由哪些終端接入信道上報(bào)狀態(tài)信息,且均考慮優(yōu)化長時(shí)平均信息年齡。參考文獻(xiàn)[8]考慮節(jié)點(diǎn)被調(diào)度時(shí)會(huì)進(jìn)行采樣并產(chǎn)生包含最新狀態(tài)信息的數(shù)據(jù)包。同時(shí)在參考文獻(xiàn)[8]中,信道狀態(tài)被抽象為服從伯努利分布的隨機(jī)過程,即傳輸成功和失敗概率固定。其中分別研究了貪心調(diào)度策略、基于虛擬隊(duì)列的調(diào)度策略以及基于懷特指數(shù)(Whittle’s index)的調(diào)度策略,仿真結(jié)果顯示,在不同的網(wǎng)絡(luò)參數(shù)下,后兩種調(diào)度策略性能均接近最優(yōu)值。參考文獻(xiàn)[9]同樣采用了懷特指數(shù)來設(shè)計(jì)調(diào)度策略,與參考文獻(xiàn)[8]不同的是,參考文獻(xiàn)[9]中假設(shè)狀態(tài)采樣過程不可控,而是在每個(gè)時(shí)隙以一定概率產(chǎn)生新的數(shù)據(jù)包。同時(shí),為了簡化分析,參考文獻(xiàn)[9]中假設(shè)每個(gè)發(fā)送端僅在采樣時(shí)刻進(jìn)行傳輸,也就是零緩沖假設(shè)。由于之前時(shí)刻采樣的數(shù)據(jù)包即使未在采樣時(shí)刻發(fā)送,仍然能夠帶來信息年齡增益,因此零緩沖將帶來一定的性能損失。在參考文獻(xiàn)[10]中,研究者們假設(shè)每個(gè)信源能夠保留最近一次采樣的數(shù)據(jù)包,而不是直接丟棄,并計(jì)算得到信道理想情況下的懷特指數(shù)。參考文獻(xiàn)[11]進(jìn)一步擴(kuò)展到采樣隨機(jī)且信道非理想場景,提出了近似調(diào)度指標(biāo)。
大多數(shù)狀態(tài)更新系統(tǒng)中并不存在一個(gè)掌握全局信息的中心調(diào)度節(jié)點(diǎn),因此,考慮分布式接入機(jī)制尤為重要。表2給出了相關(guān)代表性工作的總結(jié)。
表2 分布式接入研究總結(jié)
在參考文獻(xiàn)[12]中,作者考慮非理想信道以及調(diào)度時(shí)刻采樣,分別研究了集中式調(diào)度與基于ALOHA接入兩種策略下的平均信息年齡性能。對(duì)于集中式調(diào)度,調(diào)度中心依次調(diào)度各個(gè)節(jié)點(diǎn)上傳狀態(tài)信息,傳輸失敗時(shí)不考慮HARQ機(jī)制,而是重新采樣上傳,直到傳輸成功或達(dá)到最大重傳次數(shù)S。而基于ALOHA的接入機(jī)制中,各個(gè)節(jié)點(diǎn)以一定概率接入信道進(jìn)行狀態(tài)信息傳輸。其中給出了兩種情況下平均信息年齡的閉式表達(dá)式。當(dāng)要求各個(gè)用戶的平均信息年齡相同時(shí),基于ALOHA的接入機(jī)制下的平均信息年齡為帶有重傳機(jī)制的集中式調(diào)度的2e倍。這顯示了集中式調(diào)度與單純的ALOHA協(xié)議相比的優(yōu)勢。前述工作均考慮離散時(shí)間系統(tǒng),而參考文獻(xiàn)[13]考慮連續(xù)時(shí)間系統(tǒng):假設(shè)傳輸與退避時(shí)間均服從負(fù)指數(shù)分布,研究調(diào)度采樣和隨機(jī)采樣兩種情況下CSMA協(xié)議的平均信息年齡,并分別給出了閉式表達(dá)式和性能上界?;谛阅鼙磉_(dá)式,可以通過調(diào)節(jié)退避時(shí)長(back-off time)以優(yōu)化協(xié)議性能。該研究指出,最優(yōu)退避時(shí)長與采樣過程無關(guān)。參考文獻(xiàn)[12-13]主要對(duì)現(xiàn)有協(xié)議性能進(jìn)行分析,并沒有做出改進(jìn)。
在參考文獻(xiàn)[13]的基礎(chǔ)上,參考文獻(xiàn)[14]針對(duì)現(xiàn)有協(xié)議與最優(yōu)值之間的差距進(jìn)行分析。這里的最優(yōu)值是假設(shè)存在掌握全局狀態(tài)信息的調(diào)度節(jié)點(diǎn)時(shí),調(diào)度算法所能達(dá)到的最小平均信息年齡性能。參考文獻(xiàn)[14]中指出,通過調(diào)整退避時(shí)長,隨著系統(tǒng)中用戶數(shù)增長,使用CSMA協(xié)議在漸進(jìn)意義下的平均信息年齡為最小平均信息年齡的2倍。研究者們同時(shí)提出基于簡單的輪詢策略(round-robin)進(jìn)行調(diào)度,即每個(gè)時(shí)隙依次調(diào)度用戶接入信道。其中證明了隨著用戶數(shù)增長,輪詢策略下平均信息年齡接近最優(yōu)值。需要指出的是,由于輪詢策略的最優(yōu)性是漸近最優(yōu),在用戶數(shù)較少或者隨機(jī)采樣頻率低的情況下性能并不理想。
現(xiàn)有分布式接入?yún)f(xié)議的目標(biāo)是盡可能減少?zèng)_突,提高吞吐量。而基于信息年齡設(shè)計(jì)的接入?yún)f(xié)議則需要實(shí)現(xiàn)兩個(gè)目標(biāo):減少?zèng)_突和傳輸能夠帶來較高時(shí)效性增益的數(shù)據(jù)。一個(gè)直觀的設(shè)計(jì)思路可以同步達(dá)成這兩個(gè)目標(biāo),即只讓具有高時(shí)效增益的用戶接入信道。此時(shí)由于接入信道的用戶數(shù)減少,沖突概率也隨之下降。因此,問題轉(zhuǎn)化為如何使得用戶自行判斷是否應(yīng)該接入信道。在參考文獻(xiàn)[15]中,作者采用懷特指數(shù)作為判斷數(shù)據(jù)時(shí)效性增益高低的指標(biāo),懷特指數(shù)越大,意味著用戶進(jìn)行傳輸?shù)臅r(shí)效性增益越高。通過設(shè)置懷特指數(shù)閾值,只有懷特指數(shù)大于該閾值的用戶被允許進(jìn)行傳輸,這樣就減少了競爭信道的用戶數(shù)。同時(shí)為了減少?zèng)_突,這部分用戶采用CSMA的方式競爭信道。仿真結(jié)果證明該帶有優(yōu)先級(jí)的CSMA協(xié)議下平均信息年齡接近最優(yōu)值。但參考文獻(xiàn)[15]并沒有詳細(xì)分析如何進(jìn)行閾值設(shè)置,而是通過一維搜索進(jìn)行選擇。在參考文獻(xiàn)[16]中,作者分析了如何設(shè)置閾值,并基于平均場理論(mean-field theory)給出了各個(gè)用戶的閾值表達(dá)式。對(duì)于集中式調(diào)度,只需從信息年齡大于各自閾值的用戶中隨機(jī)挑選接入信道即可,可以證明,這種調(diào)度方法的性能在用戶數(shù)趨于無窮的條件下是漸近最優(yōu)的。同時(shí),由于該策略只需要用戶將自身信息年齡與閾值比較,因此也可以設(shè)計(jì)基于ALOHA或者CSMA的分布式接入機(jī)制。
上述工作主要考慮平均信息年齡,還有一部分工作考慮平均峰值信息年齡性能。在參考文獻(xiàn)[17]中,作者考慮用戶可以劃分為多個(gè)可行集的場景。同一可行集中的用戶可以同時(shí)接入信道,而不同可行集之間存在干擾,不能同時(shí)接入。其中指出對(duì)于峰值年齡,存在一個(gè)最優(yōu)策略是隨機(jī)策略,即每個(gè)時(shí)隙按照相同的概率分布選擇一個(gè)可行集接入信道,此時(shí)平均峰值信息年齡最優(yōu)。這主要是由于平均峰值信息年齡可以表示為調(diào)度頻率的倒數(shù)。而對(duì)于平均信息年齡,可以證明這種隨機(jī)策略所達(dá)到的平均信息年齡不超過最優(yōu)值兩倍。
除了平均性能之外,部分應(yīng)用更關(guān)心信息年齡不超過一定閾值。參考文獻(xiàn)[18]分析了當(dāng)信息年齡具有閾值約束時(shí)的調(diào)度策略設(shè)計(jì)??紤]理想信道,尋找滿足閾值約束的調(diào)度算法被轉(zhuǎn)化為在有向圖上尋找環(huán)路問題。由于尋找環(huán)路問題復(fù)雜度過高,因此作者首先對(duì)一組具有特殊結(jié)構(gòu)的閾值約束進(jìn)行分析,即不同用戶閾值具有倍數(shù)關(guān)系。針對(duì)這種特殊結(jié)構(gòu)閾值,其中提出了一種低復(fù)雜度調(diào)度算法。而對(duì)于一般閾值約束要求,作者提出了一個(gè)映射算法,將一般閾值約束映射為具有特殊結(jié)構(gòu)的閾值約束,并證明了大部分閾值約束都可以被映射成具有特殊結(jié)構(gòu)的類型。當(dāng)信道存在非理想因素時(shí),參考文獻(xiàn)[19]將硬閾值約束松弛為超過閾值的概率約束,與參考文獻(xiàn)[18]提出一種周期性調(diào)度算法類似,并證明該算法滿足約束條件。
信息年齡定義簡潔,物理意義明確,但信息年齡并不能準(zhǔn)確地反映接收端對(duì)發(fā)送端狀態(tài)信息的認(rèn)知情況。根據(jù)信息年齡的定義,即便接收端已經(jīng)獲知發(fā)送端的真實(shí)狀態(tài)信息,只要沒有收到來自發(fā)送端的新的狀態(tài)更新,信息年齡便會(huì)不斷增大。因此,對(duì)于狀態(tài)變化快速的發(fā)送端,較小的信息年齡并不意味著接收端準(zhǔn)確獲得狀態(tài)信息,對(duì)于狀態(tài)變化緩慢的發(fā)送端,較大信息年齡也可能意味著準(zhǔn)確的狀態(tài)信息認(rèn)知??紤]發(fā)送端狀態(tài)未發(fā)生改變時(shí),沒有必要進(jìn)行狀態(tài)信息傳輸,參考文獻(xiàn)[20]引入同步信息年齡(age of synchronization)這一新指標(biāo)來刻畫發(fā)送端與接收端狀態(tài)信息不同的影響,t時(shí)刻的同步信息年齡hS(t)定義為:
其中,US(t)為最近一次接收端發(fā)送端狀態(tài)不同步的時(shí)間(若當(dāng)前時(shí)刻已同步,則US(t)等于t)。同步信息年齡定義與信息年齡不同,只有當(dāng)發(fā)送端狀態(tài)信息發(fā)生改變時(shí)才會(huì)開始增長,即發(fā)送端與接收端狀態(tài)存在差異將觸發(fā)同步信息年齡增加,這就是“同步”概念的由來。圖3中的實(shí)線展示了同步信息年齡的演化曲線。同時(shí)為了便于與信息年齡區(qū)分,圖3中使用虛線標(biāo)出了信息年齡的演化曲線。可以看到,在S1時(shí)刻產(chǎn)生狀態(tài)更新后,接收端和發(fā)送端狀態(tài)存在差異,因此同步信息年齡開始增長,直到D1時(shí)刻傳輸完成后,二者再次同步。
圖3 同步信息年齡演化曲線
在參考文獻(xiàn)[20]中,作者考慮一個(gè)緩存更新系統(tǒng),多個(gè)遠(yuǎn)程節(jié)點(diǎn)向中心服務(wù)器備份各自所緩存的信息??紤]離散時(shí)間系統(tǒng),每個(gè)時(shí)隙中遠(yuǎn)程節(jié)點(diǎn)所緩存的內(nèi)容更新s事件服從伯努利分布。中心服務(wù)器周期性地提取遠(yuǎn)程節(jié)點(diǎn)緩存內(nèi)容。其中計(jì)算了周期性提取策略下的平均同步信息年齡。由于網(wǎng)絡(luò)帶寬有限,假設(shè)存在最大的總提取頻率約束,計(jì)算得到此時(shí)各個(gè)遠(yuǎn)程節(jié)點(diǎn)的提取頻率。當(dāng)總提取頻率遠(yuǎn)大于節(jié)點(diǎn)緩存內(nèi)容更新頻率時(shí),各個(gè)節(jié)點(diǎn)提取頻率為緩存內(nèi)容更新頻率的立方根形式。而當(dāng)總提取頻率小于節(jié)點(diǎn)緩存內(nèi)容更新頻率時(shí),各節(jié)點(diǎn)提取頻率為緩存內(nèi)容更新頻率平方根形式。
雖然周期性調(diào)度便于實(shí)現(xiàn),但通常并不一定是最優(yōu)的。因此參考文獻(xiàn)[21]對(duì)此展開了進(jìn)一步的分析,研究在信道不理想時(shí)的調(diào)度策略。參考文獻(xiàn)[21]將原問題建模為馬爾可夫決策問題,并證明最優(yōu)策略具有閾值結(jié)構(gòu)?;谶@一性質(zhì),進(jìn)一步設(shè)計(jì)了基于懷特指數(shù)的調(diào)度算法。在該算法下,當(dāng)同步信息年齡相同時(shí),信道傳輸成功概率越高,或狀態(tài)更新概率越小的節(jié)點(diǎn),調(diào)度優(yōu)先級(jí)越高。
從信息年齡和同步信息年齡的定義可知,兩種度量都會(huì)在收到下個(gè)更新前始終隨著時(shí)間線性增長,因此它們不能很好地度量信息時(shí)效性對(duì)系統(tǒng)性能造成的非線性影響。以遠(yuǎn)程估計(jì)(remote estimation)問題為例,參考文獻(xiàn)[22]考慮遠(yuǎn)程觀測一個(gè)維納過程,當(dāng)采樣策略考慮發(fā)送端實(shí)際狀態(tài)時(shí),遠(yuǎn)程估計(jì)的均方誤差并不能表示為信息年齡的函數(shù)形式。為了解決上述問題,參考文獻(xiàn)[23]提出了錯(cuò)誤信息年齡(age of incorrect information),將錯(cuò)誤信息年齡 ΔAoII(t)定義為一個(gè)關(guān)于時(shí)間的非減效用函數(shù)f(t)和函數(shù)的乘積,即:
盡管錯(cuò)誤信息年齡能解決信息年齡存在的問題并準(zhǔn)確反映接收端對(duì)發(fā)送端的認(rèn)知情況,但在實(shí)現(xiàn)中卻更加復(fù)雜。接收端在計(jì)算信息年齡時(shí)只需觀察收到的狀態(tài)更新數(shù)據(jù)包上的時(shí)間戳,但無法通過上述方法計(jì)算得到錯(cuò)誤信息年齡。為了得出錯(cuò)誤信息年齡,接收端必須在成功收到狀態(tài)更新數(shù)據(jù)包的時(shí)候發(fā)送ACK通知發(fā)送端,此外,收發(fā)雙端也必須約定狀態(tài)估計(jì)算法,這樣發(fā)送端才能實(shí)時(shí)地準(zhǔn)確獲知接收端的狀態(tài)估計(jì),并進(jìn)一步得出錯(cuò)誤信息年齡。
參考文獻(xiàn)[24]在遠(yuǎn)程監(jiān)控單一對(duì)稱二值馬爾可夫信息源的離散時(shí)間場景下對(duì)錯(cuò)誤信息年齡進(jìn)行了研究。在該場景中,存在一個(gè)二值馬爾可夫數(shù)據(jù)源作為發(fā)送端和一個(gè)接收端,發(fā)送端發(fā)出的狀態(tài)信息需要經(jīng)歷一個(gè)服從幾何分布的隨機(jī)時(shí)延才能到達(dá)接收端。當(dāng)接收端收到狀態(tài)信息后將立刻發(fā)送ACK告知發(fā)送端信道資源已經(jīng)被釋放,此時(shí)發(fā)送端可以選擇是否進(jìn)行采樣,并發(fā)送一個(gè)新的狀態(tài)信息。參考文獻(xiàn)[24]基于3種不同度量:平均實(shí)時(shí)錯(cuò)誤(real-time error)、平均信息年齡和平均錯(cuò)誤信息年齡分別給出了最優(yōu)采樣策略。其中,平均實(shí)時(shí)錯(cuò)誤是指,符號(hào)I表征示性函數(shù)。其中發(fā)現(xiàn)在3種策略中平均信息年齡最優(yōu)策略與平均實(shí)時(shí)錯(cuò)誤最優(yōu)策略一致,都是在馬爾可夫數(shù)據(jù)源狀態(tài)變化時(shí)進(jìn)行更新,這說明最小化錯(cuò)誤信息年齡等同于最小化系統(tǒng)的實(shí)時(shí)錯(cuò)誤性能,而最小化信息年齡則并不能保證接收端對(duì)發(fā)送端的準(zhǔn)確認(rèn)知。參考文獻(xiàn)[25-26]則分別研究了上述場景中傳輸能量受限和平均傳輸頻率受限時(shí)的平均錯(cuò)誤信息年齡最小的策略。
參考文獻(xiàn)[27]進(jìn)一步考慮了多發(fā)送端的遠(yuǎn)程監(jiān)控問題,假設(shè)離散時(shí)間系統(tǒng)中存在多個(gè)發(fā)送端通過塊衰落信道向調(diào)度中心傳輸狀態(tài)信息,每個(gè)時(shí)隙同時(shí)傳輸狀態(tài)信息的發(fā)送端不能超過M個(gè),調(diào)度中心實(shí)時(shí)將資源分配給部分發(fā)送端傳輸數(shù)據(jù)。由于調(diào)度中心不能實(shí)時(shí)獲知估計(jì)誤差,上述優(yōu)化問題被建模為部分可觀察的馬爾可夫決策過程問題,該文進(jìn)一步基于懷特指數(shù)得出了調(diào)度策略,即每時(shí)隙調(diào)度M個(gè)懷特指數(shù)最大的發(fā)送端傳輸更新。
除了不能衡量過時(shí)信息的非線性效應(yīng)外,信息年齡忽視了發(fā)送端所處的情境對(duì)信息時(shí)效性的影響。例如在編隊(duì)駕駛中,頭車與跟隨車輛之間的信息交互扮演著重要的角色。一方面,車輛移動(dòng)性較強(qiáng),編隊(duì)所處情境變化迅速,在某些情境下,例如車輛編隊(duì)經(jīng)過路口時(shí),或車輛編隊(duì)經(jīng)歷超車等突發(fā)的緊急事件時(shí),頭車的狀態(tài)信息應(yīng)當(dāng)更加頻繁地向跟隨車輛進(jìn)行更新,以保證交通安全。因此,受限的無線通信資源應(yīng)當(dāng)主要分配給處于緊急狀態(tài)中的車輛。為了聯(lián)合反映發(fā)送端對(duì)接收端的認(rèn)知情況以及發(fā)送端的情境信息,筆者在參考文獻(xiàn)[28-29]基于情境信息和狀態(tài)信息可知的系統(tǒng),提出了度量信息時(shí)效性的新指標(biāo):信息緊迫度(urgency of information)。t時(shí)刻的信息緊迫度定義為情境感知權(quán)重ω(t)和狀態(tài)估計(jì)誤差Q(t)的函數(shù)δ(Q(t))的乘積,即:
狀態(tài)估計(jì)誤差Q(t)的變化為:
其中,gt是t時(shí)刻之前收到的最新狀態(tài)信息更新的產(chǎn)生時(shí)間,A(t)是t時(shí)隙內(nèi)估計(jì)誤差的增量。D(t)表示接收端是否收到發(fā)送端發(fā)送的狀態(tài)更新,D(t)=1表示接收端收到狀態(tài)信息??梢钥闯?,信息緊迫度同樣是一個(gè)普適的信息時(shí)效性度量:
(1)當(dāng)函數(shù)δ是線性函數(shù)、情境權(quán)重不隨時(shí)間改變、估計(jì)誤差的增量A(t)是1時(shí),信息緊迫度等同于信息年齡;
(2)當(dāng)函數(shù)δ是非線性函數(shù)、情境權(quán)重不隨時(shí)間改變、估計(jì)誤差的增量A(t)是1時(shí),信息緊迫度等同于基于信息年齡的非線性效用函數(shù);
(3)當(dāng)函數(shù)δ(Q(t)) =Q(t)2、情境權(quán)重隨時(shí)間發(fā)生改變時(shí),信息緊迫度等同于均方誤差。
根據(jù)上述定義,可以看出,在編隊(duì)駕駛中,跟隨車輛收到的來自頭車的狀態(tài)信息的信息緊迫度表示頭車不及時(shí)或不準(zhǔn)確的狀態(tài)信息對(duì)跟隨車輛造成的影響。車輛編隊(duì)所處的情況越緊急,跟隨車輛對(duì)頭車的狀態(tài)信息認(rèn)知越不及時(shí),或越不準(zhǔn)確,信息緊迫度越大,此時(shí),跟隨車輛不得不在緊急情況下根據(jù)頭車的過時(shí)信息或不準(zhǔn)確信息來控制自身運(yùn)動(dòng),給編隊(duì)系統(tǒng)帶來巨大風(fēng)險(xiǎn)。
基于信息緊迫度的優(yōu)化主要包括兩個(gè)方面,即平均更新頻率受限時(shí)的單發(fā)送端狀態(tài)信息更新調(diào)度策略[29-30]和接入受限時(shí)的多發(fā)送端狀態(tài)更新調(diào)度策略[31]。
對(duì)于單發(fā)送端離散時(shí)間系統(tǒng),參考文獻(xiàn)[29]假設(shè)發(fā)送端通過一個(gè)塊衰落無線信道向控制中心發(fā)送狀態(tài)更新信息,即該發(fā)送端狀態(tài)信息傳輸成功率為p。記第t個(gè)時(shí)隙的更新策略和傳輸結(jié)構(gòu)分別為U(t)和S(t)。發(fā)送端選擇更新則U(t)=1,否則為0。狀態(tài)信息成功傳輸則S(t)= 1,否則為0。當(dāng)接收端收到狀態(tài)更新后,會(huì)向發(fā)送端發(fā)送反饋信息,否則不發(fā)送。對(duì)于狀態(tài)估計(jì)方法,接收端會(huì)將收到的最新狀態(tài)信息直接視作當(dāng)前狀態(tài)信息的估計(jì)。另一方面,由于無線資源受限,發(fā)送端不能時(shí)時(shí)占用信道,因此平均更新頻率應(yīng)當(dāng)受限,假設(shè)最大更新頻率為ρ。優(yōu)化目標(biāo)是最小化系統(tǒng)的平均信息年齡。
由于上述優(yōu)化問題存在平均更新頻率應(yīng)當(dāng)小于給定值的限制條件,首先引入虛擬隊(duì)列H(t),并將滿足該限制條件轉(zhuǎn)化為保證該虛擬隊(duì)列平均速率穩(wěn)定(mean rate stable)。該虛擬隊(duì)列遵從:H(t+ 1) = [H(t) -ρ+U(t)]+,其中ρ為平均更新頻率。進(jìn)一步定義李雅普諾夫函數(shù)和效用函數(shù),并證明李雅普諾夫漂移和效用函數(shù)的和的上界就是平均信息緊迫度上界,再代入每個(gè)時(shí)隙更新概率為ρ的隨機(jī)更新策略,即可求出平均信息緊迫度的上界。通過最小化該上界,可以得出動(dòng)態(tài)門限更新策略。在該策略中,動(dòng)態(tài)門限為李雅普諾夫優(yōu)化方法中的收斂系數(shù)和虛擬隊(duì)列長度的乘積。每個(gè)時(shí)隙開始時(shí),發(fā)送端首先基于估計(jì)誤差和下一時(shí)隙的情境權(quán)重求出更新指數(shù),僅當(dāng)更新指數(shù)大于動(dòng)態(tài)門限時(shí),發(fā)送端向接收端發(fā)送更新信息。信息緊迫度最優(yōu)的更新策略、動(dòng)態(tài)門限更新策略和信息年齡最優(yōu)的更新策略性能對(duì)比如圖4所示,仿真結(jié)果顯示基于信息緊迫度的更新策略相較基于信息年齡的更新策略,能夠達(dá)到更低的平均信息緊迫度。這說明基于信息緊迫度的更新策略傾向于將通信資源分配給緊急情況下的狀態(tài)更新,從而保證系統(tǒng)安全。
圖4 信息緊迫度最優(yōu)的更新策略、動(dòng)態(tài)門限更新策略和信息年齡最優(yōu)的更新策略性能對(duì)比
參考文獻(xiàn)[29]中的策略雖然簡潔易于實(shí)現(xiàn),但需要知道下個(gè)時(shí)隙準(zhǔn)確的情境權(quán)重(即ω(t+ 1)) 來計(jì)算更新指數(shù),而ω(t+ 1)在實(shí)際系統(tǒng)中往往難以獲知。為了解決這一問題,參考文獻(xiàn)[30]提出的動(dòng)態(tài)門限更新策略僅需用到下個(gè)時(shí)隙情境權(quán)重的條件期望,即E[ω(t+ 1)|ω(t)]。但該方法需要獲知情境權(quán)重的完整狀態(tài)轉(zhuǎn)移概率,而在實(shí)際系統(tǒng)中轉(zhuǎn)移概率往往不能獲知或隨著時(shí)間發(fā)生變化,因此參考文獻(xiàn)[30]進(jìn)一步采用在線強(qiáng)化學(xué)習(xí)算法SARSA學(xué)習(xí)出發(fā)送端情境權(quán)重的變化和相應(yīng)的更新策略。仿真顯示,動(dòng)態(tài)門限更新策略和基于SARSA的更新策略在更新頻率較大時(shí)都能達(dá)到近似最優(yōu)的性能,而在更新頻率較小時(shí),基于SARSA的更新策略顯著優(yōu)于動(dòng)態(tài)門限更新策略。仿真結(jié)果顯示,動(dòng)態(tài)門限更新策略和基于SARSA的更新策略在更新頻率較大時(shí)性能均接近最優(yōu),而在更新頻率較小時(shí),基于SARSA的更新策略顯著優(yōu)于動(dòng)態(tài)門限更新策略。
參考文獻(xiàn)[31]則考慮接入受限的多發(fā)送端場景。離散時(shí)間系統(tǒng)中存在N個(gè)發(fā)送端和一個(gè)控制中心,每個(gè)發(fā)送端都通過一個(gè)塊衰落信道向控制中心發(fā)送狀態(tài)信息,第i個(gè)發(fā)送端的傳輸成功概率為pi。系統(tǒng)中每個(gè)時(shí)隙僅允許K個(gè)發(fā)送端同時(shí)向控制中心傳輸狀態(tài)更新信息。優(yōu)化目標(biāo)是在上述系統(tǒng)中最小化平均信息緊迫度。該文首先通過李雅普諾夫優(yōu)化方法得出了集中式的調(diào)度策略,每個(gè)時(shí)隙開始時(shí)控制中心基于發(fā)送端的下一時(shí)隙情境權(quán)重和估計(jì)誤差計(jì)算每個(gè)發(fā)送端對(duì)應(yīng)的更新指數(shù),并調(diào)度更新指數(shù)最大的K個(gè)發(fā)送端向控制中心傳輸狀態(tài)更新信息。
集中式調(diào)度雖然性能優(yōu)越,但在實(shí)際系統(tǒng)控制中心往往難以獲得所有發(fā)送端的估計(jì)誤差和情境權(quán)重。因此參考文獻(xiàn)[31]進(jìn)一步提出了基于CSMA/CA的動(dòng)態(tài)門限分布式調(diào)度算法。該策略中的動(dòng)態(tài)門限由每個(gè)發(fā)送端在本地維護(hù),但所有發(fā)送端的動(dòng)態(tài)門限是一致的。僅有更新指數(shù)大于動(dòng)態(tài)門限的發(fā)送端才能在每個(gè)時(shí)隙的競爭階段參與信道競爭,競爭成功的K個(gè)發(fā)送端進(jìn)入此后的傳輸階段。在長度為W個(gè)微時(shí)隙(mini-slot)的競爭階段中,所有競爭者隨機(jī)獲得一個(gè)避讓時(shí)間。若競爭者避讓時(shí)間結(jié)束,仍有剩余的傳輸機(jī)會(huì),則該競爭者競爭成功。若競爭結(jié)束后可用信道未能被完全占用,則降低動(dòng)態(tài)門限,增加發(fā)送端競爭機(jī)會(huì),而動(dòng)態(tài)門限較低時(shí)則會(huì)導(dǎo)致劇烈競爭,此時(shí)應(yīng)當(dāng)增加門限。仿真顯示,所提動(dòng)態(tài)門限分布式調(diào)度算法性能對(duì)于發(fā)送端數(shù)目的魯棒性較強(qiáng),能很好地適應(yīng)海量接入場景。
本文從狀態(tài)更新系統(tǒng)中的信息時(shí)效性出發(fā),闡述了在通信資源受限情況下現(xiàn)有的低時(shí)延高可靠概念并不足以全面刻畫信息時(shí)效性;進(jìn)而介紹了當(dāng)前領(lǐng)域關(guān)于信息時(shí)效性度量的定義,以及在無線網(wǎng)絡(luò)中基于這些度量的相關(guān)優(yōu)化工作。
面向狀態(tài)信息時(shí)效性的通信系統(tǒng)設(shè)計(jì)不同于現(xiàn)有以時(shí)延和吞吐量為優(yōu)化目標(biāo)的系統(tǒng),主要區(qū)別有兩點(diǎn):狀態(tài)信息時(shí)效性不僅涉及通信時(shí)延,還包括調(diào)度時(shí)延、網(wǎng)絡(luò)擁塞情況等因素;狀態(tài)信息時(shí)效性與發(fā)送端本身狀態(tài)變化過程有關(guān),因此要考慮狀態(tài)信息對(duì)于系統(tǒng)性能的影響。這意味著基于狀態(tài)信息時(shí)效性的網(wǎng)絡(luò)優(yōu)化應(yīng)綜合考慮上述因素的影響。
可以看到,信息年齡、同步信息年齡、錯(cuò)誤信息年齡、信息緊迫度這些度量對(duì)于實(shí)際狀態(tài)信息的利用程度依次提升。但這并不意味著現(xiàn)有的度量就足以滿足狀態(tài)更新系統(tǒng)的需求,而更應(yīng)該被視為在這一領(lǐng)域的嘗試?,F(xiàn)有的工作往往對(duì)于信道條件、發(fā)送端狀態(tài)變化過程等有不同程度的抽象,而針對(duì)實(shí)際場景的考慮不足,未能充分刻畫狀態(tài)變化、信道條件等因素的影響。研究者們需要回答:(1)如何刻畫信息時(shí)效性與對(duì)應(yīng)物理系統(tǒng)性能之間的關(guān)系?(2)如何適應(yīng)變化復(fù)雜的信道環(huán)境以及刻畫發(fā)送端狀態(tài)變化過程?(3)如何設(shè)計(jì)具有面向大量接入場景的可擴(kuò)展性機(jī)制?回答第一個(gè)問題需要理解控制系統(tǒng)在不同時(shí)延情況下的系統(tǒng)性能;而第二個(gè)問題可以借助人工智能技術(shù)的強(qiáng)大表征能力,適應(yīng)環(huán)境和狀態(tài)的變化;針對(duì)第三個(gè)問題,需要對(duì)現(xiàn)有的系統(tǒng)做出調(diào)整,設(shè)計(jì)支持新業(yè)務(wù)的網(wǎng)絡(luò)架構(gòu)。綜上,推進(jìn)狀態(tài)信息時(shí)效性研究有賴于通信、控制、人工智能等多個(gè)學(xué)科領(lǐng)域的交叉融合,這也展示了該方向廣闊的研究前景。