邢志浩,楊博文,楊 堅(jiān)
(中國科學(xué)技術(shù)大學(xué) 自動(dòng)化系,安徽 合肥 230027)
為解決用戶設(shè)備的異構(gòu)性和網(wǎng)絡(luò)狀況的時(shí)變性,可伸縮視頻編碼(Scalable Video Coding, SVC)[1]成為了現(xiàn)代視頻傳輸系統(tǒng)中一個(gè)有吸引力的解決方案。許多研究[2-4]關(guān)注于長期演進(jìn)(Long Term Evolution, LTE)系統(tǒng)中SVC傳輸?shù)馁Y源分配問題,但這些方法不考慮視頻服務(wù)器的層數(shù)選擇,視頻服務(wù)器須向基站傳輸包含所有層數(shù)的SVC視頻,這無疑增大了回傳網(wǎng)絡(luò)的負(fù)擔(dān)。
由于上述原因,有一些研究同時(shí)關(guān)注SVC視頻的層數(shù)選擇和LTE資源分配。文獻(xiàn)[5]提出了一種在LTE系統(tǒng)下傳輸SVC視頻的跨層設(shè)計(jì),但該算法僅僅根據(jù)用戶反饋的信道質(zhì)量進(jìn)行層數(shù)劃分,然而由于無線基站資源有限,用戶的信道質(zhì)量高并不意味著能獲得充足的帶寬。文獻(xiàn)[6]提出了一種層數(shù)選擇和跨層資源分配算法,與傳統(tǒng)算法相比,該算法具有視頻質(zhì)量高且中斷率小的優(yōu)點(diǎn),但其層數(shù)選擇部分并未利用跨層信息,決策效果受到影響。
在本文中,首先針對在LTE系統(tǒng)中傳輸SVC視頻的場景,以服務(wù)質(zhì)量為優(yōu)化目標(biāo)建立視頻層數(shù)選擇和資源分配的問題模型。進(jìn)一步地,考慮到視頻層數(shù)選擇和資源分配的時(shí)間尺度差異很大,利用李雅普諾夫優(yōu)化方法將問題分離成兩個(gè)子問題。通過對子問題特性的分析,設(shè)計(jì)并實(shí)現(xiàn)了一種視頻層數(shù)選擇和資源分配算法。最后,通過對比實(shí)驗(yàn)驗(yàn)證本文提出的視頻層數(shù)選擇和資源分配算法的效果。
本文考慮單個(gè)LTE基站對多用戶傳輸SVC視頻的場景。系統(tǒng)架構(gòu)圖如圖1所示。N個(gè)用戶同時(shí)連接到基站,向視頻服務(wù)器發(fā)起不同的視頻請求?;靖鶕?jù)無線信道的狀況對用戶進(jìn)行資源分配;而視頻服務(wù)器則依據(jù)基站返回的跨層信息進(jìn)行視頻層數(shù)的選擇,從而實(shí)現(xiàn)碼率自適應(yīng)。本節(jié)針對這一場景建立問題的數(shù)學(xué)模型。
圖1 系統(tǒng)架構(gòu)圖
本節(jié)主要介紹LTE系統(tǒng)模型。為減少信令開銷,子載波被聚合成資源塊(Resource Block,RB)。調(diào)度器每隔1 ms進(jìn)行一次調(diào)度,這個(gè)周期稱為傳輸時(shí)間間隔(Transmission Time Interval, TTI)。通常,調(diào)度器以兩個(gè)在時(shí)域上連續(xù)的RB為調(diào)度的最小單位,這兩個(gè)連續(xù)的RB被稱為調(diào)度塊(Scheduling Block, SB)。設(shè)一個(gè)TTI內(nèi),所有可用的SB集合為I={1,2,…,I}。
LTE中速率的配置通過調(diào)制與編碼策略(Modulation and Coding Scheme, MCS)索引值實(shí)現(xiàn),一旦為調(diào)度塊i選擇了MCS索引j,它的傳輸速率r(j)也就隨之確定[7]。其中j∈{1,2,…,J},代表最大的MCS索引。MCS索引越大,則碼率越高,r(j)也越大,編碼的冗余度則越小。
每個(gè)用戶根據(jù)各SB塊級別的等效信號(hào)與干擾加噪聲比(Signal to Interference plus Noise Ratio, SINR)估計(jì)出可以選擇的最高M(jìn)CS索引,并將這個(gè)最高M(jìn)CS以信道質(zhì)量指示(Channel Quality Indicator, CQI)的形式向基站上報(bào)。等效SINR與MCS、CQI的映射表可見參考文獻(xiàn)[8]中的表1。用閾值Γj表示MCS索引取j時(shí),使塊誤碼率(Block Error Rate, BLER)小于10%的最小SINR。則對于用戶n而言,調(diào)度塊i的SINR為γn,i時(shí),可以選取的最大MCS索引可以表示為:
Jn,i=max{j|Γj≤γn,i,j=0,1,2,…,J}
(1)
其中,Γ0等于負(fù)無窮,對應(yīng)的MCS索引j=0表示超出范圍,傳輸速率視為0。
在LTE系統(tǒng)的MCS選擇中,有一個(gè)重要約束,即在一個(gè)TTI內(nèi),所有分配給同一用戶的SB必須選擇相同的MCS[9]。令bn,j(t)∈{0,1} 表示第t個(gè)TTI時(shí)用戶n的MCS選擇,bn,j=1表示用戶n選擇MCS索引j,bn,j=0 則相反。由于一個(gè)用戶只能選擇一個(gè)MCS,因此有:
(2)
令an,i(t)∈{0,1}表示第t個(gè)TTI時(shí)調(diào)度塊的分配,an,i=1表示將調(diào)度塊i分配給用戶,反之則表示不分配。因?yàn)橐粋€(gè)調(diào)度塊最多只能分配給一個(gè)用戶,所以an,i滿足
(3)
其中,N={1,2,…,N} 代表用戶的集合,N為用戶總數(shù)。
為避免過大的誤碼率,如果一個(gè)調(diào)度塊采用了過高的MCS,則它的速率被視為0,從而用戶n在第t個(gè)TTI時(shí)的比特率可以表示為:
(4)
由于第二個(gè)求和符號(hào)的上限是Jn,i,選取超過Jn,i的MCS會(huì)導(dǎo)致求和的結(jié)果為0。
為實(shí)現(xiàn)碼率自適應(yīng),采用SVC技術(shù)來得到不同速率的碼流。視頻以質(zhì)量可伸縮的方式被編碼為L層,其中包括一個(gè)基本層和L-1個(gè)增強(qiáng)層。通過增加和減少視頻層數(shù),視頻碼率得以適應(yīng)網(wǎng)絡(luò)狀況的變化。
由于一個(gè)圖像組(Group of Pictures, GoP)內(nèi)視頻幀的相互依賴,視頻碼率的決策一般以GoP為粒度進(jìn)行。為保證視頻的壓縮率,GoP通常包含10幀以上的數(shù)據(jù),至少持續(xù)上百毫秒。另一方面,LTE資源調(diào)度在每個(gè)TTI進(jìn)行,而一個(gè)TTI僅持續(xù)1 ms,這意味著資源分配要比層數(shù)決策頻繁得多。為方便起見,假設(shè)GoP的持續(xù)時(shí)間是TTI的整數(shù)倍,一個(gè)GoP包含T個(gè)連續(xù)的TTI。從而,視頻層數(shù)的決策每隔T個(gè)TTI進(jìn)行一次。
視頻層數(shù)決策僅在第(k-1)T+1個(gè)TTI的開始進(jìn)行,其中k為正整數(shù)。第k個(gè)GoP決策后的T個(gè)TTI滿足t∈[(k-1)T+1,kT]。用第k個(gè)GoP的平均視頻比特率代表這個(gè)時(shí)間段的視頻碼率:
ωn(t)
(5)
qn(t)
(6)
如果選取的視頻碼率持續(xù)大于用戶可用的比特率,則客戶端的播放會(huì)發(fā)生中斷,進(jìn)而導(dǎo)致服務(wù)質(zhì)量的下降。為此,引入一個(gè)約束來避免中斷的發(fā)生:
(7)
系統(tǒng)的瞬時(shí)效用定義為所有用戶的視頻質(zhì)量之和:
(8)
從而系統(tǒng)的時(shí)間平均效用定義為:
(9)
在傳輸速率約束(式(7))和資源分配約束(式(2)、式(3))下,聯(lián)合優(yōu)化層數(shù)選擇和資源分配,以最大化系統(tǒng)的時(shí)間平均效用。系統(tǒng)效用最大化的問題可以描述為:
(10)
(11)
顯然,式(10)是一個(gè)隨機(jī)優(yōu)化問題,在對信道情況的分布沒有先驗(yàn)知識(shí)的情況下難以求解。為此,本文算法不依賴先驗(yàn)統(tǒng)計(jì)知識(shí),而使用在線的方法求解。
本節(jié)基于李雅普諾夫優(yōu)化理論,提出一種雙時(shí)間尺度的算法。首先利用李雅普諾夫漂移將問題分離成兩個(gè)子問題,再根據(jù)子問題的特性進(jìn)行求解。
為利用李雅普諾夫優(yōu)化方法求解式(10),引入一個(gè)虛擬隊(duì)列Hn(t),將時(shí)間平均約束式(7)轉(zhuǎn)化成隊(duì)列穩(wěn)定性約束。隊(duì)列Hn(t)的遞推關(guān)系如下:
Hn(t+1)=(Hn(t)+ωn(t)-rn(t))+
(12)
其中(a)+max(a,0)。根據(jù)參考文獻(xiàn)[10],隊(duì)列Hn(t)的平均速率穩(wěn)定意味著時(shí)間平均約束式(7)成立。為分析隊(duì)列穩(wěn)定性,引入李雅普諾夫函數(shù)
(13)
令H(t)(H1,H2,…,Hn)表示所有用戶t時(shí)刻的虛擬隊(duì)列長度,則T個(gè)TTI內(nèi)的條件李雅普諾夫漂移定義為這段時(shí)間內(nèi)李雅普諾夫函數(shù)變化的期望:
ΔT(t)E[L(t+T)-L(t)|H(t)]
(14)
根據(jù)李雅普諾夫漂移理論,時(shí)間平均約束式(7)可以轉(zhuǎn)化為最小化李雅普諾夫漂移ΔT(t)。由于目標(biāo)是在式(7)約束下最大化系統(tǒng)效用,將漂移ΔT(t)與目標(biāo)函數(shù)相結(jié)合,如下式:
(15)
在每個(gè)TTI進(jìn)行資源分配時(shí),可以通過用戶反饋的CQI估計(jì)信道質(zhì)量,根據(jù)當(dāng)前的觀測進(jìn)行決策;然而,視頻的層數(shù)選擇每隔T個(gè)TTI才執(zhí)行一次,決策時(shí)難以知道未來T個(gè)TTI的虛擬隊(duì)列長度。為解決這個(gè)困難,采取參考文獻(xiàn)[11]中的思想,將當(dāng)前的隊(duì)列長度作為未來隊(duì)列長度的近似,以得到公式(15)的一個(gè)松弛的上界。下面給出這個(gè)上界和證明過程。
定理1令t=kT,k為非負(fù)整數(shù)。在任意可行決策下,有
(16)
其中正常數(shù)B定義為B
證明:將虛擬隊(duì)列的遞推公式式(12)兩邊取平方并展開,可以得到
(17)
那么,
(18)
將上式兩邊減去效用U,并在[t,t+T-1]區(qū)間內(nèi)求和,稍作整理可得:
(19)
其中,Aleft表示式(15),B1
接下來,對式(19)的右半部分,用Hn(t)來近似Hn(τ),以得到更寬松的條件:
Hn(t)-(τ-t)rmax≤Hn(τ)≤Hn(t)+(τ-t)ωmax
(20)
從而有:
(21)
(22)
將式(21)、式(22)帶入式(19),即得到式(16)。定理1得證。
根據(jù)李亞普諾夫漂移和優(yōu)化理論,聯(lián)合優(yōu)化問題的決策可以通過最小化上界式(16)得出,而無須直接最小化公式(15)。
可以觀察到,定理1中上界式(16)右邊的第二項(xiàng)僅與視頻層數(shù)決策ln相關(guān);而最后一項(xiàng)則與SB分配an,i和MCS選擇bn,j相關(guān)。由于這樣的特殊結(jié)構(gòu),優(yōu)化問題可以被分離成兩個(gè)并行的子問題,一個(gè)是視頻層數(shù)選擇問題,另一個(gè)是LTE資源分配問題。
2.2.1視頻層數(shù)選擇
基于前述上界(16)的特性,層數(shù)選擇決策可以通過最大化式(16)右邊的第二項(xiàng)得到。即在第t個(gè)TTI(t=(k-1)T+1,k=1,2,…)時(shí),求解以下問題:
(23)
s.t.ln(t)∈Ln,?n
(24)
在式(23)的目標(biāo)函數(shù)中,第二項(xiàng)是虛擬隊(duì)列長度乘以視頻比特率,由李亞普諾夫漂移引入,起到穩(wěn)定隊(duì)列的作用。較大的V使決策傾向于選擇更高層數(shù)以改善用戶視頻質(zhì)量,而較小的V更利于虛擬隊(duì)列的穩(wěn)定。
由于每個(gè)用戶的層數(shù)決策相互獨(dú)立,式(23)可以進(jìn)一步分離成N個(gè)子問題。通常而言,在實(shí)際系統(tǒng)中視頻的總層數(shù)不會(huì)太多,因此,視頻層數(shù)的決策可以通過遍歷所有可行的層數(shù)得到。并且,層數(shù)決策每隔T個(gè)TTI才會(huì)執(zhí)行一次,因此,層數(shù)選擇的計(jì)算開銷非常低。
2.2.2LTE資源分配問題
SB分配和MCS選擇可以通過最小化式(16)中的最后一項(xiàng)來得到。將式(4)帶入式(16)的最后一項(xiàng),LTE資源分配問題可以描述為:
(25)
(26)
問題中的目標(biāo)函數(shù)可以視為用虛擬隊(duì)列長度加權(quán)了的用戶速率。在資源分配問題中,如果像層數(shù)選擇一樣采用GoP開始時(shí)的虛擬隊(duì)列長度進(jìn)行決策,則會(huì)造成在一個(gè)GoP內(nèi)資源過多地向隊(duì)列長的用戶傾斜。所以,必須采用每個(gè)TTI實(shí)際的虛擬隊(duì)列長度,這樣當(dāng)一個(gè)用戶得到過多調(diào)度時(shí),其虛擬隊(duì)列的長度會(huì)相對變短,其他用戶就會(huì)得到調(diào)度,從而保證算法的公平性。
首先,式(25)是一個(gè)非線性問題,難以直接取得最優(yōu)解。根據(jù)文獻(xiàn)[7]和文獻(xiàn)[12]的闡述,通過換元法,可將該問題轉(zhuǎn)化成一個(gè)整數(shù)線性規(guī)劃問題。然而,求解整數(shù)線性規(guī)劃需要消耗大量的計(jì)算量。同時(shí),如果MCS約束式(2)不存在,即同一TTI內(nèi)分配給同一用戶的SB可以選取不同的MCS,式(25)可以進(jìn)一步分離為I個(gè)子問題,每個(gè)子問題對應(yīng)一個(gè)SB的調(diào)度。這樣一來,無論調(diào)度塊i分配給哪個(gè)用戶n,都可以選取最高M(jìn)CS 索引Jn,i;從而,為最大化目標(biāo)函數(shù),調(diào)度塊i應(yīng)該被分配給虛擬隊(duì)列和速率乘積最大的用戶,即
(27)
根據(jù)上述原因,本文借鑒了文獻(xiàn)[8]中的思想來解決這個(gè)問題,采用一種次優(yōu)方法進(jìn)行資源分配,描述如下:
(1)對于每個(gè)SB,按照式(27)進(jìn)行SB的分配;
(2)對于每個(gè)用戶,根據(jù)分配給它們的SB的CQI,估計(jì)出這幾個(gè)SB的SINR值γn,i,根據(jù)式(1)有:
γn,i≈Γj+ΔΓ,j=Jn,i
(28)
其中ΔΓ是加在閾值Γj上的一個(gè)正偏移量。
(29)
(30)
其中,Jn為用戶n最終選擇的MCS。
上述資源分配算法只需要遍歷用戶即可確定一個(gè)SB的分配;對于每個(gè)用戶MCS的選擇,也只需要進(jìn)行調(diào)和平均數(shù)的計(jì)算和查映射表的操作。因此,該資源分配算法具有較高的效率。
通過仿真實(shí)驗(yàn)?zāi)M多用戶連入同一個(gè)資源有限的基站進(jìn)行不同視頻請求的場景,以驗(yàn)證本文所提出的層數(shù)選擇和資源分配算法的有效性。然后通過對比實(shí)驗(yàn)評估本文所提算法的性能。
在仿真實(shí)驗(yàn)中,考慮單個(gè)LTE基站,用戶隨機(jī)散布在基站覆蓋范圍內(nèi)。一個(gè)TTI中有25個(gè)可用SB(即將頻域劃分成25個(gè)RB),每個(gè)RB有12個(gè)子載波,相應(yīng)仿真參數(shù)如表 1所示。
表1 LTE仿真參數(shù)
對于SVC視頻,選取了幾個(gè)參數(shù)相同的視頻流,視頻編碼器的設(shè)置如表 2所示。連入基站的用戶隨機(jī)選擇一個(gè)視頻發(fā)起請求,緩沖區(qū)達(dá)到10個(gè)GoP時(shí)開始播放,并持續(xù)播放100個(gè)GoP。
表2 SVC編碼器設(shè)置
為評估所提算法的性能,將實(shí)驗(yàn)結(jié)果與QCLS算法[6]進(jìn)行對比。用PSNR作為視頻質(zhì)量的衡量指標(biāo),在用戶數(shù)不同的情況下進(jìn)行實(shí)驗(yàn),平均PSNR如圖2所示。從圖2可以看出,本文所提算法的PSNR整體優(yōu)于QCLS算法。QCLS算法的性能依賴于R-D模型的擬合效果,然而R-D曲線難以表現(xiàn)出視頻碼率和質(zhì)量隨時(shí)間的變化。而在本文算法中,這些信息將實(shí)時(shí)影響隊(duì)列長度,從而影響決策。
圖2 所有用戶的平均PSNR
除視頻質(zhì)量以外,中斷率也是影響服務(wù)質(zhì)量的重要指標(biāo),圖3展示了兩種算法在不同用戶數(shù)下的中斷情況。本文算法的中斷率較少,這說明本文提出的算法通過確保虛擬隊(duì)列的穩(wěn)定性來使公式(7)成立,能有效地防止中斷的發(fā)生。
圖3 所有用戶的平均中斷GoP數(shù)量
同時(shí),采用最小-最大指數(shù)[6]作為公平性指標(biāo)對算法的公平性進(jìn)行比較。仿真結(jié)果如圖4所示??梢钥闯?,本文所提算法的公平性要優(yōu)于QCLS算法。如式(25)下方所討論的,當(dāng)一個(gè)用戶過多地得到調(diào)度時(shí),其虛擬隊(duì)列長度將會(huì)變短,從而使虛擬隊(duì)列長的用戶得到調(diào)度,保證了算法的公平性。
圖4 公平性指標(biāo)
本文基于李雅普諾夫優(yōu)化理論,針對在LTE網(wǎng)絡(luò)中傳輸SVC視頻的場景,提出了一種層數(shù)選擇和資源分配算法。通過對比實(shí)驗(yàn),表明本文所提的算法提升了視頻的PSNR,保證了視頻的流暢播放,同時(shí)具有較好的公平性。