施雨軒/SHI Yuxuan,吳泳澎/WU Yongpeng,張文軍/ZHANG Wenjun
( 上海交通大學(xué),中國(guó) 上海200240 )
2019 年底,5G 移動(dòng)通信網(wǎng)絡(luò)的正式商用為人、機(jī)、物的互聯(lián)開(kāi)創(chuàng)了嶄新的通信范式。人們對(duì)下一代移動(dòng)通信網(wǎng)絡(luò)的愿景,不僅體現(xiàn)在通信、感知、計(jì)算泛在融合的硬性需求中,還體現(xiàn)在人、機(jī)、物、靈(genie)互相聯(lián)結(jié)的超大規(guī)模架構(gòu)中[1]?!叭f(wàn)物智聯(lián)”的通信范式將通信領(lǐng)域的邊界從物理世界拓寬到數(shù)字世界,實(shí)現(xiàn)高效、智能與大規(guī)模的傳輸網(wǎng)絡(luò)。與此同時(shí),新一代通信網(wǎng)絡(luò)也給現(xiàn)有的網(wǎng)絡(luò)運(yùn)營(yíng)與設(shè)備鋪設(shè)帶來(lái)極大挑戰(zhàn)。據(jù)國(guó)際電信聯(lián)盟(ITU)預(yù)測(cè):全球移動(dòng)數(shù)據(jù)流量的年增長(zhǎng)速率將會(huì)在2030 年達(dá)到55%,數(shù)據(jù)總量將會(huì)提升至現(xiàn)在的100 倍,遠(yuǎn)超5G 的體量。此外,人們多維度、多途徑的通信需求會(huì)帶來(lái)數(shù)據(jù)模態(tài)的多樣化(語(yǔ)音、圖像、視頻)、任務(wù)需求的多樣化、智能業(yè)務(wù)的多樣化,這些都會(huì)成為現(xiàn)有架構(gòu)的難點(diǎn)。為了解決這些難點(diǎn),人們將關(guān)注點(diǎn)從“如何精確恢復(fù)傳輸?shù)姆?hào)”轉(zhuǎn)移到“如何精確恢復(fù)傳輸?shù)恼Z(yǔ)義”[2]。語(yǔ)義層傳輸即語(yǔ)義通信,是一種關(guān)注傳輸符號(hào)中蘊(yùn)含信息的通信范式。這種通信范式能利用語(yǔ)義關(guān)聯(lián)性去除冗余數(shù)據(jù),并且在接收端通過(guò)背景知識(shí)庫(kù)來(lái)恢復(fù)語(yǔ)義,以執(zhí)行特定任務(wù)。需傳輸?shù)某橄笳Z(yǔ)義概念的數(shù)據(jù)量通常遠(yuǎn)小于精確的特征數(shù)據(jù)量,因此基于該范式的通信可以極大地提升傳輸效率。
采用SPSS 17.0軟件處理數(shù)據(jù),采用卡方檢驗(yàn)和t檢驗(yàn)對(duì)兩組患者的數(shù)據(jù)進(jìn)行比較,P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
語(yǔ)義通信的首次提出可以追溯到C. E. SHANNON 與W.WEAVER 的開(kāi)創(chuàng)性的著作《The Mathematical Theory of Communication》中[2]。邏輯概率在經(jīng)典信息論中對(duì)統(tǒng)計(jì)概率的替換,是信息論先賢們對(duì)語(yǔ)義信息度量的理解[3]。語(yǔ)義熵、語(yǔ)義信道容量[4]、語(yǔ)義反饋[5]以及背景知識(shí)[6]等相關(guān)概念相繼引入,極大地推動(dòng)了語(yǔ)義傳輸?shù)睦碚撗芯?。然而這些工作主要基于邏輯概率的測(cè)度,難以拓展到文本以外的應(yīng)用場(chǎng)景。近年來(lái),深度學(xué)習(xí)及其應(yīng)用(如自然語(yǔ)言處理、語(yǔ)音識(shí)別和計(jì)算機(jī)視覺(jué))的最新進(jìn)展為多模態(tài)語(yǔ)義通信的實(shí)現(xiàn)提供了可能,同時(shí)信源信道聯(lián)合編碼(JSCC)[7]被認(rèn)為是一種語(yǔ)義通信的可達(dá)方案,用于捕獲和傳輸語(yǔ)義特征?;谝陨戏椒?,一系列為多模態(tài)數(shù)據(jù)[8-10]傳輸而開(kāi)發(fā)的語(yǔ)義通信框架引起業(yè)界廣泛的關(guān)注。上述的語(yǔ)義通信方案在已有的架構(gòu)上取得不錯(cuò)的表現(xiàn),但由于缺乏語(yǔ)義表示的通用數(shù)學(xué)模型,語(yǔ)義通信的理論建模與從信息論視角的解讀仍然是一個(gè)開(kāi)放性問(wèn)題。
白銀文化的產(chǎn)生應(yīng)歸結(jié)于明代白銀貨幣化的進(jìn)程。根據(jù)成玉玲[6]的研究,明代白銀貨幣化經(jīng)歷了大明寶鈔的衰落和白銀貨幣合法化兩過(guò)程。具體如下:
基于以上討論,本文從理論模型與可實(shí)現(xiàn)框架的綜合視角來(lái)解讀語(yǔ)義通信,并提出一個(gè)通用的語(yǔ)義通信理論模型。通過(guò)將語(yǔ)義通信過(guò)程建模為一個(gè)考慮間接信源的JSCC問(wèn)題,我們可以利用經(jīng)典信息論工具來(lái)分析該模型的性能極限,并作為現(xiàn)實(shí)編碼方案/神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)依據(jù)。在該模型中,間接信源被視為不可觀測(cè)的語(yǔ)義信息,直接信源則被視為可被捕獲的外部信息,聯(lián)合信源信道編碼方案用于描述間接信源編碼與語(yǔ)義感知的信道編碼的結(jié)合。在給定有限/無(wú)限塊長(zhǎng)的設(shè)定上,基于模型對(duì)錯(cuò)誤概率、率失真函數(shù)、編碼方案進(jìn)行分析,對(duì)現(xiàn)實(shí)語(yǔ)義通信框架的設(shè)計(jì)有著指導(dǎo)意義。
現(xiàn)階段語(yǔ)義通信的工作大致分為兩部分:語(yǔ)義信息的理論工作,如度量定義、數(shù)學(xué)建模等;基于機(jī)器學(xué)習(xí)方法的語(yǔ)義提取與通信框架的相關(guān)工作。本節(jié)中,圍繞這兩個(gè)方面,我們重點(diǎn)介紹語(yǔ)義信息與語(yǔ)義通信的發(fā)展歷史與研究進(jìn)展。
1949 年,C. E. SHANNON 與W. WEAVER 在《The Mathematical Theory of Communication》中正式提出了“語(yǔ)義層面的信息傳輸”的相關(guān)概念[2]。其中,W. WEAVER 將通信分為3個(gè)層級(jí)的問(wèn)題:技術(shù)、語(yǔ)義與效率。作為旨在有噪信道上追求精確比特傳輸?shù)姆妒?,技術(shù)層級(jí)的通信已服務(wù)于面向內(nèi)容交付的無(wú)線網(wǎng)絡(luò)長(zhǎng)達(dá)半個(gè)世紀(jì)之久。其明確的性能極限早已由香農(nóng)理論給出,并被現(xiàn)有技術(shù)不斷逼近。然而人們的通信需求卻似乎永無(wú)極限:5G、6G 的不斷迭代、通信需求的爆炸式增長(zhǎng)、下游任務(wù)的多樣化與智能化,都是現(xiàn)有無(wú)線網(wǎng)絡(luò)亟需解決的難題。作為能夠解決以上問(wèn)題的未來(lái)基礎(chǔ)通信范式之一,語(yǔ)義通信是一種不再關(guān)注精準(zhǔn)比特恢復(fù)而是面向任務(wù)交付的新型范式。如圖1所示,針對(duì)圖像識(shí)別/分類任務(wù),圖中的孩童與摩托車被抽象為依賴于下游任務(wù)的語(yǔ)義概念,隨后編碼器對(duì)語(yǔ)義進(jìn)行編碼并通過(guò)信道進(jìn)行傳輸。在接收端通過(guò)背景知識(shí)庫(kù)恢復(fù)出來(lái)的并非是原有的精確像素。但利用恢復(fù)得到的語(yǔ)義依然可以輕松地完成圖像識(shí)別或分類任務(wù)。需要注意的是,語(yǔ)義通信在很大程度上依賴于譯碼端的背景知識(shí),因此可能會(huì)出現(xiàn)無(wú)礙于任務(wù)執(zhí)行的比特層面的誤差,例如收發(fā)兩端摩托車的樣式等。由于抽象出語(yǔ)義信息的數(shù)量級(jí)遠(yuǎn)小于傳統(tǒng)通信,因此語(yǔ)義通信可以極大地提升通信效率。
對(duì)語(yǔ)義信息進(jìn)行刻畫是語(yǔ)義通信中不可或缺的環(huán)節(jié)。不同語(yǔ)義信息的度量與定義,會(huì)對(duì)數(shù)據(jù)的語(yǔ)義提取、編碼方案以及下游任務(wù)的執(zhí)行等,產(chǎn)生重要的影響。
1.2.1 語(yǔ)義信息刻畫及度量
1.理念創(chuàng)新——我國(guó)主流政治文化網(wǎng)上引導(dǎo)能力提升的先導(dǎo)。理念是行為的先導(dǎo),先進(jìn)的傳播理念則是提升傳播效果的觀念因素和先導(dǎo)條件。適應(yīng)中國(guó)轉(zhuǎn)型深化期的特殊國(guó)情和互聯(lián)網(wǎng)在我國(guó)迅速發(fā)展普及的實(shí)際,我國(guó)主流政治文化的傳播必須進(jìn)一步增強(qiáng)傳播中的政治觀念、群眾觀念和時(shí)代觀念,樹(shù)立以受眾為中心,主動(dòng)引導(dǎo)、開(kāi)放包容的網(wǎng)絡(luò)傳播新理念。
3)U不可用,V可用,我們引入不同于碼字W的輔助隨機(jī)變量,可以得到:
稱取預(yù)處理紅枸杞粉2g(精確到0.0001),在一定的料液比、超聲時(shí)間、提取溫度下進(jìn)行超聲提取,提取完畢,過(guò)濾,用乙醇溶液醇沉過(guò)夜(乙醇含量80%以上)、棄去上清液,蒸干后溶解定容、稀釋后按照1.3.2.1所示方法測(cè)定吸光度,計(jì)算多糖含量。
其中,條件熵H(W|X)為碼字中包含的語(yǔ)義不確定性,例如碼字“蘋果”蘊(yùn)含了“水果”與“品牌”兩種意思;為接收到碼字基于邏輯概率的平均信息量。這篇啟發(fā)性的文章促進(jìn)了更多相關(guān)理論的產(chǎn)生。2020年,基于Rényi熵,M.KOUNTOURIS和N. PAPPAS[11]提出了通信系統(tǒng)中語(yǔ)義感知的信息度量方式;2021 年,A. CHATTOPADHYAY[12]等為了量化語(yǔ)義任務(wù)的復(fù)雜度,提出了用特定任務(wù)中最少需要回答的問(wèn)題數(shù)量而非最少比特?cái)?shù)(即熵)來(lái)刻畫復(fù)雜度。
▲圖1 針對(duì)圖像識(shí)別任務(wù)的語(yǔ)義通信
1.2.2 語(yǔ)義信息的理論建模
隨著語(yǔ)義信息理論的發(fā)展,人們開(kāi)始基于經(jīng)典的香農(nóng)信息論來(lái)研究語(yǔ)義建模。2021年,LIU J. K.等[13]基于經(jīng)典的間接信源編碼模型來(lái)刻畫語(yǔ)義感知的率失真函數(shù)。其中,語(yǔ)義信息被建模為間接信源,表征信息被建模為直接信源。與傳統(tǒng)信源編碼不同,該模型同時(shí)對(duì)語(yǔ)義信源與表征信息的重建有失真度的要求。2022 年,ZHANG P.[1]提出用“語(yǔ)義基”(Seb)的概念作為語(yǔ)義信息的表征框架,這樣能夠更好地描述發(fā)送數(shù)據(jù)的應(yīng)用意圖與不同模態(tài);在文獻(xiàn)[14]中,NIU K.等從聯(lián)合典型的角度考慮了經(jīng)典編碼方案與語(yǔ)義編碼方案的異同。與經(jīng)典編碼中信源序列S與碼字序列X映射的唯一性不同,語(yǔ)義編碼中不同的信源序列有概率映射到同一個(gè)碼字上。這是由于針對(duì)特定任務(wù),不同的信源序列可能擁有相近的“語(yǔ)義”,即在語(yǔ)義空間毗鄰。圖2[14]很好地解釋了語(yǔ)義編碼能夠擁有更小碼本空間的原因。由于背景知識(shí)庫(kù)的存在,即使帶有歧義的映射也能完成特定任務(wù)的無(wú)損傳輸,這也是語(yǔ)義通信的優(yōu)勢(shì)所在。文獻(xiàn)[15]將語(yǔ)義信息與神經(jīng)網(wǎng)絡(luò)的隱含層變量聯(lián)系起來(lái),根據(jù)信息瓶頸理論將語(yǔ)義損失刻畫到神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中,以提高圖像的傳輸表現(xiàn)。其基本原理是基于變分自編碼器(VAE)中的證據(jù)下界,構(gòu)建輔助分布用于近似較難計(jì)算的語(yǔ)義分布。
▲圖2 經(jīng)典編碼傳輸與語(yǔ)義編碼傳輸?shù)膶?duì)比(從序列典型性角度)[14]
1.2.3 基于機(jī)器學(xué)習(xí)方法的語(yǔ)義提取與通信框架
在特定情形下(如S與X聯(lián)合高斯分布且失真測(cè)度采用均方誤差),基于該模型的速率失真函數(shù)可通過(guò)線性最小均方誤差估計(jì)(LMMSE)的線性特性以及代理(surrogate)②在聯(lián)合高斯情形下,對(duì)S的失真約束可以退化為對(duì)X的失真約束。失真測(cè)度獲得。
1)多模態(tài)數(shù)據(jù)的語(yǔ)義提取
文獻(xiàn)[10]中,LIU J. K.提出刻畫語(yǔ)義信息的信源編碼模型。如圖3所示[13],信源的語(yǔ)義特征被刻畫為不可見(jiàn)的信源S,S 服從分布PS且至信源可觀測(cè)外部特征X 的轉(zhuǎn)移概率為PX|S。與傳統(tǒng)間接信源編碼僅要求恢復(fù)不可見(jiàn)信源?有所不同,譯碼端要求同時(shí)恢復(fù)語(yǔ)義重建與比特重建,失真測(cè)度函數(shù)分別對(duì)應(yīng)要求的失真度約束。基于該模型,其速率-失真函數(shù)被表述為:
廢舊農(nóng)膜回收利用工作作為一項(xiàng)社會(huì)性公益事業(yè),社會(huì)效益和生態(tài)效益顯著,需要政府的扶持。農(nóng)業(yè)環(huán)保部門應(yīng)積極爭(zhēng)取省市廢舊農(nóng)膜專項(xiàng)補(bǔ)助資金,同時(shí)區(qū)級(jí)配套資金,加大對(duì)廢舊農(nóng)膜回收利用企業(yè)的扶持力度,鼓勵(lì)企業(yè)擴(kuò)大回收規(guī)模,對(duì)現(xiàn)有設(shè)備進(jìn)行技術(shù)改造升級(jí),延長(zhǎng)產(chǎn)業(yè)鏈,生產(chǎn)滴管、塑料筐、井蓋等產(chǎn)品,增加產(chǎn)品附加值。政府層面與電力、交通等部門協(xié)商,落實(shí)電價(jià)優(yōu)惠補(bǔ)貼政策,減免過(guò)路費(fèi)等,減少加工運(yùn)輸成本,為回收加工企業(yè)注入終端動(dòng)力。
階級(jí)的聯(lián)合必然發(fā)展為階級(jí)民主。階級(jí)間的聯(lián)合與合作,為人民民主的實(shí)現(xiàn)提供了廣泛的社會(huì)力量,保障了人民的政治地位和政治權(quán)利。統(tǒng)一戰(zhàn)線不僅為人民民主提供了廣泛的階級(jí)基礎(chǔ)和社會(huì)基礎(chǔ),而且為協(xié)商民主主體提供了多元社會(huì)力量。
語(yǔ)義信息能夠?qū)Χ嗄B(tài)數(shù)據(jù)語(yǔ)義進(jìn)行處理,還可以與經(jīng)典通信技術(shù)相結(jié)合?;谡Z(yǔ)義的混合自動(dòng)重傳請(qǐng)求(SRHARQ),在文獻(xiàn)[9]中用于克服信道狀態(tài)的動(dòng)態(tài)變化,并獲得了優(yōu)于傳統(tǒng)HARQ 的性能表現(xiàn);DAI J. C.[10]等利用基于高斯噪聲的非線性變換實(shí)現(xiàn)自適應(yīng)語(yǔ)義通信框架,并可根據(jù)不同信道情況進(jìn)行速率分配,以達(dá)到在無(wú)線信道中較好的傳輸效果。此外,應(yīng)用于物聯(lián)網(wǎng)(IoT)的云網(wǎng)絡(luò)架構(gòu)場(chǎng)景與后5G大規(guī)模連接場(chǎng)景中的相關(guān)框架也有優(yōu)異的表現(xiàn)。
3)本地背景知識(shí)庫(kù)設(shè)計(jì)
選擇具有專業(yè)素養(yǎng)且口味互異的評(píng)價(jià)員20人,組成評(píng)價(jià)小組,對(duì)飲料的色澤、氣味、口感進(jìn)行評(píng)價(jià)。應(yīng)用統(tǒng)計(jì)學(xué)的方法處理數(shù)據(jù)[9],所得感官評(píng)價(jià)方法如表1所示。
診斷多重共線性的方法常用的是方差膨脹因子(VIF)法,可根據(jù)方差膨脹因子(VIF)的大小進(jìn)行判斷。一般地,當(dāng)0<VIF<10時(shí)可認(rèn)為指標(biāo)不存在多重共線性。借助SPSS,計(jì)算結(jié)果如表4:
在語(yǔ)義通信的場(chǎng)景中,一個(gè)優(yōu)異的本地知識(shí)庫(kù)是收發(fā)端進(jìn)行語(yǔ)義提取和生成的重要因素。關(guān)于本地背景知識(shí)庫(kù)的工作目前仍處于探索階段。XIA L.[16]等從理論角度討論了本地知識(shí)庫(kù)匹配問(wèn)題對(duì)語(yǔ)義通信中用戶聯(lián)合與帶寬分配的影響。S. KADAM[17]等針對(duì)不同場(chǎng)景進(jìn)行定制化的背景知識(shí)庫(kù)的收集和獲取,也就是說(shuō)收發(fā)端僅在該案例下完成對(duì)知識(shí)庫(kù)的利用。S. KADAM等在工作中考慮足球賽事解說(shuō)的場(chǎng)景并構(gòu)建語(yǔ)義知識(shí)庫(kù),顯著提高傳輸效率。此外,聊天生成式預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT)[18]使用參數(shù)量巨大的模型和海量的優(yōu)質(zhì)原始數(shù)據(jù),預(yù)訓(xùn)練出一個(gè)能夠勝任各種場(chǎng)景、各種問(wèn)題的語(yǔ)義交互知識(shí)庫(kù),使通用人工智能技術(shù)不再遙不可及。
業(yè)界的相關(guān)研究都驗(yàn)證了語(yǔ)義通信在6G 智能網(wǎng)絡(luò)應(yīng)用中的巨大潛力。因此,語(yǔ)義通信被視為實(shí)現(xiàn)“萬(wàn)物智聯(lián)”愿景的重要助力。
基于相關(guān)工作,我們不難發(fā)現(xiàn),通用、完整的理論建模仍是語(yǔ)義通信領(lǐng)域的一大空白。為了對(duì)已有的語(yǔ)義通信框架提供適配的理論模型,本節(jié)中我們將著重討論語(yǔ)義通信理論的數(shù)學(xué)建模。我們將點(diǎn)對(duì)點(diǎn)刻畫語(yǔ)義信息的信源編碼模型,拓展到JSCC模型,并給出特定場(chǎng)景的一些初步結(jié)論。
3.1 加強(qiáng)協(xié)會(huì)建設(shè),完善中介服務(wù)。加強(qiáng)種苗行業(yè)協(xié)會(huì)建設(shè),建立健全各級(jí)林木種苗協(xié)會(huì)或社會(huì)團(tuán)體,充分發(fā)揮其在行業(yè)服務(wù)、行業(yè)自律、行業(yè)協(xié)調(diào)、行業(yè)代表等方面的職能。行業(yè)協(xié)會(huì)要以當(dāng)?shù)佚堫^企業(yè)為中心,通過(guò)簽訂合同等方式,規(guī)定各方權(quán)利和義務(wù),吸納小型種苗基地和個(gè)體育苗戶成立本地區(qū)的種苗協(xié)會(huì)或種苗合作社,收集對(duì)本組織有用的技術(shù)、市場(chǎng)、法規(guī)、政策信息,為組織自身及其成員使用。
基于深度學(xué)習(xí)的語(yǔ)義提取模塊,使得語(yǔ)義通信突破文本的桎梏,廣泛活躍于語(yǔ)音、圖片、視頻等多模態(tài)的數(shù)據(jù)傳輸場(chǎng)景中。WENG Z. Z.等[8]提出了適用于動(dòng)態(tài)信道的語(yǔ)音傳輸框架,其中利用自注意力機(jī)制的語(yǔ)義感知網(wǎng)絡(luò)可以最小化語(yǔ)音傳輸中的語(yǔ)義錯(cuò)誤; 針對(duì)圖片的傳輸, E.BOURTSOULATZE[7]等首次提出了基于深度學(xué)習(xí)的信源信道聯(lián)合編碼(D-JSCC)方案。該方案相當(dāng)于在卷積自編碼器中插入了一層不可訓(xùn)練的信道參數(shù)層,很快被證明對(duì)語(yǔ)義信息的提取有較好的幫助。例如,在JIANG P. W.等的工作[9]中,基于Transformer 的D-JSCC 模塊被用于視頻會(huì)議的語(yǔ)義傳輸,其任務(wù)需求是在恢復(fù)端恢復(fù)出表情保真的人臉信息。語(yǔ)義信息被理解為視頻流幀間的殘差信息,在譯碼端根據(jù)初始幀進(jìn)行恢復(fù)。這種基于語(yǔ)義的視頻處理方式能夠較大地減少通信開(kāi)銷,并能確保下游任務(wù)一定的精確度。
▲圖3 刻畫語(yǔ)義信息的信源編碼模型[13]
現(xiàn)代語(yǔ)義通信致力于建立完整、統(tǒng)一的數(shù)學(xué)表述。在此過(guò)程中,涌現(xiàn)大量語(yǔ)義感知的工程可實(shí)現(xiàn)框架[8-11]。接下來(lái),我們分別從數(shù)據(jù)提取與通信設(shè)計(jì)兩個(gè)角度對(duì)這些工作進(jìn)行介紹。
在實(shí)際應(yīng)用場(chǎng)景中,上述的間接信源編碼模型可以拓展為具有邊信息的場(chǎng)景模型。
圖4展示了具有邊信息的語(yǔ)義信源編碼模型。該模型在編碼器與解碼器端存在的背景知識(shí)庫(kù)被建模為兩個(gè)有限樣本空間的隨機(jī)變量U與V,即收發(fā)端在處理語(yǔ)義序列時(shí)利用兩邊的邊信息進(jìn)行編解碼??紤]到背景知識(shí)的編碼模型更貼近實(shí)際的語(yǔ)義通信模型,其速率-失真度函數(shù)RS(DS,DX)可通過(guò)求解拓展至長(zhǎng)馬爾科夫鏈的Wyner-Ziv問(wèn)題來(lái)獲得?;谠撃P偷耐嘶樾稳缦拢?/p>
▲圖4 具有邊信息的語(yǔ)義信源編碼模型
1)U 與V 都可用且U=V,RS(DS,DX)退化至語(yǔ)義感知的條件率失真函數(shù)為
2)U與V都不可用,RS(DS,DX)退化至R(DS,DX);
2)語(yǔ)義感知的通信設(shè)計(jì)
在前香農(nóng)時(shí)代,人們更多關(guān)注的是基于自然語(yǔ)言的信息度量。1953 年,Y. BAR-HILLEL 和R. CARNAP[3]審視了W.WEAVER 的工作,發(fā)現(xiàn)了其中遺漏的語(yǔ)義問(wèn)題,并基于邏輯概率的測(cè)度初步定義了語(yǔ)義信息。所謂邏輯概率,即事件為“真”的概率越大,則該事件的熵值就越小。直到2004年,針對(duì)這種概率測(cè)度,L. FLORIDI[6]發(fā)現(xiàn)了“Carnap-Bar-Hillel矛盾”,即基于邏輯概率定義的熵會(huì)導(dǎo)致任意事件與其補(bǔ)事件交集的混亂度變得無(wú)窮大。同時(shí),他提出應(yīng)該用“距離”這種非負(fù)的度量來(lái)衡量語(yǔ)義信息的信息量。此后,學(xué)者們更為關(guān)注語(yǔ)義信息的本質(zhì),而不再拘泥于自然語(yǔ)言層面的問(wèn)題。2011 年J. BAO[4]在《Towards a Theory of Semantic Communication》一文中拓展語(yǔ)義相關(guān)的通信因素,闡明了語(yǔ)義噪聲和語(yǔ)義信道的概念,并提出了一個(gè)語(yǔ)義通信框架來(lái)最小化語(yǔ)義錯(cuò)誤。在此框架中,語(yǔ)義信道的容量刻畫為:
公式(4)的失真度約束同語(yǔ)義感知的信源編碼模型(公式(2))。對(duì)于具有邊信息的任意信源模型,其率失真函數(shù)的閉式表達(dá)仍是一個(gè)開(kāi)放問(wèn)題。我們將該點(diǎn)對(duì)點(diǎn)的信源編碼模型拓展至通信問(wèn)題中,并提出一個(gè)泛用性較高的語(yǔ)義感知的JSCC模型。
在文獻(xiàn)[19]中,我們引入了語(yǔ)義感知的JSCC模型,具體如圖5。對(duì)可觀測(cè)信源序列Xk進(jìn)行JSCC 編碼后,可以得到碼字Yn,再經(jīng)信道后得到碼字Zn,之后譯碼為語(yǔ)義恢復(fù)S?與觀測(cè)恢復(fù)?。其中,編碼方案要求語(yǔ)義恢復(fù)與觀測(cè)恢復(fù)的失真程度在給定閾值DS與DX范圍內(nèi)。與信源壓縮模型不同的是,引入信道模型后,速率失真函數(shù)不再具備較高的參考價(jià)值。因此,我們定義錯(cuò)誤事件與錯(cuò)誤概率:
▲圖5 語(yǔ)義感知的信源信道聯(lián)合編碼模型[19]
基于上述語(yǔ)義感知的JSCC 模型的錯(cuò)誤概率的內(nèi)外界能夠反映語(yǔ)義與觀測(cè)失真度約束對(duì)通信譯碼錯(cuò)誤概率的影響,具有較高的研究?jī)r(jià)值??紤]到碼字塊長(zhǎng)k →∞的漸進(jìn)情況,錯(cuò)誤概率內(nèi)外界的具體推導(dǎo)由Csiszar 的單約束JSCC 發(fā)展為兩約束JSCC:在長(zhǎng)馬爾科夫鏈的情形下,錯(cuò)誤概率的逆定理即球填充外界(Sphere-packing Bound),可由最優(yōu)列表譯碼得到;錯(cuò)誤概率的正定理則可以通過(guò)構(gòu)造考慮語(yǔ)義序列的高維隨機(jī)箱(即隨機(jī)編碼)得到。值得一提的是,可達(dá)界可以通過(guò)刪除較差碼字得到更好的隨機(jī)碼本。該錯(cuò)誤概率模型同樣可以通過(guò)特定信源信道分布如信源聯(lián)合高斯、信道瑞麗衰落、信道多輸入多輸出(MIMO)等得到更具體的表達(dá)式,并進(jìn)行解析或數(shù)值求解。此外,除了錯(cuò)誤概率,該模型可以推導(dǎo)錯(cuò)誤指數(shù)(反應(yīng)誤碼率下降的指數(shù)級(jí)速度),從收斂性角度指導(dǎo)損失函數(shù)的計(jì)算;推導(dǎo)可行速率區(qū)域,通過(guò)角點(diǎn)指導(dǎo)現(xiàn)實(shí)方案的設(shè)計(jì)等。
該JSCC 模型很大程度上適配了現(xiàn)有的語(yǔ)義通信工作模型,我們以現(xiàn)有的工程可實(shí)現(xiàn)框架為例:一方面,在文獻(xiàn)[15]中,圖片序列Xk蘊(yùn)含語(yǔ)義特征Sk,經(jīng)由JSCC編碼后得到序列Yn,并經(jīng)過(guò)信道傳輸接收得到加擾序列Zn,在譯碼端由恢復(fù)為圖片像素?,從而完成重建任務(wù),再由恢復(fù)為語(yǔ)義特征進(jìn)行分類任務(wù),即為同時(shí)執(zhí)行圖像恢復(fù)與下游任務(wù)的語(yǔ)義通信框架②k指塊長(zhǎng),即k張圖片對(duì)應(yīng)k個(gè)語(yǔ)義特征,且k張圖片同時(shí)編碼得到n長(zhǎng)的碼字。圖片本身維度、語(yǔ)義特征序列的維度與塊長(zhǎng)沒(méi)有關(guān)系。在現(xiàn)實(shí)語(yǔ)義通信場(chǎng)景中,我們通常需要X的維度大于Y的維度。。另一方面,將觀測(cè)失真度約束取消即DX→∞,對(duì)應(yīng)文獻(xiàn)[9]中恢復(fù)視頻信號(hào)的單任務(wù)語(yǔ)義通信框架;將語(yǔ)義失真度取消即DS→∞,對(duì)應(yīng)以精準(zhǔn)恢復(fù)比特為目標(biāo)的傳統(tǒng)通信框架;將JSCC 拆解為獨(dú)立的兩個(gè)編碼器,,即采用分離信源信道編碼(SSCC)的語(yǔ)義通信架構(gòu),見(jiàn)文獻(xiàn)[12]。
可持續(xù)發(fā)展是全球出現(xiàn)能源危機(jī)以及全球環(huán)境問(wèn)題時(shí)形成的一種可保障人們長(zhǎng)久生存的主要理念。建筑業(yè)作為我國(guó)的支柱產(chǎn)業(yè),消耗了大量的能源,因此,倡導(dǎo)綠色建筑,有利于節(jié)約資源,對(duì)人類的可持續(xù)發(fā)展具有重大意義。本文對(duì)綠色建筑的發(fā)展情況進(jìn)行了分析與說(shuō)明,并結(jié)合綠色建筑發(fā)展情況,對(duì)綠色建筑發(fā)展取得的成就及存在的問(wèn)題進(jìn)行了分析,提出了我國(guó)綠色建筑發(fā)展的基本應(yīng)對(duì)策略,以便為后期綠色建筑發(fā)展提供借鑒。
基于以上的介紹與討論,本節(jié)將會(huì)從理論建模和實(shí)際應(yīng)用兩個(gè)角度,介紹語(yǔ)義通信在無(wú)線網(wǎng)絡(luò)應(yīng)用中的潛在挑戰(zhàn)與開(kāi)放性問(wèn)題。
現(xiàn)有語(yǔ)義信息的研究通常集中于測(cè)度定義與理論建模。本文中,我們介紹了一個(gè)具有研究?jī)r(jià)值的JSCC 模型,但其點(diǎn)對(duì)點(diǎn)的建模特性對(duì)現(xiàn)實(shí)場(chǎng)景的通信設(shè)計(jì)仍有影響,例如:在多用戶場(chǎng)景、云/邊緣場(chǎng)景、考慮邊信息(即收發(fā)兩端的語(yǔ)義知識(shí)庫(kù))場(chǎng)景中,語(yǔ)義通信的理論建模將會(huì)發(fā)生改變。因此,如何將語(yǔ)義通信在現(xiàn)實(shí)通用的場(chǎng)景中合理建模是一個(gè)挑戰(zhàn)。首先,語(yǔ)義信息的具有隱藏信源的特性,因此在CEO問(wèn)題(間接多用戶信源編碼模型中的率失真問(wèn)題)、Wyner-Ziv 問(wèn)題、多址接入(Multiple-Access Channel)、廣播(Broadcast Channel)問(wèn)題中引入間接信源是一種解決方案,但可達(dá)速率的邊界、錯(cuò)誤概率等的推導(dǎo)仍不清楚;其次,我們研究的是基于無(wú)限塊長(zhǎng)的編碼模型,漸進(jìn)等分性、聯(lián)合典型工具對(duì)有限塊長(zhǎng)的性能損失研究是無(wú)法適用的。
大多數(shù)的語(yǔ)義通信框架集中于物理層的設(shè)計(jì),語(yǔ)義與通信協(xié)議層結(jié)合的設(shè)計(jì)涉及較少。這是由于現(xiàn)有的下層協(xié)議設(shè)計(jì)大多是為了滿足上層不同類型的需求,這會(huì)導(dǎo)致協(xié)議設(shè)計(jì)需要較高的泛用性。當(dāng)語(yǔ)義通信執(zhí)行特定下游任務(wù)時(shí),現(xiàn)有的協(xié)議設(shè)計(jì)將會(huì)帶來(lái)大量的物理層資源消耗。這會(huì)使得再好的物理層設(shè)計(jì)(如語(yǔ)義提取模塊、信道CSI估計(jì)算法)都存在不必要的性能瓶頸。因此,語(yǔ)義覺(jué)知能力與現(xiàn)有通信協(xié)議的結(jié)合是一個(gè)亟待解決的問(wèn)題。
現(xiàn)有的語(yǔ)義傳輸更關(guān)注端到端的單一模態(tài)通信問(wèn)題,例如:發(fā)送圖片、接受圖片、執(zhí)行圖片相關(guān)的下游任務(wù)??梢灶A(yù)見(jiàn)的是,在6G 的智能網(wǎng)絡(luò)范疇內(nèi),跨模態(tài)的通信模式是一種必然,即發(fā)送端需要同時(shí)處理文本與視頻或語(yǔ)音與圖片等模態(tài)組合,隨后在接收端執(zhí)行多媒體的語(yǔ)義任務(wù)。對(duì)于這類需求,現(xiàn)有的框架大都無(wú)法滿足,或是只能做到簡(jiǎn)單組合。因此對(duì)于寬泛的應(yīng)用需求,如何滿足跨模態(tài)的語(yǔ)義通信仍不明確。
對(duì)于語(yǔ)義通信的范式而言,本地知識(shí)庫(kù)是完成低碼率傳輸?shù)囊粋€(gè)重要保障。也就是說(shuō),語(yǔ)義通信的性能在很大程度上取決于收發(fā)兩端的背景知識(shí)的重疊率與完備程度。除了背景設(shè)計(jì)之外,語(yǔ)句的含義或者知識(shí)庫(kù)會(huì)隨著時(shí)代的發(fā)展改變或迭代,因此需要周期性地更新以達(dá)到預(yù)期的語(yǔ)義通信性能。針對(duì)收發(fā)兩端本地知識(shí)庫(kù)的重疊比率、涵蓋范圍等,已有研究進(jìn)行了初步的建模,但仍然存在泛化性較差、耗費(fèi)資源過(guò)多等問(wèn)題。因此如何高效地對(duì)本地背景知識(shí)庫(kù)進(jìn)行設(shè)計(jì)與更新是一個(gè)重大挑戰(zhàn)。
本文中,我們對(duì)語(yǔ)義通信的研究現(xiàn)狀與前景進(jìn)行了討論,并基于理論模型與機(jī)器學(xué)習(xí)展開(kāi)了分析。首先,從刻畫語(yǔ)義信息的間接信源編碼模型出發(fā),將間接信源視為不可觀測(cè)的語(yǔ)義信息,直接信源視為可被捕獲的外部信息,并介紹了兩個(gè)具有研究?jī)r(jià)值的語(yǔ)義信源編碼模型。接著,我們將其中點(diǎn)對(duì)點(diǎn)的信源編碼模型拓展至語(yǔ)義感知的JSCC 模型中,并推導(dǎo)了初步性能邊界。我們認(rèn)為該模型對(duì)現(xiàn)有語(yǔ)義通信框架有較高的適配度,其性能極限分析對(duì)現(xiàn)有工作也有著有較大的指導(dǎo)意義。最后,指出現(xiàn)有語(yǔ)義通信框架面臨的挑戰(zhàn)與開(kāi)放性問(wèn)題。語(yǔ)義通信是繼物理層通信之后的6G 無(wú)線網(wǎng)絡(luò)新興范式,在“萬(wàn)物智聯(lián)”愿景時(shí)代中必然占有一席之地。