亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集群和GPU的寬帶混疊信號(hào)盲分離技術(shù)

        2017-03-01 01:15:45國防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院張海楠
        電子世界 2017年3期
        關(guān)鍵詞:多址運(yùn)算量線程

        國防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院 張海楠

        基于集群和GPU的寬帶混疊信號(hào)盲分離技術(shù)

        國防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院 張海楠

        PCMA(Paired Carrier Multiple Access: 成對(duì)載波多址)信號(hào)是一種比較典型的同頻同速率混疊信號(hào),對(duì)提高衛(wèi)星鏈路的頻譜利用率具有重要的意義。本文通過對(duì)寬帶混疊信號(hào)實(shí)時(shí)處理技術(shù)的研究,設(shè)計(jì)了基于集群和GPU的信號(hào)處理平臺(tái),提出了大運(yùn)算量復(fù)雜算法條件下的高性能計(jì)算方法,能夠較好地實(shí)現(xiàn)寬帶混疊信號(hào)的盲分離。

        PCMA;集群;GPU;單通道盲分離;并行計(jì)算

        1 引言

        PCMA是一種新型的衛(wèi)星通信多址技術(shù)[1,2],該技術(shù)允許兩個(gè)不同的衛(wèi)星地面站使用相同的頻率、時(shí)隙或者CDMA碼字,其信號(hào)在時(shí)域和頻域上完全重疊或者部分重疊。經(jīng)過衛(wèi)星轉(zhuǎn)發(fā)器,兩個(gè)地面站的接收信號(hào)是包含對(duì)方信號(hào)和本地信號(hào)的混合信號(hào),在接收端將本地信號(hào)作為自干擾進(jìn)行重構(gòu)并抵消實(shí)現(xiàn)對(duì)方信號(hào)的可靠解調(diào)。它可以與FDMA、TDMA和CDMA多址技術(shù)結(jié)合用于衛(wèi)星雙向通信中。

        作為非協(xié)作通信方,對(duì)混疊信號(hào)進(jìn)行盲分離即第三方在沒有任一發(fā)送方信息序列先驗(yàn)知識(shí)的情況下,從混合信號(hào)中解調(diào)出兩路信息序列。近些年,對(duì)于PCMA信號(hào)盲分離的相關(guān)研究不是很充分,主要有基于獨(dú)立分量分析ICA的單通道PCMA盲信號(hào)分離法[3,4],基于Turbo迭代的PCMA信號(hào)盲恢復(fù)算法[5],基于逐幸路徑(PSP)處理法的PCMA信號(hào)盲解調(diào)算法[6]等。本系統(tǒng)應(yīng)用的是基于PSP的盲分離技術(shù)來實(shí)現(xiàn)混合信號(hào)的參數(shù)跟蹤和穩(wěn)定分離,但由于該算法復(fù)雜度高,用主流的CPU處理器很難實(shí)現(xiàn)大運(yùn)算量的快速處理。本文采用了以“束計(jì)算”為核心的多層次任務(wù)分配與線程調(diào)度模型,可實(shí)現(xiàn)盲分離算法與GPU并行結(jié)構(gòu)的最優(yōu)匹配,可較好地解決運(yùn)算量復(fù)雜算法條件下的高性能計(jì)算問題。

        2 系統(tǒng)組成及工作原理

        由圖1所示,信號(hào)采集模塊主要完成的是對(duì)寬帶信號(hào)的中頻調(diào)理和模擬采集,采樣后的數(shù)據(jù)分段送至GPU服務(wù)器,進(jìn)行對(duì)信號(hào)的分離和信道譯碼處理。由于混疊信號(hào)符號(hào)速率較高,可達(dá)25.387Msps,進(jìn)行盲分離所需的采樣率為信號(hào)速率的9-10倍,因此數(shù)據(jù)速率達(dá)到了25.387M*9*16=3655Mbit/s,需采用萬兆網(wǎng)卡和交換機(jī)。最后,送至高速信息處理服務(wù)器進(jìn)行后端的信息處理。

        圖1 寬帶混疊信號(hào)盲分離的系統(tǒng)總方框圖

        3 高性能并行計(jì)算技術(shù)

        QPSK混疊信號(hào)盲分離和常規(guī)QPSK信號(hào)解調(diào)完全不同,每個(gè)碼元的求取都涉及大量的乘加運(yùn)算及迭代回代等復(fù)雜運(yùn)算,平均每求取一個(gè)碼元需要做24萬次浮點(diǎn)運(yùn)算,對(duì)于5.6Msps信號(hào),一秒鐘的計(jì)算量達(dá)到1.35萬億次浮點(diǎn)運(yùn)算,計(jì)算量非常龐大。如果用主頻為2.4GHz的CPU單核來處理一秒的數(shù)據(jù),需要近1000秒才能完成處理,龐大的計(jì)算量給算法的工程化實(shí)現(xiàn)帶來了極大的困難。

        如果采用CPU集群處理來完成信號(hào)的實(shí)時(shí)處理,一路信號(hào)就需要一臺(tái)大型CPU集群,費(fèi)用無法承受。如果采用FPGA,則面臨片上資源不足,開發(fā)難度大,研制周期長等困難。經(jīng)過研究和分析,在綜合分析多種計(jì)算平臺(tái)基礎(chǔ)上,選擇了GPU+CPU的硬件架構(gòu),構(gòu)建了一個(gè)桌面級(jí)的超級(jí)計(jì)算平臺(tái),單臺(tái)GPU服務(wù)器就實(shí)現(xiàn)了5.6Msps QPSK混疊信號(hào)實(shí)時(shí)處理,5臺(tái)GPU服務(wù)器構(gòu)成的小型集群就可實(shí)現(xiàn)25Msps高速Q(mào)PSK混疊信號(hào)實(shí)時(shí)處理。

        GPU的計(jì)算能力雖然非常強(qiáng)大,但受GPU硬件架構(gòu)的限制,想發(fā)揮出GPU的計(jì)算能力,卻極為困難。最大的制約因素有兩個(gè):一是GPU片上的高速緩存非常少,最大的共享內(nèi)存也僅為16KB,還需要給幾百個(gè)線程共享使用,每個(gè)線程平均不超過64字節(jié);二是GPU的工作方式是類似向量處理的方式,工作的時(shí)候每32個(gè)線程為一個(gè)束,這32個(gè)線程需要做到基本上運(yùn)行相同的指令,齊頭并進(jìn),如果線程運(yùn)行有分支就會(huì)使計(jì)算效率大大降低。以上兩個(gè)因素導(dǎo)致將一個(gè)串行算法簡單并行化后移植到GPU上,加速比通常并不高,即使采用了GPU的計(jì)算平臺(tái)也遠(yuǎn)遠(yuǎn)無法達(dá)到實(shí)時(shí)處理的要求。

        為實(shí)現(xiàn)高效的GPU盲分離并行算法,我們采用了了以“束計(jì)算”為核心的多層次智能任務(wù)分配與線程調(diào)度模型,實(shí)現(xiàn)了盲分離算法與GPU并行結(jié)構(gòu)的最優(yōu)匹配,突破了線程并行和高速存儲(chǔ)的瓶頸,最大化的發(fā)揮出了GPU強(qiáng)大的計(jì)算能力。

        在算法模型的最上層,是三個(gè)CPU線程分別綁定到三塊GPU,每個(gè)線程指揮調(diào)度一塊GPU。每塊GPU卡逐次從前端數(shù)據(jù)采集緩沖區(qū)內(nèi)讀取一塊數(shù)據(jù)分塊處理,并在處理完成后在CPU中完成數(shù)據(jù)的拼接。中間層為GPU卡內(nèi)數(shù)據(jù)分塊。這個(gè)層次的并行化受很多因素限制,首先任務(wù)數(shù)不能太多,太多就會(huì)增加分塊入鎖的計(jì)算量,而且任務(wù)數(shù)多了片上的高速儲(chǔ)存資源也不足分配。其次,任務(wù)數(shù)也不能太少,任務(wù)數(shù)太少會(huì)導(dǎo)致并行度不夠,無法充分發(fā)揮GPU的并行計(jì)算能力。根據(jù)GPU的硬件特點(diǎn),采用了GPU中“束計(jì)算”的思想,一個(gè)束就是32個(gè)線程。GPU內(nèi)部處理線程的方式是以32個(gè)線程為單位處理的,這樣就采用32個(gè)線程共同完成一個(gè)任務(wù)的計(jì)算方式,將任務(wù)數(shù)設(shè)為256,達(dá)到了計(jì)算資源的充分利用以及高速存儲(chǔ)資源的合理均衡配置。在束計(jì)算這一層,優(yōu)化調(diào)整算法流程,盡量使束內(nèi)線程做到齊頭并進(jìn)步調(diào)一致,減小性能損失,最大化的利用了計(jì)算資源;同時(shí)為適應(yīng)算法流程的改變,對(duì)數(shù)據(jù)結(jié)構(gòu)也做了整體的優(yōu)化調(diào)整,精細(xì)計(jì)算并分配了片上高速共享內(nèi)存并且防止訪存的端口沖突,最大化的利用了高速存儲(chǔ)資源和帶寬。在單個(gè)線程處理流程內(nèi)部,對(duì)計(jì)算過程進(jìn)行優(yōu)化,緩存了部分中間結(jié)果,通過重用中間計(jì)算結(jié)果,減小了計(jì)算量,進(jìn)一步提高了計(jì)算速度。除了整個(gè)算法模型的優(yōu)化設(shè)計(jì),還利用GPU特有的紋理訪存、原子操作、數(shù)“0”計(jì)算等硬件加速部件,提高了算法速度。算法處理模型如圖2所示。

        圖2 GPU盲分離并行算法模型

        4 總結(jié)

        經(jīng)過驗(yàn)證,構(gòu)建在以“束計(jì)算”為核心的多層次任務(wù)分配與線程調(diào)度模型上的優(yōu)化并行盲分離算法,達(dá)到了極高的算法效率。3塊C2050 GPU的峰值浮點(diǎn)計(jì)算能力為1.455萬億次/秒,實(shí)際完成1.35萬億次/秒,效率達(dá)到92.7%以上,解決了復(fù)雜算法條件下大運(yùn)算量的實(shí)時(shí)處理難題。

        [1]DANKBERG M,MACK J,MILLER.Self-Interference Cancellations for Two-Party Relay Communication[P].US:Patent 5596439.1997:1-21.

        [2]DANKBERG M.Paired carrier multiple access(PCMA) for satellite communication[A].Pacific Telecommunications Conference[C].1998,787-791.

        [3]萬堅(jiān),許華,朱中梁.基于獨(dú)立分量分析的成對(duì)載波多址分離新算法[J].通信學(xué)報(bào),2006,08:41-44.

        [4]盧宏.欠定盲信號(hào)分離方法研究[學(xué)位論文].杭州:杭州電子科技大學(xué),2011.

        [5]ZHANG,Dongling,et al.A Blind Data Recovery of PCMA Signals Based on the Turbo Iterative Processing.Journal of Wuhan University(Natural Science Edition).2011,5:004.

        [6]Shilong Tu,Zhang Hui,and Gu Na.Single-channel blind separation of two QPSK signals using per-survivor processing.IEEE Asia Pacific Conference on Circuits and Systems,2008.

        Blind Separation Techniques of the Wideband Overlapping Signal based

        Zhang Hainan
        (National University of Defense Technology College of Mechatronic Engineering and Automation,Changsha of Hunan Province,China,410073)

        the PCMA signal is a classical overlapping signal of the same frequency and the same speed,which is of great significance to improve the spectrum efficiency of satellite links.By studying real-time signal processing technology for wideband overlapping signal,the signal processing platform is designed based on the cluster and GPU,high-performance computing method is proposed under the amount of large complex algorithms conditions,which is achieved better wideband mixed blind separation of overlapping signal.

        PCMA;clusters;GPU;blind separation of single-channel;parallel computing

        張海楠(1985—),男,在讀碩士研究生,研究方向:自動(dòng)化識(shí)別與檢測技術(shù)。

        猜你喜歡
        多址運(yùn)算量線程
        成對(duì)載波多址技術(shù)在靶場衛(wèi)星通信系統(tǒng)中的應(yīng)用
        無線電工程(2024年8期)2024-09-16 00:00:00
        蜂群自組網(wǎng)雙信道頻率分集多址接入?yún)f(xié)議
        用平面幾何知識(shí)解平面解析幾何題
        減少運(yùn)算量的途徑
        淺談linux多線程協(xié)作
        讓拋物線動(dòng)起來吧,為運(yùn)算量“瘦身”
        面向5G的非正交多址接入技術(shù)
        第5代移動(dòng)通信基本要求與新型多址復(fù)用技術(shù)
        Linux線程實(shí)現(xiàn)技術(shù)研究
        么移動(dòng)中間件線程池并發(fā)機(jī)制優(yōu)化改進(jìn)
        在线观看亚洲第一黄片| 高清国产亚洲va精品| .精品久久久麻豆国产精品| 久久青青草原国产精品最新片| 亚洲一区二区三区1区2区| 久久777国产线看观看精品 | 日本免费久久高清视频| 久热re这里精品视频在线6| 精品水蜜桃久久久久久久| 99精品一区二区三区免费视频| 国产一区二区黑丝美女| 男女交射视频免费观看网站| 中文字幕在线精品视频入口一区 | 国产三级精品三级| 亚洲人成未满十八禁网站| 国产精品乱一区二区三区| 久久夜色精品亚洲天堂| 成熟人妻换xxxx| 少妇装睡让我滑了进去| 国产精品丝袜美女在线观看| 中文字幕一二区中文字幕| 日本一区二区三区视频免费在线| 国产又色又爽又黄的| 99视频这里有精品| 国产精品av免费网站| 在线观看国产视频午夜| 天堂网在线最新版www| 亚洲国产成人久久一区www妖精| 黄页国产精品一区二区免费| 日本中文字幕精品久久| 国产啪亚洲国产精品无码 | 久久夜色精品国产噜噜噜亚洲av| 无码孕妇孕交在线观看| 五月婷一本到五月天| 青青青视频手机在线观看| 国产av熟女一区二区三区 | 真人做人试看60分钟免费视频| 黑人巨大白妞出浆| 官网A级毛片| 中文字幕隔壁人妻欲求不满| 无码人妻精品一区二区在线视频|