亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)

        2021-10-30 02:17:20李浩羅近濤潘之辰孫鵬飛姜金辰
        時(shí)間頻率學(xué)報(bào) 2021年3期
        關(guān)鍵詞:共享內(nèi)存脈沖星色散

        李浩,羅近濤,潘之辰,孫鵬飛,姜金辰,5

        一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)

        李浩1,2,羅近濤1,3,潘之辰4,孫鵬飛1,姜金辰4,5

        (1. 中國(guó)科學(xué)院 國(guó)家授時(shí)中心,西安 710600;2. 中國(guó)科學(xué)院大學(xué),北京 100049; 3. 中國(guó)科學(xué)院 精密導(dǎo)航定位與定時(shí)技術(shù)重點(diǎn)實(shí)驗(yàn)室,西安 710600;4. 中國(guó)科學(xué)院 國(guó)家天文臺(tái),北京 100101;5. 北京大學(xué),北京 100871)

        相比于非相干消色散,相干消色散具有色散消除更徹底、可保留原始數(shù)據(jù)相位、時(shí)間分辨率信息等優(yōu)勢(shì),但同時(shí)具有運(yùn)算量大、數(shù)據(jù)處理耗時(shí)長(zhǎng)等問(wèn)題。為實(shí)現(xiàn)脈沖星基帶數(shù)據(jù)相干消色散處理,對(duì)數(shù)據(jù)處理流程進(jìn)行加速,開(kāi)發(fā)一種以DSPSR(digital signal processing software for pulsar)和GPU(graphics processing unit)為數(shù)據(jù)處理核心的脈沖星數(shù)據(jù)處理技術(shù)。利用高速共享內(nèi)存實(shí)現(xiàn)對(duì)環(huán)形緩存區(qū)兩路極化基帶數(shù)據(jù)的讀取,結(jié)合圖形處理器高性能計(jì)算技術(shù),使用DSPSR對(duì)基帶數(shù)據(jù)進(jìn)行相干消色散處理。數(shù)據(jù)處理結(jié)果表明,相比于多線程非相干消色散系統(tǒng),此數(shù)據(jù)處理技術(shù)在數(shù)據(jù)處理速度方面具有更好的優(yōu)越性,并可獲得更精細(xì)的脈沖輪廓。

        脈沖星;相干消色散;脈沖星數(shù)字信號(hào)處理程序包;圖形處理器;脈沖星分布式采集和數(shù)據(jù)分析處理軟件

        0 引言

        脈沖星信號(hào)在傳播過(guò)程中由于受到星際介質(zhì)(interstellar medium,ISM)影響產(chǎn)生色散現(xiàn)象,導(dǎo)致觀測(cè)到的脈沖輪廓展寬,需采用消色散技術(shù)對(duì)脈沖星數(shù)據(jù)進(jìn)行處理。脈沖星消色散方法主要分為非相干消色散和相干消色散兩種。非相干消色散在時(shí)域進(jìn)行,多通道濾波器將脈沖星信號(hào)等分為若干通道的窄帶信號(hào),再將每個(gè)通道的信號(hào)經(jīng)過(guò)平方檢波后在時(shí)域上對(duì)齊相加,補(bǔ)償因色散而產(chǎn)生的時(shí)間延遲,但是同一通道內(nèi)色散無(wú)法消除[1]。相干消色散核心算法為快速傅里葉變換,將時(shí)域數(shù)字信號(hào)變換到頻域,再使用星際介質(zhì)傳輸函數(shù)進(jìn)行處理,消除整個(gè)通帶內(nèi)的色散。相比于非相干消色散,相干消色散可消除帶內(nèi)色散,效果更徹底,并能夠保留原始數(shù)據(jù)的相位關(guān)系、時(shí)間分辨率。已有學(xué)者研究表明,在一定的觀測(cè)頻率之內(nèi),相干消色散的效果優(yōu)于非相干消色散[2]。

        目前主流脈沖星數(shù)字終端系統(tǒng)由現(xiàn)場(chǎng)可編程門陣列(field programmable gate array,F(xiàn)PGA)、圖形處理器(graphics processing unit,GPU)、中央處理器(central processing unit,CPU)三部分組成,F(xiàn)PGA平臺(tái)主要用于ADC(analog to digital converter)控制、數(shù)據(jù)流控制和信號(hào)預(yù)處理,GPU負(fù)責(zé)消色散等核心算法的完成,CPU用于數(shù)據(jù)傳輸、邏輯控制和文件讀寫[3]。FPGA端輸出的基帶數(shù)據(jù)可保留脈沖星信號(hào)原始信息,結(jié)合相干消色散技術(shù)可開(kāi)展超高時(shí)間分辨率脈沖星輻射特性研究,對(duì)于持續(xù)時(shí)間極短的快速射電暴(fast radio burst,F(xiàn)RB)搜尋以及脈沖星超短時(shí)標(biāo)脈沖等研究有著重要意義。以中國(guó)FAST 500 m望遠(yuǎn)鏡①http://www.cas.cn/zt/kjzt/fast/、澳大利亞Parkes 64 m望遠(yuǎn)鏡[4]、德國(guó)100 m口徑Effelsberg望遠(yuǎn)鏡[5]等為代表的大口徑射電望遠(yuǎn)鏡以脈沖星觀測(cè)為主要科學(xué)目標(biāo),寬帶寬、超高時(shí)間分辨率和高頻率分辨率數(shù)字終端技術(shù)成為發(fā)展趨勢(shì)。

        國(guó)內(nèi)脈沖星數(shù)字化終端系統(tǒng)的研制已取得一系列進(jìn)展。中國(guó)科學(xué)院新疆天文臺(tái)依托25 m射電望遠(yuǎn)鏡和VLBI記錄終端MK5A系統(tǒng),開(kāi)展脈沖星相干消色散觀測(cè)系統(tǒng)研究[6]。中國(guó)科學(xué)院云南天文臺(tái)以ROACH2平臺(tái)和脈沖星數(shù)字信號(hào)處理程序包(digital pulsar signal processing for pulsars,DSPSR)為數(shù)據(jù)處理核心構(gòu)建相干消色散觀測(cè)系統(tǒng)[7]。中國(guó)科學(xué)院上海天文臺(tái)65 m射電望遠(yuǎn)鏡配備脈沖星數(shù)字化終端(digital backend system,DIBAS),同時(shí)具備相干與非相干消色散功能[3]。中國(guó)科學(xué)院國(guó)家天文臺(tái)面向FAST開(kāi)發(fā)了基于ROACH2平臺(tái)的非相干數(shù)字化脈沖星終端[8]。中國(guó)科學(xué)院國(guó)家授時(shí)中心40 m射電望遠(yuǎn)鏡HRT脈沖星觀測(cè)系統(tǒng)使用FPGA+GPU架構(gòu),可實(shí)現(xiàn)非相干消色散與相干消色散兩種觀測(cè)模式[9]。國(guó)際上,美國(guó)NRAO(National Radio Astronomy Observatory)在GUPPI(green bank ultimate pulsar processing instrument)系統(tǒng)的基礎(chǔ)上,研制硬件平臺(tái)和性能指標(biāo)更為先進(jìn)的VEGAS(versatile GBT astronomical spectrometer),基本系統(tǒng)由ADC,ROACH系列FPGA平臺(tái)與GPU處理集群組成②http://www.cas.cn/zt/kjzt/fast/。德國(guó)Effelsberg射電望遠(yuǎn)鏡PSRIX后端采用ROACH系列平臺(tái)實(shí)現(xiàn),GPU集群進(jìn)行數(shù)據(jù)處理[10]。澳大利亞Parkes射電望遠(yuǎn)鏡的BPSR(Berkeley Parkes Swinburne Recorder)脈沖星數(shù)字終端系統(tǒng)采用FPGA平臺(tái)和CPU+GPU架構(gòu),數(shù)據(jù)處理后端采用開(kāi)源軟件PSRDADA(processing software for pulsar distributed acquisition and data analysis)實(shí)現(xiàn)數(shù)據(jù)緩沖區(qū)、DSPSR實(shí)現(xiàn)實(shí)時(shí)相干消色散和RFI處理[11]。

        結(jié)合相干消色散脈沖星觀測(cè)系統(tǒng)發(fā)展趨勢(shì),本文基于CPU+GPU架構(gòu),開(kāi)發(fā)一種以GPU和DSPSR為數(shù)據(jù)處理核心的相干消色散基帶數(shù)據(jù)處理技術(shù)。利用高速共享內(nèi)存原理實(shí)現(xiàn)最高兩路極化基帶數(shù)據(jù)輸入,后續(xù)解碼、消色散、折疊等數(shù)據(jù)處理流程采用脈沖星數(shù)字信號(hào)處理程序包DSPSR結(jié)合GPU加速技術(shù)進(jìn)行處理。數(shù)據(jù)處理結(jié)果以PSRFITS格式存儲(chǔ)。面向FAST脈沖星觀測(cè)系統(tǒng)海量數(shù)據(jù)相干消色散處理需求,將此數(shù)據(jù)處理流程在FAST基帶數(shù)據(jù)服務(wù)器集群上進(jìn)行部署測(cè)試,驗(yàn)證流程的正確性與可行性,為后續(xù)寬帶實(shí)時(shí)相干消色散脈沖星觀測(cè)系統(tǒng)的開(kāi)發(fā)提供技術(shù)儲(chǔ)備。

        1 相干消色散原理

        2 DSPSR+GPU數(shù)據(jù)處理技術(shù)

        脈沖星數(shù)據(jù)進(jìn)行相干消色散處理需進(jìn)行大量的浮點(diǎn)運(yùn)算,相比于非相干消色散算法,對(duì)計(jì)算機(jī)的性能和運(yùn)算能力要求更高,隨著圖形處理器高性能計(jì)算的發(fā)展,數(shù)字化相干消色散脈沖星終端技術(shù)研究成為新的趨勢(shì)。本文構(gòu)建的相干消色散數(shù)據(jù)處理流程如圖1所示,利用高速共享內(nèi)存,即環(huán)形緩存區(qū)(ringbuffer)實(shí)現(xiàn)基帶數(shù)據(jù)的讀寫,包括數(shù)據(jù)輸入、數(shù)據(jù)處理、數(shù)據(jù)輸出3個(gè)部分。

        圖1 數(shù)據(jù)處理流程

        首先從磁盤中讀取基帶數(shù)據(jù)、header文件并寫入環(huán)形緩存區(qū),環(huán)形緩存區(qū)由兩部分組成:Data buffer和Header buffer,Data buffer用于存放基帶數(shù)據(jù),Header buffer用于存放觀測(cè)信息以及基帶數(shù)據(jù)基本信息。然后DSPSR從環(huán)形緩存區(qū)讀取基帶數(shù)據(jù)和對(duì)應(yīng)的信息,進(jìn)行相干消色散、折疊等后續(xù)處理,并將處理結(jié)果存入磁盤。

        2.1 共享內(nèi)存技術(shù)

        共享內(nèi)存是Unix系統(tǒng)下一種高效的多進(jìn)程間通信(inter-process communication,IPC)方式,多用于同一程序不同進(jìn)程間的數(shù)據(jù)傳輸。進(jìn)程可直接對(duì)內(nèi)存進(jìn)行訪問(wèn)、讀寫,不需要進(jìn)行數(shù)據(jù)拷貝,是連接到共享內(nèi)存的多個(gè)進(jìn)程間共享和傳遞數(shù)據(jù)的有效方式。

        共享內(nèi)存中的數(shù)據(jù)可被連接到此共享內(nèi)存的所有進(jìn)程讀取,此時(shí)進(jìn)程間數(shù)據(jù)傳輸不再通過(guò)內(nèi)核,可有效減少系統(tǒng)調(diào)用時(shí)間,提高數(shù)據(jù)傳輸效率。主流的共享內(nèi)存實(shí)現(xiàn)方式有跨進(jìn)程間通訊的基于SYS V的共享內(nèi)存、基于POSIX mmap文件映射共享內(nèi)存和基于DMABUF框架,可跨設(shè)備間通訊的共享內(nèi)存兩大類[14]。

        脈沖星終端更寬帶寬、更高時(shí)間分辨率的發(fā)展趨勢(shì),面臨海量數(shù)據(jù)高速傳輸技術(shù)難題。FAST 19波束接收機(jī)在8 bits采樣下基帶數(shù)據(jù)數(shù)據(jù)量為38 Gbit/s,PSRFITS格式數(shù)據(jù)量為3 040 Mbit/s(4 k通道, 50 μs,8 bits)[3],海量數(shù)據(jù)快速處理成為基帶數(shù)據(jù)處理難題,共享內(nèi)存高效數(shù)據(jù)傳輸?shù)膬?yōu)勢(shì),是解決海量基帶數(shù)據(jù)處理的途徑。

        2.2 PSRDADA簡(jiǎn)介

        PSRDADA是用于脈沖星基帶記錄的開(kāi)源軟件項(xiàng)目,提供靈活且易于管理的環(huán)形緩存區(qū)(ringbuffer)實(shí)現(xiàn)數(shù)據(jù)讀寫??赏ㄟ^(guò)基于文本的套接字接口來(lái)控制讀、寫程序,以實(shí)現(xiàn)從ringbuffer中將數(shù)據(jù)寫入磁盤陣列、將數(shù)據(jù)發(fā)送到節(jié)點(diǎn)陣列以及直接在ringbuffer中處理數(shù)據(jù)③http://psrdada.sourceforge.net/。

        在PSRDADA的邏輯中,環(huán)形緩沖區(qū)通常有一個(gè)指向ringbuffer中可讀數(shù)據(jù)的讀指針和一個(gè)指向可寫緩存區(qū)的寫指針,通過(guò)控制讀、寫指針實(shí)現(xiàn)緩沖區(qū)數(shù)據(jù)的輸入和輸出。在PSRDADA的具體實(shí)現(xiàn)中,寫程序創(chuàng)建并鎖定環(huán)形緩存區(qū)后,未被程序讀取的數(shù)據(jù)區(qū)域定義為使用區(qū)域,通過(guò)將已讀取數(shù)據(jù)區(qū)域標(biāo)記為已清除,成為新的未使用區(qū)域且可被寫程序識(shí)別,來(lái)構(gòu)成邏輯上的循環(huán)。

        2.3 脈沖星數(shù)字信號(hào)處理程序包

        DSPSR是一款開(kāi)源、面向?qū)ο蟮臄?shù)字信號(hào)處理軟件包,可以選擇性地利用多核處理器和通用圖形處理單元進(jìn)行射電脈沖星數(shù)字信號(hào)處理,旨在提高算法和數(shù)據(jù)的可移植性[13],支持CPSR,F(xiàn)ITS,Mark5等多種數(shù)據(jù)格式。DSPSR還可實(shí)現(xiàn)多種模塊化算法:如相干消色散、生成濾波器組、全極化檢測(cè)、格式轉(zhuǎn)換等。數(shù)據(jù)結(jié)果以PSRFITS格式輸出,可用于PSRCHIVE等軟件進(jìn)行后續(xù)數(shù)據(jù)處理。

        DSPSR通過(guò)共享內(nèi)存區(qū),可直接從RAM中讀取脈沖星數(shù)據(jù)。并可結(jié)合GPU加速特性進(jìn)行并行運(yùn)算,提升消色散等數(shù)據(jù)處理效率。

        2.4 GPU加速技術(shù)

        GPU即圖形處理器,配備有高速內(nèi)存以及大量算術(shù)邏輯單元(arithmetic and logic unit,ALU),是專為執(zhí)行大量幾何計(jì)算而設(shè)計(jì)的一種高度并行化多核處理器。相比于CPU采用串行架構(gòu),功能模塊較多,能適應(yīng)復(fù)雜運(yùn)算環(huán)境的特點(diǎn),GPU可執(zhí)行大規(guī)模并發(fā)計(jì)算,擁有更強(qiáng)大的浮點(diǎn)運(yùn)算能力。

        CUDA(compute unified device architecture)是NVIDIA公司推出的軟硬件通用計(jì)算設(shè)備架構(gòu)[15],采用標(biāo)準(zhǔn)C語(yǔ)言的拓展作為編程語(yǔ)言,提供大量高性能計(jì)算指令。利用CUDA進(jìn)行編程可采用新的計(jì)算架構(gòu)來(lái)使用GPU提供的硬件資源,使線程的創(chuàng)建和調(diào)度所占用的開(kāi)銷大大減少,從而提升程序的運(yùn)算效率。

        GPU的邏輯架構(gòu)包括thread,block和grid三個(gè)部分,如圖2所示,GPU執(zhí)行計(jì)算可調(diào)用的最小單位為thread,數(shù)個(gè)thread共同組成一個(gè)block,一個(gè)block中的thread共用同一塊共享內(nèi)存,并可快速實(shí)現(xiàn)數(shù)據(jù)同步。在物理層,GPU硬件的核心組件為流式多處理器(streaming multiprocessor,SM)。SM資源主要包括CUDA核、共享內(nèi)存、寄存器、乘加器等,可以并行執(zhí)行數(shù)百個(gè)線程,資源數(shù)量越多則GPU的并行計(jì)算能力越高。

        圖2 GPU線程結(jié)構(gòu)

        脈沖星數(shù)據(jù)處理流程中,消色散所需時(shí)間占比最大,是影響數(shù)據(jù)處理效率最主要的因素[16]。隨著GPU的可編程能力及并行處理能力不斷提高,應(yīng)用范圍迅速擴(kuò)展,可利用GPU高性能并行計(jì)算特性來(lái)滿足海量基帶數(shù)據(jù)的實(shí)時(shí)處理需求。本文利用DSPSR結(jié)合GPU加速技術(shù)對(duì)相干消色散算法進(jìn)行加速,提高數(shù)據(jù)處理效率。

        3 數(shù)據(jù)處理

        本流程對(duì)基帶數(shù)據(jù)的處理可分為基帶數(shù)據(jù)的讀取與寫入、調(diào)用DSPSR讀取數(shù)據(jù)、相干消色散處理、折疊、PSRFITS格式輸出等5個(gè)步驟?;鶐?shù)據(jù)的讀寫通過(guò)編寫程序?qū)崿F(xiàn),通過(guò)在編譯時(shí)添加相應(yīng)的數(shù)據(jù)格式來(lái)實(shí)現(xiàn)DSPSR對(duì)ringbuffer中數(shù)據(jù)的讀取,相干消色散、折疊等處理通過(guò)調(diào)用DSPSR實(shí)現(xiàn),數(shù)據(jù)處理結(jié)果由DSPSR以PSRFITS格式保存。為提高數(shù)據(jù)處理速度,使用GPU對(duì)DSPSR的數(shù)據(jù)處理進(jìn)行加速。

        3.1 數(shù)據(jù)處理原理

        在本數(shù)據(jù)處理流程中,環(huán)形緩存區(qū)為基帶數(shù)據(jù)讀寫的接口,包含指針、唯一標(biāo)識(shí)符(KEY)、內(nèi)存塊大小、內(nèi)存塊數(shù)量4個(gè)參數(shù)。這4個(gè)參數(shù)中,指針指向未使用的環(huán)形緩沖區(qū)句柄,通過(guò)此指針來(lái)實(shí)現(xiàn)對(duì)共享內(nèi)存的訪問(wèn),ringbuffer的大小由內(nèi)存塊大小和內(nèi)存塊數(shù)量共同決定。程序通過(guò)指定命令及以上參數(shù)來(lái)對(duì)ringbuffer進(jìn)行創(chuàng)建、連接、鎖定、讀取、重置等操作。如圖3所示,對(duì)ringbuffer的使用以及數(shù)據(jù)處理流程步驟如下:

        ① 創(chuàng)建ringbuffer,通過(guò)設(shè)置內(nèi)存塊大小以及內(nèi)存塊數(shù)量來(lái)控制ringbuffer大小,并為其指定唯一標(biāo)識(shí)符‘KEY’。

        ② 寫程序通過(guò)唯一標(biāo)識(shí)符‘KEY’連接并鎖定ringbuffer,此時(shí)ringbuffer僅允許當(dāng)前寫程序進(jìn)行訪問(wèn)。

        ③ 寫程序通過(guò)命令行參數(shù)所指定的路徑與文件名,讀取header文件與基帶數(shù)據(jù)文件,并對(duì)ringbuffer進(jìn)行寫操作。

        ④ 寫程序通過(guò)判斷是否讀取到文件末尾以保證文件的連續(xù)讀取,直至所有文件讀取完畢。

        ⑤ DSPSR通過(guò)唯一標(biāo)識(shí)符‘KEY’連接并鎖定到ringbuffer,對(duì)基帶數(shù)據(jù)進(jìn)行讀取并進(jìn)行后續(xù)相干消色散、折疊等處理,并輸出結(jié)果文件。此時(shí)ringbuffer僅允許當(dāng)前讀程序(DSPSR)進(jìn)行訪問(wèn)。

        ⑥ 全部數(shù)據(jù)處理完成后,寫程序會(huì)返回寫入ringbuffer中基帶數(shù)據(jù)文件總數(shù)、總大小以及平均傳輸速度到屏幕,然后通過(guò)對(duì)ringbuffer進(jìn)行刷新,以釋放內(nèi)存。

        圖3 數(shù)據(jù)讀取原理

        處理兩路基帶數(shù)據(jù)時(shí),需保證兩路數(shù)據(jù)文件的數(shù)量、每個(gè)文件大小分別對(duì)應(yīng)相等,目前實(shí)現(xiàn)兩路極化各2 048個(gè)文件輸入,根據(jù)服務(wù)器內(nèi)存配置,可調(diào)整文件輸入數(shù)量上限。在數(shù)據(jù)處理服務(wù)器內(nèi)存容量允許的情況下,可通過(guò)指定不同的標(biāo)識(shí)符‘KEY’創(chuàng)建多個(gè)ringbuffer來(lái)同時(shí)進(jìn)行不同數(shù)據(jù)的讀寫操作。

        2001-2012年海南省國(guó)際旅游外匯收入除2003年和2009年下降外,總體呈波動(dòng)上升趨勢(shì)。期間,2003年受亞洲“非典”公共危機(jī)事件影響,2008-2009年受全球金融危機(jī)影響出現(xiàn)下滑。其國(guó)際旅游外匯收入從2001年的1.06億美元上升到2012年的3.48億美元。12年間的平均國(guó)際旅游外匯收入為2.21億美元,約占全國(guó)的0.65%,排名在二十一位名上下波動(dòng)。2001-2012年海南省國(guó)際旅游外匯收入一直低于全國(guó)平均值,差距越來(lái)越大。

        3.2 數(shù)據(jù)處理方式

        根據(jù)pipeline處理數(shù)據(jù)要求,使用ringbuffer前,需創(chuàng)建脈沖星觀測(cè)信息文本文件,文件中包括觀測(cè)頻率、射電源名稱、觀測(cè)模式、極化、通道、帶寬、中心頻率、采樣比特?cái)?shù)、臺(tái)站信息、數(shù)據(jù)大小等參數(shù)信息,并對(duì)參數(shù)信息根據(jù)實(shí)際觀測(cè)情況進(jìn)行修改,再將基帶數(shù)據(jù)文件名按照指定格式保存到文本文件中。

        依據(jù)3.1節(jié)數(shù)據(jù)處理原理,首先創(chuàng)建指定大小的ringbuffer,寫程序根據(jù)‘KEY’值使用指定命令連接到ringbuffer,將header文件及數(shù)據(jù)分別寫入header buffer和data buffer中,并輸出header文件內(nèi)容到屏幕。然后使用DSPSR相關(guān)命令讀取ringbuffer中數(shù)據(jù),進(jìn)行相干消色散、分通道、折疊以及PSRFITS格式輸出等處理。通過(guò)修改DSPSR命令參數(shù)調(diào)整圖形處理器以及中央處理器線程數(shù)的使用,并對(duì)通道數(shù)、輸出文件名及路徑、積分時(shí)間等數(shù)據(jù)處理信息進(jìn)行調(diào)整。所使用的脈沖星歷文件由Psrcat軟件生成,采用Tempo2生成預(yù)報(bào)多項(xiàng)式進(jìn)行折疊。最后刷新ringbuffer,清空共享內(nèi)存區(qū)中數(shù)據(jù)。

        為測(cè)試、驗(yàn)證數(shù)據(jù)處理流程的可行性與準(zhǔn)確性,在FAST基帶數(shù)據(jù)服務(wù)器集群上安裝配置此流程,并使用FAST對(duì)脈沖星PSR J0534+2200、PSR J1939+2134觀測(cè)所得的基帶數(shù)據(jù)進(jìn)行測(cè)試處理。

        4 結(jié)果分析

        本文所處理的基帶數(shù)據(jù)觀測(cè)信息為:中心頻率1 250 MHz、帶寬500 MHz、雙極化、8比特采樣。首先,分別采用3.2節(jié)的數(shù)據(jù)處理方式和DSPSR CPU多線程方式對(duì)數(shù)據(jù)進(jìn)行處理,記錄處理1 s觀測(cè)時(shí)長(zhǎng)的數(shù)據(jù)量所需時(shí)間,結(jié)果如表1所示。根據(jù)FAST基帶數(shù)據(jù)服務(wù)器集群配置信息,本文介紹的數(shù)據(jù)處理流程處理8比特采樣、觀測(cè)時(shí)長(zhǎng)1 s的雙極化基帶數(shù)據(jù),所需時(shí)間大約為0.8 s,與CPU模式下調(diào)用32線程處理時(shí)間5 s相比,速度提升約6.25倍。FAST基帶數(shù)據(jù)服務(wù)器配置信息如表2所示。

        表1 數(shù)據(jù)處理信息和所需時(shí)間

        表2 FAST基帶數(shù)據(jù)GPU配置信息

        其次,使用3.2節(jié)的數(shù)據(jù)處理方式對(duì)PSR J0534+2200和PSR J1939+2134的總觀測(cè)時(shí)長(zhǎng)基帶數(shù)據(jù)進(jìn)行相干消色散處理,處理結(jié)果如圖4至圖7所示。同時(shí)對(duì)PSR J1939+2134基帶數(shù)據(jù)進(jìn)行非相干消色散處理,結(jié)果如圖8所示。PSR J0534+2200和PSR J1939+2134經(jīng)過(guò)相干消色散處理后的數(shù)據(jù)信噪比分別為16.677和1 270.176,可以利用Tempo2和PSRCHIVE對(duì)數(shù)據(jù)進(jìn)行計(jì)時(shí)等研究工作。

        圖4 PSR J0534+2200相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

        從圖4中可清晰看到PSR J0534+2200脈沖輪廓的兩個(gè)主成分:分別位于相位0.3和0.7附近的主脈沖和中間脈沖。從圖5的頻率—相位圖中可以看到經(jīng)過(guò)相干消色散處理不同的通道已經(jīng)對(duì)齊,消除了色散效應(yīng)的影響。圖6為PSR J1939+2134經(jīng)過(guò)相干消色散處理后得到的脈沖輪廓圖,可看到位于相位0.2附近主脈沖的精細(xì)結(jié)構(gòu),在頻域圖中也可看到該結(jié)構(gòu)。圖7顯示各頻率通道也已經(jīng)對(duì)齊。

        圖6 PSR J1939+2134相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

        圖7 PSR J1939+2134頻率—相位圖

        圖8 PSR J1939+2134非相干消色散脈沖輪廓圖(中心頻率1 250 MHz,帶寬500 MHz,雙極化)

        最后,為驗(yàn)證本文所論述的數(shù)據(jù)處理流程的數(shù)據(jù)處理質(zhì)量,根據(jù)Australia Telescope National Facility④https://data.csiro.au/dap/public/atnf/pulsarSearch.zul的資料,與Parkes 對(duì)PSR J1939+2134在L波段觀測(cè)所得到的輪廓進(jìn)行比較,結(jié)果如圖9所示。圖9所示為Parkes的PDFB終端系統(tǒng)對(duì)PSR J1939+2134在1378 MHz觀測(cè)數(shù)據(jù)的相干消色散處理結(jié)果,可清晰看到位于相位0.2附近的主脈沖、相位0.7附近的中間脈沖以及主脈沖的精細(xì)結(jié)構(gòu),與圖6中FAST觀測(cè)數(shù)據(jù)處理結(jié)果一致,證明本數(shù)據(jù)處理流程的數(shù)據(jù)處理結(jié)果是符合要求的。

        圖9 Parkes觀測(cè)得到的PSR J1939+2134相干消色散脈沖輪廓圖

        5 結(jié)論

        本文提出的基于DSPSR和GPU的脈沖星數(shù)據(jù)處理流程,可實(shí)現(xiàn)最高兩路極化基帶數(shù)據(jù)相干消色散處理。數(shù)據(jù)讀取及處理方面結(jié)合高速共享內(nèi)存技術(shù)和GPU加速技術(shù),實(shí)現(xiàn)基于CPU+GPU異構(gòu)系統(tǒng)的相干消色散基帶數(shù)據(jù)處理技術(shù),相比于非相干消色散,色散消除更徹底,可以獲得更精確的脈沖輪廓。數(shù)據(jù)處理效率方面:在TITAN XP圖形處理器配置下,對(duì)8 bit采樣、觀測(cè)時(shí)長(zhǎng)1 s的雙極化PSR J0534+2200基帶數(shù)據(jù)進(jìn)行處理,所需時(shí)間約為0.8 s,與CPU模式下,DSPSR采用32線程處理同樣數(shù)據(jù)量的基帶數(shù)據(jù)所需時(shí)間約5 s相比,本數(shù)據(jù)處理流程速度提升約6.25倍。在觀測(cè)頻率、帶寬相近的條件下,將PSR J1939+2134數(shù)據(jù)處理結(jié)果與Parkes在L波段觀測(cè)所得的輪廓圖進(jìn)行對(duì)比,本流程處理所得結(jié)果與Parkes處理結(jié)果相同,驗(yàn)證了此數(shù)據(jù)處理流程在脈沖星數(shù)據(jù)處理方面的可行性與準(zhǔn)確性。本數(shù)據(jù)處理技術(shù)的開(kāi)發(fā),在實(shí)現(xiàn)相干消色散基帶數(shù)據(jù)處理的基礎(chǔ)上,提升了數(shù)據(jù)處理效率,為海量脈沖星基帶數(shù)據(jù)實(shí)時(shí)處理以及國(guó)內(nèi)開(kāi)發(fā)相干消色散脈沖星終端提供數(shù)據(jù)處理方面的技術(shù)儲(chǔ)備和技術(shù)參考。

        在今后的工作中將繼續(xù)研究DSPSR在GPU并行計(jì)算場(chǎng)景下的應(yīng)用,進(jìn)一步優(yōu)化其數(shù)據(jù)處理速度,為實(shí)時(shí)寬帶相干消色散的接收機(jī)做技術(shù)儲(chǔ)備。并拓展基于PSRDADA共享內(nèi)存技術(shù)的數(shù)據(jù)讀寫功能,如增加支撐更多數(shù)據(jù)格式,實(shí)現(xiàn)特定格式文件輸出等。

        致謝:感謝中國(guó)科學(xué)院國(guó)家天文臺(tái)FAST現(xiàn)場(chǎng)工作人員對(duì)數(shù)據(jù)處理流程部署的大力支持和熱情幫 助,在此深表謝意。

        [1] 劉建偉, 金乘進(jìn). 基于計(jì)算機(jī)集群的脈沖星相干消色散系統(tǒng)研究[J]. 科學(xué)技術(shù)與工程, 2009, 9(13): 3612-3615+3620.

        [2] 黃玉祥, 汪敏, 郝龍飛, 等. 脈沖星信號(hào)相干消色散與非相干消色散的比較研究[J]. 天文研究與技術(shù), 2019, 16(1): 16-24.

        [3] 張海龍, 張萌, 聶俊, 等. 脈沖星數(shù)字終端技術(shù)綜述[J].中國(guó)科學(xué)(物理學(xué) 力學(xué) 天文學(xué)), 2019, 49(9): 15-28.

        [4] BAILES M. Precision timing at the Parkes 64-m radio telescope[J]. Radio Pulsars, ASP Conference Proceedings, San Francisco: Astronomical Society of the Pacific, 2003: 57-60.

        [5] HACHENBERG O, GRAHL B, WIELEBINSKI R. The 100-meter radio telescope at Effelsberg[J]. Proceedings of the IEEE, 1973, 61(9): 1288-1295.

        [6] 劉立勇, 艾力·伊沙木丁, 張晉. 烏魯木齊天文站建立脈沖星相干消色散觀測(cè)系統(tǒng)[J]. 天文研究與技術(shù), 2007, 4(1): 72-78.

        [7] 徐永華, 李紀(jì)云, 張穎倩, 等. 相干消色散脈沖星觀測(cè)系統(tǒng)的研究[J]. 天文研究與技術(shù), 2015, 12(4): 480-486.

        [8] 南仁東, 李會(huì)賢.FAST的進(jìn)展—科學(xué)、技術(shù)與設(shè)備[J]. 中國(guó)科學(xué)(物理學(xué) 力學(xué) 天文學(xué)), 2014, 44(10): 1063-1074.

        [9] LUO J T, GGAO Y P, YANG T G, et al.Pulsar timing observations with Haoping radio telescope[J]. Research in Astronomy and Astrophysics, 2020, 20(7): 187-192.

        [10] LAZARUS P, KARUPPUSAMY R, GRAIKOU E, et al.Prospects for high-precision pulsar timing with the new Effelsberg PSRIX backend[J]. Monthly Notices of the Royal Astronomical Society, 2016, 458(1): 868-880.

        [11] SARKISSIAN J M, CARRETTI E, STRATEN W V.The Parkes pulsar backends[J]. AIP Conference Proceedings, 2011, 1357(1): 351-352.

        [12] LORMER D R, KRAMER M.Handbook of pulsar astronomy[K]. 2012.

        [13] STRATEN W V, BAILES M.DSPSR: digital signal processing software for pulsar astronomy[J]. Publications of the Astronomical Society of Australia, 201l, 28(1): 1-14.

        [14] Microsystems S.Shared Memory[C] // System Interface Guide, [S.l.]: Iuniverse Inc, 2001: 106-107.

        [15] CHENG J, GROSSMAN M, MCKERCHER T.Professional CUDA C programming[M]. John Wiley & Sons, [S.l.]: Wrox, 2014.

        [16] 李佳功, 徐永華, 李志玄, 等. 基于Mark5B+GPU脈沖星觀測(cè)系統(tǒng)[J]. 天文研究與技術(shù), 2014, 11(4): 335-342.

        A coherent de-dispersion processing technology on pulsar baseband data based on DSPSR and GPU

        LI Hao1,2, LUO Jin-tao1,3, PAN Zhi-chen4, SUN Peng-fei1, JIANG Jin-chen4,5

        (1. National Time Service Center, Chinese Academy of Sciences, Xi’an 710600, China;2.University of Chinese Academy of Sciences, Beijing 101048, China; 3. Key Laboratory of Precise Navigation and Timing Technology, Chinese Academy of Sciences, Xi’an 710600, China;4. National Astronomical Observatory, Chinese Academy of Sciences, Beijing 100101, China; 5. Peking University, Beijing 100871, China)

        Compared with incoherent de-dispersion, coherent de-dispersion has the advantages of more thorough dispersion elimination, and retaining the original phase information and the time resolution of the original data. However, it comes with challenges such as the massive computations and the longer data processing time. In order to realize a coherent de-dispersion processing of baseband data and accelerate the data processing, a pulsar data processing pipeline using DSPSR (the digital signal processing for pulsars) and GPU (graphics processing unit) as the data processing core is developed. Firstly, through the high-speed shared memory, the circular buffer is used to read the two-polarization baseband data. Combined with the high-performance computing technologies based on the graphics processor, the DSPSR is used to perform coherent de-dispersion, and folding process on the baseband data. Results from this pipeline show that compared with the multi-threaded incoherent de-dispersion system, this data processing technology has advantages in data processing speed and obtaining finer pulse profiles.

        pulsar; coherent achromatic dispersion; digital signal processing for pulsars (DSPSR); graphics processing unit (GPU); processing software for pulsar distributed acquisition and data analysis (PSRDADA)

        10.13875/j.issn.1674-0637.2021-03-0204-11

        李浩, 羅近濤, 潘之辰, 等. 一種基于DSPSR和GPU的脈沖星相干消色散基帶數(shù)據(jù)處理技術(shù)[J]. 時(shí)間頻率學(xué)報(bào), 2021, 44(3): 204-214.

        2021-04-21;

        2021-05-22

        國(guó)家自然科學(xué)基金資助項(xiàng)目(U1931128;11973046;91736207;42030105);國(guó)家重點(diǎn)研發(fā)計(jì)劃資助項(xiàng)目(2017YFA0402602)

        猜你喜歡
        共享內(nèi)存脈沖星色散
        “光的折射”“光的色散”知識(shí)鞏固
        “中國(guó)天眼”已發(fā)現(xiàn)740余顆新脈沖星
        軍事文摘(2023年12期)2023-06-12 07:51:00
        “光的折射”“光的色散”知識(shí)鞏固
        發(fā)現(xiàn)脈沖星的女天文學(xué)家——貝爾
        科學(xué)(2022年4期)2022-10-25 02:43:42
        “光的折射”“光的色散”知識(shí)鞏固
        『光的折射』『光的色散』隨堂練
        通過(guò)QT實(shí)現(xiàn)進(jìn)程間的通信
        基于PCI總線的多處理器協(xié)同機(jī)制研究
        基于虛擬觀測(cè)值的X射線單脈沖星星光組合導(dǎo)航
        QNX下PEX8311多路實(shí)時(shí)數(shù)據(jù)采集的驅(qū)動(dòng)設(shè)計(jì)
        電子世界(2014年21期)2014-04-29 06:41:36
        特黄熟妇丰满人妻无码| 精精国产xxx在线视频app| 国产久视频| 色婷婷av一区二区三区不卡| 久久亚洲免费精品视频| 国产女人精品视频国产灰线| 亚洲av无码成人网站在线观看 | 国产欧美日韩久久久久| 亚洲偷自拍另类图片二区| 中文字幕精品一区二区日本| 高清国产亚洲精品自在久久| 亚洲av天堂在线视频| 97人妻精品一区二区三区| 亚洲日韩乱码中文无码蜜桃臀 | 天堂视频一区二区免费在线观看| av黄色大片久久免费| 三级全黄裸体| 国产高清一区二区三区视频| 国产精品久久码一区二区| 亚洲av综合色区久久精品天堂| 免费人妖一区二区三区| 一本大道熟女人妻中文字幕在线 | 日韩人妻无码精品一专区二区三区| 国产色在线 | 亚洲| 欧美老妇人与禽交| 日本一区二区三本视频在线观看| 国产免费成人自拍视频| 国产免费久久精品99久久| 日韩高清在线观看永久| 国产精品黑色丝袜在线播放 | 国产精品一区二区夜色不卡| 日韩精品无码一区二区三区四区| 中文字幕一区二区三区日韩精品| 成人无码视频在线观看网站| 一区二区三区黄色一级片| 亚洲国产成人久久综合碰碰| 国产精品亚洲αv天堂无码| 亚洲av无码国产精品麻豆天美 | 亚洲αv在线精品糸列| 乳乱中文字幕熟女熟妇| 色88久久久久高潮综合影院|