亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多視點(diǎn)去模糊算法在雙核DSP上的并行優(yōu)化

        2015-04-10 03:43:58付航章秀華賀武
        關(guān)鍵詞:雙核視點(diǎn)運(yùn)算

        付航,章秀華,賀武

        武漢工程大學(xué)電氣信息學(xué)院,湖北 武漢 430205

        多視點(diǎn)去模糊算法在雙核DSP上的并行優(yōu)化

        付航,章秀華*,賀武

        武漢工程大學(xué)電氣信息學(xué)院,湖北 武漢 430205

        為了實(shí)現(xiàn)多視點(diǎn)去模糊算法在小型設(shè)備上快速運(yùn)行,提出了一種并行優(yōu)化的方法.采用TMS320C6657雙核數(shù)字信號(hào)處理器(DSP,Digital signal processor)作為主要運(yùn)算芯片,使用CCSv5.2作為軟件開發(fā)環(huán)境.為了解決算法在單核上運(yùn)行時(shí)間長的問題,首先使用時(shí)間戳計(jì)數(shù)器對(duì)算法中各部分功能函數(shù)的運(yùn)行時(shí)間進(jìn)行了詳細(xì)的統(tǒng)計(jì)和分析;然后將運(yùn)行時(shí)間最長的子函數(shù)中矩陣相乘部分的算法進(jìn)行了優(yōu)化,采用一個(gè)分界點(diǎn)將矩陣相乘部分算法劃分為兩塊,將計(jì)算量均等的分配到DSP的兩個(gè)核心上,使這部分算法能夠同時(shí)在兩個(gè)核心上并行運(yùn)算.結(jié)果表明對(duì)分界點(diǎn)的求解是正確有效的;優(yōu)化后的圖像去模糊算法極大的縮短了DSP上的運(yùn)算時(shí)間,提高了運(yùn)算效率.

        DSP;雙核并行;多視點(diǎn);去模糊

        0 引言

        去模糊是數(shù)字圖像處理中的一個(gè)重要分支,它能將原始的模糊圖像處理變成目標(biāo)可識(shí)別的清晰圖像[1-3].一般圖像去模糊算法主要在PC機(jī)上運(yùn)行處理,但是PC的體積大,成本高,專用性不好,并不適用于特定場(chǎng)合下的專用領(lǐng)域[4].目前DSP在圖像處理領(lǐng)域通常采用的是單核DSP,或者是使用多片DSP級(jí)聯(lián)的方式[5-6].經(jīng)過近幾年的發(fā)展,陸續(xù)出現(xiàn)了各種多核DSP芯片,這種高性能,低功耗的芯片,相比于目前市場(chǎng)上的主流圖像處理芯片在性能,外設(shè),架構(gòu)方面都更加強(qiáng)大,更加適合運(yùn)行復(fù)雜的圖像處理算法[7-8],如在醫(yī)療影像以及基礎(chǔ)設(shè)施設(shè)備等方面的運(yùn)用[9].

        本研究將多視點(diǎn)去模糊算法移植到了TMS320C6657雙核DSP芯片上,使整個(gè)圖像處理系統(tǒng)的體積,成本,功耗等大大減小,運(yùn)用范圍變得更加廣泛.根據(jù)DSP的雙核架構(gòu)[10],采用了多核并行處理的思想[11],對(duì)程序中矩陣相乘部分作了相應(yīng)的優(yōu)化調(diào)整.實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的算法縮短了多視點(diǎn)去模糊算法在DSP上的運(yùn)行時(shí)間,提高了運(yùn)算效率.

        1 多視點(diǎn)去模糊算法在雙核DSP上的移植與優(yōu)化

        1.1 多視點(diǎn)去模糊算法的移植與改進(jìn)方向分析

        多視點(diǎn)去模糊算法移植以CCSv5.2作為軟件開發(fā)平臺(tái).在算法程序的移植過程中,主要使用CCSV5.2編譯調(diào)試程序,查看實(shí)驗(yàn)圖像,校準(zhǔn)實(shí)驗(yàn)結(jié)果.基本過程為:先在CCS上新建一個(gè)工程,將現(xiàn)有的多視點(diǎn)去模糊程序根據(jù)開發(fā)板的硬件結(jié)構(gòu),修改定義變量的存儲(chǔ)空間,編譯通過后,進(jìn)入軟件或硬件調(diào)試模式,將圖像數(shù)據(jù)以.dat文件加載到指定的內(nèi)存中,然后開始運(yùn)行直至得到實(shí)驗(yàn)結(jié)果.

        多視點(diǎn)去模糊算法相對(duì)其他算法來講更加復(fù)雜,各種運(yùn)算繁多,調(diào)用到的子函數(shù)種類也很多.如果對(duì)程序中的每個(gè)函數(shù)都進(jìn)行分析優(yōu)化,工作量大,具有盲目性,是不切合實(shí)際的.為了提高優(yōu)化效率,讓算法更加快速穩(wěn)定的在硬件上運(yùn)行,我們需要對(duì)算法的初次移植實(shí)驗(yàn)結(jié)果中各個(gè)部分以某一個(gè)預(yù)定指標(biāo)來做一個(gè)分析對(duì)比,找到算法程序中計(jì)算效率低,占用資源空間大,耗費(fèi)時(shí)間長的部分,然后對(duì)這部分做針對(duì)性的改進(jìn)和優(yōu)化.

        在時(shí)間層面上的優(yōu)化設(shè)計(jì)是程序優(yōu)化當(dāng)中的一個(gè)重要指標(biāo),通過對(duì)整個(gè)程序當(dāng)中各個(gè)功能函數(shù)的運(yùn)行時(shí)間測(cè)定來確定哪個(gè)函數(shù)是最耗費(fèi)時(shí)間的,然后以減少時(shí)間消耗為目標(biāo),再來分析算法中的函數(shù),判斷是否具有改進(jìn)的空間,最后進(jìn)行針對(duì)性的修改,從而實(shí)現(xiàn)程序的快速運(yùn)行.

        1.2 程序在DSP中運(yùn)行時(shí)間的測(cè)定

        在調(diào)試多視點(diǎn)去模糊程序的過程中,如何精確測(cè)量某個(gè)函數(shù)或某段代碼的時(shí)間消耗量是必須要解決的問題.在C66xx系列DSP上每個(gè)核都具有TSCL,TSCH這兩個(gè)計(jì)數(shù)寄存器,我們以這兩個(gè)寄存器作為計(jì)時(shí)工具.TSC全稱為時(shí)間戳計(jì)數(shù)器,它具有與CPU相同的頻率,共同表示一個(gè)64 bit數(shù),每當(dāng)CPU運(yùn)行一個(gè)周期,該寄存器就加1,這兩個(gè)寄存器的值精確地反映了CPU在某個(gè)執(zhí)行段中消耗的周期數(shù)量.使用這種方法測(cè)量時(shí)間的基本公式為:

        式(1)中,a0表示待測(cè)試代碼段前獲取的CPU運(yùn)行的周期數(shù);a1表示待測(cè)試代碼段執(zhí)行完成后獲取的CPU運(yùn)行周期數(shù);f表示CPU的運(yùn)行頻率;a1-a0表示CPU運(yùn)行的周期數(shù),t為所求的CPU運(yùn)行時(shí)間.TMS320C6657的運(yùn)行頻率f為1 000 MHz,帶入公式中就能計(jì)算得到時(shí)間t.

        我們可以將多視點(diǎn)去模糊的程序劃分為幾個(gè)基本的功能函數(shù),然后使用這種方法統(tǒng)計(jì)出每個(gè)功能函數(shù)運(yùn)行所消耗的時(shí)間.表1為以128*128大小的灰度圖作為輸入圖像,運(yùn)算過程中各部分功能函數(shù)所用時(shí)間.

        表1 4種功能函數(shù)運(yùn)行時(shí)間的統(tǒng)計(jì)Table 1 Statistics of the running time of four performance functions

        從表1的數(shù)據(jù)分析中可以看到,多視點(diǎn)去模糊最耗費(fèi)時(shí)間的是功能函數(shù)03,即求解圖像的psf(點(diǎn)擴(kuò)散函數(shù))部分.為了具體確定功能函數(shù)03當(dāng)中哪一部分子函數(shù)的運(yùn)算時(shí)間最長,我們可以再按照這種方法以一幅128*128灰度圖為例將求解psf這個(gè)功能函數(shù)中調(diào)用到的5個(gè)不同子函數(shù)的運(yùn)行時(shí)間做進(jìn)一步的統(tǒng)計(jì),實(shí)驗(yàn)結(jié)果如圖1所示.

        圖1 5個(gè)不同子函數(shù)的運(yùn)行時(shí)間統(tǒng)計(jì)Fig.1 Statistics of the running time of five different sub-functions

        從圖1中可以看到運(yùn)算量幾乎都集中在func03和func05這兩個(gè)子函數(shù)上,其中func03運(yùn)算量占比最大,消耗時(shí)間最長.通過對(duì)以上圖像復(fù)原的時(shí)間統(tǒng)計(jì)結(jié)果的分析,可以得出對(duì)函數(shù)func03的修改,對(duì)整個(gè)程序在時(shí)間消耗量的優(yōu)化上的作用是最為明顯的.

        1.3 對(duì)去模糊程序中矩陣相乘算法的改進(jìn)

        通過對(duì)圖像去模糊算法和程序的分析,可以發(fā)現(xiàn)func03內(nèi)包含了大量的矩陣運(yùn)算,其中以兩個(gè)矩陣相乘求解一個(gè)對(duì)稱矩陣當(dāng)中所用到的輸入數(shù)據(jù)量最多的,運(yùn)算量也是最大的.其計(jì)算公式為:

        式(2)中,0<i<m,0<j<n,0<k<l.m表示矩陣A的行數(shù),n表示矩陣B的列數(shù),l表示A的列數(shù).從對(duì)應(yīng)的算法中已知C為對(duì)稱矩陣,即:矩陣A與矩陣B相乘只需計(jì)算0<i<m,0<j<i,0<k<l部分,也就是求出的下三角部分的數(shù)據(jù),然后再根據(jù)矩陣位置的對(duì)應(yīng)關(guān)系直接賦值就能求得整個(gè)矩陣C.在這部分函數(shù)運(yùn)算過程中,因?yàn)檩斎氲木仃嚁?shù)組A和矩陣數(shù)組B的數(shù)據(jù)量都十分巨大,所以計(jì)算消耗掉了大量的時(shí)間.

        根據(jù)TMS320C6657DSP的雙核架構(gòu),對(duì)于某些帶有大量運(yùn)算的復(fù)雜算法可以修改為雙核運(yùn)行.為了實(shí)現(xiàn)雙核并行處理,我們?cè)O(shè)定了一個(gè)分界點(diǎn)d.這個(gè)分界點(diǎn)將矩陣運(yùn)算過程分解為兩塊,只要選取的分界點(diǎn)合適就可以將兩部分的運(yùn)算量做到盡量相等,從而每個(gè)核都能被得到充分的利用,此時(shí)效率也是最高的.圖2和圖3分別表示矩陣相乘在單核上運(yùn)行和在雙核上運(yùn)行.

        圖2 單核運(yùn)行Fig.2 Single-core operation

        圖3 雙核運(yùn)行Fig.3 Dual-core operation

        從上述矩陣相乘的算法結(jié)構(gòu)中可以看出,算法的運(yùn)算量與輸入的數(shù)組A和數(shù)組B的行數(shù),列數(shù)相關(guān);同時(shí),加法的計(jì)算量和乘法的計(jì)算量是相等的.單核運(yùn)行的過程中,A[i][k]×B[k][j]的計(jì)算量為m×l次;雙核運(yùn)行過程中,對(duì)于A[i][k]×B[k][j]的計(jì)算,取0<i<d的部分在核0上運(yùn)行,取d<i<m的部分在核1上運(yùn)行,兩個(gè)核分到的計(jì)算量相等,于是可以推導(dǎo)出下列等式:

        式(3)中,參數(shù)d表示計(jì)算量分界點(diǎn);參數(shù)m表示矩陣A的行數(shù),參數(shù)l表示矩陣A的列數(shù),公式兩邊分別表示核0和核1的計(jì)算量.由上述等式可以推導(dǎo)出對(duì)分界點(diǎn)d的計(jì)算公式為:

        利用公式(4)將求得的分界點(diǎn)d帶入程序中就可以將func03中矩陣相乘求解矩陣C的過程劃分為計(jì)算量相等的兩塊,分別在核0與核1上運(yùn)行,實(shí)現(xiàn)程序的雙核并行運(yùn)算.

        同樣可以用一幅128*128大小的灰度圖像為例,僅針對(duì)求解矩陣C這部分算法在單核與雙核模式下運(yùn)行時(shí)間的測(cè)定來驗(yàn)證優(yōu)化是否有效,結(jié)果如表2所示.

        表2 不同模式下的運(yùn)行結(jié)果Table 2 The operation results under different mode

        通過表2中的實(shí)驗(yàn)數(shù)據(jù),可以得出同一函數(shù)使用不同的算法分別在單核與雙核上運(yùn)行求出結(jié)果所需的時(shí)間是大不相同的.優(yōu)化后的算法在雙核模式下最長的運(yùn)算時(shí)間與單核模式下的運(yùn)算時(shí)間之比約為1∶2,同時(shí)雙核模式下兩個(gè)核的運(yùn)算時(shí)間相近,驗(yàn)證了以上公式對(duì)分界點(diǎn)d求解的正確性.

        2 多視點(diǎn)去模糊的移植實(shí)驗(yàn)

        為了驗(yàn)證多視點(diǎn)去模糊算法優(yōu)化前后的最終效果,采用5個(gè)鏡頭,從5個(gè)角度同時(shí)拍攝5張圖片作為實(shí)驗(yàn)圖片.這里以拍攝所得的128*128大小的灰度圖作為模糊圖像進(jìn)行去模糊實(shí)驗(yàn).先將拍攝的圖像轉(zhuǎn)換成帶有圖像數(shù)據(jù)的.dat文件,然后在調(diào)試模式中下載到程序指定的內(nèi)存地址上,最后運(yùn)行程序.計(jì)算完成后在圖像分析器里配置對(duì)應(yīng)的圖像屬性查看實(shí)驗(yàn)結(jié)果,同時(shí)在控制臺(tái)窗口中可以得到打印出的函數(shù)運(yùn)行時(shí)間和運(yùn)行狀況等相關(guān)實(shí)驗(yàn)數(shù)據(jù).

        圖4 模糊圖像Fig.4 Blurred images

        圖5 多視點(diǎn)去模糊圖像Fig.5 Multi-view deblurred images

        從圖4和圖5的對(duì)比中可以很容易的看出各個(gè)角度拍攝到的模糊圖像與復(fù)原圖像的區(qū)別.復(fù)原圖像輪廓更加清晰,對(duì)比度更高,達(dá)到了預(yù)期的復(fù)原效果.

        表3記錄了以上5幅模糊圖在整個(gè)圖像復(fù)原中所需時(shí)間.通過表3中的整個(gè)圖像運(yùn)行時(shí)間的對(duì)比,可以看出將改進(jìn)后的算法運(yùn)用在雙核上后,運(yùn)算時(shí)間明顯縮短,DSP的計(jì)算效率得到提高,達(dá)到了減少時(shí)間的目標(biāo),驗(yàn)證了算法優(yōu)化的有效性.

        表3 多視點(diǎn)去模糊所需的時(shí)間統(tǒng)計(jì)Table 3 The statistics of time required for multi-view image deblurring

        3 結(jié)語

        本研究實(shí)現(xiàn)了多視點(diǎn)去模糊算法在DSP上的移植,對(duì)每個(gè)功能函數(shù)在運(yùn)行時(shí)間上做出了分析.對(duì)求解點(diǎn)擴(kuò)散函數(shù)中矩陣相乘部分算法作了優(yōu)化,并通過實(shí)驗(yàn)結(jié)果對(duì)比驗(yàn)證了對(duì)分界點(diǎn)求解的正確性.優(yōu)化后的算法在整個(gè)去模糊的過程中減少了時(shí)間消耗,效果明顯,為后續(xù)算法在時(shí)間層面上的優(yōu)化改進(jìn)提供了方向.

        致謝

        本工作得到國家自然科學(xué)基金委員會(huì),湖北省科學(xué)技術(shù)廳和武漢市科技局提供的資金資助,在此一并致以衷心的感謝!

        [1]HONG Han-yu,ZHANG Tian-xu.Fast restoration approach for rotationl motion blurred image based on deconvolution along the blurring paths[J].Optical Engineering,2003,42(12):3471-3486.

        [2]ZHANG Hang,LUO Da-yong.Statusanddevelopment of study on blind image restoration algorithm[J].Journal of Image and Graphics,2004,10:1146-1150.

        [3]HONG Han-yu,ZHANG Tian-xu,YU Guo-Liang.Regularized restoration algorithm of astronautcal turblencedegraded images using maximum-likelihoodestimation[J].Journal ofInfrared and Millimeter Waves,2005,24(2):130-134.

        [4]包正睿,陳芬.基于DSP/BIOS的視頻圖像復(fù)原系統(tǒng)設(shè)計(jì)[J].微型機(jī)與應(yīng)用,2014,33(24):48-50.

        BAO Zheng-rui,CHEN Fen.Design of video image restoration system based on DSP/BIOS[J].Microcomputer&Its Applications,2014,33(24):48-50.(in Chinese)

        [5]樊民革,趙剡,許東.基于DSP的時(shí)圖像復(fù)原[J].紅外與激光工程,2006,35(增刊):343-348.

        FAN Min-ge,ZHAO Yan,XU Dong.Real time image restoration based on DSP[J].Infrared and Laser Engineering,2006,35(Supplement):343-348.(in Chinese)

        [6]趙峰,袁東風(fēng),張海霞,等.多DSP圖像壓縮實(shí)時(shí)并行處理系統(tǒng)[J].光學(xué)精密工程,2007,15(9):1451-1455.

        ZHAO Feng,YUAN Dong-feng,ZHANG Hai-xia,et al.Multi-DSP real-time parallel processing system for image compression[J].Optics and Precision Engineering,2007,15(9):1451-1455.(in Chinese)

        [7]丁有源,汪安民.基于多核任務(wù)并行處理的DSP軟硬件設(shè)計(jì)[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2012(5):43-45.

        DING You-yuan,WANG An-min.Software and Hardware designs of DSP based on Multi-core task parallel processing[J].Microcontroller&Embedded Systems,2012(5):43-45.(in Chinese)

        [8]Texas Instruments.Keystone Architecture Multicore Navigator UserGuide(LiteratureNumber:SPRUGR9F)[OL].(2013-3)http://www.ti.com/lit/ug/sprugr9f/sprugr9f.pdf.

        [9]電子工程世界.多核DSP計(jì)數(shù)在OCT醫(yī)療成像中的應(yīng)用[OL].[2012-01-12]http://www.eeworld.com.cn/medical_electronics/2012/0112/article_2655.html.

        [10]Texas Instruments.TMS320C66x DSP CorePac User Guide(Literature Number:SPRUGW0B)[OL].(2013-7)http://www.ti.com/lit/ug/sprugw0c/sprugw0c.pdf.

        [11]曹折波,李青.多核處理器并行編程模型的研究與設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(13):2999-3002.

        CAO Zhe-bo,LI Qing.Research and designed of parallel programming model on multi-core[J].Computer Engineering and Design,2010,31(13):2999-3002.(in Chinese)

        Parallel optimization of multi-view deblurring algorithm in dual-core digital signal processor

        FU Hang,ZHANG Xiu-h(huán)ua,HE Wu
        School of Electrical and Information Engineering,Wuhan Institute of Technology,Wuhan 430205,China

        To realize fast running of the multi-view deblurring algorithm in small devices,aparallel optimization algorithm was proposed.TMS320C6657 dual-core digital signal processor(DSP)was used as the primary computing chip,and the CCSv5.2 was used as the software development environment.To solve the problem of time consume of the single core,the time of each sub-function in the algorithm was analyzed by using the time stamp counter.Then the algorithm of matrix multiplication that consumes the longest time in the subfunction was optimized by dividing into two parts using a dividing point,and the amount of calculation was assigned to the two cores of DSP equally to ensure the algorithm run in parallel.The results show that the solving method of the dividing point is correct and effective;the running time of the DSP is reduced significantly by the optimized algorithm of multi-view deblurring and the operation efficiency is improved.

        digital signal processor;parallel optimization;multi-views;deblurring

        TP391

        A

        10.3969/j.issn.1674-2869.2015.11.015

        1674-2869(2015)11-0074-05

        本文編輯:張瑞

        2015-10-23

        國家自然科學(xué)基金面上項(xiàng)目(61175013);湖北省自然科學(xué)基金創(chuàng)新群體項(xiàng)目(2012FFA046);武漢市國際科技合作計(jì)劃項(xiàng)目(2014030709020310)

        付航(1991-),男,湖北隨州人,碩士研究生.研究方向:圖像處理與目標(biāo)識(shí)別.*通信聯(lián)系人

        猜你喜歡
        雙核視點(diǎn)運(yùn)算
        重視運(yùn)算與推理,解決數(shù)列求和題
        全球金融“F20”在此召開!橫瀝進(jìn)入“雙核”時(shí)代
        有趣的運(yùn)算
        “整式的乘法與因式分解”知識(shí)歸納
        撥云去“誤”學(xué)乘除運(yùn)算
        視點(diǎn)
        河南電力(2016年5期)2016-02-06 02:11:24
        新型夾心雙核配和物[Zn2(ABTC)(phen)2(H2O)6·2H2O]的合成及其熒光性能
        讓你每天一元錢,物超所值——《今日視點(diǎn)—2014精萃》序
        新聞前哨(2015年2期)2015-03-11 19:29:22
        兩會(huì)視點(diǎn)
        中國水利(2015年5期)2015-02-28 15:12:40
        三螺旋N-N橋連的雙核Co(Ⅲ)配合物的合成、結(jié)構(gòu)和性質(zhì)
        日韩一区二区不卡av| 亚洲精品国偷拍自产在线观看| 亚洲成av人片在线观看无码| 免费 无码 国产在线观看不卡| 中文字幕久区久久中文字幕| 在线日本看片免费人成视久网| 国产福利精品一区二区| 国产女在线| 亚洲av有码精品天堂| 亚洲悠悠色综合中文字幕| 99久久国产综合精品女图图等你| 无码专区中文字幕DVD| 一区二区三区国产偷拍 | 日本亚洲国产精品久久| 国产精品熟女视频一区二区| 久久久久久亚洲AV成人无码国产| 亚洲精品国产第一区三区| 久久精品网站免费观看| 国产精品沙发午睡系列990531| 免费国产一级特黄aa大片在线| 久久亚洲精品中文字幕蜜潮| 免费a级毛片18禁网站免费| 中国a级毛片免费观看| 精品无吗国产一区二区三区av | 中文字幕综合一区二区| 久久只精品99品免费久23| 日韩精品无码区免费专区| 国产精品一区二区三区色| 免费在线观看播放黄片视频| 伊人久久久精品区aaa片| 国产精品一区二区资源| 亚洲中文字幕综合网站| 久久久久亚洲av成人片| 国产精品久久久久国产a级| 无码流畅无码福利午夜| 国产性感丝袜在线观看| 米奇777四色精品人人爽| 亚洲AV成人无码久久精品在| 精品一区二区三区国产av | 女人被爽到呻吟gif动态图视看| 国产精品久久久一本精品|