亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SSD神經(jīng)網(wǎng)絡的圖像目標物體檢測

        2021-11-02 06:03:32王君洋葉傳奇朱炳旭
        無線互聯(lián)科技 2021年17期
        關鍵詞:熊貓物體預測

        王君洋,葉傳奇,朱炳旭

        (河南科技大學 軟件學院,河南 洛陽 471003)

        0 引言

        目標檢測為我們的生活提供了極大的便利,受到越來越多人的重視。目標檢測算法主要分三類,第一類是傳統(tǒng)的目標檢測算法:Cascade+HOG,DPM+Haar,SVM。第二類是候選框+深度學習分類:R-CNN,F(xiàn)ast R-CNN,F(xiàn)aster R-CNN等。第三類則是基于深度學習的回歸方法:YOLO,SSD,DenseBox等。其中SSD算法在保留了速度和精度的同時還有比較好的準確率和性能。SSD包含大量的網(wǎng)絡模型,其不同點主要在于被檢測圖像的大小不一樣。本文主要研究圖像識別領域TensorFlow的應用。

        1 TensorFlow框架

        TensorFlow是一個用于數(shù)值計算的開源框架,主要采用數(shù)據(jù)流圖。TensorFlow是人工智能領域處理分析的主要工具,同時也是一個用于機器學習和深度學習的開源平臺。在深度學習領域,TensorFlow經(jīng)常被用于自然語言處理、語音識別以及圖像識別等。

        1.1 TensorFlow的特點

        TensorFlow具有極大的靈動性、移植性,能夠自動求取微分、支持多語言、性能高度改良。

        1.2 TensorFlow Object Detection API庫

        TensorFlow Object Detection API庫的目的是創(chuàng)建一個在單個圖像中精確定位和識別多個事物的機器學習模型。這個API是基于Tensorflow構造的開源框架,不僅有利于在目標檢測的模型中構建、訓練和部署,同時在處理物體檢測問題中也可以使用。而在一個畫面幀中檢測許多不同物體的過程就是物體檢測過程,因此可以將其運用在熊貓這個數(shù)據(jù)模型中。

        2 SSD算法

        YOLO回歸的概念和Faster-RCNN中的Anchor機制被結合在SSD中。為了維持YOLO快速的特性,同時確保保留在窗口預測過程中Faster-RCNN算法比較精準的性能,可以利用全圖多尺度區(qū)域在各個地方進行回歸滿足需求。SSD主要被用于不同尺度的特征圖中,預測一些Default Bounding Boxes的類別和坐標的偏移量等,通過采用卷積核的方式來實現(xiàn)。

        2.1 SSD結構模型

        以VGG-16為基礎,使用VGG的前5個卷積,后面增加從CONV6開始的5個卷積結構,輸入圖片規(guī)格為300×300。

        2.2 SSD流程

        Faster R-CNN的anchorbox和被引入SSD中的Defalut Box的預設目標預選框機制十分相似。不同點主要在于使用PriorBox層在不同尺度featuremap所有特征點上,過程如圖1所示。

        圖1 SSD原理過程

        2.3 選取默認框

        通常多尺度的方式被SSD在實現(xiàn)目標檢測中使用。如果n層特征圖在模型檢測中使用,那么就可以確定第k個特征圖默認框的占比是:;特征層默認框占輸入圖像的最小比重是Smin,通常取0.2;占輸入圖像的最大比重則是Smax,通常取0.9[1]。

        2.4 損失

        網(wǎng)絡輸出預測的predict box與ground truth回歸變換之間的損失計算,置信度采用Softmax,位置回歸則采用Smooth L1。訓練中,為了提高預測框類別的置信度,可以通過減小損失函數(shù)值來實現(xiàn),同時提高預測框位置可信度。每次迭代都將迭代的結果返回給模型,模型接收返回的信息后,通過返回的信息進行修改繼續(xù)訓練。通過提升模型的目標檢測能力,訓練出所需要的最佳的圖像識別模型。

        3 實驗準備及過程

        3.1 數(shù)據(jù)集的創(chuàng)建與處理

        從網(wǎng)絡中下載500張中等大小的熊貓照片保存在“images”目錄下。下載的不同角度和形狀的熊貓照片可以被用來訓練所需要的預測模型。經(jīng)過一段時間的大量訓練,模型預測結果的精確度得到了提高。為了讓系統(tǒng)知道學習訓練和識別的實際物體是邊界框內的物體,可以在獲取圖像數(shù)據(jù)后,沿著模型后期將要預測的物體畫邊界框,用Labelme進行標記。在標記完成之后,會得到一個目錄和存儲每張圖面邊界框的xml文件[2]。

        3.2 劃分和創(chuàng)建新的數(shù)據(jù)集

        將從網(wǎng)絡中下載的數(shù)據(jù)集劃分為訓練集和測試集兩大類。模型向訓練部分添加大約80%的圖片和它的描述圖像邊界框的xml文件,向測試部分添加大約20%的圖片和它的xml文件[3]。為了使TensorFlow可以順利讀取xml文件中的數(shù)據(jù),將xml文件的格式修改為Tfrecord格式,存放在新的數(shù)據(jù)集中。

        3.3 運用SSD識別物體過程

        讀取本地測試圖片,preprocess_input以及保存圖像像素值(顯示需要);模型預測結果,得到7 308個priorbox;進行非最大抑制算法處理;SSD300模型輸入以及加載參數(shù)。

        4 結語

        物體檢測改善了人們日常生活的體驗,已經(jīng)成為當今社會研究的一個熱點技術。本文基于SSD算法,設計實現(xiàn)了圖像神經(jīng)網(wǎng)絡檢測模型,并且將其應用到熊貓的圖片識別中。多次實驗中的一個預測結果如圖2所示,成功標記出熊貓的概率為87.3%。在20測試數(shù)據(jù)集的測試中,18測試集的測試結果準確率在90%以上,表明該模型檢測結果的準確率較高。

        圖2 識別熊貓

        猜你喜歡
        熊貓物體預測
        無可預測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預測卷(A卷)
        選修2-2期中考試預測卷(B卷)
        深刻理解物體的平衡
        我愛“熊貓”
        我們是怎樣看到物體的
        萌萌噠熊貓等
        我與熊貓的二十年
        金色年華(2017年10期)2017-06-21 09:46:49
        不必預測未來,只需把握現(xiàn)在
        為什么同一物體在世界各地重量不一樣?
        东京热无码人妻中文字幕| 性大毛片视频| 国产精品美女久久久久久久| 国产精品情侣露脸av在线播放 | 无码欧亚熟妇人妻AV在线外遇| 国产精品色内内在线播放| 少妇深夜吞精一区二区| 欧美性受xxxx黑人猛交| 成人片黄网站色大片免费观看cn| 天天躁日日操狠狠操欧美老妇| 一级黄片草逼免费视频| 手机在线亚洲精品网站| 成人爽a毛片在线视频| 女高中生自慰污免费网站| 国产三级在线观看不卡| 精品一区二区三区在线视频| 亚洲欧美激情在线一区| 91精品久久久久含羞草| 中文字幕一区二区三区| 女人被男人爽到呻吟的视频| 久久婷婷香蕉热狠狠综合| 中文字幕大乳少妇| 一区二区三区视频亚洲| 内射人妻视频国内| 免费一区二区三区久久| 精品女同一区二区三区不卡| 在线观看免费日韩精品| 人人妻人人妻人人片av| 亚洲人成人99网站| 国产视频一区2区三区| 波多野结衣爽到高潮大喷| 亚洲产国偷v产偷v自拍色戒| 日本红怡院东京热加勒比| 国产自拍精品一区在线观看| 国产人与禽zoz0性伦| 97av在线播放| 亚洲国产精品国自产拍性色| 777亚洲精品乱码久久久久久 | 亚洲综合第一页中文字幕| 久久99久久99精品中文字幕 | 欧美成人精品一区二区综合|