亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        視覺類深度神經(jīng)網(wǎng)絡(luò)的自動(dòng)標(biāo)注

        2020-06-20 12:00:48郭晨皓
        計(jì)算機(jī)應(yīng)用 2020年6期
        關(guān)鍵詞:模型

        李 鳴,郭晨皓,陳 星*

        (1.福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福州 350108;2.福建省網(wǎng)絡(luò)計(jì)算與智能信息處理重點(diǎn)實(shí)驗(yàn)室(福州大學(xué)),福州 350108)

        (?通信作者電子郵箱chenxing@fzu.edu.cn)

        0 引言

        視覺是人類理解認(rèn)識(shí)外部世界的重要途徑,在人類認(rèn)知的過程中,有超過80%的信息量來自視覺系統(tǒng),而計(jì)算機(jī)視覺作為計(jì)算機(jī)科學(xué)領(lǐng)域一個(gè)重要的研究方向,目標(biāo)是讓計(jì)算機(jī)能夠幫助或者代替人眼感知圖像、視頻或者多維數(shù)據(jù),并從中獲得目標(biāo)的信息和數(shù)據(jù)[1]。

        如今,隨著對(duì)深度神經(jīng)網(wǎng)絡(luò)研究的進(jìn)一步深入,它在計(jì)算機(jī)視覺領(lǐng)域中也有了廣泛的應(yīng)用,并在目標(biāo)檢測(cè)、目標(biāo)跟蹤、超分辨率、圖片生成、3D 建模和人體姿態(tài)相關(guān)等方向都取得了不錯(cuò)的效果[2]。因此,含有更多隱藏層的復(fù)雜模型被提出,相對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法具有更強(qiáng)大有效的特征學(xué)習(xí)和特征表達(dá)能力。而面對(duì)著越來越多的模型,通過閱讀論文文檔來學(xué)習(xí)了解相關(guān)模型的開發(fā)人員也就產(chǎn)生了如何根據(jù)所遇到的問題快速準(zhǔn)確地找到合適模型的需求。本文根據(jù)這一需求進(jìn)行了相關(guān)的調(diào)研,發(fā)現(xiàn)目前已有對(duì)科學(xué)文章進(jìn)行提取關(guān)鍵詞并推薦的研究[3],但是,它不是專門針對(duì)視覺類計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)自動(dòng)標(biāo)注。因此,本文提出了模型應(yīng)用領(lǐng)域的自動(dòng)標(biāo)注系統(tǒng),通過對(duì)模型進(jìn)行自動(dòng)標(biāo)注,能夠幫助開發(fā)人員更加快速準(zhǔn)確了解該模型的應(yīng)用領(lǐng)域,從而判斷是否是自己需要的模型。

        本文的主要工作如下:

        1)利用詞頻等信息計(jì)算得到不同領(lǐng)域中的關(guān)鍵詞以及其對(duì)應(yīng)的權(quán)值,并據(jù)此構(gòu)建了視覺類深度神經(jīng)網(wǎng)絡(luò)的架構(gòu)圖,方便之后的模型分類。

        2)本文發(fā)現(xiàn)關(guān)鍵詞作為最能體現(xiàn)模型所屬領(lǐng)域特點(diǎn)的詞組表達(dá),往往在摘要中出現(xiàn)的地方具有相似性與固定性,根據(jù)這一發(fā)現(xiàn),提出了能夠提取文章摘要關(guān)鍵詞組的八種提取模型。

        3)在實(shí)際數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),結(jié)果表明,與傳統(tǒng)機(jī)器學(xué)習(xí)分類算法相比,本文的方法可實(shí)現(xiàn)更好的性能。

        1 相關(guān)工作

        1.1 關(guān)鍵詞提取

        目前,關(guān)鍵詞提取技術(shù)主要可以分為三類:語言學(xué)方法、統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法。

        1.1.1 語言學(xué)方法

        語言學(xué)方法中使用了單詞、句子和文檔的語言屬性,最常使用的語言屬性是詞法分析、句法分析、語義分析和語篇分析[4-6]。基于語言學(xué)方法具有不可避免的缺點(diǎn),首先語法規(guī)則不可能涵蓋所有語句,其次這種方法對(duì)開發(fā)者的要求極為苛刻,開發(fā)者不僅要精通計(jì)算機(jī)還要精通語言學(xué),因此,雖然語言學(xué)方法解決了一些簡(jiǎn)單的問題,但是無法從根本上將自然語言理解實(shí)用化。

        1.1.2 統(tǒng)計(jì)方法

        統(tǒng)計(jì)方法基于術(shù)語內(nèi)部詞之間黏著度較高的假設(shè),該方法不需要訓(xùn)練數(shù)據(jù),而是利用統(tǒng)計(jì)特征實(shí)現(xiàn)關(guān)鍵詞提取[7]。目前統(tǒng)計(jì)方法包括n-gram 統(tǒng)計(jì)信息[8]、單詞詞頻[9]、詞匯同現(xiàn)[10]、PAT 樹(PATricia tree)[11]等。但是單純依靠?jī)?nèi)部黏著度效果并不理想,并且互信息算法很難排除語料中超低頻詞和超高頻詞的干擾等。

        1.1.3 機(jī)器學(xué)習(xí)方法

        機(jī)器學(xué)習(xí)方法在關(guān)鍵詞提取上的應(yīng)用主要分為有監(jiān)督和無監(jiān)督學(xué)習(xí)方法。有監(jiān)督的關(guān)鍵詞提取將問題看作是二進(jìn)制分類的問題,主要存在三個(gè)問題:需要昂貴的人工標(biāo)注費(fèi)用,不能滿足某些的特定要求和無法提取面向事件的關(guān)鍵短語[12]。與之相反,無監(jiān)督方法不需要標(biāo)記的訓(xùn)練數(shù)據(jù),而是探索一些外部統(tǒng)計(jì)信息來識(shí)別關(guān)鍵短語[13],目前無監(jiān)督的方法主要是基于詞頻-逆文本頻率(Term Frequency-Inverse Document Frequency,TF-IDF)、聚類和圖的排序[14-16]。

        1.2 文本分類

        目前,文本分類主要可以分兩類:基于傳統(tǒng)機(jī)器學(xué)習(xí)的文本分類和基于深度學(xué)習(xí)的文本分類。

        1.2.1 基于傳統(tǒng)機(jī)器學(xué)習(xí)

        傳統(tǒng)的機(jī)器學(xué)習(xí)方法主要利用自然語言處理中的n-gram概念對(duì)文本進(jìn)行特征提取,并且利用TF-IDF[17]對(duì)n-gram 特征權(quán)重進(jìn)行調(diào)整,然后將提取到的文本輸入到Logistics 回歸[18]、支持向量機(jī)(Support Vector Machine,SVM)[19]等分類器中進(jìn)行訓(xùn)練,但是,這類問題存在數(shù)據(jù)稀疏和緯度爆炸等問題。

        1.2.2 基于深度學(xué)習(xí)

        針對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)的高緯度高稀疏、特征表達(dá)能力弱等問題,相關(guān)領(lǐng)域?qū)<覍⑸疃葘W(xué)習(xí)應(yīng)用到文本分類中來解決這些不足。

        Wang 等[20]通過應(yīng)用word embedding 來改善短文文本的分類,雖然該方法在一些文本分類任務(wù)中,分類的效果甚至超過了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)/循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),但是如果一個(gè)句子如果很長(zhǎng),少量的重要信息會(huì)被多數(shù)的無用信息淹沒。Banerjee 等[21]將CNN/RNN 應(yīng)用在文本分類中,與word embedding 相比更適用于長(zhǎng)文本的分析,其中CNN 擅長(zhǎng)捕獲更短的序列信息,RNN 擅長(zhǎng)捕獲更長(zhǎng)的序列信息,但它們難以捕獲長(zhǎng)期的上下文信息和非連續(xù)詞之間的相關(guān)性。Cheng等[22]通過引入Attention 機(jī)制,可以對(duì)輸入的每個(gè)部分賦予不同的權(quán)值,抽取出更加關(guān)鍵及重要的信息,使模型作出更加準(zhǔn)確的判斷,同時(shí)不會(huì)給模型的計(jì)算和存儲(chǔ)帶來更大的開銷。

        2 方法設(shè)計(jì)

        2.1 總體結(jié)構(gòu)

        視覺類深度神經(jīng)網(wǎng)絡(luò)自動(dòng)標(biāo)注的流程如圖1所示。

        圖1 總體框架Fig.1 Overall framework

        首先將模型描述作為輸入,根據(jù)關(guān)鍵詞提取可以得到文章的關(guān)鍵詞,然后依據(jù)得到的關(guān)鍵詞以及不同領(lǐng)域關(guān)鍵詞對(duì)應(yīng)的權(quán)值計(jì)算得到該模型的應(yīng)用領(lǐng)域。

        2.2 模型研究領(lǐng)域的判別

        2.2.1 視覺類深度神經(jīng)網(wǎng)絡(luò)架構(gòu)圖設(shè)計(jì)

        目前,深度神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的多個(gè)領(lǐng)域都有著廣泛的應(yīng)用[23],本文主要針對(duì)其中的六個(gè)領(lǐng)域進(jìn)行研究,從網(wǎng)絡(luò)公開的計(jì)算機(jī)視覺類論文中,收集了這六個(gè)領(lǐng)域共264 篇論文作為實(shí)驗(yàn)的語料庫(kù)。其中:目標(biāo)檢測(cè)48 篇,目標(biāo)跟蹤44篇,超分辨率54篇,圖像生成43篇,3D建模相關(guān)36篇,人體姿態(tài)相關(guān)39 篇。根據(jù)語料庫(kù)中264 篇論文,并通過以下的計(jì)算公式,得到不同領(lǐng)域?qū)?yīng)的關(guān)鍵詞及其對(duì)應(yīng)的權(quán)值(關(guān)鍵詞和權(quán)值會(huì)隨著語料庫(kù)的擴(kuò)充進(jìn)行相應(yīng)的增加和修改)。

        在對(duì)某個(gè)領(lǐng)域進(jìn)行關(guān)鍵詞選擇和權(quán)值計(jì)算時(shí),本文主要考慮兩方面:第一,詞在該領(lǐng)域論文摘要中出現(xiàn)的頻率;第二,詞出現(xiàn)的論文摘要在該領(lǐng)域摘要中的占比。

        1)計(jì)算詞在不同領(lǐng)域論文摘要中出現(xiàn)的頻率,計(jì)算式如下:

        其中:freqi表示該詞在i領(lǐng)域論文摘要出現(xiàn)的次數(shù);sizei表示i領(lǐng)域中總的論文摘要數(shù)。通過觀察發(fā)現(xiàn),詞在一篇文章中出現(xiàn)的次數(shù)一般為1~3,基本都是低頻詞,所以這里將sizei乘以2.5 是為了保證計(jì)算的frequencyi值不會(huì)超過1 并且又不會(huì)過小。

        2)計(jì)算詞出現(xiàn)的論文在不同領(lǐng)域的占比,計(jì)算式如下:

        其中:timei表示i領(lǐng)域論文摘要中出現(xiàn)該詞的摘要數(shù);sizei表示i領(lǐng)域中總的論文摘要數(shù)。

        3)計(jì)算詞在不同領(lǐng)域的權(quán)值,計(jì)算公式定義如下:

        其中詞頻和占比以4∶6 的比例計(jì)算,最終結(jié)果保留一位有效數(shù)字。在計(jì)算過程中過濾掉proportioni低于0.2 的詞,因?yàn)檫@些詞不具有領(lǐng)域代表性。最后,通過人工經(jīng)驗(yàn)篩去一些干擾詞,得到領(lǐng)域的關(guān)鍵詞及其對(duì)應(yīng)的權(quán)值

        根據(jù)實(shí)驗(yàn)得到的關(guān)鍵詞和權(quán)值構(gòu)建出了視覺類深度神經(jīng)網(wǎng)絡(luò)架構(gòu),如圖2 所示,其中:第三層中單詞字號(hào)越大代表該單詞在這個(gè)領(lǐng)域的比重越大,而相同大小的單詞代表相同的權(quán)值,第四層是第三層中每個(gè)領(lǐng)域?qū)?yīng)關(guān)鍵詞的具體權(quán)值,這里每個(gè)領(lǐng)域只具體列出前五個(gè)。

        圖2 視覺類深度神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.2 Visual deep neural network architecture

        2.2.2 模型關(guān)鍵詞的提取

        通過觀察視覺類神經(jīng)網(wǎng)絡(luò)論文的摘要特點(diǎn),發(fā)現(xiàn)關(guān)鍵詞作為最能體現(xiàn)模型所屬領(lǐng)域特點(diǎn)的詞組表達(dá),往往在文中出現(xiàn)的地方具有相似性與固定性。根據(jù)這一發(fā)現(xiàn),本文提出了八種關(guān)鍵詞提取模型,以下是模型的定義與示例。

        1)提取模型一:首句主語。

        在計(jì)算機(jī)視覺類論文的文摘中,論文試圖解決的問題一般會(huì)在首句就有體現(xiàn),而首句的主語一般就會(huì)有對(duì)該問題的表述,所以首句的主語對(duì)應(yīng)的詞組對(duì)于內(nèi)容的判別來說很有參考和提取的價(jià)值。

        提取模型一定義:從句子依存樹的ROOT(根節(jié)點(diǎn))出發(fā),向前回溯,找到依存于該ROOT 且關(guān)系為nsubj(名詞性主語)的實(shí)體詞組,如未找到則取第一個(gè)找到的依存關(guān)系為dobj(直接賓語)的實(shí)體詞組。

        以句子s1為例:

        s1對(duì)應(yīng)依存樹如圖3所示。

        圖3 s1對(duì)應(yīng)的依存分析樹Fig.3 Dependency analysis tree corresponding to s1

        根據(jù)提取模型一的定義,從ROOT 出發(fā),即可得到關(guān)系為nsubj 的詞“recognition”,再以該詞為起點(diǎn)向前和向后尋找與該詞有依存且為修飾關(guān)系的詞,提取到整個(gè)實(shí)體詞組:“Material recognition for real-world outdoor surfaces”。

        2)提取模型二:特定名詞及其修飾詞。

        在計(jì)算機(jī)視覺類論文的摘要中,表述文章解決的問題或涉及的領(lǐng)域的信息常常會(huì)包含某些特定的名詞(具體如表1所示),針對(duì)這些特定的名詞提取出對(duì)應(yīng)的詞組,也能夠幫助判別模型所屬的領(lǐng)域。

        提取模型二定義:以特定名詞作為實(shí)體詞組的名詞性主體和觸發(fā)條件,向前回溯與這一名詞性主體存在依存關(guān)系的修飾詞,同時(shí)向后遍歷,提取case(狀語)關(guān)系涉及的修飾和conj(連接詞)作為后綴修飾信息。

        以句子s2為例:

        s2對(duì)應(yīng)依存樹如圖4所示。

        根據(jù)提取模型二的定義,該句中“problems”為特定名詞,向前回溯得到依存于該詞的修飾詞,最終提取出詞組“various visual recognition problems”,由于“problems”無后綴,所以這里不需要向后遍歷。

        圖4 s2對(duì)應(yīng)的依存分析樹Fig.4 Dependency analysis tree corresponding to s2

        3)提取模型三:特定名詞的case/mark 指向部分。

        根據(jù)觀察,提及論文主要工作的詞組常常出現(xiàn)在特定名詞(具體如表1 所示)的case(狀語)或者mark(主要為“that”“whether”或者“because”)指向的部分。由此現(xiàn)象,提出了該提取模型三。

        提取模型三定義:以特定的名詞出發(fā),向后查看是否存在限定場(chǎng)景、領(lǐng)域和應(yīng)用范圍的case/mark 關(guān)系引導(dǎo),如果有,根據(jù)case和mark引導(dǎo)規(guī)則的不同:對(duì)于case,直接對(duì)case指向的實(shí)體詞組進(jìn)行提??;而對(duì)于mark,向后遍歷找到依存關(guān)系是dobj(直接賓語)的詞語,然后判別mark 與dobj 對(duì)應(yīng)詞之間的詞是否依存于mark或mark指向的詞,如果有則加入到最后提取出的詞組的前修飾中。

        以句子s3為例:

        s3對(duì)應(yīng)依存樹如圖5所示。

        圖5 s3對(duì)應(yīng)的依存分析樹Fig.5 Dependency analysis tree corresponding to s3

        根據(jù)提取模型三的定義,該句中the problem of 為特定名詞,而其后是mark 引導(dǎo)的,所以向后尋找依存于mark 的直接賓語,得到“keypoints”,然后提取整個(gè)實(shí)體詞組,最終得到“estimating and tracking human body keypoints”。

        4)提取模型四:特定及物動(dòng)詞的直接賓語。

        在計(jì)算機(jī)視覺類論文的摘要中特定的及物動(dòng)詞(具體如表1 所示)往往直接賓語往往能夠代表文章的主要工作,所以這類直接賓語即為需要提取的目標(biāo)詞組。針對(duì)這一規(guī)則,提出了提取模型四。

        提取模型四定義:檢測(cè)句子中的關(guān)鍵詞,隨后尋找該關(guān)鍵詞的直接賓語,即依存關(guān)系為dobj(直接賓語)的詞語,依據(jù)索引獲取該詞語對(duì)應(yīng)的實(shí)體詞組。

        以句子s4為例:

        s4對(duì)應(yīng)依存樹如圖6所示。

        圖6 s4對(duì)應(yīng)的依存分析樹Fig.6 Dependency analysis tree corresponding to s4

        根據(jù)提取模型四的定義,該句中“improve”為特定的及物動(dòng)詞,所以提取其直接賓語“precision”,然后根據(jù)“precision”提取實(shí)體詞組,得到“precision of facial landmark detectors”。

        5)提取模型五:特定動(dòng)詞的直接賓語對(duì)應(yīng)的動(dòng)詞短語。

        對(duì)于特定的動(dòng)詞(具體如表1 所示),表達(dá)主要文章工作的內(nèi)容常常出現(xiàn)在該修飾的賓語的從句之中,而特定動(dòng)詞修飾的賓語在從句中通常充當(dāng)主語的成分,對(duì)應(yīng)的動(dòng)詞短語即是目標(biāo)詞組。

        提取模型五定義:首先檢測(cè)該特定動(dòng)詞對(duì)應(yīng)的依存關(guān)系為dobj(直接賓語)的詞語,如果之后有從句信息,則繼續(xù)向后遍歷查找依存于該直接賓語的動(dòng)詞,根據(jù)查找到的動(dòng)詞,獲取動(dòng)詞短語作為目標(biāo)詞組。

        以句子s5為例:

        s5對(duì)應(yīng)依存樹如圖7所示。

        圖7 s5對(duì)應(yīng)的依存分析樹Fig.7 Dependency analysis tree corresponding to s5

        根據(jù)提取模型五的定義,該句中“propose”為特定動(dòng)詞,然后尋找得到對(duì)應(yīng)的直接賓語“network”,由于之后還有從句信息,所以尋找“network”對(duì)應(yīng)的動(dòng)詞即“reconstruct”,最終找到“reconstruct”對(duì)應(yīng)的動(dòng)詞短語“reconstruct the high resolution image”。

        6)提取模型六:for引導(dǎo)的短語。

        在摘要之中,“For”常常在句首出現(xiàn),作為句子表明解決的問題的限定,對(duì)表達(dá)論文屬于哪一計(jì)算機(jī)視覺類的研究方向有著一定指示的作用,同時(shí)由于句式的不同和表達(dá)方式的不同,也存在句中使用“for”引導(dǎo)的情況。基于以上觀察,設(shè)計(jì)和實(shí)現(xiàn)提取模型六。

        提取模型六定義:首先判斷是否句首為“For”并且依存關(guān)系為case(狀語),如果滿足,則根據(jù)case 這一依存關(guān)系指示的對(duì)象提取實(shí)體詞組。如果句首不是“For”,則遍歷句子查找“for”單詞,滿足上述同樣的條件的情況下,提取目標(biāo)短語。

        以句子s6為例:

        s6對(duì)應(yīng)依存樹如圖8所示。

        根據(jù)提取模型六的定義,該句滿足句首為“For”并且依存關(guān)系為case 這一條件,所以找到依存于“for”且關(guān)系為case 的“modeling”,最后根據(jù)“modeling”提取實(shí)體詞組得到“modeling the 3D world behind 2D images”。

        7)提取模型七:特定及物動(dòng)詞引導(dǎo)的賓語。

        計(jì)算機(jī)視覺類論文的摘要中,一般存在主語為“We”,且句中存在特定及物動(dòng)詞(具體如表1 所示)來表述關(guān)鍵信息的句子,基于這樣的觀察,設(shè)計(jì)提取模型七。

        提取模型七定義:如果句子主語為“We”,則尋找句子中特定及物動(dòng)詞,找到特定及物動(dòng)詞后繼續(xù)向后遍歷找到與該及物動(dòng)詞存在依存關(guān)系的詞,根據(jù)該詞提取前置修飾和后綴修飾,整理組合作為目標(biāo)短語。

        以句子s7為例:

        s7對(duì)應(yīng)依存樹如圖9所示。

        圖8 s6對(duì)應(yīng)的依存分析樹Fig.8 Dependency analysis tree corresponding to s6

        圖9 s7對(duì)應(yīng)的依存分析樹Fig.9 Dependency analysis tree corresponding to s7

        根據(jù)提取模型七的定義,該句主語為“We”,并且“propose”是特定及物動(dòng)詞,繼續(xù)向后遍歷得到依存于“propose”的詞“algorithm”,然后根據(jù)“algorithm”提取前置修飾和后綴修飾,最終得到“a novel visual tracking algorithm based on the representations”為目標(biāo)詞組。

        8)提取模型八:特定非及物動(dòng)詞引導(dǎo)的賓語。

        與提取模型七同理,存在主語為“We”,且句中存在特定非及物動(dòng)詞(具體如表1 所示)來表述關(guān)鍵信息的句子,基于這樣的觀察,設(shè)計(jì)提取模型八。

        提取模型八定義:如果句子主語為“We”,則尋找句子中特定非及物動(dòng)詞,找到非及物動(dòng)詞后繼續(xù)向后遍歷,尋找與該詞存在依存關(guān)系的賓語,根據(jù)該賓語提取前置修飾和后綴修飾,整理組合作為目標(biāo)詞組。

        以句子s8為例:

        s8對(duì)應(yīng)依存樹如圖10所示。

        根據(jù)提取模型八的定義,該句主語為“We”,并且“focus”是特定非及物動(dòng)詞,繼續(xù)向后遍歷得到依存于“focus”的賓語“task”,然后根據(jù)“task”提取前置修飾和后綴修飾,最終得到“task of amodal 3D object detection”為目標(biāo)詞組。

        由于抽象出的提取模型不同,所以需要結(jié)合不同的特定詞完成提取目標(biāo)詞組,提取模型對(duì)應(yīng)的特定詞如表1所示。

        圖10 s8對(duì)應(yīng)的依存分析樹Fig.10 Dependency analysis tree corresponding to s8

        表1 提取模型對(duì)應(yīng)的特定詞Tab.1 Specific words corresponding to extraction models

        根據(jù)上述的八種模型,提取得到摘要的關(guān)鍵詞組,為便于后續(xù)公式計(jì)算,進(jìn)行應(yīng)用領(lǐng)域判別,需要將提取到的目標(biāo)詞組轉(zhuǎn)化為單詞的集合,這里采用詞袋模型[24]的思想。

        式中:patternResult是所有提取模型結(jié)合關(guān)鍵詞匹配提取的目標(biāo)詞組;wordsi由第i個(gè)模型匹配得到的詞組以詞為單位分解而來的詞集;wordBag是所有wordsi包含的詞的集合。

        2.2.3 領(lǐng)域判別

        根據(jù)上述2.2.2 節(jié)中八個(gè)模型提取到的關(guān)鍵詞組以及2.2.1節(jié)中構(gòu)建出的視覺類深度神經(jīng)網(wǎng)絡(luò)架構(gòu),通過判別公式可以計(jì)算得出模型所屬的領(lǐng)域,這里的判別公示采用余弦相似度[25]來判斷預(yù)測(cè)模型與哪種領(lǐng)域更加匹配,具體步驟如下:

        步驟1 根據(jù)式(7)和2.2.1節(jié)構(gòu)建的視覺類深度神經(jīng)網(wǎng)絡(luò)架構(gòu)第四層的關(guān)鍵詞對(duì)應(yīng)的權(quán)值,計(jì)算六個(gè)領(lǐng)域的領(lǐng)域向量xi。式(7)中wij即為i領(lǐng)域中第j個(gè)關(guān)鍵詞對(duì)應(yīng)的權(quán)值,總共有m個(gè)關(guān)鍵詞(m值根據(jù)所屬領(lǐng)域的關(guān)鍵詞數(shù)量決定),最終得到六個(gè)領(lǐng)域的領(lǐng)域向量如表2所示。

        步驟2 根據(jù)式(8)以及模型通過2.2.2節(jié)中八個(gè)模型提取到的關(guān)鍵詞集合,計(jì)算該模型在六個(gè)領(lǐng)域的模型領(lǐng)域向量yi。式(8)中,zij為i領(lǐng)域中第j個(gè)詞的模型權(quán)值,zij的值有兩種情況,如果模型提取出的關(guān)鍵詞集合中含有i領(lǐng)域的第j個(gè)詞,則zij與wij值一致;否則為0。

        步驟3 計(jì)算模型與六個(gè)領(lǐng)域的匹配程度,由步驟1與步驟2 可以得到xi和yi向量,然后通過式(9)計(jì)算得到余弦相似度simi表示該模型在第i領(lǐng)域中的相似度,值越大越接近于1表示與這個(gè)領(lǐng)域越匹配。

        步驟4 計(jì)算模型第k匹配的領(lǐng)域,根據(jù)式(10)可以得到topk,即6 個(gè)領(lǐng)域中與模型第k接近的領(lǐng)域,當(dāng)k為1 時(shí)即表示模型最大概率所屬的應(yīng)用領(lǐng)域。

        表2 六個(gè)領(lǐng)域?qū)?yīng)的領(lǐng)域向量Tab.2 Field vectors corresponding to six fields

        2.2.4 評(píng)估標(biāo)準(zhǔn)

        為了正確評(píng)估實(shí)驗(yàn)性能,選擇以下指標(biāo)作為評(píng)估標(biāo)準(zhǔn):查全率R(recall)、查準(zhǔn)率P(precision)、均值F1、宏平均查全率Macro_R、宏平均查準(zhǔn)率Macro_P、宏平均值Macro_F1[26]。

        計(jì)算式如下:

        其中:TPi表示標(biāo)注結(jié)果為第i領(lǐng)域且結(jié)果正確的論文摘要數(shù)目;FNi表示將第i類領(lǐng)域錯(cuò)誤標(biāo)注成其他領(lǐng)域的論文摘要數(shù)目;FPij表示將第j類論文領(lǐng)域錯(cuò)誤標(biāo)注成i類的論文摘要數(shù)目。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)數(shù)據(jù)來自近三年計(jì)算機(jī)視覺方面的三大頂級(jí)國(guó)際會(huì)議:國(guó)際計(jì)算機(jī)視覺大會(huì)(IEEE International Conference on Computer Vision,ICCV)、IEEE 國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(IEEE Conference on Computer Vision and Pattern Recognition,CVPR)和歐洲計(jì)算機(jī)視覺國(guó)際會(huì)議(European Conference on Computer Vision,ECCV),共收集了72 篇論文。其中,目標(biāo)檢測(cè)14 篇,目標(biāo)跟蹤11 篇,超分辨率14 篇,圖片生成11篇,3D建模10篇以及人體姿態(tài)相關(guān)12篇。

        3.2 實(shí)驗(yàn)設(shè)計(jì)

        首先,對(duì)模型輸入進(jìn)行分句、分詞和依存分析,然后得到實(shí)驗(yàn)所需的單詞集合以及依存分析樹,接著通過2.2.2 節(jié)中的八個(gè)提取模型對(duì)輸入模型進(jìn)行關(guān)鍵詞的提取,最終根據(jù)2.2.3節(jié)的流程得到輸入模型的應(yīng)用領(lǐng)域判別結(jié)果。

        以圖11 為例,在輸入模型之后,得到了模型提取的關(guān)鍵詞、模型領(lǐng)域向量以及模型領(lǐng)域判別結(jié)果,該模型應(yīng)用領(lǐng)域判別結(jié)果顯示:最匹配的領(lǐng)域?yàn)槿梭w姿態(tài)相關(guān),隨后依次是3D建模相關(guān)和目標(biāo)檢測(cè),由于與另外三類相似度為0(根據(jù)模型領(lǐng)域向量在這三個(gè)領(lǐng)域值都為0 可以看出),所以這里只輸出三個(gè)匹配結(jié)果。

        圖11 實(shí)驗(yàn)示例Fig.11 Experimental example

        3.3 實(shí)驗(yàn)結(jié)果及分析

        文本實(shí)驗(yàn)設(shè)計(jì)基于以下兩個(gè)方面進(jìn)行比較和驗(yàn)證提出的自動(dòng)標(biāo)注系統(tǒng)的優(yōu)越性和有效性:1)對(duì)于相同的語料庫(kù)和驗(yàn)證集,采用不用的傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行分類,比較并驗(yàn)證本文提出的自動(dòng)標(biāo)注系統(tǒng)的優(yōu)越性;2)對(duì)比系統(tǒng)分析出的top1和top2的正確率來判斷自動(dòng)標(biāo)注系統(tǒng)的有效性。

        1)實(shí)驗(yàn)1。

        此次實(shí)驗(yàn)直接將自動(dòng)標(biāo)注系統(tǒng)輸出的top1作為最終預(yù)測(cè)的結(jié)果,并和貝葉斯、Logistics回歸、SVM和決策樹方法進(jìn)行文本分類比較。其中貝葉斯采用多項(xiàng)式分布樸素貝葉斯方法,SVM 采用LinearSVC(Linear Support Vector Classification)。評(píng)估標(biāo)準(zhǔn)根據(jù)2.2.4節(jié)中所定義,實(shí)驗(yàn)結(jié)果如圖12和表3所示。

        圖12 實(shí)驗(yàn)1中不同方法的F1值對(duì)比Fig.12 F1 value comparison of different methods for experiment 1

        通過圖12 和表3 可以看出,雖然本文方法在目標(biāo)跟蹤和3D 建模上的F1 值不是最高的,但是在其他幾種領(lǐng)域上都是最高且F1 值達(dá)到0.9 以上,尤其在目標(biāo)檢測(cè)上達(dá)到1,并且在Macro_R、Macro_P和Macro_F1 平均達(dá)到0.89,均遠(yuǎn)遠(yuǎn)高于其他4種方法,說明獲得了較好的分類效果。

        表3 五種方法的宏平均對(duì)比Tab.3 Macro average comparison of five methods

        2)實(shí)驗(yàn)2。

        為了深入了解模型自動(dòng)標(biāo)注的效果,本實(shí)驗(yàn)對(duì)模型領(lǐng)域預(yù)測(cè)中相似度最高的前兩名計(jì)算了正確率,也就是對(duì)應(yīng)自動(dòng)標(biāo)注系統(tǒng)輸出結(jié)果的top1 和top2 的總正確率,結(jié)果如圖13所示。

        圖13 實(shí)驗(yàn)2中top1和top2的正確率Fig.13 Accuracies of top1 and top2 for experiment 2

        單看top1的正確率,目標(biāo)檢測(cè)、圖片生成以及人體姿態(tài)相關(guān)都能達(dá)到100%,而超分辨率和目標(biāo)跟蹤次之,分別為93%和73%,3D 建模最低為70%。當(dāng)引入了top2 的正確率后,可以明顯看出,除了目標(biāo)跟蹤為82%的正確率,其他五個(gè)領(lǐng)域都能達(dá)到100%的正確率,說明該自動(dòng)標(biāo)注系統(tǒng)基本能實(shí)現(xiàn)對(duì)輸入模型的準(zhǔn)確判定。開發(fā)人員在使用這套系統(tǒng)的時(shí)候,直接通過輸出的top1 和top2 的結(jié)果,基本就可以快速判斷該模型是否是自己所需要的模型。

        綜合以上實(shí)驗(yàn)可以看出,本文的方法在評(píng)估標(biāo)準(zhǔn)上取得了很好的結(jié)果,各方面均優(yōu)于其他的傳統(tǒng)機(jī)器學(xué)習(xí)算法,證明了本文方法的有效性和優(yōu)越性。

        4 結(jié)語

        本文針對(duì)開發(fā)人員難以從眾多復(fù)雜的模型中選擇自己所需要模型的問題,提出了對(duì)視覺類深度神經(jīng)網(wǎng)絡(luò)的模型進(jìn)行自動(dòng)標(biāo)注的系統(tǒng),建立了能夠抽取關(guān)鍵詞的八種模型,并基于這些模型對(duì)模型進(jìn)行自動(dòng)標(biāo)注。實(shí)驗(yàn)結(jié)果表明,該方法相較于其他傳統(tǒng)機(jī)器學(xué)習(xí)算法能夠得到較高的宏平均。下一步,將把該自動(dòng)標(biāo)注系統(tǒng)應(yīng)用于對(duì)模型的推薦系統(tǒng)之中,使得開發(fā)人員能夠更好地獲取自己需要的相關(guān)模型。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        性刺激的大陆三级视频| 国产三级自拍视频在线| 国产女主播福利一区二区 | 日本不卡视频一区二区三区| 久久久久九九精品影院| 伊人色综合视频一区二区三区 | 91精品亚洲一区二区三区| 国产亚洲一二三区精品| 男女猛烈无遮挡免费视频| 成人国产精品免费视频| 欧美日本国产亚洲网站免费一区二区 | 国产精品国产三级国产an| 久久精品亚洲94久久精品| 精品国产免费一区二区三区 | 国产人澡人澡澡澡人碰视频| 国产丝袜在线福利观看| 国产精品亚洲av无人区一区香蕉| 天美传媒一区二区| 国产短视频精品区第一页| 亚洲视频在线免费观看一区二区| 久久久久亚洲av无码a片| 国产成人av性色在线影院色戒| 妺妺窝人体色www聚色窝韩国| 日韩精品久久伊人中文字幕| 国产精品久久久久久妇女| 国产人妻久久精品二区三区| 免费国产一级片内射老| 亚洲白嫩少妇在线喷水| 午夜免费啪视频| 中国一级毛片在线观看| 日本一区二区高清视频在线播放| 日本人妻伦理在线播放| 少妇无码av无码专区线| 婷婷色国产精品视频一区| 亚洲无人区乱码中文字幕动画 | 男女啪啪免费视频网址| 激情综合色综合啪啪开心| 无码精品a∨在线观看十八禁 | 国产精品麻花传媒二三区别| 日本啪啪一区二区三区| 亚洲av不卡一区男人天堂|