亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)頁關(guān)聯(lián)特征的互聯(lián)網(wǎng)圖像自動(dòng)標(biāo)注系統(tǒng)發(fā)展芻議

        2013-03-24 06:37:47段湘寧
        電子測(cè)試 2013年5期
        關(guān)鍵詞:頁面特征文本

        段湘寧

        (葫蘆島市發(fā)展改革委信息中心 125000)

        1 互聯(lián)網(wǎng)下圖像標(biāo)注的主要方式

        信息技術(shù)快速發(fā)展的當(dāng)下,信息數(shù)據(jù)的數(shù)量和范圍愈加龐大,對(duì)于相關(guān)信息數(shù)據(jù)和圖像等的標(biāo)注和處理直接影響信息搜索的全面性和準(zhǔn)確性同時(shí)也會(huì)影響圖像自動(dòng)標(biāo)注系統(tǒng)的使用效果等。在計(jì)算機(jī)數(shù)據(jù)庫和視覺研究的推動(dòng)下,圖像標(biāo)注檢索技術(shù)成為計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)研究的重點(diǎn)之一。PASCALpj等技術(shù)在計(jì)算機(jī)視覺研究領(lǐng)域已經(jīng)得到了廣泛應(yīng)用。通過圖像和文字的關(guān)聯(lián)性、圖像之間的關(guān)系以及文本之間的關(guān)系等實(shí)現(xiàn)對(duì)圖像的有效標(biāo)注,并在該種標(biāo)注實(shí)現(xiàn)的基礎(chǔ)上使用統(tǒng)計(jì)等方式設(shè)計(jì)實(shí)現(xiàn)對(duì)圖像的自動(dòng)標(biāo)注。

        在網(wǎng)頁關(guān)聯(lián)性特征下的文本標(biāo)注的方法,通常是利用互聯(lián)網(wǎng)的圖像在特定的語言或者數(shù)據(jù)信息環(huán)境中的相關(guān)特征,利用圖像和語言內(nèi)容相關(guān)的文本信息的關(guān)系實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)圖像的語義信息或者文本信息的自動(dòng)標(biāo)注。

        對(duì)于圖像自動(dòng)標(biāo)注的實(shí)現(xiàn),是在網(wǎng)頁關(guān)聯(lián)性的基礎(chǔ)上充分利用圖像所傳達(dá)的內(nèi)容與文字的相關(guān)性,通過信息的匹配及相關(guān)的技術(shù)和標(biāo)注系統(tǒng)和設(shè)計(jì)實(shí)現(xiàn)對(duì)圖像信息的自動(dòng)標(biāo)注從而實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的搜索,提高搜索的速度和效率。

        2 圖像標(biāo)注的發(fā)展及現(xiàn)狀

        利用圖像實(shí)現(xiàn)檢索產(chǎn)生于上個(gè)世紀(jì)的70年代中期,產(chǎn)生之初采用的主要檢索技術(shù)是基于文本信息的圖像檢索,即把圖像作為數(shù)據(jù)庫中儲(chǔ)存的檢索對(duì)象,通過關(guān)鍵字或者自由的文本對(duì)儲(chǔ)存于其中的圖像進(jìn)行描述來實(shí)現(xiàn)檢索。這種圖像檢索技術(shù)的查詢操作是在對(duì)儲(chǔ)存與數(shù)據(jù)庫中的圖像描述的基礎(chǔ)上實(shí)現(xiàn)一種精確的匹配或者一種概率性的匹配,有些系統(tǒng)為了實(shí)現(xiàn)該種圖像檢索功能還設(shè)有詞典支持。圖像檢索系統(tǒng)的有效運(yùn)作,圖像的數(shù)據(jù)模型、多維索引和查詢的評(píng)價(jià)等都是在這種數(shù)據(jù)系統(tǒng)的框架下來實(shí)現(xiàn)。

        當(dāng)下的互聯(lián)網(wǎng)圖像的語義自動(dòng)標(biāo)注的方式是把所有相關(guān)的關(guān)聯(lián)文本視為整體,或者根據(jù)既有的知識(shí)或者啟發(fā)思維預(yù)先估設(shè)既定的語義分布模型和數(shù)據(jù)庫,在此基礎(chǔ)上實(shí)現(xiàn)圖像的標(biāo)注。但現(xiàn)有的圖像標(biāo)注技術(shù)大多是在訓(xùn)練集的基礎(chǔ)上實(shí)現(xiàn)基于內(nèi)容的圖像的自動(dòng)標(biāo)注的方式。這種標(biāo)注方式的特點(diǎn)是將訓(xùn)練集作為其圖像信息標(biāo)注的基礎(chǔ),因此,訓(xùn)練集中缺少相關(guān)關(guān)鍵字符時(shí)即使圖像的標(biāo)注信息恰當(dāng)無誤其標(biāo)注的結(jié)果也會(huì)缺少該關(guān)鍵字符從而無法實(shí)現(xiàn)對(duì)圖像的有效準(zhǔn)確的標(biāo)注。訓(xùn)練集的數(shù)據(jù)預(yù)先設(shè)定儲(chǔ)存,不可避免的存在數(shù)據(jù)的有限性和收據(jù)時(shí)效性的問題,因此數(shù)據(jù)信息無法及時(shí)有效的更新和擴(kuò)大會(huì)對(duì)圖像信息的標(biāo)注產(chǎn)生直接的影響。基于網(wǎng)頁關(guān)聯(lián)性特征的文本的標(biāo)注方式是限于目標(biāo)圖片位于單一的網(wǎng)頁文本中時(shí)并且要利用圖像和文本的關(guān)聯(lián)性假設(shè)來實(shí)現(xiàn)圖像的標(biāo)注和檢索,因此,它所能利用的文本信息是極其有限的也會(huì)受到當(dāng)前網(wǎng)頁文本信息的一些影響,從而直接影響圖像的標(biāo)注信息的準(zhǔn)確性最終影響檢索的結(jié)果和效率。

        3 圖像自動(dòng)標(biāo)注系統(tǒng)的發(fā)展

        就互聯(lián)網(wǎng)圖像的相關(guān)性特征而言具體體現(xiàn)為,圖像名稱對(duì)于圖像所具有的特定的提示意義、與圖像所在的HTML的頁面所表達(dá)主題的一致性、圖像所指向連接地名稱或者頁面的主體內(nèi)容與圖像內(nèi)容的對(duì)應(yīng)性等、圖像與其上下文環(huán)境下的關(guān)聯(lián)性和密切性以及圖像所出現(xiàn)的位置和次數(shù)的特征等都在一定程度上起到了提示該圖像的功能,所有這些都為我們改進(jìn)圖像自動(dòng)標(biāo)注系統(tǒng)提供了切入點(diǎn)和有效的利用方式和途徑。當(dāng)我們?cè)诟倪M(jìn)圖像自動(dòng)標(biāo)注系統(tǒng)的過程中可以通過利用互聯(lián)網(wǎng)圖像信息采集方式的完善來實(shí)現(xiàn)系統(tǒng)自身的完善和發(fā)展,在圖像采集時(shí)可以根據(jù)互聯(lián)網(wǎng)的特點(diǎn)充分利用不同的圖像所傳達(dá)的文本信息,利用其體現(xiàn)出的關(guān)聯(lián)性特征有區(qū)別的使用圖像采集和標(biāo)注技術(shù),實(shí)現(xiàn)對(duì)信息的擇優(yōu)選擇。這種有針對(duì)性的區(qū)別標(biāo)注在充分利用互聯(lián)網(wǎng)自動(dòng)標(biāo)注系統(tǒng)的有利條件,能夠保證圖像標(biāo)注信息源的全面性,將網(wǎng)頁文檔中的圖像名稱、注釋及圖像周圍的文本、圖像URL等充分利用,提高了圖像標(biāo)注信息源的全面性。

        在該系統(tǒng)中將圖像標(biāo)注作為核心內(nèi)容,該標(biāo)注的實(shí)現(xiàn)要提取各種圖像的關(guān)聯(lián)性特征,并且在現(xiàn)有自然語言技術(shù)和網(wǎng)頁分析技術(shù)的基礎(chǔ)上對(duì)提取的該種特征間的關(guān)聯(lián)性以及提取特征和圖像之間的關(guān)聯(lián)性進(jìn)行分析。該種標(biāo)注工作完成并將其應(yīng)用于互聯(lián)網(wǎng)信息檢索時(shí),標(biāo)注的結(jié)果直接關(guān)系圖像檢索系統(tǒng)運(yùn)作的效果和功能。

        該種檢索系統(tǒng)的設(shè)計(jì)由以下幾個(gè)方面共同完成。首先通過首先,通過輸入的URL抓取網(wǎng)頁,利用網(wǎng)頁分析器從網(wǎng)頁中抓取圖片文件,與此同時(shí),分析網(wǎng)頁的DOM結(jié)構(gòu)與視覺結(jié)構(gòu),抽取網(wǎng)頁中與圖像相關(guān)的語義關(guān)聯(lián)特征,并存儲(chǔ)于數(shù)據(jù)庫中。其次,在網(wǎng)頁分析器獲得圖像語義特征的基礎(chǔ)上對(duì)圖像進(jìn)行相關(guān)的語義標(biāo)注。在完成該種語義標(biāo)注時(shí)應(yīng)該對(duì)關(guān)聯(lián)性特征所包含的各種信息進(jìn)行充分的篩選和過濾以剔除噪音信息等,最終為每一圖像生成對(duì)應(yīng)的標(biāo)注結(jié)果,并且為該種結(jié)果的輸出提供多種接口。

        該系統(tǒng)架構(gòu)下的技術(shù)是將整個(gè)系統(tǒng)分為數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)處理層和數(shù)據(jù)表現(xiàn)層三個(gè)層次。具體而言,數(shù)據(jù)存儲(chǔ)層主要數(shù)據(jù)存儲(chǔ)層主要用于存儲(chǔ)網(wǎng)頁信息、圖像文件、圖像關(guān)聯(lián)信息及最終的圖像標(biāo)注結(jié)果。數(shù)據(jù)處理層主要處理存儲(chǔ)層中的圖像相關(guān)數(shù)據(jù),并為每符圖像生成圖像的語義標(biāo)注結(jié)果,它們通過數(shù)據(jù)庫訪問接口查詢、操作數(shù)據(jù)庫。數(shù)據(jù)處理層包括網(wǎng)頁分析器和圖像標(biāo)注生成器,通過對(duì)標(biāo)注圖像信息和數(shù)據(jù)的后臺(tái)處理和網(wǎng)頁相關(guān)內(nèi)容的分析實(shí)現(xiàn)對(duì)圖像信息的標(biāo)注。數(shù)據(jù)表現(xiàn)層即圖像信息標(biāo)注信息和數(shù)據(jù)的顯示,它主要用于顯示標(biāo)注過程中的相關(guān)信息和數(shù)據(jù),使得圖像標(biāo)注結(jié)果能夠以一種較好的方式呈現(xiàn)。三層結(jié)構(gòu)通過不同的分工和相互作用實(shí)現(xiàn)對(duì)圖像信息的準(zhǔn)確有效標(biāo)注并且一最佳的方式呈現(xiàn)給使用者。

        在互聯(lián)網(wǎng)環(huán)境下,網(wǎng)頁文檔的成為互聯(lián)網(wǎng)圖像的外部信息源和載體,它本身包含了對(duì)圖像內(nèi)容等進(jìn)行描述的豐富的文本信息,也便是我們所說的圖像的關(guān)聯(lián)性特征?,F(xiàn)行網(wǎng)絡(luò)技術(shù)環(huán)境下的圖像搜索都是在互聯(lián)網(wǎng)圖像關(guān)聯(lián)性的基礎(chǔ)上通過對(duì)圖像關(guān)鍵字標(biāo)注的形式建立相關(guān)的信息索引來實(shí)現(xiàn)對(duì)特定目標(biāo)的搜索。但是該種凸顯檢索系統(tǒng)對(duì)互聯(lián)網(wǎng)圖像的關(guān)聯(lián)性特征的分析和利用不夠深入存在標(biāo)注信息不全面的問題,因而影響標(biāo)注詞的生成等。而對(duì)互聯(lián)網(wǎng)圖像關(guān)聯(lián)性信息采集的全面和準(zhǔn)確直接影響圖像標(biāo)注詞義的準(zhǔn)確性和全面性,所以在互聯(lián)網(wǎng)頁面分析器設(shè)計(jì)時(shí)便要將獲取網(wǎng)頁中符合一定條件的圖像文件作為其主要目標(biāo),同時(shí)該種頁面分析器還應(yīng)該能夠?qū)崿F(xiàn)對(duì)頁面結(jié)構(gòu)的充分分析,對(duì)于頁面中和互聯(lián)網(wǎng)圖像有關(guān)的信息能夠進(jìn)行深入的挖掘和分析,實(shí)現(xiàn)自動(dòng)準(zhǔn)確的獲取互聯(lián)網(wǎng)圖像特征,并自動(dòng)的完成相關(guān)數(shù)據(jù)的組織與處理,生成圖像標(biāo)注的數(shù)據(jù)源。

        圖像關(guān)聯(lián)性特征采集的實(shí)現(xiàn),通過對(duì)頁面的預(yù)處理,依據(jù)規(guī)定的圖像處理規(guī)則來獲取相應(yīng)的圖像文件,并且從網(wǎng)頁中獲取相同類型的關(guān)聯(lián)信息,同時(shí)圍繞每個(gè)文件獲取具備一定特定的數(shù)據(jù)信息,并在獲取圖像所在頁面的文字信息,當(dāng)圖像是文字與連接的結(jié)合時(shí)獲取鏈接所指向的標(biāo)題和正文信息。為實(shí)現(xiàn)該種工作流程,通過對(duì)頁面處理器進(jìn)行不同的模塊分工,頁面預(yù)處理模塊實(shí)現(xiàn)對(duì)頁面圖像內(nèi)容的預(yù)處理,圖像上下文處理模塊則負(fù)責(zé)對(duì)圖像所在語言環(huán)境下的上下文信息的深入分析獲取相關(guān)的文本信息,網(wǎng)頁正文提取模塊實(shí)現(xiàn)對(duì)文本正文的提取,實(shí)現(xiàn)圖像標(biāo)注信息源保證圖像標(biāo)注信息的準(zhǔn)確和充分。

        [1]歐萍.基于外部數(shù)據(jù)庫的圖像自動(dòng)標(biāo)注改善模型分析[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012(06)

        [2]俞建橙,曹冬林,李紹滋,林達(dá)真.基于互聯(lián)網(wǎng)搜索與反饋驗(yàn)證的圖像自動(dòng)標(biāo)注[J].計(jì)算機(jī)工程,2012,38(24)

        [3]陳濤.基于網(wǎng)頁關(guān)聯(lián)特征的互聯(lián)網(wǎng)圖像自動(dòng)標(biāo)注系統(tǒng)[J].[學(xué)位論文],2007

        猜你喜歡
        頁面特征文本
        大狗熊在睡覺
        刷新生活的頁面
        如何表達(dá)“特征”
        在808DA上文本顯示的改善
        不忠誠(chéng)的四個(gè)特征
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        抓住特征巧觀察
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        如何快速走進(jìn)文本
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        亚洲av粉嫩性色av| 亚洲精品电影院| 国产18禁黄网站免费观看| 精品人妻va一区二区三区| 国产边摸边吃奶叫床视频| 丰满岳妇乱一区二区三区| 国产成人精品无码播放 | 亚洲精品色午夜无码专区日韩| 亚瑟国产精品久久| 国产成人av免费观看| 午夜AV地址发布| 亚洲五月婷婷久久综合| 国产精品成年人毛片毛片| 一本色道久久综合亚洲| 免费a级毛片18以上观看精品| 天天天综合网| 91久久国产情侣真实对白| 玩弄极品少妇被弄到高潮| 蜜臀av在线一区二区尤物| 久久精品一区午夜视频| 一二区成人影院电影网| 少妇高清精品毛片在线视频| 秒播无码国产在线观看| 激情五月婷婷六月俺也去 | 久久av无码精品人妻出轨| 中文字幕乱码人妻无码久久久1 | 亚洲区1区3区4区中文字幕码| 精品国产a一区二区三区v| 国产欧美精品一区二区三区四区| 精品国产三级a∨在线观看| 国产亚洲精品A在线无码| 亚洲激情一区二区三区视频| 亚洲成av人片乱码色午夜| 被黑人猛躁10次高潮视频| 无码国产精品一区二区免费16| 中文AV怡红院| 久久精品一区二区三区不卡牛牛| 国产精品一区二区久久国产| 99久久久精品免费观看国产| 探花国产精品三级在线播放| 久久综合另类激情人妖|