蔣偉 蘭州大學(xué)淮安高新技術(shù)研究院 董翔/蘭州大學(xué)圖書館/敦煌學(xué)研究所/蘭州大學(xué)淮安高新技術(shù)研究院 史志林 敦煌學(xué)研究所
甘肅華夏文明傳承創(chuàng)新區(qū)建設(shè),按照國家關(guān)于甘肅發(fā)展的戰(zhàn)略定位和建設(shè)文化大省的總要求,以文化建設(shè)為主題。包括以敦煌文化為核心的河西走廊文化生態(tài)區(qū),以形成集遺產(chǎn)保護(hù)、景觀旅游、事業(yè)服務(wù)、產(chǎn)業(yè)發(fā)展、產(chǎn)品交易、文化交流為一體的文化展示研究基地和文化園區(qū)。本文旨在通過圖像識(shí)別的方式用于華夏文明視角下主題知識(shí)庫檢索分析,改變只能靠關(guān)鍵詞檢索的單一檢索方式,進(jìn)而豐富信息檢索方法,對(duì)于華夏文明的建設(shè)發(fā)展具有積極的意義。
對(duì)于華夏文明知識(shí)庫構(gòu)建流程,本文采用許鑫等提出一個(gè)新的基于本體的專題知識(shí)庫構(gòu)建模型,主要分為6個(gè)步驟,如下圖所示。
圖1 基于本體的專題知識(shí)庫構(gòu)建流程
圖像識(shí)別,是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識(shí)別處理,圖像識(shí)別軟件國外代表的有康耐視等,國內(nèi)代表的有圖智能等。
作為智能領(lǐng)域的重要組成部分,圖像識(shí)別的發(fā)展先后經(jīng)歷了文字識(shí)別、數(shù)字圖像處理與識(shí)別、物體識(shí)別三個(gè)發(fā)展階段,而在今天的圖像識(shí)別技術(shù)中,其本身所具備的功能早已超過了人類的極限,這也是人工智能的圖像識(shí)別技術(shù)能夠在我國多種領(lǐng)域?qū)崿F(xiàn)較好應(yīng)用的原因所在。
圖像識(shí)別技術(shù)本身的原理并不算太過復(fù)雜,信息的處理是這一技術(shù)的關(guān)鍵點(diǎn)所在,由于應(yīng)用計(jì)算機(jī)實(shí)現(xiàn)的圖像識(shí)別技術(shù)本身與人眼識(shí)別并不存在著本質(zhì)的差別,這就使得圖像識(shí)別技術(shù)同樣需要根據(jù)自身對(duì)圖像的記憶完成具體的識(shí)別工作。在人類進(jìn)行圖像識(shí)別的過程中,人類的大腦會(huì)將圖像的特征進(jìn)行提取,并結(jié)合大腦中以往對(duì)各類圖像的認(rèn)知判斷自身是否對(duì)圖像存在過印象,這就是人們能夠在觀看一張圖片后快速對(duì)其識(shí)別的原因所在。結(jié)合人類識(shí)別圖像的原理,在計(jì)算機(jī)進(jìn)行的圖像識(shí)別中,計(jì)算機(jī)首先就能夠完成圖像分類并選出重要信息、排除冗余信息,根據(jù)這一分類計(jì)算機(jī)就能夠結(jié)合自身記憶存儲(chǔ)結(jié)合相關(guān)要求進(jìn)行圖像的識(shí)別,這一過程本身與人腦識(shí)別圖像并不存在著本質(zhì)差別。對(duì)于圖像識(shí)別技術(shù)來說,其本身提取出的圖像特征直接關(guān)系著圖像識(shí)別能否取得較為滿意的結(jié)果。值得注意的是,由于計(jì)算機(jī)歸根結(jié)底不同于人類的大腦,所以計(jì)算機(jī)提取出的圖像特征存在著不穩(wěn)定性,這種不穩(wěn)定性往往會(huì)因?yàn)橛?jì)算機(jī)提取圖像特征的明顯與普通影響圖像識(shí)別的效率與準(zhǔn)確性,由此可見圖像特征對(duì)于人工智能中圖像識(shí)別技術(shù)的重要意義。
本文正是借鑒了圖像識(shí)別相關(guān)技術(shù),用于“華夏文明”視角下主題知識(shí)庫的檢索中,進(jìn)而兼顧效率與準(zhǔn)確性。
基于圖像識(shí)別的華夏文明視角下主題知識(shí)庫檢索方法,既提高了檢索的效率,同時(shí)保證了檢索結(jié)果的準(zhǔn)確性,從而提高“華夏文明”視角下主題知識(shí)庫在用戶檢索中的效率和準(zhǔn)確性。具體檢索流程主要包括以下步驟,如下圖所示。
圖2 “華夏文明”視角下知識(shí)HASH庫建立過程
4.1.1 Hash 庫建立
首先對(duì)入庫的“華夏文明”視角下主題知識(shí)進(jìn)行特征點(diǎn)提取,將特征點(diǎn)依次相連形成線段;計(jì)算線段拐角的角度值,并進(jìn)行篩選,與對(duì)應(yīng)“華夏文明”主題知識(shí)一一綁定,存入數(shù)據(jù)庫中,建立“華夏文明”主題知識(shí)Hash庫;
4.1.2 “華夏文明”視角下知識(shí)庫檢索過程
首先對(duì)用戶的檢索條件進(jìn)行分析,進(jìn)行特征點(diǎn)提取,將特征點(diǎn)依次相連,計(jì)算線段拐角的角度值,并進(jìn)行篩選,根據(jù)提取的角度值,在“華夏文明”主題知識(shí)Hash庫Hash庫中進(jìn)行查找;對(duì)查找的結(jié)果,根據(jù)匹配的結(jié)果個(gè)數(shù)進(jìn)行倒序排列,展示給用戶。本發(fā)明在確保效率的前提下能夠有效實(shí)現(xiàn)“華夏文明”主題知識(shí)庫的檢索。
4.2.1 大大提高檢索效率
對(duì)于圖形的檢索方法研究較少,大眾熟知程度較低。而通過本文所述的方法,大眾在進(jìn)行“華夏文明”視角下主題的相關(guān)知識(shí)檢索時(shí),系統(tǒng)將快速計(jì)算出檢索條件Hash值,通過比對(duì),能夠迅速列出檢索結(jié)果,大大提高檢索圖形的效率。
4.2.2 提高檢索準(zhǔn)確性
本文采用提取特征點(diǎn)的方式,并進(jìn)而計(jì)算出特征點(diǎn)連接的線段的角度值,進(jìn)而計(jì)算出的Hash值具有唯一性,能夠大大的提高檢索準(zhǔn)確性,同時(shí),檢索結(jié)果根據(jù)權(quán)重進(jìn)行倒序排列,對(duì)權(quán)重值大的檢索的結(jié)果進(jìn)行優(yōu)先展示,也在一定程度上包裝了檢索結(jié)果的準(zhǔn)確性。
通過圖像識(shí)別的方式用于華夏文明視角下主題知識(shí)庫檢索分析,改變只能靠關(guān)鍵詞檢索的單一檢索方式,既提高了檢索的效率,同時(shí)保證了檢索結(jié)果的準(zhǔn)確性,從而提高“華夏文明”視角下主題知識(shí)庫在用戶檢索中的效率和準(zhǔn)確性,進(jìn)而豐富信息檢索方法,對(duì)于華夏文明的建設(shè)發(fā)展具有積極的意義。