張興旺 向宏華 柏雪
摘 要:商業(yè)型視覺搜索體系是當(dāng)前視覺搜索應(yīng)用研究的最重要組成部分,對(duì)其進(jìn)行系統(tǒng)分析,能為數(shù)字圖書館視覺搜索理論與應(yīng)用研究提供重要的參考和借鑒。文章通過調(diào)研國內(nèi)外商業(yè)型視覺搜索體系建設(shè)情況,將視覺搜索體系進(jìn)行了分類,選擇其中具有代表性案例進(jìn)行對(duì)比分析,在此基礎(chǔ)上提出數(shù)字圖書館視覺搜索體系建設(shè)需要注意的問題。數(shù)字圖書館視覺搜索體系建設(shè)需要重視體系領(lǐng)域?qū)?、視覺對(duì)象知識(shí)庫建設(shè)、視覺資源獲取倫理與法則、標(biāo)準(zhǔn)化整理與加工、資源版權(quán)與平臺(tái)安全等問題。
關(guān)鍵詞:知識(shí)服務(wù);視覺搜索;數(shù)字圖書館;視覺大數(shù)據(jù)
中圖分類號(hào): G2254.9 文獻(xiàn)標(biāo)識(shí)碼: A DOI:10.11968/tsyqb.1003-6938.2016091
Abstract Commercial visual search system is the most important part in the current visual search application research. Systematic analysis of the system can provide an important reference for visual search theory and application research of digital library. Through a research of the domestic and foreign commercial visual search system construction, classification was made and one representative case was analyzed and compared. Then problems which should be paid attention to in the construction of present digital library of visual search system were pointed out, including the system of field oriented, ethics and the law, the standard of collection and processing, resource copyright and platform security.
Key words knowledge service; visual search; digital library; visual big data
1 引言
隨著互聯(lián)網(wǎng)技術(shù)與服務(wù)模式的飛速發(fā)展,從不同途徑產(chǎn)生的文本、圖像、視頻與3D模型等視覺大數(shù)據(jù)資源及用戶生成內(nèi)容(User-Generated Content,UGC,如圖書評(píng)論、微博、視頻分享等)以全新形式整合在一起,全面地描述著事件、主題及其關(guān)聯(lián)信息,并在大數(shù)據(jù)環(huán)境下呈現(xiàn)出以下特點(diǎn):不同類型的視覺大數(shù)據(jù)資源(如文本、圖像與視頻等)相互依存與關(guān)聯(lián),數(shù)據(jù)來源(各類平臺(tái)和應(yīng)用等)廣泛豐富[1],視覺大數(shù)據(jù)資源與用戶之間的交互需求越來越迫切。正如谷歌前技術(shù)主管Norvig于2010年指出“文本、圖像和視頻等視覺資源及用戶交互信息、傳感信息的有機(jī)融合,會(huì)給搜索引擎帶來巨大挑戰(zhàn),如何對(duì)視覺搜索結(jié)果進(jìn)行資源深度整合將會(huì)成為Google未來十年面臨的最大挑戰(zhàn)”[2]。
視覺大數(shù)據(jù)資源的價(jià)值發(fā)掘、知識(shí)發(fā)現(xiàn)需求與互聯(lián)網(wǎng)技術(shù)的交匯融合催生了視覺搜索模式的誕生,使之成為信息檢索領(lǐng)域研究的熱點(diǎn)問題。自2009年斯坦福大學(xué)的Griod等將其引入到信息檢索領(lǐng)域以來[3],出現(xiàn)了許多基于時(shí)空語義關(guān)聯(lián)的視覺資源整合與視覺搜索應(yīng)用平臺(tái),為用戶提供視覺大數(shù)據(jù)知識(shí)服務(wù)。如著名的Google知識(shí)圖譜、Facebook Graph Search、百度視圖、愛奇藝大腦等。已有的視覺搜索應(yīng)用大部分局限于商業(yè)型應(yīng)用,盡管能從理論、技術(shù)上為數(shù)字圖書館領(lǐng)域開展相關(guān)研究提供一些參考,但也存在著搜索結(jié)果可信度不高、性能不夠理想或不夠穩(wěn)定、用戶體驗(yàn)質(zhì)量不佳、應(yīng)用局限性較強(qiáng)等問題,給視覺搜索理論與應(yīng)用研究帶來了一定困擾,使其暫時(shí)難以移植到數(shù)字圖書館領(lǐng)域。同時(shí),我國數(shù)字圖書館、公共文化服務(wù)大數(shù)據(jù)工程領(lǐng)域又亟待解決相關(guān)問題。國務(wù)院2015年印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》《國務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見》等文件均明確提出要培育和發(fā)展公共服務(wù)大數(shù)據(jù)工程,并要求加強(qiáng)數(shù)字圖書館建設(shè)[4],開展對(duì)視覺大數(shù)據(jù)資源的開發(fā)與利用的研究工作[5]。
基于此,本文對(duì)國內(nèi)外商業(yè)型視覺搜索平臺(tái)的商業(yè)背景、應(yīng)用領(lǐng)域、主要功能與服務(wù)模式等進(jìn)行調(diào)研與對(duì)比分析,總結(jié)歸納商業(yè)型視覺搜索體系建設(shè)的內(nèi)容與方法,探討給圖書館帶來的啟示,以期為我國數(shù)字圖書館應(yīng)用和建設(shè)提供參考和借鑒。
2 商業(yè)型視覺搜索體系建設(shè)現(xiàn)狀與分析
自2009年發(fā)源于心理學(xué)、生理學(xué)領(lǐng)域的視覺搜索理論被引入到信息檢索領(lǐng)域以來,它逐漸成為國內(nèi)外工業(yè)界與學(xué)術(shù)界研究的熱點(diǎn),也產(chǎn)生了許多商業(yè)視覺搜索應(yīng)用案例。本文采取網(wǎng)絡(luò)調(diào)查法對(duì)國內(nèi)外較為著名的視覺搜索應(yīng)用進(jìn)行調(diào)查。從資源使用類型、信息搜索模式、覆蓋范圍及體系成熟度等方面考慮,選擇了國內(nèi)外影響力較大、性能相對(duì)較穩(wěn)定的商業(yè)型視覺搜索應(yīng)用。
2.1 已有視覺搜索體系的分類
根據(jù)視覺搜索體系的服務(wù)模式和資源類型,可將當(dāng)前商業(yè)型視覺搜索體系分為三大類:
(1)基于知識(shí)計(jì)算引擎的視覺搜索體系。隨著資源描述框架(Resource Description Framework,RDF)項(xiàng)目與技術(shù)的全面發(fā)展,文本、圖像、視頻等視覺資源之間的異構(gòu)語義關(guān)聯(lián)關(guān)系能得到更好地表達(dá)和描述。傳統(tǒng)互聯(lián)網(wǎng)異構(gòu)資源之間的“超鏈接”關(guān)聯(lián)方法,開始向新型的異構(gòu)資源之間的“實(shí)體與實(shí)體”關(guān)聯(lián)方法轉(zhuǎn)變。在這種理論與方法的基礎(chǔ)上,國內(nèi)外各相關(guān)組織在此基礎(chǔ)上構(gòu)建了基于知識(shí)計(jì)算引擎的視覺搜索體系。目前,各個(gè)公司、機(jī)構(gòu)、組織建立的視覺搜索體系多達(dá)100多種,與之相關(guān)的應(yīng)用更是將近200種。其中,比較具有代表性的有Google知識(shí)圖譜(Knowledge Graph)、Facebook的實(shí)體搜索平臺(tái)(Graph Search)、Evi的知識(shí)搜索平臺(tái)(TrueKnowledge)、Wolfram Research的WolframAlpha、基于維基百科等在線百科知識(shí)構(gòu)建的知識(shí)搜索平臺(tái)DBpedia、YAGO、Omega、WikiTaxonomy、Microsoft的Probase、百度的“知心”、搜狗的“知立方”、維普的“智立方”等[7]。就覆蓋范圍、數(shù)據(jù)規(guī)模和體系成熟度而言,目前最為成功、影響力最大、功能最齊全的是Google知識(shí)圖譜、WolframAlpha、Probase等,其實(shí)體數(shù)量都在10億以上。相對(duì)而言,國內(nèi)的“知心”“知立方”“智立方”在服務(wù)模式、體系成熟度、功能、搜索效果與性能等方面都略顯不足。
(2)基于視覺資源類型的視覺搜索體系。由于視覺資源內(nèi)容是現(xiàn)實(shí)物理世界多角度、全方位的多元化反映,通過視覺資源可獲取更加全面、精確的全方位知識(shí)服務(wù)情景感知,能夠?yàn)閿?shù)字圖書館嵌入式協(xié)作化知識(shí)服務(wù)提供有效支持,進(jìn)而促進(jìn)現(xiàn)實(shí)物理世界和虛擬信息空間的有機(jī)融合。而包含有相同內(nèi)容、價(jià)值與知識(shí),但不同類型的視覺資源,彼此之間蘊(yùn)含著內(nèi)在的時(shí)空語義關(guān)聯(lián)信息,通過彼此關(guān)聯(lián)時(shí)空信息的整合與分析,清晰地組織和描述物理世界的變遷、客觀規(guī)律的演化與視覺資源的利用。在這種理論與方法的推動(dòng)下,國內(nèi)外都開展了大量相關(guān)研究,出現(xiàn)了Google知識(shí)圖譜、Google語音搜索、圖片搜索與視頻搜索、Google Now、百度識(shí)圖、Microsoft Visual Search、Wolfram Alpha、愛奇藝大腦等具有代表性的、以視覺資源類型為處理對(duì)象的視覺搜索體系。
(3)基于領(lǐng)域驅(qū)動(dòng)的專業(yè)性視覺搜索體系。所有理論與技術(shù)研究的最終目的都是付諸應(yīng)用,視覺搜索亦不例外。由于視覺大數(shù)據(jù)資源價(jià)值的產(chǎn)生機(jī)理與知識(shí)轉(zhuǎn)換規(guī)律具有高度的領(lǐng)域依賴性,使得視覺搜索在具體應(yīng)用過程中,更加依賴于應(yīng)用領(lǐng)域的專業(yè)性和行業(yè)性。同時(shí),由于視覺搜索理論與技術(shù)仍處于初步發(fā)展階段,存在著許多不足之處,使得視覺搜索應(yīng)用目前尚未深入到人們?nèi)粘I钪?,但在一些專業(yè)領(lǐng)域,國內(nèi)外出現(xiàn)了一些較具代表性的專業(yè)性視覺搜索體系,如瑞士聯(lián)邦理工學(xué)院推出的Kooaba、Yahoo!的IQ Engines、Google的Google Goggles、Amazon的Snaptell、Idee的TinEye Mobile、雅典國立技術(shù)大學(xué)的WeKnowIt IMG REC、日本日立公司的Gazopa等[8]。
2.2 已有視覺搜索系統(tǒng)的比較分析
已有的商業(yè)型視覺搜索體系除了基本的視覺資源整合、瀏覽、分析與搜索功能之外,分別都隸屬于不同的應(yīng)用領(lǐng)域,擁有各自的核心功能、拓展業(yè)務(wù)和關(guān)鍵技術(shù)。本文從以上三類商業(yè)型視覺搜索體系中分別選取了性能較穩(wěn)定、體系相對(duì)成熟、借鑒價(jià)值相對(duì)較高的五個(gè)視覺搜索平臺(tái)作為代表,從應(yīng)用領(lǐng)域、商業(yè)背景、服務(wù)模式、資源類型和主要功能等幾個(gè)方面進(jìn)行對(duì)比分析(見表1)。
2.3 已有視覺搜索體系的實(shí)踐與分析
為了更好地了解和理解已有商業(yè)性視覺搜索體系,根據(jù)以上對(duì)比分析,本文從總體建設(shè)與使用情況、視覺數(shù)據(jù)來源、存在問題等3個(gè)方面展開分析。
2.3.1 總體建設(shè)與使用情況
Google知識(shí)圖譜、TinEye、WolframAlpha、愛奇藝大腦等視覺搜索體系一經(jīng)推出,就為信息檢索領(lǐng)域帶來了新的活力。毫無疑問,視覺搜索體系在信息檢索的檢索對(duì)象、查詢意圖、檢索行為和基于知識(shí)的交互反饋上展現(xiàn)出強(qiáng)大的生命力和發(fā)展?jié)摿?。從國?nèi)外已有視覺搜索體系建設(shè)情況來看,筆者能找到并統(tǒng)計(jì)出來的應(yīng)用大約120多個(gè),經(jīng)初步調(diào)研,目前這些視覺搜索體系中,85%以上是商業(yè)型應(yīng)用(如Google知識(shí)圖譜、百度識(shí)圖、Probase、小猿搜題、TinEye與MulticolorEngine等),15%左右為研究型應(yīng)用(如清華大學(xué)的Sketch2Photo、斯坦福大學(xué)的Visual Search Dataset等)。筆者在網(wǎng)絡(luò)調(diào)研過程中也發(fā)現(xiàn),很多視覺搜索網(wǎng)站和應(yīng)用查找起來非常困難,許多應(yīng)用不管是通過Google、百度、Bing,還是通過視覺搜索應(yīng)用的主頁,都很難找到相應(yīng)的功能體驗(yàn)鏈接,將近43%的視覺搜索應(yīng)用只出現(xiàn)在相關(guān)論文、各類新聞或通知上,筆者甚至未找到對(duì)應(yīng)的主頁。
另外,國內(nèi)外已有的商業(yè)型視覺搜索體系總體建設(shè)情況仍不甚理想,了解率、利用率、普及率和掌握率偏低。筆者曾對(duì)西部某省屬高校圖書館學(xué)科覆蓋理工類、人文社科類的65位用戶(含19位教師、46位本科以上學(xué)生的)進(jìn)行過簡單調(diào)研。其中,聽過或了解過Google知識(shí)圖譜、百度識(shí)圖、愛奇藝大腦等視覺搜索應(yīng)用的僅有11人(3名教師聽說過Google知識(shí)圖譜;1名教師看過Google知識(shí)圖譜相關(guān)資料;2名教師使用過百度識(shí)圖;1名學(xué)生經(jīng)常使用百度識(shí)圖;4名學(xué)生偶然使用過愛奇藝大腦部分功能,但從未聽說過“愛奇藝大腦”概念)。而對(duì)于TinEye、WolframAlpha、DBpedia、Probase、知立方等其他視覺搜索應(yīng)用,幾乎沒有人了解,更不用說使用。盡管筆者所做的這些調(diào)研工作不具備一定的權(quán)威性和代表性,但這個(gè)調(diào)研結(jié)果仍然能從某些方面反映出一些問題。
2.3.2 視覺數(shù)據(jù)來源
為了提高視覺搜索平臺(tái)性能,提升用戶體驗(yàn)質(zhì) 量和效果,不僅需要視覺搜索體系包含有大量視覺大數(shù)據(jù)資源、關(guān)聯(lián)知識(shí)與關(guān)聯(lián)關(guān)系,還需要它能夠提供自主學(xué)習(xí)功能,自動(dòng)更新視覺搜索知識(shí)、關(guān)聯(lián)關(guān)系與視覺資源[9]。在這種情況下,視覺搜索體系就需要通過互聯(lián)網(wǎng)自主獲取、分析、組織、分析、理解、表達(dá)和描述與之相關(guān)的視覺大數(shù)據(jù)資源(包括文本、圖像、音視頻,以及來自視覺資源之間的語義關(guān)系和各種垂直關(guān)聯(lián)關(guān)系)來覆蓋、完善和補(bǔ)充新的視覺搜索知識(shí);另一方面,視覺搜索體系也會(huì)從各種復(fù)雜結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化網(wǎng)絡(luò)資源中提取相關(guān)視覺資源的“屬性-關(guān)系-值”對(duì)來豐富視覺大數(shù)據(jù)資源的表達(dá)與描述。此外,視覺搜索體系也需要通過搜索日志來發(fā)現(xiàn)新的視覺資源實(shí)體、關(guān)聯(lián)關(guān)系與關(guān)聯(lián)知識(shí),從而不斷完善和拓展視覺對(duì)象知識(shí)庫的覆蓋面。
從國內(nèi)外已有視覺搜索體系建設(shè)情況來看,視覺數(shù)據(jù)來源主要分為以下四個(gè)方面:
(1)半結(jié)構(gòu)化和非結(jié)構(gòu)化視覺數(shù)據(jù)。互聯(lián)網(wǎng)中包含有大量文本、圖像、音視頻等異構(gòu)視覺資源,這些都是已有視覺搜索體系必須要獲取的數(shù)據(jù)源,同時(shí),根據(jù)視覺搜索體系所屬應(yīng)用領(lǐng)域、服務(wù)模式與服務(wù)內(nèi)容的不同,也需要自主生產(chǎn)它所需要的文本、圖像和音視頻等視覺資源。
(2)視覺資源之間的語義關(guān)聯(lián)數(shù)據(jù)與關(guān)聯(lián)知識(shí)。由于視覺搜索體系關(guān)鍵之處在于,能找出異構(gòu)視覺資源之間的語義關(guān)聯(lián)關(guān)系,并建立對(duì)應(yīng)的關(guān)聯(lián)知識(shí)庫。因此,建立的“屬性-關(guān)系-值”對(duì)、“關(guān)系-實(shí)體”對(duì)、“屬性-值”對(duì)與“實(shí)體-關(guān)系”對(duì)與對(duì)應(yīng)的視覺對(duì)象知識(shí)庫等,也成為該體系最重要的數(shù)據(jù)來源之一。
(3)復(fù)雜結(jié)構(gòu)化數(shù)據(jù)。事實(shí)上,各組織在構(gòu)建視覺搜索體系時(shí),還考慮使用大量的結(jié)構(gòu)化數(shù)據(jù),如LOD項(xiàng)目不僅把DBpedia、YAGO等,還包括MusicBrainZ(音樂知識(shí)庫)和DrugBank(全球最大藥物知識(shí)庫)等特定領(lǐng)域的視覺對(duì)象知識(shí)庫,而這些知識(shí)庫所包含的視覺資源,大部分都是復(fù)雜結(jié)構(gòu)化數(shù)據(jù)。
(4)日志類數(shù)據(jù)。對(duì)于提供視覺搜索服務(wù)的公司、數(shù)字圖書館廠商而言,日志類數(shù)據(jù)是其多年積累下來的寶貴數(shù)據(jù),也是視覺對(duì)象知識(shí)庫重要組成部分,是視覺搜索體系的重要資源。
2.3.3 已有應(yīng)用存在的問題
從已有商業(yè)型視覺搜索體系的研究與應(yīng)用來看,盡管這些視覺搜索技術(shù)與體系已面世,且在以往很長一段時(shí)間內(nèi)獲得了科技企業(yè)、科研機(jī)構(gòu)和研究團(tuán)隊(duì)足夠的人力、物力與財(cái)力投入,但當(dāng)前仍未被廣泛應(yīng)用,剖析其原由,主要有以下原因:
(1)理論體系不夠完善。視覺搜索理論源于心理學(xué)與生理學(xué),引入至信息檢索領(lǐng)域不到十年時(shí)間,且前期發(fā)展緩慢,近幾年才逐漸引起工業(yè)界與學(xué)術(shù)界注意,想在這么短時(shí)間內(nèi)完成“產(chǎn)生→發(fā)展→消費(fèi)→利用”這個(gè)過程,顯然是不大現(xiàn)實(shí)的。
(2)技術(shù)體系不夠成熟。目前視覺搜索理論與技術(shù)仍處于不斷完善、發(fā)展與優(yōu)化的階段,尤其是對(duì)于視覺資源理解、組織、描述、視覺特征表示、提取與匹配等技術(shù),仍需要不斷研究和優(yōu)化。
(3)標(biāo)準(zhǔn)化問題和互操作問題未解決。已有商業(yè)型視覺搜索體系各自擁有大量的視覺分析和處理算法、技術(shù)方案、服務(wù)模式與系統(tǒng)平臺(tái)可供選擇和使用,但在不同體系架構(gòu)、應(yīng)用領(lǐng)域和技術(shù)方案下的視覺搜索體系之間的有機(jī)融合,必然會(huì)引來異構(gòu)資源整合與處理的標(biāo)準(zhǔn)化問題、異構(gòu)體系之間的互操作性問題,但從已有理論與應(yīng)用研究成果來看,各視覺搜索體系彼此獨(dú)立,彼此之間的標(biāo)準(zhǔn)化、互操作等問題并未得到解決。
(4)現(xiàn)有應(yīng)用暫不具備通用性,且性能不夠理想。從已有商業(yè)型視覺搜索體系的服務(wù)內(nèi)容、建設(shè)模式與應(yīng)用領(lǐng)域來看,目前除了基于知識(shí)計(jì)算引擎的視覺搜索體系(如Google知識(shí)圖譜、DBpedia等)應(yīng)用具有一定的通用性,易被普通用戶接受之外,另兩類視覺搜索體系都具有較強(qiáng)的領(lǐng)域依賴性,暫時(shí)還沒有提供具備較強(qiáng)通用性的服務(wù)功能。但前者也存在一定的局限性,如主要接受文本型搜索對(duì)象,對(duì)圖像型、視頻型視覺資源支持度較低。由此可認(rèn)為已有商業(yè)型視覺搜索體系主要是為某些特定領(lǐng)域、行業(yè)提供相應(yīng)的內(nèi)容或功能上的視覺搜索服務(wù)。
3 商業(yè)型視覺搜索應(yīng)用帶給圖書館的啟示
3.1 注重?cái)?shù)字圖書館視覺搜索體系建設(shè)的領(lǐng)域?qū)?/p>
一方面,已有商業(yè)型視覺搜索體系理論與應(yīng)用研究大部分都具有較強(qiáng)的領(lǐng)域依賴性,如百度識(shí)圖目前制作了花卉品種與美女圖片等兩個(gè)領(lǐng)域、愛奇藝大腦目前主要是針對(duì)影視視頻領(lǐng)域、Google知識(shí)圖譜圍繞知識(shí)問答與知識(shí)服務(wù)領(lǐng)域、TinEye與MulticolorEngine應(yīng)用主要圍繞葡萄酒或旅游服務(wù)等特定領(lǐng)域來開展;另一方面,已有商業(yè)型視覺搜索體系所處理的視覺資源類型也各自具有一定的限制,并非針對(duì)全范圍、全類型、全資源的視覺資源,而是針對(duì)某一個(gè)或幾個(gè)特定類型、領(lǐng)域或?qū)W科的視覺資源,如Google知識(shí)圖譜主要是針對(duì)文本與圖像等類型、百度識(shí)圖主要針對(duì)圖像類型、愛奇藝大腦主要針對(duì)視頻類型等。
商業(yè)型視覺搜索體系的這些局限,給數(shù)字圖書館領(lǐng)域開展視覺搜索理論與應(yīng)用研究提供了重要參考。因此,數(shù)字圖書館視覺搜索體系的理想研究過程是:首先,選擇某特定領(lǐng)域、學(xué)科、專業(yè)或行業(yè),確定需要獲取、分析、組織、表達(dá)、理解和描述的視覺資源類型;其次,制定完整的理論體系、系統(tǒng)研發(fā)、平臺(tái)搭建、應(yīng)用推廣策略和縝密的研發(fā)計(jì)劃;再次,系統(tǒng)地去探索某特定領(lǐng)域的視覺資源價(jià)值的產(chǎn)生機(jī)理、轉(zhuǎn)換規(guī)律與時(shí)空語義關(guān)聯(lián)關(guān)系;最后,形成一套具有普遍意義、完整、有價(jià)值的數(shù)字圖書館視覺搜索體系。
3.2 重視數(shù)字圖書館視覺對(duì)象知識(shí)庫的建設(shè)
筆者曾在文獻(xiàn)[8-9]中多次提出視覺對(duì)象知識(shí)庫建設(shè)是視覺搜索體系建設(shè)與發(fā)展最為重要的環(huán)節(jié),它建設(shè)的好壞直接影響到視覺搜索體系能否成功。高文院士研究團(tuán)隊(duì)也曾經(jīng)多次強(qiáng)調(diào)視覺知識(shí)庫(或稱視覺數(shù)據(jù)集)視覺搜索服務(wù)依賴于視覺對(duì)象的高精度匹配和識(shí)別,通過建立高度結(jié)構(gòu)化、高質(zhì)量的視覺知識(shí)庫,用戶可迅速將現(xiàn)實(shí)物理世界的視覺對(duì)象與虛擬信息空間中的視覺資源建立關(guān)聯(lián),才能方便快捷地獲取待搜索視覺對(duì)象的時(shí)空關(guān)聯(lián)信息,獲取到“所見即所知”的新一代搜索服務(wù)[10-11]。從已有商業(yè)型視覺搜索體系建設(shè)與發(fā)展現(xiàn)狀來看,也充分印證了這一觀點(diǎn)。
因此,如何準(zhǔn)確有效地獲取、分析、組織與管理大規(guī)模視覺對(duì)象知識(shí)庫是數(shù)字圖書館視覺搜索體系建設(shè)面臨的一個(gè)極具挑戰(zhàn)性課題。只有解決好這個(gè)問題,才能有效地建立數(shù)字圖書館視覺搜索體系,為用戶提供“所見即所知”式視覺搜索服務(wù)。
3.3 嚴(yán)格遵循視覺資源獲取、保存的倫理與法則
數(shù)字圖書館存儲(chǔ)的文本、圖像和視頻等視覺資源源于人類生活,用于用戶教學(xué)、科研、工作和生活,圖書館在獲取、存儲(chǔ)這些視覺資源的同時(shí),也必須要遵守一些基本規(guī)則。一方面對(duì)互聯(lián)網(wǎng)與現(xiàn)實(shí)生活中正在傳播或可能存在的反動(dòng)、色情、違背社會(huì)倫理與道德倫常、違反法律法規(guī)、負(fù)面消極的視覺資源應(yīng)該毫不猶豫地摒棄;另一方面自建某特定領(lǐng)域視覺搜索體系必然需要實(shí)地采集相關(guān)視覺資源,在采集過程中可能會(huì)對(duì)周圍人、事、物、環(huán)境等產(chǎn)生影響,因此,就務(wù)必在協(xié)調(diào)好各方關(guān)系,保護(hù)涉事多方利益。如在進(jìn)行某些特定領(lǐng)域(如非物質(zhì)文化遺產(chǎn))視覺資源實(shí)地采集信息的過程中,可在雙方知情愿意的情況下進(jìn)行,必要時(shí)可簽訂相應(yīng)的使用協(xié)議。
3.4 重視視覺資源的標(biāo)準(zhǔn)化整理、加工與利用工作
已有商業(yè)型視覺搜索體系建設(shè)過程中,所有視覺資源都是經(jīng)過專業(yè)化整理、加工與處理的,不同之處在于,商業(yè)型視覺搜索體系基本都是采用機(jī)器手段,部分自建的基于特定領(lǐng)域的視覺搜索體系是采用人工手段。對(duì)于圖書館而言,視覺資源搜集、整理與加工的最終目的是為了給用戶提供相應(yīng)服務(wù)。如果將所需要的視覺資源搜集回來束之高閣,或不進(jìn)行規(guī)范化、系統(tǒng)化、標(biāo)準(zhǔn)化整理和加工,就會(huì)導(dǎo)致花費(fèi)了無數(shù)時(shí)間、精力和財(cái)力獲取到的是視覺資源也無法充分利用,使得數(shù)字圖書館視覺搜索體系建設(shè)這項(xiàng)工作失去了價(jià)值和意義。
從圖書館實(shí)際工作和數(shù)字圖書館應(yīng)用研究的角度來看,導(dǎo)致視覺資源未被充分開發(fā)和利用的原因,主要有:一是參與加工、編輯與處理人員少、人員專業(yè)性不強(qiáng)、或軟硬件設(shè)施跟不上,導(dǎo)致視覺資源價(jià)值無法被充分發(fā)掘;二是視覺資源獲取、整理、加工與分析工作未建立標(biāo)準(zhǔn)規(guī)范,導(dǎo)致相關(guān)環(huán)節(jié)銜接出現(xiàn)問題;三是涉及到版權(quán)問題,大部分獲取原生視覺資源未獲得相關(guān)人員授權(quán);四是視覺搜索平臺(tái)的功能與性能無法充分滿足要求,這也是當(dāng)前圖書館面臨的最大難題。
3.5 重視視覺搜索平臺(tái)的安全和視覺資源的版權(quán)問題
無論在任何時(shí)候,資源版權(quán)和平臺(tái)安全問題都是需要解決的關(guān)鍵問題,也是無法回避的難點(diǎn)問題,數(shù)字圖書館視覺搜索體系也不例外。從目前已有商業(yè)型視覺搜索體系所采用的策略來看,主要有:一是與用戶簽訂相關(guān)安全管理、使用與建設(shè)協(xié)議,協(xié)議形式是通過設(shè)定默認(rèn)電子協(xié)議方式,用戶在開始參與建設(shè)與使用時(shí),必須遵守相關(guān)協(xié)議與安全操作規(guī)范才能繼續(xù)參與;二是通過軟硬件方式限定相關(guān)安全操作、資源訪問與知識(shí)服務(wù)權(quán)限;三是建立資源與服務(wù)實(shí)時(shí)更新、安全實(shí)時(shí)監(jiān)控、版權(quán)實(shí)時(shí)檢測(cè)機(jī)制;四是強(qiáng)化用戶、服務(wù)與資源提供者的行為安全與資源版權(quán)的自我管理意識(shí)。這四點(diǎn)經(jīng)驗(yàn)值得數(shù)字圖書館領(lǐng)域借鑒。
4 結(jié)語
視覺搜索體系的建設(shè)工作本身是一項(xiàng)系統(tǒng)而又繁雜的工程,也是數(shù)字圖書館信息檢索模式創(chuàng)新與變革的必然方向。盡管在不同領(lǐng)域、不同環(huán)境和不同需求下,它的表現(xiàn)形式、服務(wù)模式、業(yè)務(wù)功能、甚至名稱都會(huì)有所不同,但其致力于為用戶提供嵌入式、協(xié)作化的大數(shù)據(jù)知識(shí)服務(wù)的本質(zhì)是不會(huì)變的。
隨著諸如Google、百度等商業(yè)型搜索引擎在知識(shí)服務(wù)領(lǐng)域的影響力和技術(shù)水平正在飛速前進(jìn)。圖書館目睹了一大批信息檢索工具、知識(shí)服務(wù)平臺(tái)的崛起與騰飛,也親身目睹了無數(shù)用戶放棄數(shù)字圖書館,轉(zhuǎn)而成為商業(yè)型搜索引擎的忠實(shí)擁蹙者。視覺搜索未必會(huì)成為挽救圖書館最有效的手段和工具,但卻能有效提升數(shù)字圖書館信息檢索效果與用戶體驗(yàn)質(zhì)量,對(duì)于提升圖書館核心競爭力也會(huì)產(chǎn)生積極影響。在移動(dòng)互聯(lián)網(wǎng)與大數(shù)據(jù)技術(shù)飛速發(fā)展大背景下,如何借助“互聯(lián)網(wǎng)+”的地方,在數(shù)字圖書館與信息檢索前沿領(lǐng)域?qū)で蠡A(chǔ)性突破,亟待圖書館產(chǎn)業(yè)界、學(xué)術(shù)界的共同努力。
參考文獻(xiàn):
[1] 吳飛,朱文武,于俊清.多媒體技術(shù)研究:2014—深度學(xué)習(xí)與媒體計(jì)算[J].中國圖像圖形學(xué)報(bào),2014,19(11):1423-1433.
[2] Norvig P.2020 visions[J].Nature,2010(463):26-32.
[3] Griod B.Chandrasekhar V.,Grzeszczuk R.et al.Mobile visual search:architectures,technologies,and the emerging MPEG standard[J].IEEE Computer Society,2011,18(3):86-94.
[4] 國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[EB/OL].[2016-04-01].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[5] 國務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見[EB/OL].[2016-04-01].http://www.gov.cn/zhengce/content/2015-07/04/content_10002.htm.
[6] 國家自然科學(xué)基金委員會(huì).“大數(shù)據(jù)驅(qū)動(dòng)的管理與決策研究”重大研究計(jì)劃2015年度項(xiàng)目指南[EB/OL].[2016-04-01].http://www.nsfc.gov.cn/publish/portal0/tab38/info49994.htm.
[7] 王元卓,賈巖濤,趙澤亞,等.OpenKN—網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代的知識(shí)計(jì)算引擎[J].中國計(jì)算機(jī)學(xué)會(huì)通訊,2014,10(11):30-35.
[8] 張興旺,黃曉斌.國外移動(dòng)視覺搜索研究述評(píng)[J].中國圖書館學(xué)報(bào),2014(3):114-128.
[9] 張興旺,李晨暉.數(shù)字圖書館移動(dòng)視覺搜索機(jī)制建設(shè)的若干關(guān)鍵問題[J].圖書情報(bào)工作,2015,59(15):42-48.
[10] 段凌宇,黃鐵軍,高文.移動(dòng)視覺搜索技術(shù)研究與標(biāo)準(zhǔn)化進(jìn)展[J].信息通信技術(shù),2012(6):51-58.
[11] 段凌宇,黃鐵軍,Alex C K,等.移動(dòng)視覺搜索技術(shù)瓶頸與挑戰(zhàn)[J].中國計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(12):8-15.
作者簡介:張興旺(1982-),男,桂林理工大學(xué)圖書館副研究館員,研究方向:數(shù)字圖書館;向宏華(1978-),女,桂林理工大學(xué)圖書館館員,研究方向:信息服務(wù);柏雪(1988-),女,桂林理工大學(xué)圖書館助理館員,研究方向:信息服務(wù)。