亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新媒體環(huán)境下網(wǎng)絡(luò)檔案信息檢索的創(chuàng)新

        2018-01-23 20:59:34李曉艷陳曉媛
        山西檔案 2018年3期
        關(guān)鍵詞:查全率信息檢索搜索引擎

        文 / 李曉艷 陳曉媛

        網(wǎng)絡(luò)檔案信息檢索是檔案信息化建設(shè)中的重要環(huán)節(jié)。良好的網(wǎng)絡(luò)信息檢索技術(shù)是檔案信息檢索效率和質(zhì)量的重要保障。自1990年代計算機網(wǎng)絡(luò)逐漸普及以來,網(wǎng)絡(luò)檔案信息檢索的檢索效率和檢索質(zhì)量都有了明顯提升。新媒體的日益發(fā)展以及大數(shù)據(jù)技術(shù)的不斷進步,極大地豐富了檔案信息系統(tǒng)的數(shù)據(jù)資源,同時也給網(wǎng)絡(luò)檔案信息檢索帶來一定的挑戰(zhàn)。

        一、網(wǎng)絡(luò)檔案信息檢索的發(fā)展現(xiàn)狀

        網(wǎng)絡(luò)檔案信息檢索是在傳統(tǒng)檔案信息檢索的基礎(chǔ)上,引入互聯(lián)網(wǎng)信息技術(shù),實現(xiàn)信息檢索方式、檢索理念以及技術(shù)支持的轉(zhuǎn)變。網(wǎng)絡(luò)檔案信息檢索與傳統(tǒng)檔案信息檢索相比,利用計算機的快速處理能力,在檢索方式和檢索效率上,均有顯著提升。

        信息檢索技術(shù)最早出現(xiàn)在文摘索引和圖書館參考資訊工作中。1970年代,手工檢索仍是檔案信息檢索的主要形式,這一時期檢索的主要對象是文獻和各類工作性書籍。計算機問世后,由于初期的使用成本和使用效率都不太理想,計算機技術(shù)并未在信息檢索中獲得廣泛的應(yīng)用。直到1990年代,計算機網(wǎng)絡(luò)廣泛普及,計算機技術(shù)的使用成本明顯降低,不少檔案機構(gòu)引入計算機技術(shù),由此進入了網(wǎng)絡(luò)檔案信息檢索時代[1]。

        在互聯(lián)網(wǎng)技術(shù)影響下,我國檔案信息檢索真正實現(xiàn)了網(wǎng)絡(luò)技術(shù)的創(chuàng)新,檔案信息資源平臺也由此呈現(xiàn)出全新的面貌。網(wǎng)絡(luò)圖書館作為提供網(wǎng)絡(luò)檔案信息檢索的主要平臺之一,在網(wǎng)絡(luò)檔案信息檢索的發(fā)展中發(fā)揮了重要作用。比較著名的網(wǎng)絡(luò)圖書館有中國國家圖書館、南京大學(xué)圖書館等[2]。目前,越來越多的檔案資料開始以電子檔案形式保存,網(wǎng)絡(luò)檔案庫存資源日益豐富,也給網(wǎng)絡(luò)檔案信息檢索帶來更為廣闊的發(fā)展前景。

        網(wǎng)絡(luò)檔案信息檢索主要采取語義檢索,通過輸入檢索關(guān)鍵詞,在資源系統(tǒng)中檢索出與關(guān)鍵詞相匹配的檔案資料。檢索技術(shù)和檔案資源庫建設(shè)的不足使得檔案信息檢索中經(jīng)常出現(xiàn)無效檢索。大數(shù)據(jù)技術(shù)的發(fā)展,使各個檔案信息檢索平臺的檔案資料得到了很大的豐富,檔案形式也更加多元化。圖片、影像以及音頻等多媒體形式為載體的檔案信息,逐漸被納入到檔案信息資源體系中,給當前網(wǎng)絡(luò)檔案信息檢索提供了更加優(yōu)質(zhì)的檢索內(nèi)容與服務(wù)形式。

        二、新媒體下網(wǎng)絡(luò)檔案信息檢索的缺陷

        (一)信息查全率技術(shù)存在障礙

        信息查全率是反映檢索質(zhì)量的重要指標。信息查全率越高表明網(wǎng)絡(luò)檔案信息檢索成功率越高[3]。當前信息檢索系統(tǒng)所使用的布爾邏輯檢索常用孤立的詞匯作為檢索入口,對標題、詞匯的識別產(chǎn)生遺漏,容易出現(xiàn)信息檢索不出的現(xiàn)象,給網(wǎng)絡(luò)檔案信息檢索的發(fā)展帶來了很大的阻礙。

        信息查全率存在技術(shù)障礙,會降低網(wǎng)絡(luò)檔案檢索的效率,還可能因為檢索詞匯的相關(guān)性不高導(dǎo)致信息檢索出錯。在進行網(wǎng)絡(luò)檔案信息檢索時,用比較熱門的檢索詞匯檢索,得到的檢索內(nèi)容會比較全面;用冷僻、偏門的孤立詞匯進行檢索,由于詞匯間相關(guān)性不高,很難檢索出有效的檔案信息。

        網(wǎng)絡(luò)檔案資料系統(tǒng)為檔案信息檢索提供了重要的數(shù)據(jù)支撐,但其中的信息查全率技術(shù)障礙問題很容易導(dǎo)致檢索內(nèi)容產(chǎn)生遺漏。一般網(wǎng)絡(luò)檔案資料系統(tǒng)越大,信息檢索遺漏的可能性越大,信息查全率也越低。信息查全率技術(shù)的不成熟,影響了檔案信息檢索的質(zhì)量,成為我國檔案信息檢索平臺發(fā)展受限的主要原因之一。

        (二)檢索內(nèi)容技術(shù)存在局限

        網(wǎng)絡(luò)檔案信息檢索的出現(xiàn),使人們獲取檔案信息資源更加便捷。人們在檢索檔案信息時常用關(guān)鍵詞檢索法,通過輸入檔案信息的關(guān)鍵詞,檢索出符合要求的檔案資源。關(guān)鍵詞檢索可以滿足用戶對于文字檔案信息的檢索需求。由于檢索內(nèi)容技術(shù)的局限,在檢索內(nèi)容中加入圖片、音頻以及影像等仍存在障礙,用戶的檢索需求難以獲得良好的滿足。

        通過圖片、音頻以及影像等檢索內(nèi)容進行檔案信息檢索,可以提高檔案檢索的精準度,提升檢索效率。在當前網(wǎng)絡(luò)檔案信息檢索系統(tǒng)中,對圖片、音頻以及影像等檔案信息資源進行檢索,需要先開展文字詞匯轉(zhuǎn)化,再利用關(guān)鍵詞進行檔案信息檢索,這直接影響了檔案信息檢索的效率和質(zhì)量。部分網(wǎng)絡(luò)檔案信息檢索平臺已經(jīng)開放了圖片檢索功能,但由于技術(shù)上的不足,導(dǎo)致信息查全率及查準率出現(xiàn)明顯的偏差,嚴重影響網(wǎng)絡(luò)檔案信息檢索的發(fā)展。

        (三)響應(yīng)時間因素的制約

        進行網(wǎng)絡(luò)檔案信息檢索時,從輸入關(guān)鍵字到獲取檢索內(nèi)容,存在一定的時間間隔,這被稱為響應(yīng)時間。響應(yīng)時間的長短與信息檢索技術(shù)有關(guān),還受到檢索設(shè)備的影響。在信息檢索技術(shù)不成熟的階段,響應(yīng)時間比較長。隨著網(wǎng)絡(luò)設(shè)備的發(fā)展,信息集成處理能力的增強,目前已實現(xiàn)將檢索響應(yīng)時間控制在1秒左右,但是仍然存在很大不足。

        檔案信息資源越多,數(shù)據(jù)庫越龐大,信息檢索的響應(yīng)時間也會越長。網(wǎng)絡(luò)檔案信息系統(tǒng)資源量日益增加,使得在信息檢索時需要對大量的同類型信息進行集成處理,影響了檢索響應(yīng)時間。此外,響應(yīng)時間還受到硬件設(shè)備的影響。硬件設(shè)備對高強度、高數(shù)量的數(shù)據(jù)信息承載能力存在不足,會延長響應(yīng)時間。由于信息集成處理能力不足以及網(wǎng)絡(luò)硬件設(shè)備落后,延長了系統(tǒng)響應(yīng)時間,甚至導(dǎo)致系統(tǒng)崩潰。響應(yīng)時間的長短既影響了網(wǎng)絡(luò)檔案信息檢索的質(zhì)量,也制約著網(wǎng)絡(luò)檔案信息檢索的整體發(fā)展。

        三、新媒體下網(wǎng)絡(luò)檔案信息檢索創(chuàng)新

        (一)智能化搜索引擎

        創(chuàng)新網(wǎng)絡(luò)檔案信息檢索首先要在搜索引擎上入手。目前,檔案信息搜索引擎具備一定判斷識別關(guān)鍵詞的能力,但在檔案信息內(nèi)容篩選和使用者需求判斷上,缺乏智能性,因此對檢索效果和質(zhì)量造成一定影響[4]。

        智能搜索引擎具備一定的思維能力。它可以對用戶的使用意圖進行判斷。在檢索過程中,通過對用戶的檢索關(guān)鍵詞、檢索圖片等進行精確分析,實現(xiàn)檢索內(nèi)容向檢索需求的轉(zhuǎn)變,使檔案信息檢索的效果和質(zhì)量得到提升。2009年,美國推出阿爾法搜索引擎,實現(xiàn)搜索語義的智能判讀,成為網(wǎng)絡(luò)檔案信息搜索引擎智能化發(fā)展中的重大技術(shù)突破。

        智能化搜索引擎的智能性不僅體現(xiàn)在語義搜索上,還體現(xiàn)在搜索內(nèi)容、搜索需求以及個性化搜索等方面。搜索引擎智能化對數(shù)據(jù)庫、信息檢索系統(tǒng)、數(shù)據(jù)挖掘以及自然語言處理提出了更高的技術(shù)要求,以達成通過簡單的檢索操作獲得高質(zhì)量信息資源的目標。關(guān)于智能化搜索引擎,技術(shù)人員已經(jīng)取得了不少研究成果,如微軟的“群體搜索”、谷歌實驗室的“羅盤搜索”和“整合搜索”等。這些智能化搜索引擎技術(shù)的出現(xiàn),促進了網(wǎng)絡(luò)檔案信息檢索的發(fā)展和進步。

        (二)基于內(nèi)容特征的多媒體檢索技術(shù)

        基于內(nèi)容特征的多媒體檢索技術(shù)與傳統(tǒng)檔案信息檢索相比,更加注重與多媒體技術(shù)的結(jié)合。多媒體技術(shù)的應(yīng)用使得在檢索內(nèi)容中加入圖片、語音、音頻以及影像片段等成為可能,增加了網(wǎng)絡(luò)檔案信息檢索內(nèi)容的多樣性,有利于人們對各種檔案信息資源進行多種檢索形式的嘗試[5]。

        過去,由于檢索內(nèi)容技術(shù)的限制,利用關(guān)鍵詞進行信息檢索占了絕大多數(shù)。在此背景下,只能滿足用戶對文字檔案信息的檢索需求,對于影像、音頻等高級檔案信息的檢索需求,難以獲得滿足。目前,不少網(wǎng)絡(luò)檔案信息檢索平臺開放了語音和圖片檢索功能,但由于語音識別和圖片識別技術(shù)的不成熟,并沒有取得很好的檢索效果?;趦?nèi)容特征的多媒體檢索技術(shù)可以對各種檔案信息進行同源檢索。比起傳統(tǒng)檔案信息檢索,它在檢索效率、檢索速度和檢索質(zhì)量上都有明顯的提升。

        基于內(nèi)容特征的多媒體檢索技術(shù),需要在現(xiàn)有技術(shù)基礎(chǔ)上,增強語音識別能力,提高對圖像、音頻和影像等檔案信息的處理識別能力。多媒體檢索內(nèi)容在容量大小上比關(guān)鍵詞檢索內(nèi)容要大很多。在進行多媒體內(nèi)容檢索時,不僅需要加強多媒體檔案信息數(shù)據(jù)庫的建設(shè),還需要提高多媒體檢索內(nèi)容的處理速度,減少響應(yīng)時間,促進多媒體內(nèi)容檢索的質(zhì)量和效果提升。

        (三)信息集成處理能力

        網(wǎng)絡(luò)檔案信息檢索實質(zhì)是在龐大的檔案信息資源系統(tǒng)中,利用用戶給定的限制條件(關(guān)鍵詞等),來篩選出符合檢索需要的內(nèi)容。整個檢索過程包含對大量數(shù)據(jù)的處理。因此,信息處理能力的高低直接影響到檔案信息檢索的效率和質(zhì)量。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,信息在容量和數(shù)量上都有明顯的提升。檔案信息資源系統(tǒng)中,檔案信息的數(shù)量日益增多,檔案容量越來越大,給檔案信息檢索帶來了很大的壓力。信息處理能力不足,會增長檔案信息檢索的系統(tǒng)響應(yīng)時間,如果在同一時間需要處理的信息內(nèi)容過多,甚至可能導(dǎo)致系統(tǒng)崩潰。

        信息集成處理能力的大小主要體現(xiàn)在同一時間內(nèi)不同信息的處理上。同一時間內(nèi)信息處理的數(shù)量越多,檢索的速度越快,用戶等待的時間也會越短。信息集成處理能力的運用主要是為了減少信息檢索的響應(yīng)時間,為用戶提供更高質(zhì)量的檢索服務(wù)體驗。大數(shù)據(jù)時代下,檔案信息化程度不斷擴大,網(wǎng)絡(luò)信息數(shù)據(jù)數(shù)量日益增多。在執(zhí)行信息檢索指令時,系統(tǒng)需要處理更多數(shù)量的信息數(shù)據(jù),這給網(wǎng)絡(luò)檔案信息檢索帶來了不少挑戰(zhàn)。信息集成處理技術(shù)在網(wǎng)絡(luò)檔案信息檢索中的應(yīng)用,加快了信息處理的速度,提高了信息檢索的效率和質(zhì)量。

        從過去以KB為計算單位,逐步發(fā)展到以MB、G甚至TB為計算單位,信息處理能力得到了很大的提高。信息處理集成化、系統(tǒng)化作為未來發(fā)展的重要趨勢,可以很好地解決過去信息處理不足的問題。信息集成處理能力的提升,最終也將促進網(wǎng)絡(luò)檔案信息檢索效率和質(zhì)量的提升。

        猜你喜歡
        查全率信息檢索搜索引擎
        海量圖書館檔案信息的快速檢索方法
        基于詞嵌入語義的精準檢索式構(gòu)建方法
        醫(yī)學(xué)期刊編輯中文獻信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
        河南科技(2014年11期)2014-02-27 14:10:19
        中文分詞技術(shù)對中文搜索引擎的查準率及查全率的影響
        公共圖書館信息檢索服務(wù)的實踐探索——以上海浦東圖書館為例
        圖書館界(2013年5期)2013-03-11 18:50:29
        国产在线精品成人一区二区三区| 国产高清视频91| 国产真实乱XXXⅩ视频| 精品亚洲国产亚洲国产| 国产激情久久久久久熟女老人| 漂亮人妻被中出中文字幕久久| 91麻豆精品激情在线观看最新| 美腿丝袜美腿国产在线| 国产性感丝袜在线观看| 午夜精品久久久久久毛片| 在线精品免费观看| 亚洲一区二区女优av| av天堂最新在线播放| 亚洲人成电影在线播放| 国产高级黄区18勿进一区二区| 亚洲国产精品一区亚洲国产| 婷婷色国产精品视频二区 | 麻豆国产精品伦理视频| 2018天天躁夜夜躁狠狠躁| 嫖妓丰满肥熟妇在线精品| 国产三级精品美女三级| 午夜少妇高潮在线观看视频| 国产电影一区二区三区| 国产一级做a爱免费观看| 亚洲av精品一区二区三 | 欧美性猛交xxxx免费看蜜桃 | 小sao货水好多真紧h视频| 欧美日韩国产乱了伦| 四季极品偷拍一区二区三区视频| 97精品久久久久中文字幕| av鲁丝一区鲁丝二区| 亚洲精品成人久久av| 亚洲乱码无人区卡1卡2卡3| 波多野结衣中文字幕久久| 婷婷激情五月综合在线观看| 国语淫秽一区二区三区四区| 无码国产伦一区二区三区视频| 97SE亚洲国产综合自在线不卡| 美女一区二区三区在线视频| 丝袜美腿一区二区三区| 99re这里只有热视频|