亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        檔案信息智能檢索研究綜述及發(fā)展趨勢探討

        2017-01-29 14:33:17張倩
        山東檔案 2017年4期
        關(guān)鍵詞:信息檢索檢索智能

        文·張倩

        學(xué)術(shù)研究

        檔案信息智能檢索研究綜述及發(fā)展趨勢探討

        文·張倩

        本文以時(shí)間為線索,對檔案信息檢索技術(shù)發(fā)展的演進(jìn)歷程進(jìn)行了梳理,將檔案信息檢索領(lǐng)域相關(guān)的理論研究和技術(shù)應(yīng)用劃分為三個(gè)階段,并在全面了解國內(nèi)外信息檢索領(lǐng)域理論研究和實(shí)踐發(fā)展動態(tài)的基礎(chǔ)上,對本項(xiàng)研究所涉相關(guān)概念的內(nèi)涵進(jìn)行了界定,闡述了檔案信息智能檢索的發(fā)展趨勢。

        檔案;智能檢索;演進(jìn)歷程;發(fā)展趨勢

        信息檢索工作,是檔案信息化建設(shè)不可或缺的重要組成部分,是關(guān)系到檔案信息資源能否最終在更大范圍內(nèi)、更便捷地為社會所利用的現(xiàn)實(shí)問題?;仡櫃n案信息檢索技術(shù)發(fā)展的演進(jìn)歷程可以發(fā)現(xiàn),其發(fā)展主要隨著信息檢索技術(shù)的發(fā)展而不斷向前推進(jìn),并經(jīng)歷了手工檢索、計(jì)算機(jī)化檢索、網(wǎng)絡(luò)化檢索三個(gè)階段,逐步發(fā)展形成了一些成熟的檢索模型、方法與技術(shù),特別是隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,Internet上的智能搜索引擎(Intelligent Search Engine)、智能瀏覽器(Intelligent Browser)、學(xué)習(xí)智能體(Learning Agent)、知識共享智能體(Knowledge-sharing Agent)等人工智能產(chǎn)品的不斷推出,使智能檢索技術(shù)成為當(dāng)代檔案信息檢索領(lǐng)域的朝陽技術(shù)。已有的實(shí)踐告訴我們,計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)是推動傳統(tǒng)信息檢索向智能檢索轉(zhuǎn)型的基石,但檔案信息檢索領(lǐng)域應(yīng)用知識引擎技術(shù)尚處于起步階段,離實(shí)現(xiàn)智能檢索還有很長的路要走,特別是數(shù)據(jù)化、網(wǎng)絡(luò)化技術(shù)對檔案信息檢索手段會產(chǎn)生怎樣的變革?何為檔案信息檢索效果的最高境界?對此,國內(nèi)外的理論界和產(chǎn)業(yè)界尚未形成共識。但在信息檢索技術(shù)發(fā)展中的一個(gè)毋庸置疑的事實(shí)是:檔案信息檢索服務(wù)模式和技術(shù)手段的“創(chuàng)新”,必須把滿足用戶的查詢需求放在首位,并作為目標(biāo)追求的最高境界。

        目前,檔案信息智能檢索技術(shù)的研發(fā)與應(yīng)用還處于較滯后的狀態(tài),特別是檔案信息檢索手段存在著諸多不盡人意之處,致使檔案信息資源的開發(fā)利用程度難以提高。如:檔案館(室)使用的檔案管理系統(tǒng),通常采用基于人工分類目錄或“關(guān)鍵詞+布爾邏輯”的機(jī)械匹配,前者對海量信息資源的揭示效率不高,深度極為有限;后者割裂了“字”與“詞”之間的語義關(guān)聯(lián),缺乏必要的語義分析,在信息的語義和語用揭示上有較大的局限性,特別是其提供的檢索入口專業(yè)性太強(qiáng),需用戶學(xué)會運(yùn)用邏輯運(yùn)算符、通配符等專業(yè)檢索技巧,加之檢索系統(tǒng)適用性較弱,檢出的結(jié)果往往不甚理想,遠(yuǎn)不能滿足用戶之需。針對傳統(tǒng)檔案信息檢索模式的缺陷和不足,將智能信息技術(shù)作為檔案信息檢索的核心支撐技術(shù),加強(qiáng)檔案信息智能檢索服務(wù)平臺建設(shè),必將成為完善和提升檔案信息檢索手段的重要途徑。

        一、 國內(nèi)外研究現(xiàn)狀綜述

        推進(jìn)信息檢索技術(shù)的智能化發(fā)展,是當(dāng)前信息學(xué)界普遍關(guān)注的問題,但關(guān)于檔案信息智能檢索方面的研究則較少。如:筆者以“檔案 智能檢索”為題名,對CNKI、維普、萬方等多個(gè)數(shù)據(jù)庫進(jìn)行檢索,只找到九篇相關(guān)期刊論文;在相關(guān)英文信息檢索數(shù)據(jù)庫中以“Archives (or Records or Files) Intelligent Retrieval”為檢索表達(dá)式進(jìn)行查詢,暫未找到與本項(xiàng)研究相關(guān)的文章或著作;在中國國家圖書館、南京大學(xué)圖書館、超星數(shù)字圖書館等館藏?cái)?shù)據(jù)庫中,也未檢索到檔案智能檢索方面的專著。為了解信息檢索方面的研究狀況,筆者又對CNKI數(shù)據(jù)庫進(jìn)行了檢索,找到的相關(guān)論文有四千多篇,并在中國國家圖書館數(shù)據(jù)庫中檢索到近千部著作。此外,圍繞“智能檢索”這一研究主題,筆者進(jìn)一步檢索了智能信息檢索的研究狀況,在CNKI數(shù)據(jù)庫中檢索出與智能檢索聯(lián)系較為緊密的文章有五百余篇;在中國國家圖書館、南京大學(xué)圖書館、超星數(shù)字圖書館等館藏?cái)?shù)據(jù)庫中檢索到的專著僅四本。在這些文獻(xiàn)中看到,學(xué)者們利用中文自然語言理解、智能Agent、可視化、本體論、語義Web、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、知識發(fā)現(xiàn)、遺傳算法、神經(jīng)網(wǎng)絡(luò)、XML索引技術(shù)等現(xiàn)代信息技術(shù),對信息智能檢索課題展開了廣泛的研究,一些設(shè)計(jì)開發(fā)的智能管理系統(tǒng),已被應(yīng)用于圖書、情報(bào)等行業(yè)的研究與開發(fā)、計(jì)算機(jī)工程與應(yīng)用、中小企業(yè)管理、醫(yī)療疾病診斷等領(lǐng)域。伴隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)特別是信息檢索技術(shù)的快速普及,檔案信息檢索領(lǐng)域相關(guān)的理論研究和技術(shù)應(yīng)用也逐漸受到業(yè)界的關(guān)注和重視,大致經(jīng)歷了以下三個(gè)不同的探索階段:

        (一)手工檢索階段(1830年—20世紀(jì)70年代初期)

        信息檢索發(fā)端于文獻(xiàn)的文摘索引工作和圖書館參考咨詢工作。1830年,柏林科學(xué)院出版了著名的文摘刊物《藥學(xué)總覽》,這一事件被研究人員普遍認(rèn)作手工信息檢索研究的起源。1876年,美國圖書館協(xié)會第一屆大會召開,這一事件被研究人員認(rèn)作規(guī)范信息檢索工作的起點(diǎn)。1949年,莫爾斯(Galvin W.Mooers)在國際數(shù)學(xué)會議上首次提出“信息檢索”(Information Retrieval)的概念。他提出的關(guān)于信息檢索兼具了信息的“存儲”與“檢索”(Information Storage and Retrieval)兩個(gè)方面涵義的論述,得到了學(xué)界普遍認(rèn)同。

        20世紀(jì)70年代,手工檢索處于主流地位,并達(dá)到了發(fā)展的高潮。此后,在信息檢索最發(fā)達(dá)的英美國家,手工檢索逐漸退出主流地位。這一階段的主要發(fā)展特點(diǎn):一是以印刷文獻(xiàn)(如期刊、圖書、專利、會議、學(xué)位論文等)為主要檢索對象;二是以各類目錄性工具、文摘、題錄和書為可利用的主要檢索工具;三是圖書館的咨詢部門成為開展信息檢索的主要服務(wù)機(jī)構(gòu)。

        我國學(xué)界開展檔案信息檢索研究,大約始于 20 世紀(jì) 30-40 年代。這一期間,滕固、程長源、龍兆佛等學(xué)者開始關(guān)注檔案管理的理論研究。如:1935年,史學(xué)家滕固提出的“檔案學(xué)”一說正式問世,并得到眾多學(xué)者的公認(rèn)。1936 年,程長源的《縣政府檔案管理法》論著,被視為我國研究檔案信息檢索理論的發(fā)端。1962年,陳兆祦的《檔案管理學(xué)》論著,首次將檔案管理工作的內(nèi)容概括為六個(gè)環(huán)節(jié),并提出了一套檔案管理工作的原理與方法。需要指出的是,受時(shí)代背景所限,我國這一時(shí)期的檔案信息檢索理論研究,主要是借鑒歐美在圖書、檔案管理方面的經(jīng)驗(yàn),對檔案信息檢索的編目問題進(jìn)行了探究。

        (二)計(jì)算機(jī)化檢索階段(20世紀(jì)50年代初期—20世紀(jì)90年代初期)

        1946年計(jì)算機(jī)誕生后,計(jì)算機(jī)信息檢索技術(shù)隨之應(yīng)運(yùn)而生,其作為一個(gè)獨(dú)立領(lǐng)域的地位在國際上迅速得以確立。

        計(jì)算機(jī)信息檢索系統(tǒng)的應(yīng)用,是信息檢索步入現(xiàn)代化的一個(gè)重要標(biāo)志。其主要經(jīng)歷了脫機(jī)批處理檢索(Off-line Batch Processing,1954—1964年)、聯(lián)機(jī)實(shí)時(shí)檢索(On-line Real Time,1965-1975年)和聯(lián)機(jī)網(wǎng)絡(luò)化與多元化信息檢索(1975—1990年)等不同發(fā)展階段。這一時(shí)期值得關(guān)注的事件有:以英國數(shù)學(xué)家和邏輯學(xué)家喬治·布爾(George Boole)命名的布爾(Boolean)檢索技術(shù)的誕生。這項(xiàng)技術(shù)不僅逐漸發(fā)展成為各種大型聯(lián)機(jī)檢索系統(tǒng),而且成了網(wǎng)絡(luò)搜索引擎的標(biāo)準(zhǔn)檢索模式。這一階段的主要發(fā)展特點(diǎn):一是各類機(jī)讀數(shù)據(jù)庫被作為檢索對象;二是各類情報(bào)所、聯(lián)機(jī)服務(wù)中心被作為新興信息服務(wù)機(jī)構(gòu);三是信息檢索用戶逐漸由專業(yè)人員向終端用戶轉(zhuǎn)移,信息檢索的社會普及程度日益提高。

        我國檔案信息檢索研究勃興于20世紀(jì)80年代。1985年,國家檔案局頒布的《檔案著錄規(guī)則》,標(biāo)志著我國檔案檢索工作與研究上升到國家高度。同年,鄧紹興的《檔案檢索》論著被視為國內(nèi)檔案檢索學(xué)科形成的標(biāo)志。其后,少數(shù)研究者開始涉足檔案信息智能檢索研究領(lǐng)域。1988年,中央檔案館采用模糊運(yùn)算開發(fā)的檔案自動編目檢索系統(tǒng)(簡稱CAFC系統(tǒng)),為檔案智能檢索的實(shí)現(xiàn)開辟了一條新途徑。[1]1989年,張柏雄提出了智能化、高速檢索子系統(tǒng)(IRS)所遵循的設(shè)計(jì)原則和設(shè)計(jì)方法。[2]1990年,中央檔案館等單位聯(lián)合開發(fā)的OAS光盤檔案全文存貯與智能檢索系統(tǒng),使檢索軟件具有了初步的人工智能。[3]1991年,國防科工委檔案館開發(fā)的檔案智能化管理信息系統(tǒng),增加了檔案主題概念檢索功能,構(gòu)建了知識庫管理模式,實(shí)現(xiàn)了基于專家規(guī)則的智能檢索機(jī)制和相應(yīng)的學(xué)習(xí)機(jī)制。[4]1994年,湯道鑾等設(shè)計(jì)的檔案檢索自動化系統(tǒng),可分為檔案目錄組織自動化、目錄檢索自動化、全文檢索自動化、全文著錄與標(biāo)引自動化。[5]同年,朱久蘭將反映檔案信息特征的主題詞,作為知識存儲、知識管理和應(yīng)用的手段,為人工智能技術(shù)在檔案自動化管理中的應(yīng)用作了有益嘗試。[6]1996年,馬緒超論述了具有人工智能的專家系統(tǒng)(ES)等技術(shù)在檔案信息檢索中的應(yīng)用效果。[7]需要指出的是,這一階段雖有一些單位開始使用計(jì)算機(jī)技術(shù)對檔案信息進(jìn)行輔助管理,但國內(nèi)檔案信息檢索方式仍以手工為主,檔案信息檢索的研究對象仍以紙質(zhì)檔案為主,檢索技術(shù)的總體發(fā)展?fàn)顩r尚處于對傳統(tǒng)手工檢索的探討與總結(jié)層面。

        (三)網(wǎng)絡(luò)化檢索階段(20世紀(jì)90年代初期至今)

        20世紀(jì)90年代初,以Internet為代表的全球性計(jì)算機(jī)網(wǎng)絡(luò)廣為普及,不僅迅速推動了信息檢索的新技術(shù)發(fā)展,而且信息檢索的主流平臺都先后將自己的服務(wù)轉(zhuǎn)入WWW為核心的網(wǎng)絡(luò)應(yīng)用環(huán)境之中,信息檢索開始邁入數(shù)據(jù)化、網(wǎng)絡(luò)化檢索時(shí)期。目前,互聯(lián)網(wǎng)已步入Web2.0時(shí)代,以人工智能為代表的信息檢索自動化技術(shù)已是網(wǎng)絡(luò)信息檢索的基礎(chǔ)技術(shù),如超文本/超媒體技術(shù)的應(yīng)用、基于內(nèi)容的多媒體信息檢索系統(tǒng)的開發(fā)、自然語言的理解與處理、海量網(wǎng)絡(luò)信息的組織與檢索、語義檢索與邏輯推理、知識檢索服務(wù)等,已成為信息服務(wù)的主要議題。

        隨著社會信息需求的急劇增長,檔案信息檢索實(shí)踐活動也發(fā)生了日新月異的變化。如:電子檔案信息組織與管理、網(wǎng)絡(luò)檔案信息檢索、檔案信息檢索自動化等新技術(shù)、新方法撲面而來。這些新情況、新事物為推進(jìn)檔案信息檢索理論研究,提供了大量生動的實(shí)踐素材。國內(nèi)不少檔案學(xué)者投入大量的心血與精力,對檔案信息檢索的相關(guān)技術(shù)難題進(jìn)行了積極探究,不僅有相當(dāng)數(shù)量的論文、專著、教材發(fā)表或出版,而且一些地方的檔案管理機(jī)構(gòu)還研發(fā)了功能較先進(jìn)的檔案信息檢索系統(tǒng)。如:1999年,謝華撰文指出著錄標(biāo)引的豐富是解決智能檢索中因?qū)傩赃^少而導(dǎo)致“瓶頸”現(xiàn)象的途徑。[8]2001年,馮惠玲撰文指出目前的計(jì)算機(jī)檔案信息檢索系統(tǒng)大多采用檢索語言或檢索語言與自然語言并用的方法,但自然語言將成為未來檔案文獻(xiàn)檢索的主要方式。[9]2006年,鄒吉輝撰文闡述了檔案信息檢索系統(tǒng)向信息智能檢索、多維檢索系統(tǒng)、社會功能人本化方向發(fā)展的趨勢。[10]2010年,陳麗撰文提出了檔案信息檢索自然語言化的五種實(shí)現(xiàn)方式。[11]2011年,肖秋會撰文介紹了計(jì)算機(jī)檔案信息檢索系統(tǒng)的設(shè)計(jì)與開發(fā)等。[12]2012年,潘士萍設(shè)計(jì)出了遞進(jìn)式檔案信息檢索教學(xué)實(shí)驗(yàn)項(xiàng)目,并提供了可資研究參考的檔案管理機(jī)構(gòu)檢索工作范例。[13]需要指出的是,這一階段國內(nèi)雖開始關(guān)注對計(jì)算機(jī)和網(wǎng)絡(luò)共享環(huán)境下的檔案信息檢索技術(shù)研究與開發(fā),但多數(shù)論著以介紹檔案信息檢索的基礎(chǔ)理論、方法、技術(shù)為主,針對智能檢索技術(shù)的專題論述不多,實(shí)踐案例極為少見,或僅限于表層研究,缺乏實(shí)用性。

        綜上所述,雖然一個(gè)多世紀(jì)以來,國內(nèi)外學(xué)者對信息檢索問題作了較廣泛、深入的研討,但從研究文獻(xiàn)的總體情況來看,研究所涉的領(lǐng)域范圍大同小異,且多為敘述性介紹,尤其是國內(nèi)檔案學(xué)界僅將檔案信息檢索的過程作為研究對象,主要研究傳統(tǒng)載體形態(tài)、記錄方式的檔案及其檢索方法。毋庸諱言,檔案信息檢索研究不僅始終處于滯后狀態(tài),而且普遍借鑒了圖書館學(xué)、情報(bào)學(xué)等領(lǐng)域關(guān)于信息檢索的研究成果,并明顯留有對相關(guān)學(xué)科及技術(shù)變革蕭規(guī)曹隨的痕跡。如:近年來國內(nèi)一些論著對信息智能檢索技術(shù)雖有描述,但側(cè)重點(diǎn)多數(shù)集中在基本理論、方法方面,很少見諸研究信息智能檢索技術(shù)的實(shí)證性論著,而檔案信息智能檢索技術(shù)研究的論著更是屈指可數(shù)。目前,國外一些著名IT企業(yè)研發(fā)出的智能檢索工具不容小覷。相比而言,國內(nèi)的檔案信息檢索系統(tǒng)專業(yè)性強(qiáng)、透明度差,缺乏良好的交互性。

        二、概念界定及發(fā)展趨勢

        考察文獻(xiàn)發(fā)現(xiàn),人們對智能檢索的概念論述呈各執(zhí)見解之態(tài),特別是檔案信息智能檢索研究處于滯后狀態(tài),其概念尚無規(guī)范的定義。通過學(xué)習(xí)、借鑒業(yè)內(nèi)專家學(xué)者對智能檢索概念的介紹,我們將“檔案信息智能檢索”的概念理解為:其由抽詞檢索與全文檢索發(fā)展而來,能夠融合檔案學(xué)、圖書館學(xué)、情報(bào)學(xué)、計(jì)算機(jī)科學(xué)等相關(guān)領(lǐng)域的先進(jìn)理念,應(yīng)用計(jì)算機(jī)和網(wǎng)絡(luò)等先進(jìn)的技術(shù)與方法,通過實(shí)施語義理解、邏輯推理與學(xué)習(xí)、數(shù)據(jù)挖掘、知識發(fā)現(xiàn)與關(guān)聯(lián)等諸多環(huán)節(jié),對檔案信息進(jìn)行智能化的獲取、存儲、處理與利用,實(shí)現(xiàn)在更高層次上模擬、應(yīng)用人類的認(rèn)知功能和智能活動,滿足用戶的各種檔案信息個(gè)性化需求,為廣泛的應(yīng)用領(lǐng)域提供高效率、高質(zhì)量的檔案信息知識檢索服務(wù)。通過對已有實(shí)踐的研究,筆者認(rèn)為檔案信息智能檢索未來將在以下幾個(gè)方面深入發(fā)展。

        (一)自然語言理解能力

        自然語言理解(Natural Language Understanding)是智能信息檢索系統(tǒng)的基礎(chǔ)。自然語言、分類檢索語言和主題檢索語言是三種不同的語言系統(tǒng),三者的標(biāo)識和組織方式雖不一樣,但本質(zhì)都是同樣的主題概念標(biāo)識系統(tǒng),且關(guān)鍵詞、分類號、主題詞都可用來表示某一文獻(xiàn)信息的主題概念。這三者之間,存在著概念對應(yīng)關(guān)系,即兼容關(guān)系。

        傳統(tǒng)檔案檢索采用的檢索語言屬于高度規(guī)范化的受控語言或人工語言,其主要作用是通過對自然語言進(jìn)行規(guī)范化處理,使標(biāo)引用語與檢索用語相匹配。如:《中國檔案分類法》和《中國檔案主題詞表》就是兩種不同的檢索語言。分類檢索語言的特點(diǎn)是:把各種概念按知識分類進(jìn)行系統(tǒng)組織和排列。主題檢索語言的特點(diǎn)是:把各種概念按字順排列而不管其相互關(guān)系如何,在詞表中只存在“用、代、屬、分、參”等簡單聯(lián)系。傳統(tǒng)檔案檢索語言的主要缺點(diǎn):一是對書寫形式有嚴(yán)格的要求,特別是標(biāo)引難度大、速度慢,需標(biāo)引人員具備閱讀、分析、概括、提煉檔案主題和準(zhǔn)確歸類的能力;二是除強(qiáng)調(diào)詞匯控制外,其構(gòu)造和維護(hù)是一件非常艱難的任務(wù);三是需將檢索用語轉(zhuǎn)換成與標(biāo)引用語相同的語言,才能進(jìn)行相符性比較而檢出用戶所需的信息,對專指性檢索需求不如自然語言。

        將自然語言理解能力模塊嵌入檔案信息檢索系統(tǒng)之中,其主要功效可體現(xiàn)為:用戶直接使用任意自然語言問句(“語句搜索”Sentence Search),就可實(shí)現(xiàn)跨數(shù)據(jù)庫檢索;檔案管理者則可利用系統(tǒng)實(shí)現(xiàn)各種不同受控詞表、不同結(jié)構(gòu)的知識組織系統(tǒng)(Knowledge Organization System,KOS,是一種基于概念語義網(wǎng)絡(luò)的新一代情報(bào)檢索語言與自然語言的結(jié)合體)之間的兼容轉(zhuǎn)換,即通過建立檢索詞匯之間的語義映射和互操作機(jī)制,從檔案文獻(xiàn)中直接抽詞、賦詞,并進(jìn)行自動標(biāo)引、自動分類、自動全文檢索等。

        需要指出的是:自然語言與傳統(tǒng)檔案檢索語言相比,其具有查準(zhǔn)率高、通用性廣、易用性好、詞匯無滯后、便于實(shí)現(xiàn)自動標(biāo)引等諸多優(yōu)點(diǎn),但自然語言也存在著顯著的缺點(diǎn),如詞形詞義不規(guī)范,存在語義模糊現(xiàn)象,不能全面地顯示詞匯間的語義關(guān)系等。因此,完善和提升基于語義、語用知識的智能信息處理機(jī)制,是實(shí)現(xiàn)檔案信息智能檢索的關(guān)鍵所在。

        (二)人工智能推理能力

        傳統(tǒng)檔案信息檢索一般要求檢索者對用戶提出的檢索事件進(jìn)行分析,并掌握有關(guān)該事件的基本情況及背景信息。而檔案信息智能檢索是建立在可用自然語言進(jìn)行概念性全網(wǎng)絡(luò)檢索的智能知識庫之上的,其依賴特殊形式的人工智能推理技術(shù),根據(jù)存儲的事實(shí)、用戶的檢索行為等,建立高效率、高品質(zhì)的檢索模板庫,利用概念邏輯和人工智能邏輯實(shí)現(xiàn)多種語義推理、邏輯推理、挖掘及知識發(fā)現(xiàn),選擇最優(yōu)或最經(jīng)濟(jì)的途徑,引導(dǎo)智能檢索的高效執(zhí)行,演繹出所需的答案,以幫助用戶改善策略,實(shí)現(xiàn)檢索過程的自動化。

        機(jī)器學(xué)習(xí)技術(shù)是檔案信息智能檢索技術(shù)智能化的基礎(chǔ),可從用戶與系統(tǒng)的交互中獲取知識,使系統(tǒng)適應(yīng)環(huán)境的變化而發(fā)展變化。目前,自動標(biāo)引和自動分類的算法智能化程度仍不高,需要引入“本體”等技術(shù)來增強(qiáng)知識庫的推理功能。

        (三)知識集成處理能力

        智能檢索與傳統(tǒng)檢索最大的區(qū)別在于:它在用戶與網(wǎng)絡(luò)信息資源之間創(chuàng)建了一個(gè)知識庫,即一個(gè)元數(shù)據(jù)的集合。擁有知識是智能信息檢索系統(tǒng)區(qū)別于一般信息檢索系統(tǒng)的重要標(biāo)志,而知識的質(zhì)量與數(shù)量又是決定其性能的關(guān)鍵因素。

        傳統(tǒng)檔案信息檢索一般是將確立待檢標(biāo)志看作是檢索工作的入口,即以檔案上各種經(jīng)過規(guī)范化整理的標(biāo)記符號來作為檢索線索。這是一種基于倒排索引采用語詞匹配的檢索模式,不提供基于知識及推理的檢索方法。

        檔案信息智能檢索,是指依據(jù)知識內(nèi)容和知識關(guān)聯(lián)來求解問題的過程(不是簡單的字符匹配查找過程)。它的知識庫提供的是一種主動式、高效率的知識服務(wù)。這種知識庫與傳統(tǒng)數(shù)據(jù)庫之間的差別迥異,一般分為:綜合文獻(xiàn)知識庫、專業(yè)知識庫、規(guī)則庫、語言知識庫、用戶知識庫。系統(tǒng)將各種檔案信息的檢索語言放在專業(yè)知識庫和規(guī)則庫,在人機(jī)接口處,可應(yīng)用人工智能技術(shù)模擬專家處理問題的認(rèn)知功能。如:接受用戶的查詢問題時(shí),不受任何人工命令語言或語法的限制,能明白用戶以自然語言方式表達(dá)的需求,識別用戶的認(rèn)知空間,并可選用合適的檢索語言生成需求模型,然后把系統(tǒng)對用戶的回答、推理結(jié)果及對結(jié)果的解釋等進(jìn)行逆轉(zhuǎn)換,以用戶可以理解的方式輸出給用戶。當(dāng)前,急待引入超鏈接、標(biāo)記語言、互操作等技術(shù)來完善和提升系統(tǒng)的智能功能,加速推進(jìn)知識庫由靜態(tài)走向動態(tài)、由線性走向網(wǎng)狀,以利實(shí)現(xiàn)知識庫的不斷更新?lián)Q代。

        面對大數(shù)據(jù)的挑戰(zhàn),開展檔案信息智能檢索技術(shù)應(yīng)用研究,既是檔案管理理論創(chuàng)新的內(nèi)在要求,也是檔案管理實(shí)踐創(chuàng)新的迫切需要。當(dāng)前,現(xiàn)有的檔案信息檢索建設(shè)現(xiàn)狀,已不能滿足大數(shù)據(jù)時(shí)代下對海量檔案信息資源的管理與利用,迫切需要相關(guān)智能技術(shù)的引入。尤其是檔案信息智能檢索領(lǐng)域的理論研究成果很少,且多為基礎(chǔ)性論述,亟待進(jìn)行技術(shù)創(chuàng)新方面的實(shí)證性研究。此外,檔案信息檢索實(shí)踐中面臨諸多矛盾和問題,急盼研發(fā)成果給予指導(dǎo),以利加快創(chuàng)新成果的應(yīng)用轉(zhuǎn)化及解決技術(shù)難題。

        [1]鄭曉威等.模糊運(yùn)算應(yīng)用于檔案智能編目檢索系統(tǒng)的理論探討與實(shí)驗(yàn)[J].檔案學(xué)研究,1989(4):35-42.

        [2]張柏雄.檔案信息庫系統(tǒng)的智能檢索[J].微電子學(xué)與計(jì)算機(jī),1991(7):33-36.

        [3]王信功.《OAS光盤檔案全文存貯與智能檢索系統(tǒng)》的研制與應(yīng)用[J].檔案學(xué)研究,1992(4):3-4.

        [4]李少杰.《檔案智能化管理信息系統(tǒng)》的功能與特點(diǎn)[J].檔案學(xué)研究,1992(2):70-73.

        [5]湯道鑾等.檔案全文自動著錄與智能標(biāo)引初探[J].檔案學(xué)研究,1994(2):39-41.

        [6]朱久蘭.檔案信息智能檢索[J].檔案學(xué)研究,1994(4):57-58.

        [7]馬緒超.人工智能及其在檔案檢索中的應(yīng)用[J].黑龍江檔案,1996(12):36-37.

        [8]謝華.電子檔案的智能化初探[J].湖北檔案,1999(10):11-13.

        [9]馮惠玲.檔案文獻(xiàn)檢索[M].北京:高等教育出版社,2001:94-96.

        [10]鄒吉輝.論檔案信息檢索智能化趨勢[J].浙江檔案,2006(4):6-7.

        [11]陳麗.檔案信息檢索[M].成都:四川人民出版社,2010:15.

        [12]肖秋會.檔案信息檢索[M].武漢:武漢大學(xué)出版社,2011:155-157.

        [13]潘世萍,賀真.檔案檢索實(shí)驗(yàn)教程[M].北京:北京師范大學(xué)出版社,2012:3

        *本文系2013年江蘇省社會科學(xué)基金項(xiàng)目“云計(jì)算環(huán)境下數(shù)字檔案資源管理的理論與實(shí)踐研究”(項(xiàng)目編號:13XWC018)和2016年度江蘇省檔案局科技項(xiàng)目“區(qū)域性高校數(shù)字檔案資源共享平臺建設(shè)研究”(項(xiàng)目編號:2016-13)研究成果之一。

        (作者單位:南京藝術(shù)學(xué)院綜合檔案室)

        猜你喜歡
        信息檢索檢索智能
        2019年第4-6期便捷檢索目錄
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        公共圖書館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書館為例
        圖書館界(2013年5期)2013-03-11 18:50:29
        欧美高大丰满freesex| 丝袜美腿福利一区二区| 午夜天堂精品久久久久| 无码手机线免费观看| 欧美韩国精品另类综合| 在线亚洲精品免费视频| 久久综合久久美利坚合众国| 欧美性受xxxx白人性爽| 精品国产高清一区二区广区| 天堂av中文在线官网| 在线视频国产91自拍| 精品国产午夜理论片不卡| 亚洲AV毛片无码成人区httP| 人妻少妇粉嫩av专区一| 青青草原综合久久大伊人精品| 中文字幕一区二区三区人妻少妇| 日韩一区二区超清视频| 国产一区二区美女主播| 欧美激欧美啪啪片| 国产zzjjzzjj视频全免费| 九九久久精品大片| 日本综合视频一区二区| 疯狂添女人下部视频免费| 在线精品免费观看| 蜜臀av人妻一区二区三区| 一区二区精品国产亚洲| 欧美金发尤物大战黑人| 99久久久无码国产精品动漫| 人妻少妇偷人精品视频| 中文字幕亚洲精品无码| 国产v片在线播放免费无码| 国产a v无码专区亚洲av| 亚洲成a人片在线观看中| 中文字幕人妻在线少妇| 少妇无码吹潮| 亚洲av不卡电影在线网址最新| 日韩亚洲一区二区三区在线| 国产乱人对白| 国产无码夜夜一区二区| av二区三区在线观看| 欧美牲交a欧美牲交aⅴ免费下载|