亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于語義擴(kuò)展搜索的圖書館服務(wù)研究

        2013-09-15 14:21:30陳萍秀
        圖書與情報 2013年4期
        關(guān)鍵詞:知識庫檢索語義

        陳萍秀

        (成都航空職業(yè)技術(shù)學(xué)院圖書館 四川成都 610010)

        作為社會信息和知識存儲、 服務(wù)、 加工中心的圖書館,向用戶提供咨詢服務(wù)是體現(xiàn)其存在價值的主要方式。隨著知識社會的到來,民眾的知識需求逐漸向?qū)I(yè)化、學(xué)科化、泛在化發(fā)展,圖書館的咨詢服務(wù)、學(xué)科服務(wù)等更進(jìn)一步體現(xiàn)出了其存在的價值和服務(wù)效益,因而成為現(xiàn)代圖書館服務(wù)方式和內(nèi)容的主要組成部分,并隨著用戶的需求變化而變化,現(xiàn)已從簡單的文獻(xiàn)服務(wù)、信息服務(wù)階段發(fā)展到了嵌入式服務(wù)、知識服務(wù)階段,圖書館服務(wù)所借助的工具也不再僅僅是工具書、目錄卡等,知識來源也不再只是來源于館藏文獻(xiàn)或數(shù)據(jù)庫信息,從海量、異構(gòu)、復(fù)雜的知識庫、Web 資源信息中通過自然語言、語義擴(kuò)展搜索所需的知識成為了圖書館服務(wù)的新的增長點,也成為了當(dāng)前圖書館員所需要研究和思考的問題。

        1 語義擴(kuò)展搜索模型的構(gòu)建

        本文提出的語義擴(kuò)展檢索模型基于 HNC(Hierarchical Network of Concepts,一個以概念聯(lián)想脈絡(luò)為主線,融語義、語法、語用為依托的自然語言理論的理論體系)理論,借助于美國搜索引擎公司Powerset 的搜索產(chǎn)品Search Wikipedia Articles 使用的自然語言處理技術(shù),將圖書館員的信息檢索從以前的關(guān)鍵詞層面提升到了可對詞組或整句自然語言檢索的知識檢索層面,并在知識檢索的基礎(chǔ)上進(jìn)行了知識的理解與處理,如分析與抽取等,以提高人們?nèi)缬脩艉蛨D書館咨詢服務(wù)人員的語義搜索能力。本文所提出的基于知識庫的語義擴(kuò)展搜索模型主要包括:擴(kuò)展查詢條件,映射知識庫,相關(guān)度分析和圖書館延伸服務(wù)(模型見圖1)。主要步驟為:(1)根據(jù)用戶需求輸入查詢條件,使用領(lǐng)域知識詞典對其輸入進(jìn)行擴(kuò)展,得到擴(kuò)展搜索引擎條件,并分析得出各擴(kuò)展查詢條件間的關(guān)聯(lián);(2)將查詢條件映射到知識庫、Web 資源之中,并對映射得到的知識數(shù)據(jù)進(jìn)行相關(guān)度分析;(3)返回排序后的查詢結(jié)果,并通過圖書館豐富的服務(wù)方式輸出給用戶。

        圖1 語義擴(kuò)展搜索模型

        從模型可以看出,圖書館實施語義擴(kuò)展搜索服務(wù)的工作主要有:(1)領(lǐng)域知識詞典的構(gòu)建;(2)相關(guān)度分析的實現(xiàn)與算法優(yōu)化;(3)擴(kuò)展搜索資源的建設(shè)與選取,如機構(gòu)知識庫的構(gòu)建與Web 資源的獲?。唬?)查詢結(jié)果的輸出與相關(guān)服務(wù)的實現(xiàn)。其中,領(lǐng)域知識詞典的構(gòu)建、相關(guān)度分析的實現(xiàn)以及算法優(yōu)化需要研究的問題都已超出了圖書館學(xué)和情報學(xué)的研究范疇,同時也是近年來計算機科學(xué)、人工智能、管理科學(xué)與工程等學(xué)科的研究熱點之一,因此本文的研究重點是在語義擴(kuò)展搜索資源的選取與構(gòu)成基礎(chǔ)上,對可以提供的圖書館相關(guān)服務(wù)以及方式、方法與途徑進(jìn)行研究,并將圖書館對用戶的具體服務(wù)延伸與深化。

        2 圖書館語義擴(kuò)展搜索資源的組成與構(gòu)建

        在本文所設(shè)計的語義擴(kuò)展搜索模型中,圖書館語義擴(kuò)展搜索的資源主要由數(shù)據(jù)庫、機構(gòu)知識庫和Web 資源組成。其中,圖書館現(xiàn)已建成的大量特色數(shù)據(jù)庫以及CALIS、CADAL、文化資源共享工程資源數(shù)據(jù)庫、商業(yè)數(shù)據(jù)庫組成了數(shù)量龐大、資源豐富的數(shù)據(jù)庫資源,也成為了語義擴(kuò)展搜索的主要數(shù)據(jù)來源。其次,語義擴(kuò)展搜索的第二大數(shù)據(jù)來源就是機構(gòu)知識庫。機構(gòu)知識庫是近年來高校等科研機構(gòu)與圖書館等信息中心實現(xiàn)學(xué)術(shù)資源開放獲取與知識服務(wù)的主要創(chuàng)新發(fā)展途徑之一,且自2003 年開放存取國際會議首次召開以來,機構(gòu)知識庫在不同的國家和地區(qū)均獲得了不同程度的發(fā)展,據(jù)開放獲取學(xué)術(shù)信息資源檢索的主要平臺OpenDOAR 統(tǒng)計,截至2012 年5 月6 日,歐洲的機構(gòu)知識庫數(shù)量達(dá)到了1022 個,北美洲有472 個機構(gòu)知識庫,南美洲有153 個機構(gòu)知識庫,澳洲有69 個機構(gòu)知識庫,非洲也有50 個機構(gòu)知識庫。而在亞洲,日本有137 個機構(gòu)知識庫,印度有54 個機構(gòu)知識庫,中國的機構(gòu)庫數(shù)量則為34 個。這些數(shù)據(jù)一方面說明已建成的機構(gòu)知識庫數(shù)量龐大,且在迅猛增加;另一方面也說明機構(gòu)知識庫在中國還未得到充分發(fā)展,未來發(fā)展?jié)摿薮?,同時由于其是科研機構(gòu)開放獲取服務(wù)與學(xué)術(shù)服務(wù)的未來發(fā)展趨勢之一,沒有是否是注冊用戶或IP 內(nèi)用戶的限制,因此利用其進(jìn)行的圖書館服務(wù)前景廣闊。在機構(gòu)知識庫的構(gòu)建中,我國圖書館界可充分借鑒廈門大學(xué)、 中科院國家科學(xué)圖書館等已建成知識庫的建設(shè)經(jīng)驗,充分利用現(xiàn)有系統(tǒng)開發(fā)平臺,建設(shè)具有自身特色與優(yōu)勢的知識庫,并在語義擴(kuò)展搜索中注重知識庫間的資源共享,達(dá)到豐富搜索資源的目的。再次,語義擴(kuò)展搜索資源的第三大組成部分是Web 資源。大數(shù)據(jù)時代的到來會極大豐富Web 資源的組成和存在形態(tài),其組成不僅有傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也將有產(chǎn)生于社交網(wǎng)絡(luò)、移動終端、消費場所等場合的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),因而未來的服務(wù)機構(gòu)所借助和分析的數(shù)據(jù)也將向這些外部數(shù)據(jù)轉(zhuǎn)移,企業(yè)將更多關(guān)注非傳統(tǒng)的數(shù)據(jù)類型和外部數(shù)據(jù)源。因此,當(dāng)圖書館越來越多的借助這些非傳統(tǒng)數(shù)據(jù)進(jìn)行資源的檢索時,其所得到的數(shù)據(jù)分析結(jié)果能為用戶解決問題的價值性、 知識性會極大提高。關(guān)于Web數(shù)據(jù)資源的構(gòu)建,目前對于大量的非機構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)還不夠成熟,但已有的Hadoop、NoSQL 等分布式系統(tǒng)架構(gòu)平臺的資源收集方式則為我們提供了思路。

        3 基于語義擴(kuò)展搜索的圖書館服務(wù)延伸與創(chuàng)新

        3.1 知識咨詢與挖掘服務(wù)

        網(wǎng)絡(luò)社交活動的頻繁及移動設(shè)備的大量使用,使得數(shù)據(jù)的產(chǎn)生、來源、類型變得簡單而豐富,越來越多的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)呈爆發(fā)式增長趨勢,且其組成結(jié)構(gòu)、類型格式、存在形態(tài)等都愈加復(fù)雜,整個社會發(fā)展進(jìn)入到了一個大數(shù)據(jù)時代,數(shù)據(jù)將成為社會資源的一部分被加以重視,基于數(shù)據(jù)的處理、分析、挖掘等都將被信息服務(wù)機構(gòu)所應(yīng)用和開展,這對承載著知識存儲、組織、開發(fā)與傳播重任的傳統(tǒng)圖書館及以文獻(xiàn)信息分析為基礎(chǔ)的咨詢服務(wù)工作造成了強烈沖擊。而基于語義的擴(kuò)展搜索,不僅能實現(xiàn)對所建知識庫、數(shù)據(jù)庫的關(guān)聯(lián)搜索引擎,還能實現(xiàn)對Web 資源的搜索、整理與分析,最終向用戶提供以用戶知識需求為起點、 以實現(xiàn)用戶知識價值增值為目標(biāo)、以動態(tài)、交互、連續(xù)的服務(wù)模式貫穿于知識咨詢與知識挖掘服務(wù)的全過程。

        3.2 可行性分析服務(wù)

        大數(shù)據(jù)時代的到來,使得Web 信息資源豐富而富有價值,圖書館服務(wù)的理念也將從以前追求數(shù)據(jù)分析較為簡單的信息咨詢等服務(wù)深化到以數(shù)據(jù)分析和挖掘為主的數(shù)據(jù)服務(wù),從數(shù)據(jù)的角度出發(fā)去挖掘其存在的價值,如企業(yè)決策的可行性分析。2012 年10 月23 日,著名信息技術(shù)研究和分析公司Gartner 認(rèn)為云計算、打包分析應(yīng)用和大數(shù)據(jù)將在未來加速發(fā)展,移動設(shè)備將能訪問數(shù)據(jù)和參與業(yè)務(wù)決策制定,可行性分析將成為未來科技發(fā)展的十大趨勢之一。基于語義的擴(kuò)展搜索,因其搜索了大量的Web 資源,如資源最豐富的五大數(shù)據(jù)資源社交圖譜、意向圖譜、消費圖譜、興趣圖譜和移動圖譜,因而能從數(shù)據(jù)和表面現(xiàn)象中去發(fā)現(xiàn)事實發(fā)展真像,進(jìn)而去預(yù)測事物在未來發(fā)展的趨勢,達(dá)到對現(xiàn)時決策的可行性分析。這種對決策、 行為進(jìn)行的可行性分析必將在圖書館的企業(yè)用戶服務(wù)如企業(yè)情報服務(wù)中發(fā)揮重要作用。

        3.3 用戶個人信息資源結(jié)構(gòu)的關(guān)聯(lián)、擴(kuò)展服務(wù)

        隨著信息技術(shù)的發(fā)展與信息資源存在結(jié)構(gòu)的日益豐富,特別是現(xiàn)代意義的數(shù)字圖書館出現(xiàn),使得圖書館不僅要實現(xiàn)對所藏信息資源本身的保存、加工與利用,對描述這些信息資源的著錄元數(shù)據(jù)、 關(guān)聯(lián)信息等也要進(jìn)行相應(yīng)存儲。圖書館為了服務(wù)與檢索便捷,一方面根據(jù)這些信息資源的表現(xiàn)形式、 內(nèi)容構(gòu)成進(jìn)行資源的分類,如根據(jù)學(xué)科、所屬年代的劃分與關(guān)聯(lián)鏈接,并對這些信息資源進(jìn)行元數(shù)據(jù)描述、標(biāo)注與相關(guān)知識關(guān)聯(lián)。同時,也根據(jù)信息資源表達(dá)內(nèi)容的層級結(jié)構(gòu)進(jìn)行資源的劃分與關(guān)聯(lián),如將表達(dá)和描述同一信息描述對象的資源既劃分為其所屬學(xué)科之中,又可按其描述單元的細(xì)化來切分為不同的若干信息。這些信息資源的歸類與關(guān)聯(lián),方便了圖書館資源的保存與利用,也有利于用戶的檢索,但圖書館目前只是對自身資源進(jìn)行如此分類,并沒有對用戶的檢索信息、私有資源進(jìn)行相關(guān)關(guān)聯(lián)與擴(kuò)展服務(wù),因此,在圖書館基于知識庫語義擴(kuò)展搜索實現(xiàn)后來提供此類服務(wù),如在信息咨詢、學(xué)科服務(wù)過程中,通過對語義擴(kuò)展搜索得到信息資源進(jìn)行關(guān)聯(lián)和擴(kuò)展,來全面表現(xiàn)用戶所擁有信息資源的著錄信息和結(jié)構(gòu)信息。

        3.4 基于圖書館知識社區(qū)的知識發(fā)現(xiàn)服務(wù)

        圖書館作為社會信息、知識存儲、加工和服務(wù)中心,一直以來在為用戶提供信息服務(wù)的過程中積累了豐富的經(jīng)驗,培養(yǎng)了一批批優(yōu)秀的信息服務(wù)專業(yè)人才,也擁有了其它社會機構(gòu)無法比擬的資源優(yōu)勢,因而也形成了一個集資源優(yōu)勢、 服務(wù)優(yōu)勢、 人才優(yōu)勢于一體的知識社區(qū)。Web、本體、XML、RDF、標(biāo)簽等技術(shù)產(chǎn)物的出現(xiàn),使得圖書館資源的共享、檢索、標(biāo)注與利用更加便捷,圖書館的服務(wù)環(huán)境走向信息化、 網(wǎng)絡(luò)化與語義化,信息用戶成為主體,通過創(chuàng)建個性化的書簽、標(biāo)簽等來整合用戶感興趣的信息資源,系統(tǒng)通過對用戶行為的跟蹤建立符合用戶偏好的動態(tài)認(rèn)知地圖,用戶在圖書館這個知識社區(qū)內(nèi)就可通過表達(dá)自己興趣愛好的關(guān)鍵詞、 自然語言來搜索引擎相關(guān)信息,最終實現(xiàn)知識的積累。IT 界則清晰的看到了用戶的這種需求和愿望,于是產(chǎn)生了以谷歌為代表的IT 搜索巨頭,并掀起了搜索引擎的發(fā)展熱潮,基于語義擴(kuò)展搜索的信息資源發(fā)現(xiàn)系統(tǒng)如ExLibris 公司的Primo、EBSCO公 司 的 EBSCO Discovery Service (EDS)、Innovative Interfaces 公司的Encore 等也相繼問世并投入到圖書館等信息服務(wù)機構(gòu)的用戶知識服務(wù)之中。在用戶需求的驅(qū)動下,圖書館界也不甘示弱,開發(fā)了一批基于圖書館知識社區(qū)的資源發(fā)現(xiàn)系統(tǒng),如OCLC 的一站式知識資源發(fā)現(xiàn)與服務(wù)系統(tǒng)Worldcat Local,提供了全世界近2 萬個圖書館的館藏紙質(zhì)資源和部分?jǐn)?shù)字資源的信息共17 億條。

        5 結(jié)語

        語義網(wǎng)和圖書館看似屬于不同領(lǐng)域,但因為之間存在的共性,隨著兩者之間的發(fā)展,語義網(wǎng)已被圖書館特別是數(shù)字圖書館所用。以信息服務(wù)為其存在價值體現(xiàn)的圖書館需在信息服務(wù)中加深檢索的語義含義理解,避免傳統(tǒng)以關(guān)鍵詞檢索為主的多次檢索,在信息搜索中引入語義擴(kuò)展搜索,無疑將對圖書館服務(wù)的延伸與創(chuàng)新帶來便捷與可行基礎(chǔ)。

        [1]劉幺和,李巧云.基于語義搜索的語音交互系統(tǒng)模型研究[J].計算機應(yīng)用,2009,29(7):1978-1980.

        [2]萬靜,王文聰,易軍凱.一種基于本體的知識庫語義擴(kuò)展搜索方法[J].計算機工程,2012,38(6):19-22.

        [3]席運江.組織知識的網(wǎng)絡(luò)表示模型及分析方法[D].大連:大連理工大學(xué),2007.

        [4]The Directory of Open Access Repositories-OpenDOAR[EB/OL].[2013-07-12].http://www.opendoar.org/.

        [5]Gartner:2013 年十大科技趨勢[EB/OL].[2013-07-12].http://www.ctocio.com/trend/9239.html.

        [6]司輝,成全,曹高輝.基于本體的語義數(shù)字圖書館知識檢索服務(wù)研究[J].情報理論與實踐,2009,32(1):113-116.

        [7]孫楊.OCLC Worldcat local 發(fā)展綜述[J].山東圖書館學(xué)刊,2011,(5):46-54.

        猜你喜歡
        知識庫檢索語義
        語言與語義
        2019年第4-6期便捷檢索目錄
        基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
        高速公路信息系統(tǒng)維護(hù)知識庫的建立和應(yīng)用
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        基于Drupal發(fā)布學(xué)者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        認(rèn)知范疇模糊與語義模糊
        語義分析與漢俄副名組合
        國際標(biāo)準(zhǔn)檢索
        成人国内精品久久久久一区| 国内精品久久久久久久97牛牛 | 国产一区二区三区白浆在线观看| 中文人妻无码一区二区三区| 日韩精品视频在线观看免费| 在线免费观看亚洲天堂av| 青青草手机在线观看视频在线观看| 91超精品碰国产在线观看| 精品久久久久久无码专区| 日本真人做人试看60分钟| 日躁夜躁狠狠躁2001| 日本动态120秒免费| 久久半精品国产99精品国产 | 国产在线一区二区av| 人妻熟妇乱又伦精品视频| 少妇内射兰兰久久| 色狠狠av老熟女| 久久免费视频国产| 亚洲中文字幕av天堂| 国产成人色污在线观看| av毛片亚洲高清一区二区 | 亚洲av永久无码精品漫画| 无码人妻av免费一区二区三区| 成年无码av片完整版| 九九久久国产精品大片| 亚洲国产精一区二区三区性色| 自拍偷区亚洲综合激情| av影院在线免费观看不卡| 亚洲日韩久久综合中文字幕| 人妻少妇精品中文字幕av蜜桃| 亚洲专区欧美| 国产成人精品无码一区二区老年人| 青青草最新在线视频观看| 国产亚洲中文字幕一区| 日日碰日日摸日日澡视频播放| 秘书边打电话边被躁bd视频| 久久精品无码免费不卡| 一级呦女专区毛片| 久久久精品国产视频在线| 白色月光免费观看完整版| 极品一区二区在线视频观看|