亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢(shì)

        2011-04-08 16:05:42黃振江李勇
        關(guān)鍵詞:信息檢索搜索引擎可視化

        黃振江,李勇

        (菏澤醫(yī)學(xué)??茖W(xué)校,山東菏澤 27400)

        網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢(shì)

        黃振江,李勇

        (菏澤醫(yī)學(xué)??茖W(xué)校,山東菏澤 27400)

        信息檢索;網(wǎng)絡(luò)技術(shù);發(fā)展趨勢(shì)

        信息時(shí)代的到來(lái)對(duì)社會(huì)發(fā)展、文明進(jìn)步和人類日常生活產(chǎn)生了重大而深遠(yuǎn)的影響。同時(shí)隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息檢索工作已經(jīng)由傳統(tǒng)的手工文獻(xiàn)檢索發(fā)展到智能檢索。認(rèn)清網(wǎng)絡(luò)信息檢索的現(xiàn)狀和發(fā)展趨勢(shì),掌握先進(jìn)的網(wǎng)絡(luò)信息檢索技術(shù),從浩如煙海的信息中找到所需的信息,已成為當(dāng)前重要而迫切的研究課題。

        1 什么是網(wǎng)絡(luò)信息檢索

        網(wǎng)絡(luò)信息檢索是由網(wǎng)絡(luò)站點(diǎn)、網(wǎng)頁(yè)瀏覽器和搜索引擎以及網(wǎng)絡(luò)支撐組成的檢索系統(tǒng),其中的核心部分,不是眾多站點(diǎn),而是網(wǎng)絡(luò)瀏覽器和具有收集、檢索功能的搜索引擎。眾多站點(diǎn)、網(wǎng)頁(yè)上的信息是網(wǎng)絡(luò)信息的基本組成部分[1]。在網(wǎng)絡(luò)發(fā)展初期,瀏覽器和簡(jiǎn)單的搜索引擎即可幫助人們檢索所需的文獻(xiàn)信息。瀏覽器瀏覽雖然方法簡(jiǎn)易、直接,但隨機(jī)性強(qiáng),耗時(shí)費(fèi)用較高,因此,更科學(xué)的方法是借助搜索引擎。搜索引擎是網(wǎng)絡(luò)信息的檢索工具,它可以幫助用戶快速搜索所需信息及其相關(guān)資料。

        2 幾種常規(guī)信息檢索技術(shù)

        從歷史上看,信息檢索經(jīng)歷了手工檢索、計(jì)算機(jī)檢索到網(wǎng)絡(luò)化、智能化檢索等多個(gè)發(fā)展階段。如今網(wǎng)絡(luò)信息檢索技術(shù)得到長(zhǎng)足發(fā)展。隨之,有如下檢索技術(shù)在日常生活中被廣泛應(yīng)用。

        2.1 全文檢索把文獻(xiàn)中出現(xiàn)的每一個(gè)詞(或字)都作為檢索入口的、基于全文標(biāo)引的檢索過(guò)程和技術(shù)。在全文檢索系統(tǒng)中,文獻(xiàn)中任何有檢索意義的詞或字串都可被檢索出來(lái)。

        全文檢索主要分為兩類:基于關(guān)鍵詞匹配的精確檢索和根據(jù)內(nèi)容的概念檢索。在實(shí)現(xiàn)技術(shù)上,全文檢索采用的算法主要有:1)全文掃描。2)倒排文件。3)位圖文件[2]。為了提高全文檢索的結(jié)果質(zhì)量,采用相關(guān)排序與相關(guān)反饋等技術(shù)。全文檢索的擴(kuò)展包括能利用文字來(lái)檢索多媒體信息,結(jié)合超文本技術(shù)及通過(guò)交互式的瀏覽和導(dǎo)航來(lái)改善檢索的效果。中文全文檢索可分為按字全文檢索與按詞全文檢索。按詞全文檢索具有檢索速度快、查準(zhǔn)率高等優(yōu)點(diǎn)。同時(shí),如果要利用較為高級(jí)的檢索技術(shù)如相關(guān)排序,則按詞建庫(kù)和檢索具有較大的優(yōu)越性。

        2.2 中文信息檢索將作為主要信息來(lái)源的中文文獻(xiàn)資料按一定的方式進(jìn)行組織、儲(chǔ)存、管理,并根據(jù)用戶的要求查找到所需信息的方法、技術(shù)和過(guò)程。中文信息檢索的主要內(nèi)容有:1)信息檢索建模。即采用何種方法表示文檔和檢索要求并計(jì)算它們之間的相關(guān)性。2)文獻(xiàn)處理。主要指自動(dòng)標(biāo)引、自動(dòng)分類和自動(dòng)文摘。3)基礎(chǔ)資源建設(shè)。包括停用詞表和主題詞表的構(gòu)造。4)實(shí)現(xiàn)技術(shù)。包括倒排文件結(jié)構(gòu)、位圖文件、散列索引、B樹索引等快速檢索技術(shù)。5)檢索效果評(píng)價(jià)體系。其中查全率(檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫(kù)中的相關(guān)文獻(xiàn)總量之比率)和查準(zhǔn)率(檢出的相關(guān)文獻(xiàn)量與檢出的文獻(xiàn)總量之比率)是最重要的兩個(gè)評(píng)價(jià)指標(biāo)。6)漢語(yǔ)自動(dòng)分析技術(shù)及其與中文信息檢索技術(shù)的結(jié)合。

        2.3 知識(shí)檢索全文檢索解決了一般非結(jié)構(gòu)化文字信息內(nèi)容的查詢問(wèn)題,有效解決了關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)不能很好查詢非結(jié)構(gòu)化信息的問(wèn)題,但是全文檢索的效果需要進(jìn)一步提高,其適應(yīng)不同應(yīng)用的能力還需要改進(jìn)。網(wǎng)絡(luò)檢索技術(shù)的發(fā)展核心是發(fā)展知識(shí)檢索,因此知識(shí)檢索的發(fā)展應(yīng)該能夠有效解決如下一些關(guān)鍵問(wèn)題。

        2.3.1 結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的混合檢索在電子商務(wù)應(yīng)用中,通常都需要系統(tǒng)能夠高效地解決結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的混合檢索問(wèn)題,如在一個(gè)人才數(shù)據(jù)庫(kù)查詢中,除了可以對(duì)人才的一些特征進(jìn)行查詢外,更重要的是對(duì)其簡(jiǎn)歷中的內(nèi)容進(jìn)行查詢,盡管有些產(chǎn)品具有混合檢索功能,但核心數(shù)據(jù)模型上都沒有很好地解決這個(gè)問(wèn)題,需要進(jìn)一步發(fā)展。

        2.3.2 智能檢索技術(shù)智能檢索技術(shù)就是采用人工智能進(jìn)行信息檢索的技術(shù)。它可以模擬人腦的思維方式,分析用戶以自然語(yǔ)言表達(dá)的檢索請(qǐng)求,自動(dòng)形成檢索策略進(jìn)行智能、快速、高效的信息檢索。智能檢索技術(shù)主要體現(xiàn)在語(yǔ)義理解、知識(shí)管理和知識(shí)檢索三個(gè)方面。它利用語(yǔ)義分析模塊自動(dòng)智能分詞,進(jìn)行用戶請(qǐng)求和知識(shí)庫(kù)“數(shù)據(jù)”的語(yǔ)義理解,最終把知識(shí)庫(kù)中匹配的信息篩選、整序后提供給用戶。

        2.3.3 多媒體檢索技術(shù)多媒體信息是文本、圖像、聲頻和視頻的混合體,多媒體信息檢索技術(shù)是信息檢索研究的熱點(diǎn)。多媒體信息檢索技術(shù)的關(guān)鍵是圖像、聲頻和視頻檢索技術(shù)。信息特征是聯(lián)系信息標(biāo)引與信息檢索的唯一橋梁,圖像、聲頻與視頻信息的檢索也是以其自身的形式與內(nèi)容特征描述為基礎(chǔ)。基于內(nèi)容的多媒體信息檢索技術(shù)的基理:a)計(jì)算機(jī)自動(dòng)抽取多媒體信息特征,編制多媒體信息特征倒排檔索引數(shù)據(jù)庫(kù)。b)從用戶接口獲得多媒體信息檢索標(biāo)識(shí),諸如輸入草圖、輪廓圖、音頻、鏡頭或從檢索庫(kù)中調(diào)用的相似多媒體信息。c)計(jì)算機(jī)“理解”用戶多媒體信息查詢請(qǐng)求標(biāo)識(shí)(查詢樣本)并與索引數(shù)據(jù)庫(kù)中的對(duì)象進(jìn)行相似匹配[3]。d)排序與輸出多媒體信息檢索結(jié)果。

        3 網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)

        時(shí)至今日,信息檢索的對(duì)象已從相對(duì)封閉、穩(wěn)定一致、由獨(dú)立數(shù)據(jù)庫(kù)集中管理的信息內(nèi)容擴(kuò)展到開放、動(dòng)態(tài)、更新快、分布廣泛、管理松散的Web內(nèi)容;信息檢索的用戶也由原來(lái)的情報(bào)專業(yè)人員擴(kuò)展到包括商務(wù)人員、管理人員、教師學(xué)生、各專業(yè)人士等在內(nèi)的普通大眾,他們對(duì)信息檢索從結(jié)果到方式提出了更高、更多樣化的要求。因此,適應(yīng)智能化、可視化以及個(gè)性化的需要是目前信息檢索技術(shù)發(fā)展的新趨勢(shì)。

        3.1 網(wǎng)絡(luò)檢索智能化近年來(lái),因特網(wǎng)上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網(wǎng)絡(luò)信息檢索的智能化程度,促進(jìn)智能信息檢索的發(fā)展。隨著網(wǎng)絡(luò)用戶對(duì)檢索的精度、檢索效率要求的不斷提高,網(wǎng)絡(luò)檢索軟件開發(fā)更重視開發(fā)檢索工具在檢索功能及檢索服務(wù)上的智能化程度。

        3.2 網(wǎng)絡(luò)檢索可視化由于網(wǎng)絡(luò)信息量爆炸帶來(lái)的檢索效率低的問(wèn)題越來(lái)越突出,而信息檢索的可視化優(yōu)勢(shì)又日趨顯現(xiàn),人們?cè)絹?lái)越多地認(rèn)識(shí)到設(shè)計(jì)和創(chuàng)建各種信息可視化工具來(lái)表示檢索結(jié)果,是改善目前網(wǎng)絡(luò)信息檢索的一種有效途徑。在可視化信息檢索的研究上,已出現(xiàn)了許多研究成果。最新的一項(xiàng)信息檢索可視化研究成果,是一種用于網(wǎng)絡(luò)知識(shí)發(fā)現(xiàn)的信息可視化和檢索集成工具----WIDAS。

        WIDAS(www Information Discovery Assistant System)的原理及功能:WIDAS是為實(shí)現(xiàn)信息可視化和檢索功能的集成,提高用戶在信息發(fā)現(xiàn)中的準(zhǔn)確性和效率而開發(fā)的一個(gè)網(wǎng)絡(luò)信息檢索的可視化工具[4]。其主要設(shè)計(jì)思想基于Lampling等人提出的雙曲線樹。網(wǎng)址的鏈接結(jié)構(gòu)通過(guò)3D雙曲線樹來(lái)表示,樹內(nèi)的一個(gè)節(jié)點(diǎn)(對(duì)應(yīng)一個(gè)網(wǎng)頁(yè))的高度表示用戶對(duì)該網(wǎng)頁(yè)的“興趣”[5]。在這里興趣是通過(guò)一個(gè)網(wǎng)頁(yè)和一個(gè)用戶提供的查詢(嵌套的關(guān)鍵詞)之間的匹配功能來(lái)計(jì)算的。這個(gè)方法可以用來(lái)過(guò)濾不感興趣的網(wǎng)頁(yè),減少鏈接結(jié)構(gòu)的規(guī)模。

        3.3 網(wǎng)絡(luò)檢索個(gè)性化Internet信息資源已經(jīng)發(fā)展成巨大的全球化信息空間,目前的眾多搜索引擎由于其自身的局限性,再加上Web信息的大容量、異構(gòu)性、分布性和動(dòng)態(tài)性,所提供信息的準(zhǔn)確度和關(guān)聯(lián)度未能達(dá)到所期待的目標(biāo)。新崛起的Agent技術(shù)正把被動(dòng)的搜索引擎變?yōu)榉e極的“個(gè)人助手”,它提供了一種完全不同的Web信息檢索模式,能滿足用戶個(gè)性化檢索需求,并能幫助用戶監(jiān)視、跟蹤所需信息,減少用戶的查詢負(fù)擔(dān)。因此,基于智能Agent的個(gè)性化信息檢索系統(tǒng)成為信息管理、計(jì)算機(jī)科學(xué)、人工智能等領(lǐng)域研究的熱點(diǎn)。

        智能Agent(Intelligent)是人工智能技術(shù)、分布式計(jì)算技術(shù)及神經(jīng)網(wǎng)絡(luò)技術(shù)等多門技術(shù)相結(jié)合的產(chǎn)物[6]。Agent是一個(gè)能在特定環(huán)境中連續(xù)和自主地運(yùn)行的軟件Agent實(shí)體,它還可包含更低層次的Agent。為提高信息服務(wù)的個(gè)性化特征,Agent必須收集用戶信息、維護(hù)用戶興趣模型和分析用戶特征,

        由網(wǎng)絡(luò)信息檢索現(xiàn)有技術(shù)對(duì)比可以看出,網(wǎng)絡(luò)信息檢索的智能化、可視化和個(gè)性化是其發(fā)展的必然趨勢(shì),也會(huì)對(duì)互聯(lián)網(wǎng)的發(fā)展、網(wǎng)絡(luò)信息資源建設(shè)和利用起到一個(gè)推動(dòng)作用。

        [1]宛文紅.數(shù)字圖書館多媒體信息檢索技術(shù)[J].圖書館工作與研究,2004(1):36-37.

        [2]褚亞萍.搜索引擎的現(xiàn)狀及分析[J].計(jì)算機(jī)與現(xiàn)代化,2001(5)11-12.

        [3]柳群英.網(wǎng)絡(luò)環(huán)境下的信息檢索技術(shù)[J].現(xiàn)代情報(bào),2003(9):16-17.

        [4]王玉波.多媒體信息檢索技術(shù)略論[J].情報(bào)科學(xué),1999(2)76-77.

        [5]向桂林.復(fù)合型Web信息檢索系統(tǒng)[J].情報(bào)學(xué)報(bào),2003(5)28-29.

        [6]王啟云.如何利用搜索引擎檢索網(wǎng)絡(luò)信息[J].現(xiàn)代圖書情報(bào)技術(shù),2001(4)22-23.

        G202

        A

        1008-4118(2011)02-0095-02

        2011-03-09

        10.3969/j.issn.1008-4118.2011.02.51

        猜你喜歡
        信息檢索搜索引擎可視化
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        久久国产精品免费一区六九堂 | 亚洲精品天堂av免费看| 女优视频一区二区三区在线观看| 开心激情网,开心五月天| 国产自拍偷拍精品视频在线观看 | 白浆高潮国产免费一区二区三区 | 成熟妇女毛茸茸性视频| 国产又色又爽无遮挡免费软件| 极品少妇被猛的白浆直喷白浆| 亚洲高潮喷水无码av电影| 精品国产免费久久久久久| 亚洲成生人免费av毛片| 看日本全黄色免费a级| 成人三级a视频在线观看| 亚洲AV无码国产成人久久强迫| 在线无码免费看黄网站| 加勒比久久综合久久伊人爱| 亚洲 欧美 国产 制服 动漫| 亚洲av无码乱码国产精品fc2| 国产欧美一区二区成人影院| 台湾自拍偷区亚洲综合| 一二三区无线乱码中文在线| 亚洲av无码专区首页| 国产偷国产偷高清精品 | av天堂午夜精品一区| 99久久国产福利自产拍| 国产在线欧美日韩一区二区| 中文字幕中文字幕三区| 精品日韩亚洲av无码| 欧美巨大xxxx做受中文字幕| 欧美亚洲国产丝袜在线| 国产91成人精品高潮综合久久| 国产成人精品日本亚洲专区61| a级特黄的片子| 久久精品国产免费观看99| 少妇我被躁爽到高潮在线影片| 国产精品久久免费中文字幕| 男女车车的车车网站w98免费| 亚洲一区爱区精品无码| 亚洲一区二区国产精品视频| 草逼动态图视频免费观看网站 |