亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        試論網(wǎng)絡(luò)信息資源的組織方法和方式

        2013-12-31 00:00:00王淼
        經(jīng)濟(jì)研究導(dǎo)刊 2013年30期

        摘 要:探討幾種不同網(wǎng)絡(luò)信息資源的組織方法和方式,并對(duì)網(wǎng)絡(luò)信息資源組織的發(fā)展趨勢(shì)提出一些看法。

        關(guān)鍵詞:網(wǎng)絡(luò)信息資源;組織方法;方式

        中圖分類號(hào):G20 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2013)30-0280-03

        網(wǎng)絡(luò)信息資源就是依據(jù)互聯(lián)網(wǎng)傳播,它是由信息存儲(chǔ)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)通信技術(shù)與超文本、超媒體技術(shù)所支撐的信息資源。網(wǎng)絡(luò)信息資源組織就是通過(guò)一定的技術(shù)和手段,對(duì)網(wǎng)絡(luò)上產(chǎn)生和傳播的信息資源進(jìn)行搜集、整理,使之從無(wú)序到有序,便于用戶訪問(wèn)和使用的過(guò)程。隨著計(jì)算機(jī)技術(shù)的發(fā)展與完善,網(wǎng)絡(luò)上的信息量成幾何倍數(shù)在增加。我們知道網(wǎng)絡(luò)上信息傳播的速度和產(chǎn)生的速度已經(jīng)達(dá)到令人驚詫的地步,知道互聯(lián)網(wǎng)和正在利用互聯(lián)網(wǎng)的人都在成倍數(shù)地增加,但是隨之而來(lái)的不足和缺點(diǎn)也越來(lái)越突出,就是由于局部的有序性和整體的無(wú)序性、缺乏統(tǒng)一的標(biāo)準(zhǔn)和版權(quán)等問(wèn)題,許多信息用戶需要信息,但是他們卻不知道怎么在網(wǎng)絡(luò)上準(zhǔn)確地查找到自己所需要的信息,或者不能夠找全自己所需要的全部信息。因此對(duì)網(wǎng)絡(luò)信息資源的組織也越來(lái)越重要,如何改進(jìn)網(wǎng)絡(luò)信息資源的組織方式,提高信息的可利用率已經(jīng)迫在眉睫了。

        一、網(wǎng)絡(luò)信息資源的組織方法

        (一)分類組織法

        分類組織法主要是從宏觀的角度上揭示信息的內(nèi)涵,方便用戶的查詢和使用,其優(yōu)勢(shì)是首先可以限定檢索范圍,提高檢準(zhǔn)率。其次其等級(jí)結(jié)構(gòu)可以提供檢索詞的上下文,可以方便分類瀏覽。另外多媒體信息在網(wǎng)絡(luò)信息資源中的比例越來(lái)越大,其內(nèi)容特征難以用文字表達(dá),分類組織法的聚類功能及號(hào)碼標(biāo)識(shí)為之提供了一條解決途徑。但是由于網(wǎng)絡(luò)信息資源的新特點(diǎn),分類法也在進(jìn)一步的調(diào)整,增加新的類目,修訂類名,增加新的術(shù)語(yǔ)作為索引詞,控制類目的深度等。傳統(tǒng)文獻(xiàn)分類法如DDC、LCC、UDC,在網(wǎng)絡(luò)信息資源組織中被直接采用。自編分類系統(tǒng)也相繼出現(xiàn),其類型主要有以下三種:一是等級(jí)式主題分類系統(tǒng),如雅虎中國(guó)就是采用該方法建立其檢索系統(tǒng);二是分面組配分類系統(tǒng),如中文搜索引擎“中華網(wǎng)目”;三是學(xué)科分類系統(tǒng),如“網(wǎng)絡(luò)指南針”等。

        (二)主題分類法

        主題標(biāo)引是網(wǎng)絡(luò)信息資源組織的另一種主要模式。它是一種利用自然語(yǔ)言或規(guī)范語(yǔ)言對(duì)信息內(nèi)容進(jìn)行標(biāo)引的方法。主題法組織網(wǎng)絡(luò)信息資源一般分為以下幾種類型[1]:(1)使用關(guān)鍵詞法組織網(wǎng)絡(luò)信息,關(guān)鍵詞法就是將信息原來(lái)所用的、能描述其主題概念的那些具有關(guān)鍵性的詞抽出來(lái),不加規(guī)范或只作極少的規(guī)范化處理,按字順排列,以提供檢索途徑的方法。作為一種自然語(yǔ)言,關(guān)鍵詞能夠直觀揭示信息中所包含的知識(shí),并且不必查表選詞,不必依賴專業(yè)標(biāo)引人員,因而在網(wǎng)絡(luò)信息組織中得到了廣泛的應(yīng)用,各種搜索引擎和數(shù)據(jù)庫(kù)大多采用了此種方法;(2)使用敘詞法組織網(wǎng)絡(luò)信息。其主要是采用受控語(yǔ)言作為標(biāo)識(shí),來(lái)表達(dá)信息所論及的事物的主題,并將全部標(biāo)識(shí)按字順排列,且都有完善的參照系統(tǒng)來(lái)顯示主題概念間的關(guān)系。但是由于其需要專業(yè)的人員進(jìn)行編排,往往有些滯后,成本也高;(3)使用關(guān)鍵詞法與敘詞法相結(jié)合組織網(wǎng)絡(luò)信息。這種方法可以綜合利用兩者的優(yōu)點(diǎn),準(zhǔn)確地對(duì)信息資源進(jìn)行描述和組織。

        (三)元數(shù)據(jù)組織

        元數(shù)據(jù)的一般定義是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”(dataabout data)。元數(shù)據(jù)包括著錄項(xiàng)目和著錄格式兩個(gè)方面。網(wǎng)絡(luò)信息資源的元數(shù)據(jù)著錄項(xiàng)目已提出的有Dublin Core,VRA Core Categoriesfor Visual Resource,CDWA等。著錄格式有HTML和XML兩種[2]。元數(shù)據(jù)可以描述信息資源的特征,進(jìn)而對(duì)網(wǎng)絡(luò)信息資源進(jìn)行定位,有利于網(wǎng)絡(luò)信息資源的獲取。根據(jù)元數(shù)據(jù)所提供的描述信息,參照相應(yīng)的評(píng)估標(biāo)準(zhǔn),結(jié)合使用環(huán)境,用戶便能夠做出對(duì)信息對(duì)象取舍的決定,選擇適合用戶使用的資源。

        (四)基于語(yǔ)義的網(wǎng)絡(luò)信息組織

        XML是由W3C于1998年2月發(fā)布的一種描述任意文本結(jié)構(gòu)的標(biāo)準(zhǔn)。XML的目的是標(biāo)示網(wǎng)絡(luò)數(shù)據(jù)以供機(jī)器辨識(shí)跟處理,并且去除了多余的煩瑣的代碼。 XML的新特點(diǎn)是將數(shù)據(jù)的內(nèi)容與顯示格式分開(kāi),程序的開(kāi)發(fā)者可以根據(jù)自己的需要?jiǎng)?chuàng)建屬于自己的標(biāo)記,對(duì)信息進(jìn)行確切描述,并使用文檔類型定義(Document Type Definition,DTD)或XMLSchema來(lái)約束這些標(biāo)簽的結(jié)構(gòu)。

        其利用RDF實(shí)現(xiàn)信息之間的語(yǔ)義關(guān)聯(lián),RDF是一種描述和使用數(shù)據(jù)的方法,它提出了一個(gè)簡(jiǎn)單的數(shù)據(jù)模型,通過(guò)屬性(Property)和值(Value)來(lái)描述資源以及資源與資源之間的關(guān)系。RDF的實(shí)質(zhì)是一種二元表達(dá)關(guān)系,因?yàn)槿魏螐?fù)雜的關(guān)系都可以轉(zhuǎn)換成多個(gè)簡(jiǎn)單的二元關(guān)系來(lái)表示,所以RDF可以用簡(jiǎn)單的二元關(guān)系模型來(lái)表達(dá)復(fù)雜的關(guān)系模型。同時(shí),RDF還提供了一種基于XML語(yǔ)法的RDF圖[3]。如某單位A是資源A的創(chuàng)建者,具體表示(見(jiàn)下圖):

        二、網(wǎng)絡(luò)信息資源的組織方式

        (一)文件方式

        以文件方式組織網(wǎng)絡(luò)信息資源簡(jiǎn)單方便,由于計(jì)算機(jī)所處理的最終結(jié)果都是以文件方式保留在磁盤里,所以它可以存儲(chǔ)圖形、圖像、圖表、音頻、視頻等非結(jié)構(gòu)化信息,可以方便地利用文件系統(tǒng)來(lái)管理。技術(shù)簡(jiǎn)單,非常容易實(shí)現(xiàn),但是由于網(wǎng)絡(luò)的普及和信息量的增多,信息結(jié)構(gòu)較為復(fù)雜,這種方式難以實(shí)現(xiàn)有效控制和管理。

        (二)數(shù)據(jù)庫(kù)方式

        該方式指將所有獲得的信息資源按照固定的記錄格式存儲(chǔ),用戶通過(guò)關(guān)鍵字查詢,就可以找到所需信息線索,然后就可以鏈接相關(guān)的數(shù)據(jù)庫(kù),查獲相關(guān)的信息資源。利用數(shù)據(jù)庫(kù)技術(shù)對(duì)網(wǎng)絡(luò)信息資源進(jìn)行管理有很大的優(yōu)勢(shì):首先,數(shù)據(jù)庫(kù)技術(shù)利用嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)模型對(duì)信息進(jìn)行規(guī)范化處理,利用關(guān)系代數(shù)理論進(jìn)行信息查詢的優(yōu)化,提高了效率。其次,數(shù)據(jù)的最小存取單位是字段,可根據(jù)用戶需求靈活地改變查詢結(jié)果集的大小,從而大大降低了網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)呢?fù)載[4]。數(shù)據(jù)庫(kù)組織方法是目前網(wǎng)絡(luò)信息資源組織的普遍使用方法,特別是在數(shù)據(jù)量比較大的時(shí)候。

        (三)搜索引擎方式

        搜索引擎是一種以查詢?yōu)槟康牡木W(wǎng)絡(luò)信息資源組織方式,它通過(guò)網(wǎng)絡(luò)蜘蛛等爬行程序,將網(wǎng)絡(luò)上的信息資源或者是與某一個(gè)課題相關(guān)的站點(diǎn)收錄到自己的數(shù)據(jù)庫(kù)中,抽取關(guān)鍵詞并進(jìn)行索引,并提供檢索入口,將用戶輸入的詞語(yǔ)與數(shù)據(jù)庫(kù)中的信息資源相匹配,按照相關(guān)性高低將檢索結(jié)果輸出,呈現(xiàn)給用戶的一種程序。其特點(diǎn)是使用方便,操作簡(jiǎn)單,缺點(diǎn)是缺乏統(tǒng)一的規(guī)范,有時(shí)檢索的結(jié)果不能滿足用戶的需求。

        (四)主題指南方式

        主題指南方式綜合使用主題組織法與分類組織法,利用網(wǎng)絡(luò)的超鏈接技術(shù)將眾多的網(wǎng)絡(luò)信息資源以節(jié)點(diǎn)為基本單位組成檢索體系,其類目用主題詞標(biāo)識(shí),Yahoo就是一種代表性的主題指南。用戶檢索時(shí)從較大的類目開(kāi)始,通過(guò)超鏈的指引,逐層點(diǎn)擊瀏覽,直到所需信息。該方式的優(yōu)點(diǎn)是具有嚴(yán)密的系統(tǒng)性和良好的包容性和可擴(kuò)充性,能較好地滿足用戶的族性檢索要求,檢準(zhǔn)率高,特別適合建立專業(yè)性或?qū)n}性的網(wǎng)絡(luò)信息體系[5]。缺點(diǎn)是很難確定一個(gè)全面的范疇體系作基礎(chǔ),來(lái)涵蓋所有的網(wǎng)絡(luò)信息資源。另外用戶為了快速地查到自己所需的信息,還需要對(duì)相應(yīng)的體系結(jié)構(gòu)有一定的了解。

        (五)超媒體組織方式

        它是指以超文本與多媒體技術(shù)相結(jié)合而組織利用網(wǎng)上信息資源的方式,它是將文字、表格、聲音、圖像、視頻等多媒體信息以超文本方式組織起來(lái),使人們可以通過(guò)高度鏈接的網(wǎng)絡(luò)結(jié)構(gòu)在各種信息庫(kù)中自由航行,檢索到所需要的信息[6]。這種方式可組織各類媒體的信息,方便地描述和建立各媒體信息之間的語(yǔ)義聯(lián)系,并且其節(jié)點(diǎn)中的內(nèi)容可多可少,結(jié)構(gòu)可以任意伸縮,具有良好的包容性和可擴(kuò)充性。由于超媒體的諸多優(yōu)點(diǎn),使它成為了Internet上占主流地位的信息資源組織與檢索的方式。

        三、網(wǎng)絡(luò)信息資源組織的發(fā)展趨勢(shì)

        (一)實(shí)現(xiàn)信息資源組織標(biāo)準(zhǔn)化和規(guī)范化

        由于網(wǎng)絡(luò)信息資源的多樣性和存讀的開(kāi)放性,使得信息資源組織標(biāo)準(zhǔn)化和規(guī)范化有很大的難度。標(biāo)準(zhǔn)化主要包括編制和使用標(biāo)準(zhǔn)化的網(wǎng)絡(luò)分類表,制定和執(zhí)行標(biāo)準(zhǔn)化的標(biāo)引規(guī)則,從而使不同的標(biāo)引機(jī)構(gòu)對(duì)網(wǎng)絡(luò)信息的揭示和表達(dá)趨于一致[7]。目前,國(guó)際和國(guó)內(nèi)已先后頒布了多種相關(guān)標(biāo)準(zhǔn),如《分類表編制指南:方法示例》(ISOlR919)、《多語(yǔ)種分類表的版面設(shè)計(jì)》(ISO/R.1149)、《文獻(xiàn)工作—文獻(xiàn)審讀、主題分析與選定標(biāo)引詞的方法》(IS05693)等。

        (二)探索發(fā)展新的技術(shù)

        隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,一些新的發(fā)明也給了網(wǎng)絡(luò)信息資源組織以強(qiáng)有力的技術(shù)支持,但是都還不是很成熟,都需要進(jìn)一步的開(kāi)發(fā)和研究。(1)數(shù)據(jù)挖掘技術(shù)。它使用復(fù)雜的統(tǒng)計(jì)分析和模型技術(shù)從大量的數(shù)據(jù)或信息中抽取或識(shí)別出用戶需要的深層次信息。它既能挖掘數(shù)據(jù)又可挖掘文本。(2)自動(dòng)標(biāo)引技術(shù)。隨著信息時(shí)代的到來(lái),網(wǎng)絡(luò)信息資源急劇增加,利用人工對(duì)海量數(shù)據(jù)進(jìn)行標(biāo)引已經(jīng)成為不可能,因此自動(dòng)標(biāo)引技術(shù)的實(shí)現(xiàn)尤為重要。計(jì)算機(jī)對(duì)網(wǎng)絡(luò)信息資源進(jìn)行自動(dòng)標(biāo)引時(shí),或應(yīng)用網(wǎng)絡(luò)搜索軟件如Web spider(蜘蛛)、crawler(爬蟲(chóng))等來(lái)實(shí)現(xiàn)自動(dòng)標(biāo)引,或應(yīng)用人機(jī)結(jié)合標(biāo)引的方式進(jìn)行標(biāo)引。(3)信息推送技術(shù)。信息推送是網(wǎng)絡(luò)公司通過(guò)一定的技術(shù)標(biāo)準(zhǔn)或協(xié)議,從網(wǎng)上的信息源或信息制作商獲取信息,通過(guò)學(xué)習(xí)固定的頻道向用戶發(fā)送信息的新型的信息傳播系統(tǒng)。它能深刻地改變互聯(lián)網(wǎng)絡(luò)的傳播方式,并對(duì)信息采集、加工、利用和控制產(chǎn)生重大影響。(4)基于內(nèi)容的多媒體檢索技術(shù)。基于內(nèi)容的多媒體檢索技術(shù)是利用圖像/視頻內(nèi)容的特征進(jìn)行特征檢索。除了根據(jù)內(nèi)容的特征來(lái)進(jìn)行特征檢索的同時(shí)還提供了許多其他檢索手段,如可通過(guò)提供樣本圖像進(jìn)行相似性檢索,通過(guò)人機(jī)交互進(jìn)行瀏覽檢索等,這種技術(shù)融合了圖像理解技術(shù),拓寬了檢索的途徑,具有一定的人工智能技術(shù)。

        (三)分類、主題一體化

        分類法的族性檢索與主題法的特性檢索都是在檢索體系中所不可少的,它們各有自己的優(yōu)點(diǎn)與不足。在網(wǎng)絡(luò)信息資源的組織中應(yīng)該將二者組織在一起使用,Yahoo等搜索引擎均較好地將分類與主題檢索系統(tǒng)綜合在一起。分類、主題一體化是對(duì)分類法和敘詞表的術(shù)語(yǔ)、標(biāo)識(shí)、參照、索引等實(shí)施統(tǒng)一的控制,使二者有機(jī)地融為一體。敘詞表采用完整的參照系統(tǒng)、編制范疇表和詞族表,兩者有機(jī)地結(jié)合,可以相互補(bǔ)充。走分類主題一體化道路,克服分類檢索語(yǔ)言單純以學(xué)科聚類,主題語(yǔ)言單純以事物聚類的局限性。如可以在搜索引擎輸出關(guān)鍵詞檢索結(jié)果的同時(shí),列出相應(yīng)的分類途徑和相似上位類的站點(diǎn)或者資源,也可以選擇在搜索結(jié)果中二次檢索,這種方法既可以用關(guān)鍵詞進(jìn)行檢索,也保留了分類法的等級(jí)分類體系,較好地克服了了分類檢索與主題檢索各自的缺點(diǎn)。

        (四)自然語(yǔ)言與人工語(yǔ)言結(jié)合

        網(wǎng)絡(luò)檢索工具都采用自然語(yǔ)言標(biāo)引和檢索,這樣的結(jié)果是詞間的相互關(guān)系得不到揭示,同義詞和近義詞得不到控制,后控詞表可以很好地解決這樣的問(wèn)題,它既有規(guī)范語(yǔ)言的特點(diǎn),也十分地接近自然語(yǔ)言。網(wǎng)絡(luò)信息的特點(diǎn)和網(wǎng)絡(luò)用戶的多樣性,決定了自然語(yǔ)言更適合計(jì)算機(jī)網(wǎng)絡(luò)檢索。為此改進(jìn)的措施是自然語(yǔ)言和受控制語(yǔ)言一體化。自然語(yǔ)言以其成本低、方便用戶利用、處理時(shí)差短、檢索效率高等優(yōu)勢(shì)已將成為檢索的主流。然而人工語(yǔ)言的優(yōu)點(diǎn)也是自然語(yǔ)言所無(wú)法比擬的,促進(jìn)自然語(yǔ)言與人工語(yǔ)言互相取長(zhǎng)補(bǔ)短、共同發(fā)展應(yīng)成為檢索語(yǔ)言的研究發(fā)展方向。

        參考文獻(xiàn):

        [1] 畢靜.略論網(wǎng)絡(luò)信息資源的組織[J].晉圖學(xué)刊,2006,(2):5-7.

        [2] 臧國(guó)全,柯平,郭少友.虛擬圖書(shū)館中元數(shù)據(jù)研究[J].圖書(shū)館,2001,(1):23-25.

        [3] 劉瑛,黃奇.基于語(yǔ)義的網(wǎng)絡(luò)信息資源組織[J].信息系統(tǒng),2006,(1):112-114.

        [4] 施雁冰.網(wǎng)絡(luò)信息資源的組織[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2007,(17):82-83.

        [5] 鄧惠心,陳書(shū)華.論網(wǎng)絡(luò)信息資源組織[J].圖書(shū)館,2007,(5):78-80.

        [6] 徐險(xiǎn)峰.網(wǎng)絡(luò)信息資源組織的方式與方法[J].圖書(shū)館學(xué)刊,2006,(4):100-102.

        [7] 馬宏惠,路一.論網(wǎng)絡(luò)信息資源的組織[J].情報(bào)探索,2007,(8):54-56.

        Organization Methods in Network Information Resources

        WANG Miao

        (Nanyang Library,Nanyang 473000,China)

        Abstract:This paper investigates the methods of network information organization in some different ways.In the last,it introduces the development trends of etwork information resource organization.

        Key words:network information resource;organization method;ways

        99久久精品国产一区二区| 国产精品无套粉嫩白浆在线| 美女草逼视频免费播放| 中文字幕中文字幕在线中二区| 亚洲色大成网站www永久网站| 欧美黑人疯狂性受xxxxx喷水| 91精品91久久久久久| 国产精品又爽又粗又猛又黄| 强开小婷嫩苞又嫩又紧视频| 97夜夜澡人人爽人人喊中国片 | 日韩av一区二区无卡| 日本无遮挡真人祼交视频| 亚洲国产精品va在线播放| 国产综合自拍| 久久深夜中文字幕高清中文| 手机看片久久第一人妻| 少妇无码吹潮| 老熟妇Av| 一本到亚洲av日韩av在线天堂| 国产 高潮 抽搐 正在播放| 天堂影院一区二区三区四区| 国产精品国产午夜免费福利看| 中文字幕午夜精品一区二区三区| 无码aⅴ精品一区二区三区浪潮| 国产亚洲av人片在线观看| 国产精品美女久久久久浪潮AVⅤ| 国产剧情av麻豆香蕉精品| 让少妇高潮无乱码高清在线观看| 婷婷成人亚洲| 娇柔白嫩呻吟人妻尤物| 久久综合伊人有码一区中文字幕| 男人的天堂av网站| 精品无码国产污污污免费| 男女干逼视频免费网站| 黄片视频免费观看蜜桃| 国产福利一区二区三区在线观看| 精品午夜一区二区三区久久 | 欧美日韩中文制服有码| 国产一区二区三区色区| 91在线视频在线视频| 亚洲精品国偷拍自产在线麻豆|