亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會(huì)化標(biāo)注系統(tǒng)的語(yǔ)義標(biāo)簽資源導(dǎo)航構(gòu)建*

        2015-06-01 09:59:05胡改麗陳福集
        圖書(shū)館建設(shè) 2015年1期
        關(guān)鍵詞:關(guān)聯(lián)可視化語(yǔ)義

        陳 婷 胡改麗 陳福集

        (福州大學(xué)經(jīng)濟(jì)與管理學(xué)院 福建 福州 350108)

        社會(huì)化標(biāo)注系統(tǒng)的語(yǔ)義標(biāo)簽資源導(dǎo)航構(gòu)建*

        陳 婷 胡改麗 陳福集

        (福州大學(xué)經(jīng)濟(jì)與管理學(xué)院 福建 福州 350108)

        社會(huì)化標(biāo)簽的資源導(dǎo)航可以為用戶(hù)提供個(gè)性化的信息服務(wù)。主題圖不僅能解決一般社會(huì)化標(biāo)注系統(tǒng)中標(biāo)簽云的語(yǔ)義缺失和語(yǔ)義模糊問(wèn)題,還可以實(shí)現(xiàn)資源導(dǎo)航的可視化。基于社會(huì)化標(biāo)簽與主題圖技術(shù)的資源導(dǎo)航可通過(guò)以下3個(gè)步驟實(shí)現(xiàn):采集與預(yù)處理用戶(hù)標(biāo)簽;形成具有明確架構(gòu)和語(yǔ)義關(guān)系的知識(shí)網(wǎng)絡(luò);實(shí)現(xiàn)資源導(dǎo)航的可視化。

        社會(huì)化標(biāo)注系統(tǒng) 資源導(dǎo)航 主題圖 語(yǔ)義標(biāo)簽

        1 引 言

        社會(huì)化標(biāo)注系統(tǒng)在分類(lèi)學(xué)中又稱(chēng)自由分類(lèi)法,是用戶(hù)根據(jù)自身的認(rèn)知和需要,自由地隨社會(huì)情境選擇詞匯對(duì)資源進(jìn)行標(biāo)注,由此而形成的分布式系統(tǒng)。社會(huì)化標(biāo)注系統(tǒng)允許用戶(hù)自由地對(duì)文章、圖片、視頻等資源進(jìn)行標(biāo)注以形成標(biāo)簽,以實(shí)現(xiàn)用戶(hù)對(duì)網(wǎng)絡(luò)信息資源的分類(lèi)、檢索和共享。社會(huì)化標(biāo)簽作為一種用戶(hù)驅(qū)動(dòng)的資源組織機(jī)制,具有面向大眾、操作簡(jiǎn)單、共享互動(dòng)等特點(diǎn)和優(yōu)勢(shì),通過(guò)社會(huì)化標(biāo)簽,用戶(hù)可以連接到其他的資源,實(shí)現(xiàn)資源之間的鏈接與導(dǎo)航。因此,社會(huì)化標(biāo)注系統(tǒng)充分融合了用戶(hù)的認(rèn)知行為和信息組織行為,并因其社會(huì)性、自由性、大眾性、靈活性等優(yōu)勢(shì)為網(wǎng)絡(luò)用戶(hù)所青睞。但由于社會(huì)化標(biāo)簽之間是平等關(guān)系,其他分類(lèi)體系中最基本的詞間關(guān)系(如上位類(lèi)、下位類(lèi)等)在社會(huì)化標(biāo)注系統(tǒng)中均無(wú)法體現(xiàn),整個(gè)社會(huì)化標(biāo)注系統(tǒng)是靈活的扁平化平面結(jié)構(gòu)模式,加之一詞多義和同義詞現(xiàn)象,造成標(biāo)簽的多樣性、模糊性,標(biāo)簽的這些固有缺陷降低了社會(huì)化標(biāo)注系統(tǒng)的資源利用率。

        在這種背景下,如何充分挖掘用戶(hù)標(biāo)簽間的語(yǔ)義關(guān)系、構(gòu)建基于語(yǔ)義標(biāo)簽的資源導(dǎo)航、提高其資源檢索的查準(zhǔn)率和查全率,正在成為社會(huì)化標(biāo)注系統(tǒng)優(yōu)化的新生長(zhǎng)點(diǎn),也是情報(bào)學(xué)的研究熱點(diǎn)。

        社會(huì)化標(biāo)注系統(tǒng)知識(shí)導(dǎo)航是將系統(tǒng)資源聚類(lèi)的結(jié)果從邏輯上聯(lián)系起來(lái),采用可視化的資源組織和呈現(xiàn)方式將結(jié)果展示給用戶(hù)的過(guò)程[1]。國(guó)內(nèi)外關(guān)于社會(huì)標(biāo)注系統(tǒng)中知識(shí)導(dǎo)航的研究工作,主要集中在3個(gè)方面:①針對(duì)社會(huì)化標(biāo)注系統(tǒng)的核心要素——標(biāo)簽,基于其語(yǔ)義關(guān)系缺失和語(yǔ)義模糊性等固有缺陷,對(duì)標(biāo)簽云優(yōu)化機(jī)理進(jìn)行探討,以此為基礎(chǔ)嘗試構(gòu)建知識(shí)導(dǎo)航模型[2-5]。②在社會(huì)化標(biāo)注系統(tǒng)中,資源聚合是資源導(dǎo)航的前提,因此一部分研究工作通過(guò)剖析社會(huì)化標(biāo)注系統(tǒng)資源聚合機(jī)理,促進(jìn)資源聚合,進(jìn)而為實(shí)現(xiàn)人性化和多元化的資源導(dǎo)航提供思路[6-7]。③通過(guò)融合傳統(tǒng)知識(shí)組織方法與大眾分類(lèi)法的優(yōu)勢(shì),提高社會(huì)化標(biāo)注系統(tǒng)中資源的可查性,構(gòu)建混合性知識(shí)導(dǎo)航模型[8-9]。

        研究表明構(gòu)建社會(huì)化標(biāo)注系統(tǒng)中的知識(shí)導(dǎo)航是社會(huì)化標(biāo)注系統(tǒng)發(fā)展的必然趨勢(shì),正成為學(xué)術(shù)界廣泛關(guān)注的研究熱點(diǎn)。

        關(guān)于如何構(gòu)建社會(huì)化標(biāo)注系統(tǒng)的知識(shí)導(dǎo)航,國(guó)內(nèi)外的研究主要圍繞標(biāo)簽云導(dǎo)航展開(kāi),以?xún)?yōu)化標(biāo)簽云布局為研究起點(diǎn),說(shuō)明標(biāo)簽云是認(rèn)識(shí)社會(huì)化標(biāo)注系統(tǒng)中知識(shí)導(dǎo)航構(gòu)建的主流方式。仍舊不能解決用戶(hù)信息檢索中的“知識(shí)迷航”問(wèn)題,且上述研究大多是從理論上提出知識(shí)導(dǎo)航的構(gòu)建思路和原則,以期探索相適應(yīng)的可視化導(dǎo)航方式,尚未實(shí)現(xiàn)知識(shí)導(dǎo)航的可視化。

        然而無(wú)論采取何種資源聚合形式,實(shí)現(xiàn)與之相適應(yīng)的可視化資源導(dǎo)航模式是研究工作的落腳點(diǎn)。因此,在國(guó)內(nèi)外學(xué)者研究成果的基礎(chǔ)上,筆者以解決標(biāo)簽云語(yǔ)義關(guān)系缺失及由同義詞和一詞多義造成的語(yǔ)義模糊等問(wèn)題為研究起點(diǎn),提出融合主題圖技術(shù)與社會(huì)化標(biāo)簽構(gòu)建社會(huì)化標(biāo)注系統(tǒng)知識(shí)導(dǎo)航的研究思路,利用主題圖在知識(shí)組織中的語(yǔ)義完整性和知識(shí)關(guān)聯(lián)表達(dá)的靈活、易用性,以社會(huì)化標(biāo)簽為基礎(chǔ),構(gòu)建意義豐富、完整的知識(shí)語(yǔ)義網(wǎng)絡(luò),從實(shí)現(xiàn)主題知識(shí)關(guān)聯(lián)的視角優(yōu)化標(biāo)簽云,最終構(gòu)建一個(gè)融合社會(huì)化標(biāo)簽和主題圖的可視化導(dǎo)航模型。

        2 基于社會(huì)化標(biāo)簽與主題圖的資源導(dǎo)航模型

        融合社會(huì)化標(biāo)簽和主題圖技術(shù)的資源導(dǎo)航,可以充分利用標(biāo)簽在提供個(gè)性化信息服務(wù)上的優(yōu)勢(shì)以及主題圖技術(shù)較強(qiáng)的語(yǔ)義表達(dá)能力和可視化功能的特點(diǎn),克服標(biāo)簽云所缺失的語(yǔ)義表達(dá)功能。筆者從分析模型生成機(jī)理入手,設(shè)計(jì)研究方案,實(shí)現(xiàn)標(biāo)簽云融合主題圖技術(shù)與社會(huì)化標(biāo)簽的導(dǎo)航模型的轉(zhuǎn)化。

        2.1 模型生成機(jī)理分析

        通過(guò)分析主題圖技術(shù)的特點(diǎn)和社會(huì)化標(biāo)簽云導(dǎo)航在社會(huì)化標(biāo)注系統(tǒng)中的缺陷,明確二者在導(dǎo)航構(gòu)建中的角色與作用,可以明晰資源導(dǎo)航模型的生成機(jī)理。

        允許用戶(hù)自定義標(biāo)簽對(duì)資源進(jìn)行標(biāo)識(shí)而形成的標(biāo)注結(jié)果更符合大眾的需求,在此基礎(chǔ)上形成的信息檢索更人性化、社會(huì)化。但是用戶(hù)自定義標(biāo)簽也存在顯著的局限性,如缺乏層次性,僅僅基于用戶(hù)自定義標(biāo)簽,整個(gè)信息資源的組織結(jié)構(gòu)是若干個(gè)語(yǔ)詞形成的平面結(jié)構(gòu),難以揭示知識(shí)資源間的復(fù)雜關(guān)聯(lián);另外,由于多義詞和同義詞的存在,僅僅采用標(biāo)簽組織資源會(huì)造成表達(dá)概念的模糊性,產(chǎn)生大量“噪音”,降低信息分類(lèi)的準(zhǔn)確性。

        主題圖(Topic Map)作為一種新興的數(shù)字化資源組織技術(shù),主要用于描述信息資源知識(shí)結(jié)構(gòu)的數(shù)據(jù)格式,可以定位某一概念間的相互聯(lián)系,為信息資源結(jié)構(gòu)可互相轉(zhuǎn)換的信息描述提供一個(gè)標(biāo)準(zhǔn)的表示方法,即使用定義主題和主題之間關(guān)系的方法[10]。主題圖的組成要素包括主題(Topic)、關(guān)聯(lián)(Associations)、資源實(shí)體(Occurrence)、范圍(Scope)、標(biāo)記(Identity)、分面(Facet)等,可以將主題圖看作是一個(gè)由主題、關(guān)聯(lián)、資源實(shí)體3個(gè)核心要素組成的集合體。主題是對(duì)信息資源實(shí)體的具體化,是能夠反映現(xiàn)實(shí)事物特征及本質(zhì)的名詞;與主題相關(guān)聯(lián)的信息資源就是主題圖中的資源實(shí)體;關(guān)聯(lián)是主題圖中最有價(jià)值的部分,是描述主題間或主題與資源實(shí)體相互關(guān)系的元素,由于主題位于不同的上下文環(huán)境中,“范圍”就是用來(lái)描述上下文環(huán)境的概念[11]。主題圖將某一特定領(lǐng)域信息資源的知識(shí)結(jié)構(gòu)及其語(yǔ)義關(guān)聯(lián)用一定的方式揭示出來(lái),并以特定的方式顯示。主題圖的多層主題用于表達(dá)不同概念范圍的不同層次,不同層次主題之間的關(guān)聯(lián)體現(xiàn)了主題之間的隸屬關(guān)系。通過(guò)多層主題及其關(guān)聯(lián),可以適應(yīng)社會(huì)化標(biāo)注系統(tǒng)中資源知識(shí)結(jié)構(gòu)的復(fù)雜性。

        剖析主題圖和社會(huì)化標(biāo)簽的優(yōu)劣特點(diǎn),可發(fā)現(xiàn)二者具有互補(bǔ)性。

        (1)主題圖的多層主題結(jié)構(gòu)可以彌補(bǔ)社會(huì)化標(biāo)簽中的語(yǔ)義關(guān)系缺失的缺陷。主題圖的多層主題結(jié)構(gòu),從第1層到第n層代表主題的層次,主題的層級(jí)越小,說(shuō)明該主題概念的涵蓋范圍越??;層級(jí)越大,相對(duì)應(yīng)的主題概念涵蓋的范圍越大。上層的主題是涵蓋該層主題的“父主題”,而該層的下層主題則是“子主題”。這種明確、清晰的層級(jí)關(guān)系,自頂向下,層層相扣,正好可以用于表達(dá)社會(huì)化標(biāo)簽中上位類(lèi)、下位類(lèi)等詞間關(guān)系和標(biāo)簽間的語(yǔ)義關(guān)聯(lián),從而把扁平結(jié)構(gòu)的標(biāo)簽云轉(zhuǎn)化為具有層級(jí)結(jié)構(gòu)的語(yǔ)義標(biāo)簽知識(shí)網(wǎng)絡(luò)。

        (2)標(biāo)簽云中由于標(biāo)簽的一詞多義會(huì)造成語(yǔ)義模糊,主題圖的相關(guān)機(jī)制能夠有效降低標(biāo)簽云的語(yǔ)義模糊性。標(biāo)簽中存在一詞多義現(xiàn)象(如標(biāo)簽“PLA”既可以指“中國(guó)人民解放軍”,也可以指“聚酸乳”),為避免這一問(wèn)題,可以為標(biāo)簽賦予特征,使其在特定界限內(nèi)有效[12],在主題圖中把這種分配主題特定有效性的限定稱(chēng)為主題范圍(Scope)。例如,可以對(duì)范圍加以描述,用來(lái)描述上下文的環(huán)境概念,對(duì)于“PLA”這一標(biāo)簽,可以通過(guò)Scope將其限定在一定范圍內(nèi),即特定領(lǐng)域,可為其設(shè)定學(xué)科領(lǐng)域,用以明確其具體含義。

        (3)社會(huì)化標(biāo)簽中同義詞現(xiàn)象可能造成的語(yǔ)義模糊性問(wèn)題。對(duì)于同一資源,不同的用戶(hù)可能會(huì)用不同的標(biāo)簽進(jìn)行標(biāo)注,導(dǎo)致標(biāo)簽云中存在大量同義詞,從而造成資源分散并給用戶(hù)查找資源帶來(lái)不便。例如,用戶(hù)的資源需求為圖書(shū)《麥田的守望者》,但是大量用戶(hù)將該資源標(biāo)注為“王小波”,從而使標(biāo)簽云中該資源對(duì)應(yīng)的標(biāo)簽為“王小波”,導(dǎo)致用戶(hù)資源檢索的“信息迷航”。而主題圖提供了一個(gè)比較便利的手段為每個(gè)主題賦予多個(gè)基本名稱(chēng)(Base Names),用多個(gè)名稱(chēng)表示相同的概念,并根據(jù)不同的應(yīng)用環(huán)境為每個(gè)基本名稱(chēng)提供一個(gè)變量(Variants)。例如,標(biāo)簽“網(wǎng)絡(luò)輿情”,對(duì)應(yīng)的英文為“Internet public opinion”筆者設(shè)定其在默認(rèn)的Scope下顯示“王小波”,在英文Scope下顯示“Internet public opinion”,利用這種機(jī)制可根據(jù)格式、語(yǔ)言、學(xué)科領(lǐng)域、地理范圍及時(shí)間的差異,在不同的Scope下為同一概念定義不同的名稱(chēng),大大增強(qiáng)了標(biāo)簽的適用性。

        (4)標(biāo)簽云在標(biāo)引對(duì)象方面仍存在較大的局限性,主要表現(xiàn)為精確性較低。而主題圖中的資源指引(Occurrence)機(jī)制可將標(biāo)簽與所對(duì)應(yīng)的資源聚集在一起,能夠使用戶(hù)根據(jù)標(biāo)簽迅速定位相關(guān)資源,具體可以精確到網(wǎng)頁(yè)中的一張圖表或文本的某一行。

        (5)主題圖的合并機(jī)制能夠適應(yīng)社會(huì)化標(biāo)注系統(tǒng)中用戶(hù)分布式創(chuàng)建模式,可支持多用戶(hù)的協(xié)作,將其他用戶(hù)為資源添加的標(biāo)簽主題通過(guò)合并主題圖及時(shí)歸并到一起。

        實(shí)現(xiàn)社會(huì)化標(biāo)簽與主題圖技術(shù)的融合,創(chuàng)建基于標(biāo)簽主題的資源導(dǎo)航,既保留了社會(huì)化標(biāo)簽的優(yōu)勢(shì)(即符合用戶(hù)分類(lèi)的思維習(xí)慣),又借助于主題圖技術(shù)能夠?qū)⑷我鈴?fù)雜關(guān)系以結(jié)構(gòu)化方式清晰地揭示出來(lái)并進(jìn)行可視化展示,克服了標(biāo)簽間弱化的語(yǔ)義關(guān)聯(lián)問(wèn)題,由此構(gòu)建的資源導(dǎo)航有助于用戶(hù)對(duì)標(biāo)簽之間復(fù)雜關(guān)系的理解,主題圖的范圍和身份標(biāo)識(shí)機(jī)制允許同一概念有不同的表達(dá)形式及對(duì)同一概念不同表達(dá)形式的合并,能夠解決標(biāo)簽中一詞多義和同義詞造成的語(yǔ)義模糊問(wèn)題。因此,基于標(biāo)簽主題的資源導(dǎo)航可有效滿(mǎn)足用戶(hù)的資源組織和檢索需求,引導(dǎo)用戶(hù)在特定的知識(shí)組織架構(gòu)中漫游。

        2.2 資源導(dǎo)航的概念模型

        本文繼續(xù)提出資源導(dǎo)航的概念模型。社會(huì)化標(biāo)注系統(tǒng)中的信息資源,從類(lèi)型和組織形式看,有數(shù)據(jù)庫(kù)、電子圖書(shū)、電子期刊、網(wǎng)頁(yè)、多媒體資源等?;谥黝}標(biāo)簽的資源導(dǎo)航生成機(jī)理分析,筆者以社會(huì)化標(biāo)注系統(tǒng)中對(duì)旅游文獻(xiàn)的標(biāo)注情況為例,通過(guò)實(shí)現(xiàn)標(biāo)簽云到標(biāo)簽主題的轉(zhuǎn)換,提出基于標(biāo)簽主題的資源導(dǎo)航概念模型(見(jiàn)圖1)。

        在圖1中,資源實(shí)體層中的不同形狀表示不同類(lèi)型的信息資源,包括電子圖書(shū)、網(wǎng)頁(yè)等;連線(xiàn)表示主題間的關(guān)系,具體包括同層主題之間的關(guān)系和上下層主題間的關(guān)系;通過(guò)資源指引形式實(shí)現(xiàn)主題層與信息資源層之間的關(guān)聯(lián)。從模型中也可看到扁平結(jié)構(gòu)標(biāo)簽云的標(biāo)簽中缺失的語(yǔ)義關(guān)系(包括上位類(lèi)、下位類(lèi)等詞間關(guān)系和同義、近義關(guān)系)及資源鏈接借助于主題圖技術(shù)得到了有效補(bǔ)充。不同層的連線(xiàn)表達(dá)了標(biāo)簽間的隸屬關(guān)系,即上位類(lèi)、下位類(lèi)等詞間關(guān)系;同層中的連線(xiàn)表達(dá)了標(biāo)簽間的語(yǔ)義關(guān)聯(lián)。二者的融合在內(nèi)容和形式上都達(dá)到了高度統(tǒng)一,形成了一個(gè)關(guān)于阿壩卓克基土司官寨旅游資源的較完整的知識(shí)網(wǎng)絡(luò)。

        圖1 基于標(biāo)簽主題的資源導(dǎo)航概念模型

        3 具體實(shí)現(xiàn)方案

        3.1 用戶(hù)標(biāo)簽采集與預(yù)處理

        目前,社會(huì)化標(biāo)注的知識(shí)組織模式已被廣泛應(yīng)用于各類(lèi)資源型網(wǎng)站,只是標(biāo)簽的應(yīng)用程度、功能略有差異,商業(yè)性網(wǎng)站中的標(biāo)簽使用量較高[13]。

        豆瓣網(wǎng)是Web2.0網(wǎng)站中具有特色的社區(qū)網(wǎng)站,提供關(guān)于圖書(shū)、電影、音樂(lè)等作品的信息,目前注冊(cè)用戶(hù)超過(guò)5 000萬(wàn),包括豆瓣讀書(shū)、豆瓣電影和音樂(lè)[14]?!岸拱曜x書(shū)”融合了社會(huì)化標(biāo)簽的特征,網(wǎng)站用戶(hù)使用標(biāo)簽組織自己感興趣的網(wǎng)絡(luò)資源,因此,“豆瓣讀書(shū)”可看作一個(gè)典型的社會(huì)化標(biāo)注系統(tǒng)。筆者選取“豆瓣讀書(shū)”展示模型的構(gòu)建過(guò)程,從“豆瓣讀書(shū)”“最受關(guān)注圖書(shū)榜”中選取排名前30的圖書(shū),然后在每本圖書(shū)的豆瓣成員常用的標(biāo)簽列表中選取使用頻率最高的5個(gè)標(biāo)簽,得到一個(gè)容量為150的標(biāo)簽數(shù)據(jù)集樣本。限于篇幅,筆者僅列出部分標(biāo)簽(見(jiàn)表1)。

        表1 部分初始標(biāo)簽樣本

        3.2 模型的實(shí)現(xiàn)

        實(shí)現(xiàn)“豆瓣讀書(shū)”資源導(dǎo)航模型的重點(diǎn)、難點(diǎn)是從其信息資源特點(diǎn)、用戶(hù)標(biāo)注習(xí)慣、用戶(hù)需求3個(gè)角度定義主題類(lèi)型,并定義主題之間的關(guān)聯(lián),進(jìn)而建立本體,以形成具有明確架構(gòu)和語(yǔ)義關(guān)系的知識(shí)網(wǎng)絡(luò)。

        3.2.1 定義主題類(lèi)型

        分析“豆瓣讀書(shū)”中用戶(hù)標(biāo)簽的分布情況和圖書(shū)資源的特點(diǎn),筆者定義“書(shū)名”、“作者”、“類(lèi)型”、“標(biāo)題”、“學(xué)科領(lǐng)域”、“出版社”、“出版年”、“國(guó)家”8個(gè)主題類(lèi)型,在“類(lèi)型”主題下再定義“題材”和“體裁”兩個(gè)子類(lèi),作為兩個(gè)新的主題。筆者在對(duì)主題進(jìn)行提取后,將實(shí)驗(yàn)中采集到的標(biāo)簽樣本集分類(lèi)和歸類(lèi),確定每個(gè)主題下的標(biāo)簽實(shí)例,具體方法如下:

        書(shū)名:親愛(ài)的生活,練習(xí)一個(gè)人,時(shí)蔬小話(huà),偉大的博弈,貨幣戰(zhàn)爭(zhēng),飛鳥(niǎo)集,假面騎士。

        類(lèi)型:①體裁:專(zhuān)題,書(shū)信集,傳記;②題材:科幻,人生哲理,傳統(tǒng)文化,健康,軍事。

        作者:愛(ài)麗絲·門(mén)羅,王小波,泰戈?duì)?,阿瀾·盧。

        學(xué)科:中國(guó)文學(xué),教育,社會(huì)學(xué),經(jīng)濟(jì)學(xué),醫(yī)學(xué)。

        出版社:中信出版社,哈爾濱出版社,浙江文藝出版社。

        出版年:2005,2003,2010,2009。

        國(guó)家:中國(guó),挪威,印度。

        3.2.2 定義主題關(guān)聯(lián)

        要實(shí)現(xiàn)標(biāo)簽云到基于語(yǔ)義標(biāo)簽的資源導(dǎo)航模型的轉(zhuǎn)換,就必須揭示標(biāo)簽主題之間的語(yǔ)義關(guān)系,即在定義了“豆瓣讀書(shū)”中的主題類(lèi)型和實(shí)例后,要定義主題之間的關(guān)聯(lián)。在“豆瓣讀書(shū)”的標(biāo)簽集中,筆者歸納出以下5種主題關(guān)聯(lián):“屬于”、“相關(guān)”、“揭示”、“出版”、“創(chuàng)作”。

        (1)“屬于”關(guān)聯(lián),表達(dá)主題類(lèi)型“書(shū)名”和“國(guó)家”之間的語(yǔ)義關(guān)系,如“飛鳥(niǎo)集”屬于“印度”。此外,“作者”和“國(guó)家”,“書(shū)名”和“類(lèi)型”也具有“屬于”關(guān)聯(lián)。

        (2)“相關(guān)”關(guān)聯(lián)用來(lái)聯(lián)系主題“類(lèi)型”之間的關(guān)系,如標(biāo)簽“隨筆”和“散文”標(biāo)注的資源在內(nèi)容上可能存在較大的相關(guān)性;“傳記”也很有可能是一部“回憶錄”;“學(xué)科”之間也存在“相關(guān)”關(guān)系。

        (3)“揭示”關(guān)聯(lián)。作品大都揭示了某一學(xué)科領(lǐng)域的發(fā)展現(xiàn)狀或某種學(xué)科主題,因此,“書(shū)名”和“學(xué)科”之間存在“揭示”關(guān)聯(lián)。

        (4)“出版”關(guān)聯(lián)?!皶?shū)名”和“出版社”、“出版年”明顯是“出版”關(guān)聯(lián)。

        (5)“創(chuàng)作”關(guān)聯(lián)實(shí)現(xiàn)這兩個(gè)標(biāo)簽主題之間的語(yǔ)義關(guān)聯(lián),例如“王小波”和“麥田的守望者”、“泰戈?duì)枴焙汀帮w鳥(niǎo)集”。

        3.2.3 定義實(shí)體資源

        實(shí)體資源是描述某一主題的圖片、文本、網(wǎng)頁(yè)等信息資源,通過(guò)主題圖中的“資源指引”機(jī)制指引使用者鏈接到相關(guān)的信息資源、其存放處或存放形式。“豆瓣讀書(shū)”中的信息資源大多為圖書(shū),因此,本文構(gòu)建資源導(dǎo)航模型中的實(shí)體資源為圖書(shū)。

        3.3 基于語(yǔ)義標(biāo)簽的主題圖資源導(dǎo)航模型生成

        3.3.1 用Ontopoly實(shí)現(xiàn)模型可視化

        本文選用挪威Ontopia公司開(kāi)發(fā)的Ontopoly構(gòu)建基于語(yǔ)義標(biāo)簽的主題圖資源導(dǎo)航模型,將語(yǔ)義標(biāo)簽及其關(guān)系以圖形的方式展現(xiàn)給用戶(hù),輸出資源導(dǎo)航模型的可視化形式。通過(guò)主題圖可視化工具Vizigator,用戶(hù)可以通過(guò)圖形可視化直觀地瀏覽語(yǔ)義標(biāo)簽間潛在和顯在的知識(shí)關(guān)聯(lián)。

        3.3.2 基于語(yǔ)義標(biāo)簽的資源導(dǎo)航應(yīng)用

        在社會(huì)化標(biāo)注系統(tǒng)中,標(biāo)簽是用戶(hù)對(duì)感興趣的資源的描述、定位等相關(guān)信息,大量用戶(hù)在搜索、標(biāo)注的過(guò)程中,通過(guò)相互之間信息的碰撞與融合,最終使標(biāo)簽具有了社會(huì)性。因此,社會(huì)化標(biāo)注系統(tǒng)不僅是用戶(hù)添加關(guān)鍵詞的簡(jiǎn)單行為,而且是大量用戶(hù)對(duì)某些資源的特定看法的詞匯集,是一種綜合行為,通過(guò)這種綜合行為,社會(huì)化標(biāo)注系統(tǒng)建立了系統(tǒng)內(nèi)部的各種要素,包括信息資源、用戶(hù)、標(biāo)簽之間的關(guān)系網(wǎng)絡(luò)[15](見(jiàn)下頁(yè)圖2)。筆者以社會(huì)化標(biāo)注系統(tǒng)中的這種關(guān)系網(wǎng)絡(luò)為視角,闡述可視化的模型在資源導(dǎo)航中的應(yīng)用。

        (1)標(biāo)簽-標(biāo)簽網(wǎng)絡(luò)的可視化。用戶(hù)通過(guò)社會(huì)化標(biāo)注的行為,使標(biāo)簽、資源和用戶(hù)之間產(chǎn)生了一定的聯(lián)系,在拓?fù)渖闲纬删W(wǎng)絡(luò)結(jié)構(gòu),如標(biāo)簽之間通過(guò)對(duì)資源的標(biāo)注形成標(biāo)簽-標(biāo)簽網(wǎng)絡(luò)。用于標(biāo)注相同資源的標(biāo)簽在一定程度上具有相似的語(yǔ)義,標(biāo)簽之間的同現(xiàn)關(guān)系形成網(wǎng)絡(luò)結(jié)構(gòu)。例如,“威尼斯商人”的常用標(biāo)簽有“小說(shuō)”和“文學(xué)”,而標(biāo)簽“文學(xué)”和“小說(shuō)”有很大的相關(guān)性。從圖2中可看到“王小波全集”的標(biāo)簽-標(biāo)簽網(wǎng)絡(luò),該作品使用頻率較高的標(biāo)簽包括“文學(xué)”、“小說(shuō)”、“王小波”等,如果用戶(hù)想繼續(xù)獲取與該資源相關(guān)的其他資源,可點(diǎn)擊與其相關(guān)的標(biāo)簽,如點(diǎn)擊“小說(shuō)”,會(huì)發(fā)現(xiàn)一系列相關(guān)資源,包括“威尼斯商人”、“親愛(ài)的生活”、“三體全集”等。

        圖2 基于語(yǔ)義標(biāo)簽的知識(shí)網(wǎng)絡(luò)可視化

        (2)資源-資源網(wǎng)絡(luò)的可視化。經(jīng)常使用相同標(biāo)簽進(jìn)行標(biāo)注的不同資源之間也具有很大的相關(guān)性。例如,“飛鳥(niǎo)集”和“新月集”的高頻標(biāo)簽都包括“印度”、“泰戈?duì)枴焙汀霸?shī)集”,說(shuō)明作品“飛鳥(niǎo)集”和“新月集”具有很大的相關(guān)性,二者都是印度文學(xué)巨匠泰戈?duì)栐诓煌瑫r(shí)期創(chuàng)作的詩(shī)集。換句話(huà)說(shuō),社會(huì)化標(biāo)注系統(tǒng)中相同的高頻標(biāo)簽可以聚合不同用戶(hù)在相同分類(lèi)下的資源,形成資源-資源網(wǎng)絡(luò),而通過(guò)基于語(yǔ)義標(biāo)簽的主題圖資源導(dǎo)航模型可實(shí)現(xiàn)這種網(wǎng)絡(luò)的可視化。例如,圖2中“科幻”、“硬科幻”、“中國(guó)科幻”等標(biāo)簽從布局上看具有很大的相關(guān)性,而通過(guò)這些相關(guān)度高的標(biāo)簽聚集可將“假面騎士”和“三體全集”聚合在一起。

        (3)不同標(biāo)簽概念知識(shí)網(wǎng)絡(luò)可視化。通過(guò)定義不同的標(biāo)簽概念之間的語(yǔ)義關(guān)系,可將不同的標(biāo)簽概念進(jìn)行聚合,如通過(guò)“相關(guān)”關(guān)系將“科幻”、“硬科幻”、“科幻小說(shuō)”、“中國(guó)科幻”等標(biāo)簽進(jìn)行語(yǔ)義層面的聚合。通過(guò)不同標(biāo)簽概念間的聚合,可以實(shí)現(xiàn)資源的聚合,如點(diǎn)擊圖2中標(biāo)簽“硬科幻”,可看到該標(biāo)簽標(biāo)注的資源為“三體全集”,點(diǎn)擊“科幻”看到該標(biāo)簽標(biāo)注的資源為“假面騎士”,標(biāo)簽“硬科幻”與“科幻”通過(guò)“相關(guān)”關(guān)系可聚合資源“三體全集”和“假面騎士”。由此可見(jiàn),通過(guò)標(biāo)簽概念知識(shí)網(wǎng)絡(luò)實(shí)現(xiàn)了社會(huì)標(biāo)注系統(tǒng)中資源的聚合。

        以上社會(huì)化標(biāo)簽中形成的3種網(wǎng)絡(luò)的可視化,反映了用戶(hù)個(gè)性化的認(rèn)知,實(shí)現(xiàn)了社會(huì)化標(biāo)簽到語(yǔ)義標(biāo)簽的轉(zhuǎn)化,構(gòu)建了具有完整語(yǔ)義的知識(shí)網(wǎng)絡(luò),彌補(bǔ)了標(biāo)簽云的扁平化造成弱語(yǔ)義的缺陷;同時(shí)將標(biāo)簽間復(fù)雜關(guān)系以結(jié)構(gòu)化的方式清晰地揭示出來(lái),有助于用戶(hù)對(duì)復(fù)雜關(guān)系的理解。綜合社會(huì)化標(biāo)簽構(gòu)建標(biāo)簽語(yǔ)義網(wǎng)絡(luò),并利用這種語(yǔ)義網(wǎng)絡(luò)可視化構(gòu)建資源導(dǎo)航,是從用戶(hù)對(duì)資源的理解和認(rèn)知的角度對(duì)資源進(jìn)行的組織,這有助于縮短用戶(hù)查詢(xún)的時(shí)間,提高檢索效率,并能夠有效減少用戶(hù)在社會(huì)化標(biāo)注系統(tǒng)中進(jìn)行資源查找時(shí)的“信息迷航”。直觀的圖形檢索方式可以使用戶(hù)在瀏覽資源時(shí)形成資源結(jié)構(gòu)的整體印象,從宏觀上掌握知識(shí)結(jié)構(gòu)。用戶(hù)在對(duì)感興趣的知識(shí)內(nèi)容進(jìn)行資源讀取的同時(shí),可根據(jù)不同標(biāo)簽概念間的語(yǔ)義知識(shí)關(guān)聯(lián)擴(kuò)大知識(shí)面,實(shí)現(xiàn)跨學(xué)科領(lǐng)域的資源查找。

        3.3.3 基于語(yǔ)義標(biāo)簽的數(shù)字圖書(shū)館資源導(dǎo)航

        數(shù)字圖書(shū)館的出現(xiàn)打破了用戶(hù)資源獲取的時(shí)空界限,實(shí)現(xiàn)了館藏資源數(shù)字化。在“豆瓣讀書(shū)”中,用戶(hù)需要通過(guò)自定義標(biāo)簽組織自己的知識(shí)收藏,同時(shí)也可以通過(guò)標(biāo)簽主題來(lái)瀏覽和檢索被標(biāo)注了同一標(biāo)簽的信息資源,從而發(fā)現(xiàn)與自己興趣相近的用戶(hù),并與其進(jìn)行交流互動(dòng)。因此,“豆瓣讀書(shū)”的典型應(yīng)用——個(gè)人數(shù)字圖書(shū)館可以作為社會(huì)化標(biāo)注的典型代表。

        資源導(dǎo)航的重要意義在于將數(shù)字圖書(shū)館資源組織的結(jié)果以可視化的方式呈現(xiàn)給用戶(hù),并能滿(mǎn)足其個(gè)性化和多樣化的信息需求?;谥黝}圖技術(shù)構(gòu)建的語(yǔ)義標(biāo)簽系統(tǒng)能夠支持基于Tolog語(yǔ)言的資源請(qǐng)求和復(fù)雜的關(guān)系檢索。例如,用戶(hù)對(duì)既屬于“漫畫(huà)”又屬于“科幻”題材的資源進(jìn)行檢索,檢索語(yǔ)句如下:

        select $ resources from

        @1008(@726:@538, $resources:@394),

        @1008(@257:@538, $resources:@394),

        instance-of ($resources, $type),

        @1058 ($type:1060,@1125:@874) ?

        檢索結(jié)果為“假面騎士”,如果用戶(hù)繼續(xù)查找相關(guān)資源,點(diǎn)擊屬性“漫畫(huà)”或“科幻”,可得到全部相關(guān)資源。由此可見(jiàn),基于語(yǔ)義標(biāo)簽的資源導(dǎo)航系統(tǒng)能夠?qū)?shù)字圖書(shū)館的信息資源進(jìn)行有效的組織與整合,從用戶(hù)的認(rèn)知出發(fā)將分散、異構(gòu)、無(wú)序的信息資源組建成一個(gè)集成化、統(tǒng)一有序的系統(tǒng),實(shí)現(xiàn)數(shù)字資源之間的無(wú)縫鏈接;同時(shí)支持基于用戶(hù)認(rèn)知水平的資源檢索,提高了查準(zhǔn)率和查全率,有助于用戶(hù)發(fā)現(xiàn)相關(guān)資源集合,消除檢索時(shí)的“信息迷航”。

        4 結(jié) 語(yǔ)

        在Web2.0環(huán)境下,社會(huì)化標(biāo)注系統(tǒng)構(gòu)建資源導(dǎo)航問(wèn)題的求解是一個(gè)多值問(wèn)題,不同的視角下會(huì)出現(xiàn)不同的研究思路?;谡Z(yǔ)義標(biāo)簽的資源導(dǎo)航能夠有效提高社會(huì)化標(biāo)注系統(tǒng)中資源的可查找性,具有較強(qiáng)的實(shí)踐指向性,為社會(huì)化標(biāo)注系統(tǒng)中的資源聚合與導(dǎo)航提出了一種新的解決思路。這僅僅是研究的起點(diǎn),如何對(duì)標(biāo)簽的語(yǔ)義相關(guān)度進(jìn)行衡量,并結(jié)合相關(guān)度構(gòu)建更為精確的資源導(dǎo)航,最終實(shí)現(xiàn)跨系統(tǒng)的資源聚合與導(dǎo)航,將成為未來(lái)研究的重點(diǎn)。

        [1]楊 萌, 張?jiān)浦? 社會(huì)化標(biāo)注系統(tǒng)資源多維度聚合機(jī)理研究[J].圖書(shū)情報(bào)工作, 2013,57(15):126-131.

        [2]畢 強(qiáng), 周姍姍. 面向知識(shí)關(guān)聯(lián)的標(biāo)簽云優(yōu)化機(jī)理研究[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù), 2014,246(5):33-39.

        [3]Halpin H, Robu V, Shepherd H. The Complex Dynamics of Collaborative Tagging [C]//Proceedings of the 16th International Conference on World Wide Web. New York: ACM Press,2007: 211-220.

        [4]傅麗君. 社會(huì)化標(biāo)簽與分類(lèi)集成的信息導(dǎo)航結(jié)構(gòu)及其應(yīng)用研究[D]. 杭州:浙江理工大學(xué)經(jīng)濟(jì)管理學(xué)院, 2013:13-14.

        [5]Manish G, Rui L. An Overview of Social Tagging and Applications [J]. Social Network Data Analytics, 2011:447-296.

        [6]Ivan M,Cantadora C, Konstasb I, et al. Catagorising Social Tags to Improve Folksonomy-Based Recommendations[J]. Web Semantics: Science, Service and Agents on the World Wide Web, 2011,32(7):1-15.

        [7]張?jiān)浦? 楊 萌. Tax-folk混合導(dǎo)航:社會(huì)化標(biāo)注系統(tǒng)資源聚合的新模型[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2014,40(3):78-89.

        [8]Kiu C C, Eric T. TaxoFolk: A Hybrid Taxonomy-Folksonomy Structure for Knowledge Classification and Navigation[J]. Expert Systems with Applications,2011,38(5):6049-6058.

        [9]Heymann P, Koutrika G, Garcia-Molina H. Can Social Bookmarking Improve Web Search[C]//Proceedings of WSDM'08. New York:ACM Press,2008:195-206.

        [10]白新國(guó). 基于主題圖的教育文獻(xiàn)資源組織模型與應(yīng)用研究[D].武漢:華中師范大學(xué)教育信息學(xué)院, 2008:4-7.

        [11]艾丹祥, 張玉峰. 利用主題圖建立概念知識(shí)庫(kù)[J]. 圖書(shū)情報(bào)知識(shí), 2003,(2):48-50,53.

        [12]李清茂. 主題圖理論與應(yīng)用方法研究:以四川省阿壩州旅游文化資源組織為例[M]. 成都:四川大學(xué)出版社, 2011:7-19.

        [13]賈君枝, 張 寧. 社會(huì)標(biāo)簽的應(yīng)用功能分析[J]. 圖書(shū)情報(bào)工作, 2012,35(11):112-116.

        [14]豆瓣[EB/OL]. [2014-07-05]. http://www.douban.com.

        [15]武慧娟, 徐寶祥. 社會(huì)化標(biāo)注系統(tǒng)自組織演化機(jī)理研究[J]. 圖書(shū)情報(bào)工作, 2014,58(2):132-137.

        Construction on the Resource Navigation of the Semantic Label in the Social Tagging System

        The resource navigation of the social label could provide the personalized information service for users. The topic map could not only solve shortcomings of the tag cloud such as the semantic deletion and the semantic ambiguity in the general social tagging system, but also could be implemented the visualization of the resource navigation. The resource navigation based on the social label and the topic map technology could be implemented in following three steps: collecting and pretreating user labels; forming the knowledge network that has the clear structure and semantic relations; implementing the visualization of the resource navigation.

        Social tagging system; Resource navigation; Topic map; Semantic label

        G254.1

        B

        2014-08-04 ]

        *本文系國(guó)家自然科學(xué)基金項(xiàng)目“基于知識(shí)網(wǎng)格面向網(wǎng)絡(luò)輿情的政府決策知識(shí)供需匹配研究”的成果之一,項(xiàng)目編號(hào): 71271056。

        陳 婷 女,福州大學(xué)經(jīng)濟(jì)與管理學(xué)院碩士研究生,研究方向?yàn)樯鐣?huì)協(xié)同標(biāo)注的語(yǔ)義網(wǎng)絡(luò)挖掘,已發(fā)表論文7篇。胡改麗 女,福州大學(xué)經(jīng)濟(jì)與管理學(xué)院碩士研究生,研究方向?yàn)樯鐣?huì)化標(biāo)注系統(tǒng)的資源聚合機(jī)理,已發(fā)表論文4篇。陳福集 福州大學(xué)經(jīng)濟(jì)與管理學(xué)院教授,博士生導(dǎo)師,研究方向?yàn)閿?shù)字圖書(shū)館館藏資源的資源協(xié)同和服務(wù)協(xié)同研究,已發(fā)表論文100余篇。

        猜你喜歡
        關(guān)聯(lián)可視化語(yǔ)義
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        “苦”的關(guān)聯(lián)
        基于CGAL和OpenGL的海底地形三維可視化
        語(yǔ)言與語(yǔ)義
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        亚洲国产精品区在线观看| 久久亚洲国产中v天仙www| 国内精品久久久久国产盗摄 | 亚洲精品中文字幕熟女| 久久日日躁夜夜躁狠狠躁| 18禁黄久久久aaa片| 亚洲中文无码久久精品1| 亚洲人成伊人成综合网中文| 久久av不卡人妻出轨一区二区| 国产国产裸模裸模私拍视频| 亚洲最大中文字幕无码网站| 无码专区无码专区视频网址| 亚洲av调教捆绑一区二区三区| 国产亚洲精品美女久久久m| 老熟女高潮一区二区三区| 亚洲大片免费| 亚洲情久久久精品黄色| 亚洲av色香蕉一区二区三区| 国产精品白浆在线观看无码专区| 一区二区三区日本大片| 一区二区三区在线日本视频| 狠狠97人人婷婷五月| 中文字幕精品无码一区二区| 国产AV秘 无码一区二区三区| 午夜精品久久99蜜桃| 成人aaa片一区国产精品| 一本大道香蕉视频在线观看| 一区二区三区精品偷拍| 国产白浆一区二区三区性色| 变态 另类 欧美 大码 日韩| 亚洲色偷拍一区二区三区 | 三区中文字幕在线观看| 中文亚洲av片在线观看| 精品无码av不卡一区二区三区| 国产av黄色一区二区| 美女网站免费观看视频| 久久99精品久久久久久hb无码| 亚洲国产视频精品一区二区| 水蜜桃精品视频在线观看| 人妻av乱片av出轨| 福利网在线|