亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會(huì)化標(biāo)注系統(tǒng)的標(biāo)簽語義檢索研究綜述

        2011-04-29 00:00:00宣云干朱慶華鞠秀芳
        現(xiàn)代情報(bào) 2011年2期

        [摘要]社會(huì)化標(biāo)注系統(tǒng)中標(biāo)簽的語義模糊性和形式不規(guī)范使得資源管理與共享越來越困難,為準(zhǔn)確定位標(biāo)簽語義,文章從擴(kuò)展標(biāo)簽語義與涌現(xiàn)標(biāo)簽語義兩個(gè)方面,對(duì)標(biāo)簽語義檢索研究現(xiàn)狀進(jìn)行了綜述,分析了社會(huì)化標(biāo)注系統(tǒng)中標(biāo)簽語義檢索的研究動(dòng)態(tài)和不足,并總結(jié)得出可計(jì)算性高、可操作性強(qiáng)、能智能獲取標(biāo)簽的語義關(guān)系是社會(huì)化標(biāo)注系統(tǒng)標(biāo)簽語義檢索的未來研究方向。

        [關(guān)鍵詞]標(biāo)簽;標(biāo)注;社會(huì)化標(biāo)注系統(tǒng);標(biāo)簽檢索;標(biāo)簽語義;語義檢索

        [中圖分類號(hào)]G354.47 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2011)02-0174-04

        構(gòu)建社會(huì)化標(biāo)注系統(tǒng)的初衷是為方便個(gè)人對(duì)網(wǎng)絡(luò)信息資源的管理,后來越來越多的用戶用標(biāo)簽對(duì)資源進(jìn)行描述、分類和檢索,表現(xiàn)出了足夠的社會(huì)效應(yīng),便逐漸發(fā)展成為重要的資源組織與共享平臺(tái)。但不同用戶認(rèn)知程度不同,對(duì)標(biāo)簽詞義的理解各異,造成標(biāo)簽的模糊和不規(guī)范,單憑標(biāo)簽的定位與匹配很難準(zhǔn)確、便捷的得到用戶所需,給資源管理與共享帶來很大困難,所以標(biāo)簽的語義檢索近幾年成為社會(huì)化標(biāo)注系統(tǒng)的研究熱點(diǎn)。

        語義檢索是基于知識(shí)與語義的匹配,在提高檢索的查準(zhǔn)率和查全率方面有很好的表現(xiàn),筆者檢索了社會(huì)化標(biāo)注系統(tǒng)標(biāo)簽語義檢索領(lǐng)域的相關(guān)文獻(xiàn),發(fā)現(xiàn)普遍思路是通過增強(qiáng)標(biāo)簽的語義信息來提高檢索能力,研究主要分兩個(gè)方向:一是利用受控詞表、樹或本體通過標(biāo)簽的智能擴(kuò)展,增強(qiáng)標(biāo)簽規(guī)范性,減少模糊性來提高提問式和資源集的匹配度。二是利用概率統(tǒng)計(jì)、無向權(quán)圖、共現(xiàn)矩陣等向量空間模型,從標(biāo)注系統(tǒng)中提取出標(biāo)簽涌現(xiàn)語義。下面對(duì)這方面的研究進(jìn)行綜述,以期掌握標(biāo)簽語義檢索的研究動(dòng)態(tài)和趨勢(shì)。

        1. 擴(kuò)展標(biāo)簽語義

        1.1 利用語義工具

        研究者認(rèn)為,用分類法模式來組織標(biāo)簽,對(duì)確定標(biāo)簽的含義非常有幫助,如利用WordNet返回標(biāo)簽所屬的類,幫助檢查該標(biāo)簽是否與內(nèi)容屬于同一類,或用WordNet將相關(guān)標(biāo)簽建立語義層級(jí),這一方法對(duì)解決標(biāo)簽同義較為有效,對(duì)歧義問題則幫助不大。還有研究者利用軟件OMCS以及Conceptnet,將標(biāo)簽擴(kuò)展為幾個(gè)相同的概念,然后再進(jìn)行相應(yīng)的查找,并對(duì)查找結(jié)果進(jìn)行打分,進(jìn)而得到相應(yīng)的結(jié)果。Yusef提出一個(gè)把海量標(biāo)簽集合轉(zhuǎn)換成層次的分類標(biāo)簽樹的方法,以便用戶的檢索和導(dǎo)航。

        有研究者將多種工具結(jié)合使用,來確定標(biāo)簽所屬概念及其間關(guān)系,如使用在線詞典與本體資源將標(biāo)簽繪制成概念、屬性以及例子,確定已繪制標(biāo)簽間的關(guān)系。也有研究者將目標(biāo)標(biāo)簽的鄰居標(biāo)簽吸納進(jìn)來,在選擇維基中的解釋文本時(shí),選擇鄰居標(biāo)簽總頻率發(fā)生最高的那個(gè)文本,進(jìn)而建立標(biāo)簽與概念的對(duì)應(yīng)庫。Ronzano則將研究提升到了新的高度,認(rèn)為資源是由概念組成,而概念又是由關(guān)鍵詞(標(biāo)簽)組成,因此通過維基,將文章作為資源,文章標(biāo)題作為概念,再將文章標(biāo)題與內(nèi)容中提取的詞作為關(guān)鍵詞,建立Syntag庫,該庫由概念與關(guān)鍵詞組成,可以消除歧義,更加全面的表達(dá)概念。

        有研究者則自己開發(fā)工具來擴(kuò)展語義,如Marchetti通過開發(fā)一個(gè)新的基于語義的系統(tǒng)SemKey,對(duì)當(dāng)前的標(biāo)注系統(tǒng)加以概念上的擴(kuò)展,在該系統(tǒng)中,標(biāo)簽被分為三類關(guān)系:hasAsTopcic,hasAsKind,myOpinionls,用戶需要指出其所標(biāo)注與內(nèi)容關(guān)系屬性,同時(shí),Semkey也通過WordNet來減少歧義。也有學(xué)者提出對(duì)用戶的自定義標(biāo)簽再添加可控標(biāo)簽。即標(biāo)簽的標(biāo)簽,筆者認(rèn)為該方法不僅成本高,而且并不十分有效。

        1.2 利用本體技術(shù)

        社會(huì)化標(biāo)注系統(tǒng)中標(biāo)簽數(shù)據(jù)體現(xiàn)了群體智慧,具有不規(guī)范和非形式化的特性,使用本體對(duì)這些數(shù)據(jù)進(jìn)行形式化的描述,可以從中提取出豐富的語義信息。Tom Gruber最初提出標(biāo)簽本體的思想,設(shè)計(jì)了基于標(biāo)簽構(gòu)建本體的概念模型,Davis開展了更進(jìn)一步的研究,提取出描述網(wǎng)絡(luò)資源的標(biāo)簽,并自動(dòng)的將其映射為相應(yīng)的預(yù)定義領(lǐng)域本體。

        一些研究用本體的思想規(guī)范化標(biāo)簽,如將標(biāo)簽結(jié)構(gòu)化,使標(biāo)簽信息更為具體,或?qū)?biāo)簽的信息定義為包括主體、客體以及兩者間的關(guān)系。還有用本體將標(biāo)簽進(jìn)行層級(jí)化表示,具體到上下層級(jí)之間的特定關(guān)系,進(jìn)而幫助用戶尋找相關(guān)的資源。

        另一些研究者對(duì)標(biāo)簽本體思想進(jìn)行了深化,通過建立一個(gè)類似維基的體系,將本體編輯的任務(wù)交給大眾,或者認(rèn)為社會(huì)化標(biāo)注是一種“社會(huì)化的本體”,本體的構(gòu)建不需要再依賴于專家,而可以從豐富的用戶數(shù)據(jù)中提取。Jose開發(fā)出了一個(gè)基于語義網(wǎng)技術(shù)和社會(huì)化標(biāo)注相結(jié)合的平臺(tái),將不同領(lǐng)域細(xì)節(jié)本體聯(lián)合,用戶可以添加元數(shù)據(jù)到資源中,同時(shí)協(xié)同標(biāo)注資源,該系統(tǒng)利用聯(lián)合不同元數(shù)據(jù)搜索引擎來定位期望的資源,通過本體和標(biāo)簽提供瀏覽能力。Haklackin在語義層面上討論數(shù)種社會(huì)化標(biāo)簽系統(tǒng)標(biāo)注的方法,提出一個(gè)標(biāo)簽協(xié)作標(biāo)注和設(shè)計(jì)的民俗分類法的概念模型,同時(shí)比較已有的標(biāo)簽本體,提出一個(gè)評(píng)價(jià)標(biāo)準(zhǔn)。

        2. 涌現(xiàn)標(biāo)簽語義

        2.1 利用概率論

        這一方法是通過將用戶的標(biāo)注行為用一個(gè)概率生成模型加以表示和處理,自動(dòng)的得到標(biāo)簽的涌現(xiàn)語義,實(shí)現(xiàn)同義與多義標(biāo)簽的識(shí)別和區(qū)分。Wu運(yùn)用概率論方法挖掘潛藏在用戶、資源和標(biāo)簽共現(xiàn)頻率中的潛在語義。Pasquale通過大眾分類提出一個(gè)支持用戶標(biāo)注資源的新途徑,利用概率技術(shù)來加速精確地決定兩個(gè)標(biāo)簽的相似度和概括度,提出兩個(gè)等級(jí)結(jié)構(gòu)和兩個(gè)相關(guān)算法,在一個(gè)等級(jí)里安排語義相關(guān)的標(biāo)簽組,這樣可以讓用戶根據(jù)期望的語義粒度顯現(xiàn)他們感興趣的標(biāo)簽,幫助他們發(fā)現(xiàn)最能表達(dá)他們信息需求的標(biāo)簽。

        2.2 利用圖論

        運(yùn)用圖論研究社會(huì)化標(biāo)注系統(tǒng)中的語義也較為多見,被廣泛應(yīng)用于研究社會(huì)化標(biāo)簽系統(tǒng)的語義結(jié)構(gòu),Heymann等通過將標(biāo)簽作為點(diǎn),標(biāo)簽相似度為邊,建立相應(yīng)的無權(quán)圖,將大量的標(biāo)簽轉(zhuǎn)化為可導(dǎo)航的層次結(jié)構(gòu)的分類法,將標(biāo)簽按其所標(biāo)注的資源的次數(shù)表示成向量的形式,同時(shí)用余弦相似性計(jì)算不同標(biāo)簽的相似性,并給定相應(yīng)閾值,就可以得到標(biāo)簽的相似圖,進(jìn)而得到潛在層級(jí)的分類法。Begelman統(tǒng)計(jì)了基于資源的標(biāo)簽共現(xiàn),并利用分離點(diǎn)去除弱關(guān)聯(lián)的標(biāo)簽,將強(qiáng)關(guān)聯(lián)的標(biāo)簽表示成無向權(quán)圖。運(yùn)用聚類分析得到層次性。

        2.3 利用共現(xiàn)網(wǎng)絡(luò)

        Halpin對(duì)高出現(xiàn)頻率標(biāo)簽形成的共現(xiàn)網(wǎng)絡(luò)進(jìn)行分析,指出可以利用這些高頻標(biāo)簽與其他標(biāo)簽的關(guān)系,確定目標(biāo)標(biāo)簽的意義。Specia建立共現(xiàn)矩陣來劃分標(biāo)簽簇,使用在線詞典以及本體資源將標(biāo)簽繪制成概念、屬性以及例子,并確定已繪制標(biāo)簽間的關(guān)系。還有研究也是對(duì)高出現(xiàn)頻率標(biāo)簽形成的共現(xiàn)網(wǎng)絡(luò)進(jìn)行分析,指出可以利用這些高頻標(biāo)簽與其他標(biāo)簽的關(guān)系,確定目標(biāo)標(biāo)簽的意義。

        2.4 其他方法

        Aurnhammer等的研究較為初步,主要是給出了一個(gè)相似度搜索模型,可以讓用戶得到在概念上相關(guān)的數(shù)據(jù)。同樣的,通過概念作為過渡,Hsieh方法化了如何將標(biāo)簽分層級(jí),實(shí)現(xiàn)了提高檢全率的同時(shí)又不過多損失檢準(zhǔn)率…。Zhou應(yīng)用確定性退火算法,提出從社會(huì)化標(biāo)簽中自動(dòng)提取出層次性語義的相關(guān)模型,有效的反映語義概念和層級(jí)間的關(guān)系。

        3. 討論

        利用本體或受控詞庫來確定標(biāo)簽的類屬關(guān)系,以加強(qiáng)標(biāo)注規(guī)范性,在標(biāo)注時(shí)推薦標(biāo)簽,這有利于有能力提供更多的檢索詞的檢索者。但這些工具的建設(shè)仍需要大量的人工參與,完備性不夠,同時(shí),采用導(dǎo)航的方式進(jìn)行概念擴(kuò)展和匹配,可計(jì)算性不高,建立提問式與資源集的語義關(guān)系比較困難,應(yīng)用效果不理想。

        采用共現(xiàn)矩陣、無向權(quán)圖等傳統(tǒng)語義向量分析方法從標(biāo)注系統(tǒng)中涌現(xiàn)出標(biāo)簽語義,將資源內(nèi)容表示成標(biāo)簽項(xiàng)及其權(quán)重的向量,形成標(biāo)簽——資源矩陣或圖,使得各種數(shù)學(xué)處理成為可能。這樣做的缺點(diǎn)是兩個(gè)不包含共同標(biāo)簽的資源其相關(guān)度為0,而沒有考慮到詞形不同的標(biāo)簽間仍然存在語義關(guān)系,用互不相關(guān)的向量代表標(biāo)簽這一點(diǎn)本身與人對(duì)標(biāo)簽的認(rèn)知不符,無法分辨自然語言的語義模糊性,且當(dāng)資源集較大時(shí),形成的向量維度較大,計(jì)算困難。

        在社會(huì)化標(biāo)注系統(tǒng)中,存在潛在的語義結(jié)構(gòu)支配標(biāo)簽的出現(xiàn)和資源的構(gòu)成,一個(gè)包含語義的資源出現(xiàn)在以標(biāo)簽為維度的空間中,其分布服從某種語義結(jié)構(gòu),一個(gè)標(biāo)簽出現(xiàn)在某個(gè)資源中也同其它出現(xiàn)在該資源中的標(biāo)簽有密切的聯(lián)系,這體現(xiàn)了“標(biāo)簽——資源”雙重概率關(guān)系。因此筆者認(rèn)為標(biāo)簽和資源在語意空間的位置可以用來作為一種語意指引,如果能夠找到一種方法自動(dòng)提取出這種語義結(jié)構(gòu),將標(biāo)簽和資源以可計(jì)算性高、可操作性強(qiáng)、代表語義的形式表示和存儲(chǔ),可以為標(biāo)簽檢索提供一種語義匹配的新方法,這對(duì)未來的社會(huì)化標(biāo)注系統(tǒng)標(biāo)簽語義檢索意義重大,將直接推動(dòng)社會(huì)化標(biāo)注系統(tǒng)和互聯(lián)網(wǎng)技術(shù)的發(fā)展。

        參考文獻(xiàn)

        [1]Carmagnola F,Cena F,Gena C.User Modeling in the Social Web[C].LNCS:Knowledge-Based Inteligent Information and Engineer-ing Systems.Springer Berlin/Heidelberg,2008,4694/2008:745-752.

        [2]Laniado D,Eynard D,Colombetti M.A Semantic Tool to SupportNavigation in a Folksonomy[C].Proceedings of the Eighteenth Con-ference on Hypertext and hypermedia ACM,New York,USA,2007:153-154.

        [3]Nauman M,Hussain F.Using Personalized Web Search for Enhancing Common Sense and Folksonomy Based Intelligent Search Systems[C].Proceedings of the IEEE/WIC/ACM International Conference on WebIntelligence.IEEE Computer Society,Washington,DC,USA,2007:423-426.

        [4]Yusef H M,vlctor H S.Improving Tag Clouds as Visual Information Retrieval Interfaces[DB/OL].International Conference onMultidisci-plinary Information Sciences and Technologies http://www.instac.es/in scit2006/psper/fdf/165.pdf,2009-12-12.

        [5]Specia L,Motta E.Integrating Folksonomies with me Semantic Web[C].LNCS:The Semantic Web:Research and Applications.Springer Berlin/Heidelberg,2007,4519/2007:624-639.

        [6]Ronzano F,Marchetti A,Tesconi M et al.Tagpedia:a Semantic Reference to Describe and Search for Web Resources[C].Workshop on Social Web and Knowledge Management at 17th International Confer-ence on World Wide Web.Beijing,China,April2008.

        [7]Ronzano F,Marchetfi A,Tesconi M et al.Tagpedia: a Semantic Reference to Describe and Search for Web Resources[C].Workshop on Social Web and Knowledge Management at 17th International Confer-ence on World Wide Web.Beijing,China,2008:216-132.

        [8]Marchetti A,Tesconi M,Roozano F et al SemKey:A Semantic Col-laborative Tagging System[C].Proceeding of the 16th International Conference on World Wide Web.ACM,New York,USA。 2007:825-834.

        [9]Vlad T,Olge S.Extreme Tagging:Emergent Semantics through the Tagging of Tags[C].ESOE,2007:212-231.

        [10]Gruber T.Ontology of Folksonorny:A Mash-up of Apples Or-anges[EB/OL].2009-10-02.http://tomgruber.org/writing/mt-sr05-ontology-of-folksonomy htm,2008-10-02.

        [11]Davis H C,Al-Khalifa H S,Gilbert L.Creating Structure from Disor-der:Using Folksonomies to Create Semantic Metadata[C].Prceedings of the 3rd International Conference on Web Information Systems and Technologies,Barcelona,Spain,March,2007:214-231.

        [12]Singh A V,Wombacher A,Aberer K.Personalized Information Access.in a Wiki Using Structured Tagging[C].LNCS:On the Move to Meanindul Internet Systems 2007:OTM 2007 Workshops.Springer Berlin/Heidel-berg,2007,4805/2007:427-436.

        [13]Yang J,Matsuo Y,Ishizuka M.An Augrmented Tagging Scheme with Triple Tagging and Collective Filtering[C].Proceedings of me IEEE/WIC/ACM International Conference on Web intelligence.IEEE Comput-er Society,Washington,DC,USA,2007:35-38.

        [14]Christiaens S Metadata Mechanisms:From Ontology to Folksonomy and Back[C].LNCS:On the Move to Meaningful Internet Systetm 2006:OTM 2006 Workshops.Springer Berlin/Heidelberg,2006:199-207.

        [15]Gendarmi D,Lanubile F.Community-Driven Ontology Evolution Based on Folksonomies,LNCS:On the Move to Meaningful Internet Systems 2006:OTM 2006 Workshops Springer Berlin/Heidelberg,2006,4277/2006:181-188.

        [16]Mote N.The New School of Ontologies[EB/OL].http://www.isi.edu/-mote/papers/Folksonomy.html,2009-10-02.

        [17]Jose E G.WESONet:applying semantic web technologies and collab-orative tagging to multimedia web infomation systems[J].Computers in Human Behavior,2010,(26):205-209.

        [18]Hamasaki M,Matsuo Y,Nishimura T.et al.Ontology Extraction by Collaborative Tagging with Social Networking[EB/OL].http://ymatsup.com/papers/www2008hama.pdf,2009-12-12.

        [19]Wu X,Zhang L,Yu Y.Exploring Social Annotations for the Seman-tic Web[C].Proceedings of the 15th International Confernce on World Wide Web.ACM,New York,USA,2006:417-426.

        [20]Psaquale D M.Exploitatioa of semantic relationships and hierarchical data structures to support a user in his annotation and browsing activities.in folksonomies[J].Infornation systems,2009,(34):511-535.

        欧美中文字幕在线| а√天堂资源官网在线资源| 国产成人av区一区二区三| 高清不卡日本v二区在线| 久久久精品国产性黑人| 久久久久99精品成人片| 狠狠躁夜夜躁人人爽天天古典| 成人免费毛片aaaaaa片| 香蕉人人超人人超碰超国产 | 国产av无码专区亚洲av中文 | 亚洲欧美在线播放| 97中文字幕在线观看| 中文字幕亚洲精品人妻| 一本之道加勒比在线观看| 熟女免费观看一区二区 | 国产一级r片内射视频播放| 毛茸茸的女性外淫小视频| 国产一区二区三区久久悠悠色av | 国产精品亚洲一区二区在线观看 | 久久久久久九九99精品| 国模精品一区二区三区| 日韩视频中文字幕精品偷拍| 亚洲乱亚洲乱少妇无码99p| 激情综合欧美| 精品的一区二区三区| 人妻中出中文字幕在线| 久久久国产精品无码免费专区| 国产婷婷色一区二区三区在线 | 亚洲麻豆视频免费观看| 国产二级一片内射视频插放| 无码国产激情在线观看| 美国黄色片一区二区三区| 国产不卡在线免费视频| 亚洲精品综合中文字幕组合| 欧美综合天天夜夜久久| 日日噜狠狠噜天天噜av| 福利一区二区三区视频午夜观看| 人人妻人人澡av| 日本二区三区在线免费| 无码人妻精品一区二区三| 色欲av自慰一区二区三区|