亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶情境及語義網(wǎng)技術(shù)的個(gè)性化搜索引擎

        2011-03-31 05:57:58
        圖書館研究 2011年4期
        關(guān)鍵詞:搜索引擎語義情境

        吳 芳

        (沈陽理工大學(xué)圖書館,遼寧 沈陽 110159)

        隨著用戶個(gè)性化信息需求的增加,用戶信息搜索的目的性和針對性越來越明顯,搜索的深度和專業(yè)性越來越強(qiáng),搜索的復(fù)雜性和層次性越來越凸顯。這些變化對搜索引擎提出了更高的要求,搜索引擎必須能夠根據(jù)用戶的個(gè)性、學(xué)習(xí)、教育等不同的特性為用戶提供客觀、準(zhǔn)確、及時(shí)、深入的個(gè)性化信息,使用戶更多地參與到搜索流程中。這是未來搜索引擎發(fā)展的必然趨勢。

        1 搜索引擎現(xiàn)狀

        搜索引擎是用戶在Internet上查找相關(guān)信息時(shí)最常用的一種工具。隨著網(wǎng)絡(luò)資源的增加,用戶對網(wǎng)絡(luò)搜索引擎的要求越來越高。在信息檢索過程中,搜索引擎必須在查詢的目的性、查詢的準(zhǔn)確性、查詢式的易于表達(dá)性和查詢結(jié)果的選擇性之間作出適當(dāng)?shù)臋?quán)衡,從而將具有高度相關(guān)性的網(wǎng)頁內(nèi)容返回給用戶。當(dāng)今現(xiàn)有的搜索引擎還不完善,具體表現(xiàn)在以下幾個(gè)方面:(1)用戶在利用搜索引擎進(jìn)行檢索時(shí),因檢索式表達(dá)的含義比較模糊,搜索引擎返回的檢索結(jié)果也不盡如人意,雖然附加的檢索術(shù)語有助于對檢索式更進(jìn)一步的限定,但即便是很有經(jīng)驗(yàn)的檢索者選擇最佳的檢索術(shù)語也很難準(zhǔn)確地檢索到其所需要的信息;(2)當(dāng)前,許多大型搜索引擎仍在盲目追求數(shù)據(jù)庫規(guī)模,在利用大型數(shù)據(jù)庫的基礎(chǔ)上提供信息檢索服務(wù),其檢索功能基本上還停留在數(shù)據(jù)庫基礎(chǔ)建設(shè)和流程挖掘?qū)用?,所返回的檢索結(jié)果只是基于簡單的關(guān)鍵詞匹配,即搜索輸出處于一種對搜索結(jié)果的初加工狀態(tài),并沒有考慮到用戶在特定時(shí)期內(nèi)特殊的信息需求;(3)事物是普遍聯(lián)系的。用戶提交給搜索引擎的關(guān)鍵詞之間總是存在著一定的關(guān)系,而在搜索引擎進(jìn)行檢索的過程中卻無法識別這種關(guān)系的存在,致使檢索結(jié)果中出現(xiàn)了大量的缺乏關(guān)鍵詞之間關(guān)系的網(wǎng)頁。

        據(jù)估計(jì),在現(xiàn)有的網(wǎng)絡(luò)資源中,83%的網(wǎng)站含有商業(yè)廣告,只有6%的網(wǎng)站含有科學(xué)和教育的內(nèi)容。對于用戶而言,其在搜索流程中的識別和控制作用還相對薄弱。因此,須加強(qiáng)搜索基礎(chǔ)建設(shè),加強(qiáng)用戶搜索目的的分析,在搜索引擎檢索過程中融入用戶的情境信息,從而實(shí)現(xiàn)全新的高匹配性搜索服務(wù)。

        2 用戶情境模型的構(gòu)建及其與搜索引擎的集成

        2.1 用戶情境模型的構(gòu)建

        收集用戶情境信息的目的是為了了解用戶搜索喜好、習(xí)慣、目標(biāo)、心理、個(gè)性、知識、行為、專業(yè)、交往、創(chuàng)作等方面的基礎(chǔ)信息。建立用戶情境模型,分析用戶的短期興趣、長期興趣及其動態(tài)的興趣變化,對其進(jìn)行存儲、表示和描述,并將此模型結(jié)構(gòu)與現(xiàn)有的搜索引擎集成在一起,確定更加個(gè)性化的搜索指向、搜索輸出項(xiàng)、輸出界面、搜索所進(jìn)入的分類數(shù)據(jù)庫、搜索的性質(zhì)界定、搜索結(jié)果的定量定性等,從而實(shí)現(xiàn)以用戶為中心的個(gè)性化信息檢索模式,真正實(shí)現(xiàn)搜索引擎面向用戶而非面向主題的檢索。

        圖1 用戶情境模型的框架結(jié)構(gòu)

        圖1為所建立的用戶情境模型的框架結(jié)構(gòu)。如圖1所示,此結(jié)構(gòu)由“特征收集器”和“情境管理器”兩個(gè)模型組成,包括三個(gè)層次:接口層、知識管理層、數(shù)據(jù)資源/搜索引擎層。每層都存在一些獨(dú)立的專用的代理完成特定的功能。這些代理支持交互式的監(jiān)控,獲取用戶的行為、偏好。查詢規(guī)范和查詢處理既要對情境特征進(jìn)行收集和歸類,還要對相關(guān)的結(jié)果進(jìn)行表達(dá)。此種結(jié)構(gòu)是通用的、模塊化的,很容易與新的類目、本體和搜索引擎結(jié)合在一起,同時(shí)也具備可配置的特性,能夠?qū)τ脩羟榫程卣鞯难莼c轉(zhuǎn)變進(jìn)行存儲。

        2.2 用戶情境模型與搜索引擎的集成

        圖2描述了上述結(jié)構(gòu)與搜索引擎集成在一起的過程。其中,特征收集器存在于用戶的計(jì)算機(jī)中,情境管理器存在于搜索引擎服務(wù)器中。

        圖2 用戶情境模型結(jié)構(gòu)與搜索引擎的集成

        2.2.1 特征收集器模型

        特征收集器模型有兩個(gè)代理,即自適應(yīng)代理和喜好代理,它們存在于用戶的臺式機(jī)中,扮演著前端經(jīng)紀(jì)人的角色,主要負(fù)責(zé)搜集用戶基本的個(gè)人信息。自適應(yīng)代理通過監(jiān)控用戶在臺式機(jī)上的活動獲取用戶的行為信息,從而保持用戶最新的情境特征。喜好代理除和自適應(yīng)代理發(fā)生交互外,還和情境知識代理發(fā)生交互作用,為用戶提出最適合的建議。喜好代理根據(jù)經(jīng)驗(yàn)和用戶以前檢索過程中相關(guān)的反饋信息得知用戶的偏好。

        2.2.2 情境管理器模型

        情境管理器模型包含四個(gè)代理:情境收集器代理、情境知識代理、查詢過程代理和集成代理。由于情境收集器代理要和數(shù)以百萬計(jì)的計(jì)算機(jī)發(fā)生交互作用來收集用戶的情境特征,因此,它是最薄弱的一個(gè)代理。情境管理器提供了一個(gè)可配置的特性,這樣就使用戶能夠自行定義他們的情境特征存儲在本地機(jī)上,也可存儲在搜索引擎服務(wù)器中。若存儲在搜索引擎服務(wù)器中,用戶須進(jìn)行注冊或者明確其所訂閱的情境收集服務(wù),以便在服務(wù)器中存儲他們的情境特征。

        情境收集器代理又依次分為管理人代理、中級代理、服務(wù)代理。管理人代理是決定的簽署者;中級代理是管理人代理和服務(wù)代理之間的使者;服務(wù)代理從數(shù)以百萬計(jì)的機(jī)器中收集用戶的情境特征。每一層代理都具有明確的任務(wù),協(xié)作完成用戶情境特征的收集。情境收集器代理是一種重要的情境收集方式,它將成為未來搜索引擎建設(shè)中的一個(gè)重要組成部分。

        情境知識代理是最復(fù)雜的一個(gè)代理,它處理數(shù)以百萬計(jì)的情境特征,建立并維護(hù)知識庫,查詢各種公用的本體領(lǐng)域。如圖3所示,此代理應(yīng)用了情境處理器代理、查詢本體代理、知識管理代理來執(zhí)行上述三個(gè)任務(wù)。

        圖3 情境知識代理

        情境處理器代理從每個(gè)情境特征中處理并獲取相關(guān)的關(guān)鍵詞。查詢本體代理應(yīng)用這些關(guān)鍵詞在用戶應(yīng)用之間創(chuàng)建共享的概念理解。知識管理代理將這些信息轉(zhuǎn)換成組織良好的、直觀的分類體系并加以保存以便將來應(yīng)用,如為用戶提供相關(guān)的反饋和建議并改善檢索式。

        查詢過程代理負(fù)責(zé)查詢式的構(gòu)造和檢索結(jié)果的處理。查詢式的構(gòu)造任務(wù)是完成情境查詢的創(chuàng)建、操作、擴(kuò)充、執(zhí)行、持續(xù)保存和再利用。結(jié)果處理任務(wù)包括對返回的查詢結(jié)果進(jìn)行分析、過濾,相關(guān)信息的匹配以及檢索結(jié)果的重組排列。

        一個(gè)查詢式可以由用戶提供的一個(gè)或多個(gè)術(shù)語來創(chuàng)建,查詢過程代理參考情境知識代理來分析用戶查詢式的句法和語義,然后將此查詢式分解成若干個(gè)子情境檢索式。這其中又包含了各種處理過程:基于概念的匹配、字句含糊意義的消除、詞匯參照、查詢式的優(yōu)化等待。用戶也可以從喜好代理中選擇所建議的一個(gè)或多個(gè)主題開始查詢。查詢過程代理為搜索引擎提供情境子檢索式或者用戶偏好檢索,一旦搜索引擎的檢索結(jié)果被返回,此代理就根據(jù)用戶的情境特征對結(jié)果進(jìn)行處理,然后再將處理后的結(jié)果發(fā)送給用戶。

        集成代理是一個(gè)相對簡單的代理,主要管理各種公用的本體和搜索引擎,并與查詢過程代理和情境知識代理進(jìn)行交流以提供相關(guān)的信息來支持整個(gè)情境信息的檢索過程。

        用戶情境模型與搜索引擎集成在一起,大大加強(qiáng)了信息檢索服務(wù)中對用戶情境信息的分析與利用,從而使得搜索引擎的搜索結(jié)果從目前輸出項(xiàng)的千篇一律向多樣化轉(zhuǎn)變,使搜索起點(diǎn)從共用大型抓取數(shù)據(jù)庫向復(fù)雜分類數(shù)據(jù)庫和搜索過程數(shù)據(jù)庫轉(zhuǎn)變,使搜索內(nèi)容從知識信息的簡單構(gòu)成向知識、信息、關(guān)系、邏輯、技術(shù)等方面的復(fù)雜構(gòu)成轉(zhuǎn)變。

        3 語義網(wǎng)技術(shù)在所集成的用戶情境模型與搜索引擎結(jié)構(gòu)中的應(yīng)用

        語義網(wǎng)是對當(dāng)前WWW的一個(gè)擴(kuò)展,能夠很好地使計(jì)算機(jī)和人類合作完成工作。語義網(wǎng)采用多層次的表示框架XML,并引入文檔模式描述文檔結(jié)構(gòu),但XML沒有對結(jié)構(gòu)本身的語義進(jìn)行描述。如果不知XML元素的語義,計(jì)算機(jī)仍不能理解信息。因此,需一個(gè)更高的層次來描述結(jié)構(gòu)的語義,即RDF。RDF定義了元素之間的關(guān)系,表現(xiàn)為三元組集(類似于句子的主體、動詞、客體)。XML加上RDF相當(dāng)于人工智能中的語義網(wǎng)絡(luò),可進(jìn)行簡單推理。要計(jì)算機(jī)相互理解信息,還需要有一套共同的標(biāo)準(zhǔn)的概念體系,即本體(Ontology)。本體主要使用網(wǎng)絡(luò)本體語言O(shè)WL來進(jìn)行描述,OWL是RDF的子集。XML+RDF+Ontology構(gòu)成了計(jì)算機(jī)相互理解的基礎(chǔ)。在Ontology層之上還可以有更高的為各種Ontology進(jìn)行通信提供支持的描述層次。語義網(wǎng)每加一個(gè)層次,計(jì)算機(jī)在知識處理上就多一份能力。

        在用戶情境模型與搜索引擎集成在一起的結(jié)構(gòu)中,應(yīng)用語義網(wǎng)和本體技術(shù)對所收集到的用戶情境信息進(jìn)行處理,對情境信息的結(jié)構(gòu)和特征進(jìn)行形式化的描述,將其轉(zhuǎn)化為計(jì)算機(jī)可理解的形式,并為搜索引擎所使用。同時(shí)也便于各實(shí)體間對情境信息達(dá)成共同的語義理解,從而能夠利用已存在的本體對情境信息進(jìn)行推理,推導(dǎo)出從當(dāng)前環(huán)境中不能直接收集到的情境信息,用于搜索引擎檢索結(jié)果的過濾、選取與推薦。

        由于用戶提交給搜索引擎的關(guān)鍵詞之間存在一定關(guān)系,為了使搜索引擎能夠識別這種關(guān)系,我們需要利用語義網(wǎng)中的相關(guān)技術(shù)來明確定義關(guān)鍵詞之間的關(guān)聯(lián)信息。即當(dāng)用戶輸入某些關(guān)鍵詞進(jìn)行檢索時(shí),我們應(yīng)用語義網(wǎng)中的RDF來描述關(guān)鍵詞之間的關(guān)系,并用OWL對這個(gè)關(guān)系進(jìn)行解釋,從而實(shí)現(xiàn)對關(guān)鍵詞之間語義信息的理解,并以RDF三元組的形式將此關(guān)系存儲在本體中,以語義標(biāo)識的形式嵌入到網(wǎng)頁內(nèi)容中。這樣,搜索引擎所處理的就不是單一的關(guān)鍵詞,而是包含了關(guān)鍵詞及其之間關(guān)聯(lián)信息的統(tǒng)一整體。

        在搜索引擎檢索過程中,情境管理器選擇情境信息中那些有限的前向鏈接,即用戶的檢索歷史,作為搜索引擎可能要擴(kuò)充的敘詞表,以此來對檢索結(jié)果進(jìn)行限定和過濾。同時(shí),通過對關(guān)鍵詞之間關(guān)聯(lián)信息的處理,將關(guān)鍵詞獨(dú)立的網(wǎng)頁從檢索結(jié)果中過濾掉,即對檢索結(jié)果中只包含關(guān)鍵詞而沒包含其關(guān)系的那些網(wǎng)頁過濾掉,只將那些既包含了關(guān)鍵詞又包含了其關(guān)系的網(wǎng)頁返回給用戶,達(dá)到檢索結(jié)果集的少而準(zhǔn),為用戶提供其真正所需的信息資源。

        在對用戶未來的情境進(jìn)行復(fù)雜推理時(shí),情境知識代理將利用本體技術(shù)生成一個(gè)部分證明樹,并產(chǎn)生一個(gè)可在網(wǎng)絡(luò)中查詢到的語義標(biāo)記的描述,把用戶的局部情境知識庫用到盡可能大的范圍內(nèi),從而挖掘出用戶未來可能存在的部分情境信息,并以此為依據(jù)為用戶推薦其可能需要的相關(guān)信息資源 。另外,還要積極建立各種公用的領(lǐng)域本體,加強(qiáng)搜索引擎對自然語言的理解能力,應(yīng)用語義網(wǎng)及本體技術(shù)對網(wǎng)站網(wǎng)頁的標(biāo)引進(jìn)行統(tǒng)一規(guī)范,各搜索引擎關(guān)鍵詞檢索統(tǒng)一采用OWL—和RDF的符號及其含義,分類檢索所建立的類目體系及使用規(guī)則也都采用OWL和DAML+OIL等相關(guān)語言,從而在網(wǎng)頁構(gòu)建和搜索引擎檢索與標(biāo)引方面達(dá)到統(tǒng)一。

        4 結(jié)束語

        本文從搜索引擎現(xiàn)狀出發(fā),提出了應(yīng)用用戶情境模型及語義網(wǎng)技術(shù)對現(xiàn)有的搜索引擎進(jìn)行改進(jìn),從而實(shí)現(xiàn)深層次的知識挖掘,實(shí)現(xiàn)個(gè)性化的網(wǎng)絡(luò)檢索。筆者認(rèn)為,當(dāng)前的工作主要集中在對所提出的框架結(jié)構(gòu)進(jìn)行調(diào)研、規(guī)劃、設(shè)計(jì)和測試上。此課題的研究對網(wǎng)絡(luò)搜索引擎的發(fā)展將起到至關(guān)重要的作用,也將提升此類搜索引擎在同類產(chǎn)品中的競爭優(yōu)勢。

        [1] 吳祐昕,順風(fēng).網(wǎng)絡(luò)搜索引擎的發(fā)展趨勢分析[J].當(dāng)代傳播,2007(3):73-74.

        [2] 宋迪,呂英杰,李一軍.基于用戶偏好的搜索引擎指標(biāo)分析與評價(jià)[J].圖書情報(bào)工作,2007(1):122-125.

        [3] 袁穎,趙捧未.基于語義網(wǎng)的數(shù)字圖書館信息檢索模型研究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2010(7):1-3.

        [4] 儲荷婷.語義網(wǎng)與信息檢索[J].圖書情報(bào)知識,2009(127):30-32.

        [5] 杜國芳.搜索引擎技術(shù)的突破——知識化搜索[J].現(xiàn)代情報(bào),2005(4):155-156.

        [6] 孔為民,涂中群.語義網(wǎng)的技術(shù)及其應(yīng)用[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2010(1):54-56.

        猜你喜歡
        搜索引擎語義情境
        情境引領(lǐng)追問促深
        不同情境中的水
        語言與語義
        護(hù)患情境會話
        特定情境,感人至深
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        認(rèn)知范疇模糊與語義模糊
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        欧美性猛交xxxx黑人| 亚洲av日韩av综合| 国产精品美女久久久久| 少妇人妻在线视频| AⅤ无码精品视频| 日韩中文字幕欧美亚洲第一区| 无码成人片一区二区三区| 久久久久久久久久免免费精品 | 人妻体体内射精一区中文字幕| 国产精品一区av在线| 九九九免费观看视频| 7m精品福利视频导航| 无遮挡边摸边吃奶边做视频免费| 国产哟交泬泬视频在线播放 | 1717国产精品久久| 精品一区二区av天堂| 亚洲国产av午夜福利精品一区| a黄片在线视频免费播放| 成人无码网www在线观看| 337人体做爰大胆视频| 成人亚洲欧美久久久久| 熟女少妇丰满一区二区| 亚洲肥婆一区二区三区| 国产99一区二区三区四区| 国产尤物精品视频| 福利体验试看120秒| 欧美人妻日韩精品| 一区二区三区国产97| 国产精品美女一区二区av| 国产精品一区二区三区专区| 欧美亚洲国产一区二区三区| 亚洲人成亚洲精品| 精品一区二区av天堂| 国产一区二区三区白浆肉丝| 免费国产黄网站在线观看视频| 国产丝袜在线精品丝袜| 久99久热只有精品国产男同| 国产亚洲女人久久久久久| 国产超碰在线91观看| 久久午夜精品人妻一区二区三区| 鲁一鲁一鲁一鲁一曰综合网|