亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        提高網(wǎng)絡(luò)信息搜索匹配準(zhǔn)確率的相關(guān)研究

        2012-12-31 00:00:00金貴榮
        科技資訊 2012年31期

        摘 要:步入信息化時(shí)代,人們獲取信息的主要方式就是通過網(wǎng)絡(luò)。Internet上的信息量不斷更新增多,雖然為人們提供了豐富的信息資源,但是卻也加大了人們搜索所需信息的難度。一些搜索引擎,諸如百度、Google等雖然提供了網(wǎng)頁搜索的便捷方式,但由于關(guān)鍵詞的匹配是信息檢索技術(shù)的基礎(chǔ),因此搜索結(jié)果往往存在冗余及多余無用信息,搜索匹配準(zhǔn)確率不高。如何在浩瀚如海的信息空間里快速、準(zhǔn)確的查找到所需信息,是目前人們關(guān)注的焦點(diǎn)問題。

        關(guān)鍵詞:網(wǎng)絡(luò)信息 搜索匹配 準(zhǔn)確率

        中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2012)11(a)-0002-01

        1 搜索引擎技術(shù)

        基于Internet信息檢索技術(shù),將Internet上的網(wǎng)頁間建立相關(guān)聯(lián)的索引數(shù)據(jù)庫,便于用戶檢索時(shí)在庫中快速定位信息并提供信息給用戶即為搜索引擎。

        搜索引擎由量大部分組成:前臺和后臺。例如:Google、百度等即為前臺。前臺主要用于為用戶提供檢索接口,依據(jù)用戶的請求進(jìn)行信息的檢索,并反饋用戶經(jīng)過濾后的信息資源;后臺用于實(shí)時(shí)搜集網(wǎng)頁建立引擎。

        搜索引擎可以大范圍的進(jìn)行信息源的檢索,進(jìn)一步提高召回率,且提升檢索的全面性、綜合性等。搜索引擎的缺點(diǎn)在于查詢的時(shí)間相對較長。

        2 造成網(wǎng)絡(luò)信息搜索匹配準(zhǔn)確率低下的因素

        (1)無關(guān)、重復(fù)信息過多。由于傳統(tǒng)搜索引擎需要返回的網(wǎng)頁有很多,而且網(wǎng)頁內(nèi)存在大量無關(guān)且多余的信息,有部分網(wǎng)頁內(nèi)容相同,造成用戶難以在海量信息中對所需信息準(zhǔn)確、快速定位。(2)檢索方式單一。由于通常情況下信息檢索技術(shù)都是采用關(guān)鍵詞匹配檢索方式查詢,關(guān)鍵詞并不能將用戶所需的信息資料準(zhǔn)確的表達(dá)出來,或者用戶很難找到合適的關(guān)鍵詞進(jìn)行查詢。(3)關(guān)鍵詞檢索通常情況下僅使用詞頻信息,并沒有涉及語義、句法及語用信息方面,所以只是在篇章或段落里面檢索答案,并不是最明確的答案[1]。

        3 網(wǎng)絡(luò)信息搜索匹配原理

        信息搜索就是進(jìn)行網(wǎng)絡(luò)信息的快速匹配。詞匯的檢測、匹配需要依據(jù)語言特征,通過對基礎(chǔ)語言詞匯數(shù)據(jù)進(jìn)行對比、對核才能完成。網(wǎng)絡(luò)信息特征是傳統(tǒng)信息搜索方法進(jìn)行檢索的依據(jù),但由于網(wǎng)絡(luò)中的數(shù)據(jù)量較大,而且詞匯存在相似的特征,造成網(wǎng)絡(luò)中數(shù)據(jù)有很大一部分相似,傳統(tǒng)的匹配搜索法檢索結(jié)果會(huì)存在大量的非匹配詞匯,用戶在提取數(shù)據(jù)源時(shí)無法滿足需求,導(dǎo)致搜索匹配準(zhǔn)確率不高。

        4 提高網(wǎng)絡(luò)信息搜索匹配準(zhǔn)確率的策略

        (1)基于網(wǎng)頁去重。在進(jìn)行信息檢索時(shí)將不同鏈接、卻基本相同的信息資源進(jìn)行后臺整合,將多余的冗雜信息去除,就能夠提高信息檢索的精度及效率。

        (2)基于分面、分類。對一個(gè)概念進(jìn)行不同角度的劃分或?qū)⑵浞殖刹煌膫?cè)面,進(jìn)行細(xì)13091f9321483fa9408f5083cac5db9a349a87ae742f7f31ffce656df98ffb73分后編制能夠替代主題詞表的分類體系。這樣用戶進(jìn)行信息檢索時(shí),先將檢索到的關(guān)鍵詞劃分成為一些子類別,從中選擇合乎自己要求的類別,選中后系統(tǒng)再次進(jìn)行分類,直到用戶滿意或系統(tǒng)分類到達(dá)節(jié)點(diǎn)。這樣將其一步一步細(xì)化進(jìn)行檢索能夠快速實(shí)現(xiàn)用戶所需信息搜索,且準(zhǔn)確率較高。

        (3)基于詞頻統(tǒng)計(jì)。統(tǒng)計(jì)法是信息檢索的最基本方式之一。詞頻統(tǒng)計(jì)法又是最常用的統(tǒng)計(jì)方法。通常情況下作者都會(huì)在一篇文章中進(jìn)行重點(diǎn)詞語的強(qiáng)調(diào),重點(diǎn)詞語便會(huì)在文中反復(fù)出現(xiàn)。這樣可以進(jìn)行檢索信息的關(guān)鍵詞統(tǒng)計(jì),并設(shè)置一個(gè)閾值,如果關(guān)鍵詞出現(xiàn)的頻率(詞頻率)超過了閾值,便會(huì)返回所對應(yīng)的文章。還可以顯示出關(guān)鍵詞的順序及在文中的位置。

        (4)基于自動(dòng)文摘。科技的進(jìn)步帶動(dòng)了自然語言處理技術(shù)的發(fā)展,使其得到了廣泛的應(yīng)用。用戶在進(jìn)行信息檢索時(shí),自然語言處理技術(shù)會(huì)對檢索到的網(wǎng)頁、文檔進(jìn)行自動(dòng)抽取摘要信息的功能,用戶依據(jù)文摘選擇符合自己需求的信息進(jìn)行瀏覽,這樣提高了檢索的準(zhǔn)確性及效率。

        (5)基于知識的表示及處理。將與世界事實(shí)、關(guān)系及過程等信息編碼,使其成為科學(xué)的數(shù)據(jù)結(jié)構(gòu)即為知識表示。語義網(wǎng)絡(luò)及產(chǎn)生式表示法是常見的兩種知識表示法。采用知識表示方法進(jìn)行信息檢索,對于具有相同意義的關(guān)鍵詞檢索,當(dāng)輸入關(guān)鍵詞以后,搜索的信息能夠?qū)⑼x的描述顯示出來。

        (6)基于超鏈接技術(shù)。超鏈接是一種網(wǎng)狀檢索,能夠進(jìn)行沿鏈訪問,是以超鏈接網(wǎng)絡(luò)作為瀏覽基礎(chǔ)進(jìn)行瀏覽的方式。當(dāng)網(wǎng)絡(luò)中的信息、文檔依照不同的主題進(jìn)行分類存儲(chǔ)以后,主題詞表以及分類體系間所具備的相關(guān)聯(lián)系會(huì)形成網(wǎng)狀的結(jié)構(gòu)。將分類體系中的類作為一個(gè)節(jié)點(diǎn),相互間的關(guān)系作為鏈,就形成了網(wǎng)狀體系,在此基礎(chǔ)上能夠進(jìn)行超鏈接檢索。

        (7)基于語料庫。語言的詞匯、語義、語法結(jié)構(gòu)及語用信息都屬于語料庫范圍。語料庫是進(jìn)行信息檢索、統(tǒng)計(jì)、比較研究的基礎(chǔ)。目前自然語言處理的各環(huán)節(jié)已經(jīng)融入了語料庫研究,并有機(jī)結(jié)合自然語言處理方法,有效的促進(jìn)了對用戶檢索意圖的理解,加深了知識表示,極大的推動(dòng)了信息檢索匹配的準(zhǔn)確性。

        (8)基于合適的網(wǎng)絡(luò)檢索工具。檢索需求不同可以采用不同的檢索引擎、專題數(shù)據(jù)庫及主題指南等。這樣可以較為準(zhǔn)確的檢索出所需的信息資料,提高搜索匹配效率。

        (9)高效檢索技巧:①打開多個(gè)檢索窗口可以有效的節(jié)省檢索等待時(shí)間。②關(guān)閉主頁圖像能夠提升下載速度。③運(yùn)用詞組檢索能夠提高信息匹配準(zhǔn)確性。④直接查找信息源,利用IP地址直接打開網(wǎng)頁及網(wǎng)站。⑤選擇就近的網(wǎng)絡(luò)站點(diǎn)。⑥使用大型專業(yè)數(shù)據(jù)庫進(jìn)行搜索。⑦使用網(wǎng)絡(luò)搜索軟件。⑧不在上網(wǎng)高峰期進(jìn)行信息的檢索。

        5 結(jié)語

        伴隨互聯(lián)網(wǎng)的發(fā)展,信息資源將會(huì)進(jìn)一步的增加、膨脹。為了提高網(wǎng)絡(luò)信息搜索匹配的準(zhǔn)確率,可以借助一些常用的技術(shù)方法等,并進(jìn)一步理解用戶檢索意圖,加上一些檢索技巧能夠有效的提升搜索匹配準(zhǔn)確率。網(wǎng)絡(luò)信息搜索匹配準(zhǔn)確率的提升需要不斷的進(jìn)行探索研究,科技的進(jìn)步必將促進(jìn)網(wǎng)絡(luò)信息檢索技術(shù)的準(zhǔn)確性提升。

        參考文獻(xiàn)

        [1] 陳海光.HNC理論和隨機(jī)模糊在問答系統(tǒng)中的應(yīng)用研究[D].江蘇:江蘇大學(xué),2009.

        日本不卡不二三区在线看 | 人妻在线有码中文字幕| 亚洲一区二区二区视频| 日韩激情无码免费毛片 | 精品三级久久久久久久| 不卡av一区二区在线| 在线观看av网站永久| 中国农村熟妇性视频| 无码成人片一区二区三区| 亚洲区福利视频免费看| 国产老熟女精品一区二区| 99久久婷婷国产综合精品青草免费| 中文字幕无线码中文字幕| 美女熟妇67194免费入口| 国产熟女白浆精品视频二| 亚洲精品美女久久777777| 国产精品区一区第一页| 中文国产成人精品久久一区| 日本一区二区在线播放视频| 亚洲午夜久久久久久久久久| 国产内射合集颜射| 麻豆成年视频在线观看| 91九色最新国产在线观看| 久久精品黄aa片一区二区三区| 蜜桃尤物在线视频免费看| 国产av麻豆mag剧集| 日本高清不卡二区| 精品av一区二区在线| 久久国产精品一区二区三区| 亚洲精品午睡沙发系列| 天天干夜夜躁| 青青草在线免费观看视频| 日韩av无码久久一区二区| 男女扒开双腿猛进入免费看污| 日韩精品视频免费福利在线观看| 亚洲高清在线免费视频| 精品深夜av无码一区二区| 亚洲视频高清| 麻豆成人久久精品一区| 少女韩国电视剧在线观看完整| 91精品福利一区二区|