[摘 要]網絡技術推動了傳統(tǒng)信息服務業(yè)的發(fā)展,搜索引擎技術在信息服務業(yè)中有著越來越廣泛的應用。本文首先對各行各業(yè)搜索引擎技術應用于信息服務業(yè)的現狀進行了抽樣調查,列出了部分有代表性的用戶的應用實際情況;然后總結出了不同領域對搜索引擎的要求,和應用中存在的問題。進而通過對需求和存在問題的分析引出了個性化搜索引擎的概念,提出信息服務業(yè)與個性化搜索引擎相結合的道路,探索了搜索引擎技術應用于信息服務業(yè)的未來發(fā)展方向。
[關鍵詞]搜索引擎技術;信息服務業(yè);個性化
[中圖分類號]TP393 [文獻標識碼]A [文章編號]1008-0821(2010)04-0016-04
The Application of Searching Engine Technology in the Information ServicesWang Sujian Li Peng Lu Huaqiao
(Beijing Institute of Scientific and Technical Information,Beijing 100120,China)
[Abstract]Network technology has improved the development of traditional information services,and searching engine technology has become increasingly used in information services.This article surveyed some samples that searching engine technology used in different kinds of area firstly,and then listed the current application of some representative users.Secondly,it summed up the requirements of searching engine in different areas and the problems of current application.Thirdly,it refered to the concept of personalized searching engine by analyzing the needs and problems,suggested that the information services should be combined with personalized searching engine,and exploring the developing direction of searching engine technology used in information service.
[Keywords]searching engine technology;information services;personalized
網絡技術使傳統(tǒng)的信息服務業(yè)進入了一個嶄新的時代,在先進的網絡環(huán)境和豐富的網絡資源條件下,需要重新審視網絡環(huán)境對情報研究工作的影響,重新確立情報研究工作模式,才會使信息服務業(yè)與時俱進。隨著互聯網的迅猛發(fā)展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就像大海撈針一樣,搜索引擎技術恰好解決了這一難題。搜索引擎是指互聯網上專門提供檢索服務的一類網站,這些站點的服務器通過網絡搜索軟件或網絡登錄等方式,將Internet上大量網站的頁面信息收集到本地,經過加工處理建立信息數據庫和索引數據庫,從而對用戶提出的各種檢索做出響應,提供用戶所需的信息或相關指針。用戶的檢索途徑主要包括自由詞全文檢索、關鍵詞檢索、分類檢索及其他特殊信息的檢索,如企業(yè)、人名、電話黃頁等。目前,搜索引擎技術已經被廣泛的應用到信息服務業(yè)的各個領域中,數字化和網絡化是信息服務業(yè)的發(fā)展方向,網絡搜索引擎技術的引入必將對傳統(tǒng)的信息情報行業(yè)產生革命性的影響。
1 搜索引擎技術在信息服務業(yè)中應用的現狀搜索引擎對于各行各業(yè)來講都是一種越來越重要的信息服務手段。本文對一些有代表性的搜索引擎技術應用方進行了調研;對調研情況進行了多方面的分析總結,力圖從多角度全面的了解搜索引擎技術在信息服務業(yè)中應用的現狀。
1.1 應用情況調查筆者和其團隊通過實地走訪;網上調查;查閱信息服務系統(tǒng)提供商所提供的產品應用案例介紹;以及信息服務業(yè)界所發(fā)表的實踐報告、文獻著作等方式選取了各領域的數十家機關、機構、企業(yè)、媒體;對搜索引擎技術在其信息服務中的的應用情況進行了調查。表1列出有代表性的部分調查對象的實際情況。
表1 搜索引擎技術在其信息服務中的的應用情況調查
序號單位名稱類別需求應用現狀1環(huán)境保護部政府機關通過“監(jiān)控”和“抓取”各原有內部信息系統(tǒng)的信息資源,建立集中的信息資源庫和有效專業(yè)的搜索機制,實現統(tǒng)一跨庫資源檢索,提供統(tǒng)一、便捷的信息搜索服務。環(huán)保部搜索引擎系統(tǒng)查全率和查準率非常高。目前系統(tǒng)既可對公文信息進行全文搜索,又可以對發(fā)文日期、擬稿人等屬性信息進行搜索,實現了結構化數據和非結構化數據的聯合搜索。2國家知識產權局管理部門為實施國家知識產權戰(zhàn)略,建設中國專利檢索與服務平臺項目。中國專利檢索與服務平臺整合了專利文獻和非專利文獻的書籍資源;同時,建立了穩(wěn)定長效、反饋渠道通暢、反應迅速的維護機制。3首都之窗政務內網實現對海量信息資源的高效采集和組織管理,并以搜索引擎的模式提供信息資源的共享服務。SaaS模式幫助首都之窗對龐大的網站群進行管理,及時的信息搜索、靈活的移動接入式辦公、統(tǒng)一的信息分析處理,降低了首都之窗的維護成本,提高了經濟效益。4湖南省競爭情報中心科研單位以資源整合和智能搜索的方式為省委、省政府領導提供全面的科技情報決策信息。采用網絡信息雷達進行網上情報信息的定制實時監(jiān)控和采集,并借助文本挖掘軟件進行情報信息的自動關鍵詞、自動摘要、自動濾重。5中國銀行金融行業(yè)中國銀行在實施全面風險管理體系建設過程中,需要搜索行業(yè)和政策方面的實時情報,以便做出合理科學的判斷。中國銀行所采用的相關情報系統(tǒng)可對實時網絡自動搜索結果按照事先設定的規(guī)則進行自動分類。6廣東移動通訊行業(yè)對管理系統(tǒng)數據的整合,實現統(tǒng)一的檢索入口和統(tǒng)一的Portal服務;相關的授權用戶對自己權限內的信息進行瀏覽和檢索。用戶進行全文檢索首先命中相應檢索記錄,然后通過權限過濾命中相應的數據集合,最后通過顯示模塊展示給相關人員經過安全驗證的信息內容。7海爾集團電話中心制造行業(yè)通過建立知識分享機制,推廣最佳實踐,打造學習型組織來提升電話中心的績效勢在必行,建設強大的呼叫中心知識管理系統(tǒng)。采用內容協(xié)作平臺、企業(yè)搜索引擎和文本挖掘技術等產品搭建海爾電話中心知識管理信息系統(tǒng)。8萬隆證券投資行業(yè)應用垂直搜索引擎技術在其新網站上金融行業(yè)搜索引擎,它通過對證券類網頁資源的結構化資源進行深度整合為網民提供服務。以高效的全文檢索引擎,提供用戶相關信息的搜索服務;以單一入口提供對行業(yè)信息的全面、及時、快速、智能的獲取和搜索。9新華網新聞媒體構建以全球新聞咨詢?yōu)橹鞯木C合查詢平臺,為海內外廣大網民提供權威、便捷的多媒體、多語種新聞信息搜索服務。整合站內新聞資源,中央重點新聞網站及其他重要媒體網站的新聞資源,構建面向新聞信息資源的多媒體搜索應用平臺,實現快速、準確、實用的站內外新聞搜索及相關服務。10IT168行業(yè)媒體建立更人性化的搜索平臺,帶給用戶更良好的訪問體驗。建立了跨站點的聯合搜索系統(tǒng),將原來分散的三個子系統(tǒng)中的內容整合到一起,并對外提供一個統(tǒng)一的檢索界面,允許訪問者對所有的信息進行相應的檢索,并提供漸進的檢索提示,訪問者根據提示,能逐步縮小檢索范圍,找到所需要的信息內容。期個性化搜索引擎應用于信息服務業(yè)初探Apr.,2010Vol.30 No.41.2 應用需求分析根據調查結果我們不難發(fā)現,不同行業(yè)不同調查對象對搜索引擎系統(tǒng)實際應用的需求也有所不同:
1.2.1 政府機關(1)實時跟蹤、采集與業(yè)務工作相關的信息來源。(2)全面滿足內部工作人員對互聯網信息的全局觀測需求。(3)及時解決政務外網、政務內網的信息源問題,實現動態(tài)發(fā)布。(4)快速解決政府主網站對各地級子網站的信息獲取需求。(5)全面整合信息,實現政府內部跨地區(qū)、跨部門的信息資源共享與有效溝通。(6)節(jié)約信息采集的人力、物力、時間,提高辦公效率。
1.2.2 企業(yè)(1)實時準確地監(jiān)控、追蹤競爭對手動態(tài),是企業(yè)獲取競爭情報的利器。(2)及時獲取競爭對手的公開信息以便研究同行業(yè)的發(fā)展與市場需求。(3)為企業(yè)決策部門和管理層提供便捷、多途徑的企業(yè)戰(zhàn)略決策工具。(4)大幅度地提高企業(yè)獲取、利用情報的效率,節(jié)省情報信息收集、存儲、挖掘的相關費用,是提高企業(yè)核心競爭力的關鍵。(5)提高企業(yè)整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業(yè)核心競爭力的神經中樞。
1.2.3 新聞媒體(1)快速準確地自動跟蹤、采集數千家網絡媒體信息,擴大新聞線索,提高采集速度。(2)支持每天對數萬條新聞進行有效抓取。監(jiān)控范圍的深度、廣度可以自行設定。(3)支持對所需內容智能提取、審核。(4)實現互聯網信息內容采集、瀏覽、編輯、管理、發(fā)布的一體化。
1.2.4 行業(yè)媒體(1)實時跟蹤、采集與網站相關的信息來源。(2)及時跟蹤行業(yè)的信息來源網站,自動,快速更新網站信息。動態(tài)更新信息。(3)實現互聯網信息內容采集、瀏覽、編輯、管理、發(fā)布的一體化。(4)針對商務網站提出商務管理模式,大大提高行業(yè)網站的商務應用需求。(5)針對資訊網站分類目錄生成,提出用戶生成網站分類結構。并可以實時增加與更新分類結構。不受級數限制。從而大大提高行業(yè)的應用性。(6)提供搜索引擎SEO優(yōu)化專業(yè)服務,快速提高行業(yè)網站的推廣。
1.2.5 網絡信息監(jiān)察與監(jiān)控(1)網絡輿情系統(tǒng)。如“網絡輿情雷達監(jiān)測系統(tǒng)”。(2)網站信息內容監(jiān)察與監(jiān)控系統(tǒng)。
1.3 目前存在的問題隨著調研的進行筆者發(fā)現,搜索引擎對信息資源的開發(fā)與利用帶來了很大的便利,但現有的搜索技術與用戶需求之間的矛盾也給信息服務業(yè)的網絡化進程帶來了很大的困擾。隨著網絡應用的普及,網絡信息資源以指數級增長;情報服務業(yè)對搜索引擎技術的關注點也從如何找到更多的信息轉移到如何找到準確、有用的信息上,搜索引擎技術面臨著前所未有的挑戰(zhàn)。目前,查詢工具的查詢能力還比較有限,特別是缺乏識別、理解和使用深層信息的能力,現有搜索引擎技術與信息服務業(yè)需求的差距,主要體現在以下幾個方面:(1)大部分搜索引擎需要關鍵字的匹配來收集信息。用戶常常不能準確地描述所要查詢的內容,而且,由于中文關鍵字一詞多義的特性,使得搜索返回的結果中常常包含著許多無關的信息。因此,高查準率已成為改進搜索引擎的關鍵所在。(2)現有的傳統(tǒng)搜索引擎由于使用各自不同的索引技術、信息收集技術和關鍵字查詢語法技術,使得他們各自收集的信息有很大的差異,用戶在進行查詢時,有時使用這種搜索引擎較為滿意,有時使用另一種搜索引擎搜索的結果才更為滿意。這使得用戶經常在不同的搜索引擎之間進行切換,浪費了很大的人力資源。(3)用傳統(tǒng)的搜索引擎進行搜索時,用戶想要獲得自己所需的信息,只有在搜索引擎中輸入關鍵字才能得到,是一種較為被動的信息獲取方法。(4)傳統(tǒng)的搜索引擎沒有對收集的信息進行綜合整理,冗余和噪聲信息含量大,用戶只能親自從大量的反饋信息中提取自己所需的信息,浪費了用戶大量的時間與精力。(5)現有的傳統(tǒng)搜索引擎基本上都采用“一個搜索適用所有用戶”的模型。也就是不同的用戶提交相同的關鍵字進行查詢時,搜索引擎返回的結果相同,毫無個性而言。然而,搜索本身是一個個性化的活動,不同用戶對信息的需求不同,傳統(tǒng)的搜索引擎無法滿足用戶的個性化需求。
2 搜索引擎技術與信息服務業(yè)未來結合方式的展望
2.1 個性化搜索引擎搜索技術滿足了用戶一定的需要,但由于其通用的性質,仍然不能滿足不同背景、不同目的和不同時期的查詢請求。個性化搜索引擎就是針對這個問題而提出的,它為不同用戶提供不同的服務,以滿足不同的需求。個性化搜索引擎通過收集和分析用戶信息來學習用戶的興趣和行為,從而實現針對不同用戶進行相應信息篩選的目的。個性化服務技術能夠充分提高搜索引擎的服務質量和訪問效率,以吸引更多的訪問者。目前,個性化搜索引擎技術主要分為兩種:基于規(guī)則的系統(tǒng)和信息過濾系統(tǒng)?;谝?guī)則的系統(tǒng)允許系統(tǒng)管理員根據用戶的靜態(tài)特征和動態(tài)屬性來制定規(guī)則,一個規(guī)則本質上是一個if-then語句,規(guī)則決定了在不同情況下如何提供不同的服務。其主要優(yōu)點是簡單直接,缺點是規(guī)則質量難以保證,可擴展性差,對于大數據量,大用戶量的情況難以維護和管理?;趦热葸^濾的系統(tǒng)則利用資源與用戶興趣相似性來過濾評價信息,相比于基于規(guī)則的系統(tǒng),其優(yōu)點是自動化程度高,可擴展性好。
2.2 個性化搜索引擎與信息服務業(yè)的結合隨著信息量的日益增加,現在信息服務業(yè)的信息采集所面臨的難題不再是信息的數量問題,而是如何從海量信息中智能化地獲取有價值的信息并從中挖掘有用的知識;挑選出對企業(yè)有益的關鍵性情報;提高情報采集的質量和效率。調查中發(fā)現信息采集存在深層次情報獲取的潛在需求,把個性化搜索引擎引入信息服務業(yè)對解決這些問題和需求會有非常積極的意義,而要想最大效用的發(fā)揮個性化搜索引擎對信息服務業(yè)的影響,應該本著以下幾條原則:
2.2.1 以用戶為中心個性化搜索引擎以用戶為中心,以方便用戶獲取、滿足用戶需求為前提,其服務功能與設施以用戶的需求為導向設計與安排;按照用戶或用戶群的特點組織信息資源,創(chuàng)建個性化的信息環(huán)境,設計用戶所期望的個性化信息服務模式,為用戶提供多樣化的信息服務,使用戶得到便利和尊重。
2.2.2 重視與用戶交互個性化搜索引擎是主動的、交互式的服務,它將傳統(tǒng)的“我提供什么,用戶接受什么”改變?yōu)椤坝脩粜枰裁矗姨峁┦裁础?,實現了從“人找信息”到“信息找人”的轉變。信息服務的系統(tǒng)提供友好界面,用戶可以方便地描述自己的需求,及時反饋對服務結果的評價。個性化搜索系統(tǒng)還能夠根據用戶的搜索行為,自動對用戶個人需求、習慣、愛好、興趣等信息進行記錄、開發(fā)和挖掘,為用戶提供“量身定制”的個性化信息服務。
2.2.3 提供多樣化服務方式網絡環(huán)境下,個性化搜索引擎突破了時間和空間的限制,它不但可以為用戶提供更加準確的信息,而且能夠按照用戶的個性客觀需求進行服務,如信息的顯示方式、提供結果的方式(紙質、電子版、網絡版、電子郵件等)、服務時間的要求、對服務地點的要求等。這種便捷的服務方式使得圖書館的利用率大為提高。
2.2.4 主動推送信息個性化搜索引擎可以進行信息推送,即可根據用戶對信息的需求,主動將用戶所需信息送達用戶。依托先進的信息處理技術,為用戶建立興趣模型,通過種種數據特征,進行資源數據的挖掘過濾,主動發(fā)現用戶的潛在需求和深層次需求,為各行各業(yè)的用戶提供有針對性的信息。
3 結束語目前,隨著因特網的快速發(fā)展,單獨的搜索引擎已無法解決信息服務業(yè)快速獲得信息的問題,我們需要有一種更有效地獲取信息的方法。個性化搜索引擎通過計算機輔助、網絡技術,建立人性化的信息服務環(huán)境,根據用戶提出的明確要求,或基于用戶的專業(yè)、偏好、使用習慣等個人特征,通過用戶定制、系統(tǒng)推薦和推送功能,主動向用戶提供獨特的信息和針對性的服務,“以用戶為中心”。個性化搜索引擎的開發(fā)雖然現在已經有了一定的基礎,但它距離成為一個成熟技術還有一定的差距,所以要實現它與信息服務業(yè)的完美結合,道路還很漫長。但相信隨著這項技術的逐步成熟,它對提高信息服務業(yè)的工作效率、完善信息服務業(yè)的工作模式將會發(fā)揮出越來越重要的作用。
參考文獻
[1]Shi Ze-Lin,Kang Jiao,Sun Rui.BP NN-based method for lens distortion correction of large-field imaging[J].Optics and Precision Engineering,2005,13(3):348-353.
[2]Shen Yanjun,Wang Bingwen.A fast learning algorithm of neural network with tunable activation function[J].Science in China,2008,47(1):126-136.
[3]苗蕾,許明金.競爭情報協(xié)作平臺初探——以湖南省競爭情報網絡協(xié)作平臺為例[J].現代情報,2008,(9):10-12.
[4]王艷.科技信息與科技決策[J].中國科技成果,2003,14:23-24.
[5]賀德方.我國科技情報行業(yè)發(fā)展方向的探討[J].情報學報,2008,27(4):483-489.
[6]北京拓爾思信息技術股份有限公司.搜索 整合 發(fā)現[M].北京:北京拓爾思信息技術股份有限公司,2008.
[7]桑艷艷,劉培剛,李勇.擬合用戶偏好的個性化搜索[J].情報科學,2008,26(8):1248-1251.
[8]崔麗杰,劉偉.基于用戶興趣的個性化搜索引擎的設計[J].計算機與現代化,2008,(7):1-4.