謝海英
摘要:在全球化和信息化浪潮洶涌的當今世界,我國的信息產(chǎn)業(yè)取得了快速的發(fā)展,信息已成為社會發(fā)展的重要戰(zhàn)略資源并將迎來自己的黃金發(fā)展時期,但是,我國信息服務業(yè)還存在著一些問題。將個性化搜索引擎技術應用到信息服務業(yè)正是解決問題的方法之一。該文闡述了我國信息服務業(yè)的發(fā)展現(xiàn)狀及存在的問題,分析傳統(tǒng)搜索引擎技術在信息服務業(yè)的應用及不足,最后對個性化搜索引擎在信息服務業(yè)應用提出了建議。
關鍵詞:信息服務業(yè);個性化搜索引擎;搜索引擎
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2012)36-8653-03
1 我國信息服務業(yè)現(xiàn)狀及存在的問題
1.1 我國信息服務業(yè)現(xiàn)狀
工信部5月31日發(fā)布《中國軟件和信息服務業(yè)發(fā)展報告(2012)》(以下簡稱《報告》)。數(shù)據(jù)顯示,2011年中國軟件和信息服務業(yè)創(chuàng)投活躍度猛增,投資案例數(shù)、已披露投資金額案例數(shù)、已披露投資金額、平均每期投資案例金額等均同比大幅增長。產(chǎn)業(yè)規(guī)模擴大,發(fā)展迅速,共實現(xiàn)軟件業(yè)務收入超過1.84萬億元,同比增長32.4%,超過“十一五”期間平均增速4.4個百分點,并超過同期電子信息制造業(yè)增速10個百分點以上。軟件業(yè)務收入占GDP的比重達3.9%,占電子信息產(chǎn)業(yè)的比重首次突破20%,在國民經(jīng)濟中的作用進一步增。?2011年,我國手機網(wǎng)民規(guī)模達3.56億(包含WAP用戶),同比增長17.5%,與前兩年相比,增長速度開始放緩。毫無疑問已成為全球最大的互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)市場。
1.2 我國信息服務業(yè)存在的問題
1)地區(qū)差異明顯
根據(jù)“軟件和信息服務業(yè)城市競爭力評價指標體系”,從排名來看,2012年19個城市依然呈現(xiàn)三個陣營排列:第一梯隊為北京、深圳,第二梯隊為上海、成都、南京、廣州、杭州、濟南、大連、青島,相較2011年競爭力格局變化不大,廣州、杭州分別下滑1位和3位;青島大力發(fā)展軟件和信息服務外包產(chǎn)業(yè)成績顯著,本年度超過武漢躍升至第二梯隊;廈門、寧波等軟件出口導向型城市受國際經(jīng)濟氣候影響,下滑幅度較大;
2)大部分企業(yè)規(guī)模偏小,缺乏競爭力
我國信息服務企業(yè)的數(shù)量雖多,但大多數(shù)企業(yè)規(guī)模比較小,資金的短缺使其只能開發(fā)一些投入較少的短期項目,而無法進一步開發(fā)風險和收益高但投入也大的大型軟件和服務項目。而且,在信息服務業(yè)全球化的發(fā)展趨勢下,這種小規(guī)模的資金、人員的投入和經(jīng)營尤其突顯出。
3)人才相對匱乏,缺乏高素質(zhì)人才
現(xiàn)代信息服務業(yè)具有高人力資本含量、高技術含量和高附加值的特點,其發(fā)展需要擁有高素質(zhì)的人才。我國現(xiàn)代信息服務業(yè)的人才積累較少,尤其是與現(xiàn)代信息服務業(yè)發(fā)展密切相關的專業(yè)人才嚴重匱乏,高層次服務人才短缺、外流的現(xiàn)象比較嚴重,制約了現(xiàn)代信息服務業(yè)的發(fā)展。
4)政策法規(guī)體系不健全
中國信息服務業(yè)相關法律、法規(guī)不健全,導致了信息市場運作的不規(guī)范,嚴重影響了信息服務業(yè)的全面發(fā)展,目前中國針對信息服務業(yè)發(fā)展中出現(xiàn)的新技術、新業(yè)務和新問題存在政策缺位。對于因信息技術廣泛應用和融合到其他領域而引發(fā)的一些新問題,例如虛擬財產(chǎn)、個人隱私、數(shù)字化信息內(nèi)容的評估定價等,還缺乏明確的政策指引和法律規(guī)范,阻礙了新興業(yè)務發(fā)展。
2 搜索引擎技術在信息服務業(yè)中應用
信息服務業(yè)主要分為三大類:即 信息傳輸服務業(yè);IT服務業(yè)(信息技術服務業(yè));信息資源產(chǎn)業(yè)(主要指信息內(nèi)容產(chǎn)業(yè))。不同行業(yè)和對象所提供的服務不同,所以使用搜索引擎技術時信息需求也不同,因此具有不同特點。
2.1不同行業(yè)和對象的信息需求
政府的信息需求是通過共享信息改善工作效率和提高政府內(nèi)人員綜合能力;構建電子化的虛擬機關,將政府可公開的信息直接歸納,準備面向社會、企業(yè)和公眾發(fā)布,并使政府的服務工作網(wǎng)絡化;構建統(tǒng)一、高效、廉潔和規(guī)范的"虛擬電子政府",樹立各級政府各部門在網(wǎng)絡上的形象,提高政府工作的透明度和勤政、廉政建設。
企業(yè)的信息需求就是信息集成,打破“信息孤島”“應用孤島”的挑戰(zhàn),數(shù)據(jù)平臺的建設和數(shù)據(jù)的深度挖掘是其核心要素,信息和資源共享,同時找到自己的潛在客戶,支撐企業(yè)的決策系統(tǒng),降低庫存、提高生產(chǎn)質(zhì)量、快速應變,增強企業(yè)的市場競爭力。
媒體的信息需求是實時跟蹤、采集與網(wǎng)站相關的信息來源,數(shù)據(jù)要準確、安全、可靠。強大查詢功能,方便用戶瀏覽網(wǎng)站的所有信息,系統(tǒng)最大限度地實現(xiàn)易維護性和易操作性,實現(xiàn)互聯(lián)網(wǎng)信息內(nèi)容采集、瀏覽、編輯、管理、發(fā)布的一體化。
2.2傳統(tǒng)搜索引擎的弊端
搜索引擎主要使用自動跟蹤索引軟件,通過自動的方式分析網(wǎng)頁的超鏈接,依靠超鏈接和HTML代碼分析獲取網(wǎng)頁信息內(nèi)容,并采用自動搜索、自動標引等事先設計好的規(guī)則和方式來建立和維護其索引數(shù)據(jù)庫,以Web形式提供給用戶一個檢索界面,供用戶輸入檢索關鍵詞、詞組或邏輯組配的檢索式,搜索引擎根據(jù)這些關鍵詞在數(shù)據(jù)庫中進行匹配,然后返回相關網(wǎng)址。在這種情況下會存在下列弊端:
1)命中率低: 是爆炸式的互聯(lián)網(wǎng)信息,讓歧義信息、垃圾信息越來越多,而“不通人情”的算法排序模式,很難理解用戶真正的需求,這使得用戶往往需要多次反復搜索才能找到正確的答案,搜索效率越來越低。
2)信息的時效性差
由于網(wǎng)上的信息量巨大,傳統(tǒng)搜索引擎的數(shù)據(jù)更新周期短則十幾天,長則幾個月,而垂直搜索引擎的數(shù)據(jù)更新可以以秒為單位。
3)信息描述不全面
傳統(tǒng)搜索引擎提供的信息是網(wǎng)頁鏈接包括標題、描述、url鏈接三個部分, 它們是當前URL鏈接上的網(wǎng)頁整體內(nèi)容的介紹,而不是針對用戶檢索的特定信息的介紹,其匹配原則是網(wǎng)頁描述與關鍵詞的相關度;
4)排序方式單一
傳統(tǒng)搜索引擎是按照系統(tǒng)設定的排序算法,自動根據(jù)相關性將網(wǎng)頁排列,用戶只能被動的接受搜索引擎的排列順序。用戶不能自主的選擇的多種方式進行排序。
3 個性化搜索引擎術在信息服務業(yè)中的應用
個性化搜索引擎指的是搜索引擎依靠用戶搜索的關鍵詞、點擊情況、訪問路徑,收藏記錄等歷史記錄,來返回更適合這個用戶的搜索結果。需要對用戶興趣進行收集; 用戶描述信息確定、分類;資源信息特征選取、分類; 建立用戶和興趣的關聯(lián),興趣和資源的關聯(lián); 利用資源和用戶興趣的關系,計算出搜索結果中的每個文檔和用戶興趣的相似度,并對相似度進行排序; 用戶對搜索結果進行評分(或記錄用戶行為),更新該類用戶的興趣規(guī)則等幾個步驟。當今社會高度信息化,面對全球電子商務大潮的沖擊,信息服務業(yè)正處于一個爭空前激烈的境地,各種咨詢機構和網(wǎng)絡供應商的出現(xiàn),將對信息服務業(yè)構成極大的威脅。因此要引入個性化搜索引擎來提高信息服務的質(zhì)量,滿足用戶需求,必須做到以下幾點:
1)加強互動
加強與用戶的溝通可以了解用戶的意見和建議,用戶之間可以在論壇發(fā)表自己的意見,交流體驗。用戶要想發(fā)表意見,必須通過注冊自己的信息,如年齡性別,個人收入以及聯(lián)系方式等。因此能獲得了豐富的用戶資料,對用戶的生活風格、消費風格、興趣愛好、主要的技能、職業(yè)以及大體的收入水平等有了相當?shù)牧私狻_€可以在直接進行在線調(diào)查,可以主動、熱情地邀請訪問者或會員參與調(diào)查,可以是進行市場調(diào)查,也可是對某些熱點問題的探討等。
2)用戶至上
網(wǎng)站要提高用戶體驗,那么必須從內(nèi)容入手,因為內(nèi)容才是用戶最終的瀏覽目標,是用戶尋找所需信息的源頭。對于內(nèi)容的好壞則可是用戶體驗的決定因素。按照用戶或用戶群的特點組織信息資源,創(chuàng)建個性化的信息環(huán)境, 設計用戶所期望的個性化信息服務模式, 為用戶提供多樣化的信息服務, 使用戶得到便利。
3)服務多樣化
對搜集到的信息進行整理、加工、評價、研究和選擇之后,通過報刊、廣播、電視、網(wǎng)絡等通信方式予以主動發(fā)布,以滿足用戶的信息需求。
4)重視推送服務
為了使信息資源得到充分利用,實現(xiàn)最大范圍的共享,采用上門,電話,郵件等方式,主動介紹,宣傳,推廣信息產(chǎn)品的服務方式。主動發(fā)現(xiàn)用戶的潛在需求和深層次需求, 為各行各業(yè)的用戶提供有針對性的信息。
4 結束語
隨著網(wǎng)絡發(fā)展和普及, 搜索引擎已成為用戶信息檢索的主要工具。但通用搜索引擎針對不同用戶的查詢請求都提供相同的檢索結果,體現(xiàn)不出用戶的個性化需求。個性化搜索引擎在信息服務業(yè)的應用可以幫助用戶在最短的時間內(nèi)找到最適合自己的信息,不僅提高了信息的查準率和用戶滿意度, 同時也增強了用戶的個性化使用體驗和感受, 能夠在為用戶提供有效信息的同時更加契合用戶對個性化檢索的需求。
參考文獻:
[1] 王蘇艦.個性化搜索引擎應用于信息服務業(yè)初探[J].現(xiàn)代情報,2010,30(4).
[2] 張瑞藜.個性化搜索引擎中用戶興趣提取技術的研究[J].科技信息,2011(24).
[3] 張璇.用戶興趣模型在個性化搜索引擎中的應用研究[J].微計算機信息,2010(26).
[4] 廖紹雯.個性化搜索引擎關鍵技術及應用[J].軟件導刊,2011(8).
[5] 黃羿.用戶興趣模型在個性化搜索引擎中的應用[J].重慶文理學院學報:自然科學版,2008(10).