讓資源找到你
2007年
搜索技術
外部環(huán)境的不斷變化、用戶的多樣性需求,都將促使教育網的搜索引擎向分布式、個性化、智能化、社區(qū)化、移動化、行業(yè)化的方向發(fā)展。在云時代,我們有望實現“讓資源找到你”的愿景。
愛因斯坦說:“只要是我能夠在字典上找到的東西,我就不會去記它?!被ヂ摼W時代的典型現象之一是人人變成了“搜索控”。當一個“搜索控”的好處是,你總能在最短的時間內集結許多需要的信息。
搜索的誕生并非來自于滿足“需要找到一家最受好評的餐館”諸如此類的需求,雖然這在如今非常有必要。
搜索引擎的祖先,是1990年由蒙特利爾大學學生Alan Emtage發(fā)明的Archie,僅用于查找網絡文件。
最早現代意義上的搜索引擎出現于1994年7月。當時Michael Mauldin將John Leavitt的蜘蛛程序接入到其索引程序中,創(chuàng)建了Lycos。同年4月,斯坦福(Stanford)大學的兩名博士生,David Filo和Gerry Yang共同創(chuàng)辦超級目錄索引Yahoo。
1996年,Larry Page和Sergey Brin將第一個Google版本放在斯坦福大學的網站上。當時誰能料到一個搜索帝國將要崛起?從這時起,網絡開始變得更有價值。
之后,Google、百度、雅虎、搜狐、網易等逐鹿搜索市場。隨著互聯網爆炸性的增長,用戶搜索需求的增長使得互聯網公司的“蛋糕”越做越大,在資本市場受到追捧,以至于軟件巨頭微軟迫不及待地以Bing一爭高下。時至今日,搜索戰(zhàn)場硝煙不斷。
追溯搜索的歷史,我們發(fā)現,搜索出身于大學。同樣地,在我國,高校對搜索技術的研究從1995年開始。
“九五”建設時期,北京大學的天網搜索引擎,清華大學的網絡指南針搜索引擎,華南理工大學的木棉搜索引擎,開啟了國內研究搜索引擎的先河。有專家表示,與面向普通大眾的通用引擎相比,高校的搜索引擎具有自身的特色:
第一,針對教育網內用戶的特殊需求,為其提供有針對性的信息檢索服務,校園網用戶經常使用的搜索功能包括網頁搜索、FTP 文件搜索、論文檢索、IP地址查詢、BBS用戶信息查詢等功能,尤其在論文檢索方面,很多教師對于網上搜到的科研信息的出處常常感到困惑。而基于北大天網搜索的中國網頁博物館能夠建立含有時間標簽的搜索引擎服務,這是很有價值的。
第二,作為深具科研實力的研究機構,高校的研究和探索具有前沿性,華南理工大學的木棉搜索引擎基于開源項目進行,力圖解決搜索引擎應用中所帶來的挑戰(zhàn),試圖通過搜索引擎實現校園網電子郵件、新聞、BBS、博客和檔案系統(tǒng)等各種信息的互通。清華網絡指南針搜索引擎目前在分布式搜索方向展開了一系列研究,針對集中式搜索存在的問題和瓶頸進行嶄新嘗試,聯合多個搜索引擎,采取分布式的聯邦搜索方式,充分發(fā)揮局部搜索引擎的優(yōu)勢,從而試圖達到更加全面與精確的搜索效果。
搜索引擎隨著互聯網的發(fā)展而發(fā)展。今天我們需要搜索引擎具有文字、圖片、視頻等信息整合功能。隨著市場推動應用,更專業(yè)、深入、個性化的服務需求,社區(qū)網絡的興起,垂直搜索和社區(qū)化搜索在2005年左右興起,并擁有藍海前景。
搜索作為2007年的教育信息化的關鍵詞的原因是,國內搜索市場當時發(fā)生著“聯合”:百度聯合北大,搜狐與清華合作,雅虎中國攜手哈工大,人們希望通過校企合作共建實驗室的方式,促進搜索技術的不斷發(fā)展。2007年年底, Google籌備與各高校的聯系與合作。2008年伊始,Google開始向高校免費捐贈搜索服務器GSA。
這幾年,互聯網一直很熱鬧。云計算、移動互聯網、智能手機等新理念、新技術、新產品的發(fā)展讓人眼花繚亂,Web2.0技術讓社區(qū)網絡蓬勃興旺,多媒體、圖片、團購、社區(qū)互動、地圖等應用在網上縱橫。
外部環(huán)境的劇烈變化和用戶需求的多樣性都將促使搜索引擎發(fā)生變化。以云計算為例。云計算是搜索界無法回避的話題,實際上,日常所使用的搜索引擎就是云計算最方便被感受到的一種應用。云計算促進了整合搜索。整合搜索打破傳統(tǒng)的搜索引擎模式的概念,它通過智能分析和導航系統(tǒng),把不同的搜索領域的結果有機整合在一個網頁內,將最有用的信息呈現給用戶,用一個搜索框解決所有垂直搜索需求,而不是簡單地把鏈接羅列在一起。而用戶最希望的就是“想要的資源在眼前”。
“隨著下一代網絡的快速發(fā)展,以及Web2.0等新一代信息技術的成熟,信息資源的分布和呈現越來越分布化,這為搜索引擎的體系結構設計提出更多新的挑戰(zhàn)。”華南理工大學信息網絡工程研究中心副主任董守斌表示?;贗Pv6的新一代互聯網為網上信息服務的發(fā)展、特別是為個性化和專業(yè)化信息資源的更大規(guī)模的擴張?zhí)峁┛涨暗脑鲩L潛力,對信息檢索技術提出了革命性的要求,蘊涵著全新的機遇。分布式搜索引擎的優(yōu)勢在于可以聯合眾多的有特色的小型搜索引擎單元。合理的體系結構可促使系統(tǒng)支持成百上千個單元搜索引擎,支持目前連通性較差的IPv6 網絡以及社交網絡等的數據采集,提高系統(tǒng)的覆蓋率。
教育信息化正在逐步深入,整個校園網信息的綜合利用依賴于對信息的有效控制和管理。校園網信息整合的龍頭仍然是搜索引擎。外部環(huán)境的不斷變化、用戶的多樣性需求,都將促使教育網的搜索引擎向分布式、個性化、智能化、社區(qū)化、移動化、行業(yè)化的方向發(fā)展。在云時代,我們有望實現“讓資源找到你”的愿景。