劉建輝,朱 蕾
(中國地質大學,武漢 430074)
當前,信息產生的速度正以幾何級數形式增長,信息資源也隨之以幾何級數的速度增長,尤其是網絡信息資源,較傳統(tǒng)信息資源增長,更新速度更快,數量更大。在這種情況下,加強對國內外網絡地學文獻信息源的研究,掌握網絡地學文獻信息源的分布情況、規(guī)律和特點,為地學學科發(fā)展提供針對性的服務,成為高校圖書館學科服務人員的責任和義務,如對網上信息資源進行篩選、分類、鑒別和鏈接,制作專業(yè)網站,為用戶在浩瀚無際的互聯網信息海洋中采擷信息提供導航等,即通過引導用戶快速、準確地進入特定網站,檢索到所需的有效信息,以優(yōu)化檢索質量。
信息是指應用文字、數據或符號等形式通過一定的傳遞或處理,來表現各種相互聯系的客觀事物在運動中所具有的特征內容的總稱。地球科學飛速發(fā)展,新理論、新方法、新技術層出不窮,相應地,地學信息源也日益擴大。地學信息資源涵蓋了涉及地學的文獻、知識、信息的所有方面。其中,學術文獻信息資源是最常用、內容最豐富的一種信息資源。對國際地球科學發(fā)展趨勢的分析表明,現代地球科學的概念與傳統(tǒng)相比已經發(fā)生了巨大的變化,出現了“大地質”、“大資源”、“大國土”的理念。根據這一思路,將傳統(tǒng)的地學概念進一步拓展,研究范圍也進一步拓寬,主要包括2個方面:(1)從狹義的地質學向廣義的資源科學拓寬,涉及范圍包括地質、礦產、土地、海洋、水資源、環(huán)境、測繪等方面,逐步確立“大資源”、“大地質”的理念;(2)從單純的以科學研究為主的文獻信息,向科研信息和管理信息并重拓寬,從某種意義上看,更側重于加強管理文獻信息源的建設。
地學信息按出版方式不同分為:期刊、博碩論文、會議、專利、科技報告等等。Internet上免費電子資源十分豐富,如專業(yè)的搜索引擎、社區(qū)和論壇、免費電子期刊、免費電子圖書、免費軟件下載等等,其中有很多學術價值較高的地學資源。圖書館工作人員通過網絡收集整理免費的電子資源,從中選擇與地學有關的網站,專供用戶瀏覽、下載。以此增加圖書館的虛擬館藏,這對于緩解圖書館經費緊張,提升圖書館的服務質量,改善圖書館的服務模式有著深遠的影響。
如何從海量的網絡信息資源中選出具有專業(yè)學術價值的信息資源,是導航庫建設過程中非常重要的一環(huán),因此必須在遵循網絡信息選擇標準的前提下,建立嚴格的信息采集原則,并借助科學的信息獲取方法和途徑。信息采集原則應遵循:
(1)需求性。所謂需求性就是根據用戶信息的需求來決策采集內容,信息采集要為教學服務、為科研服務、為廣大師生服務。
(2)特色化。有特色才有生命力,在信息資源的收集中,要體現中國地質大學的辦學特色。只有在文獻資源的采集時特色突出,才能形成以地球科學為主,其他專業(yè)為輔的特色館藏資源。既要區(qū)別于專業(yè)單一的圖書館,又要區(qū)別于其他綜合型大學圖書館。
(3)系統(tǒng)性。系統(tǒng)性就是不是簡單地將收集到數據堆砌、拼湊,而是按照導航庫的基本框架系統(tǒng)地收集、組織、編輯、處理、存儲地球科學領域中的信息。
采集方法主要包括隨機累積法、專題累積法、使用評估和專家推薦法。隨機累積法就是通過平時隨機積累與分類,變一般資源為專題資源,增加其用途和價值;專題累積法就是設置專題,有的放矢、持之以恒地進行專項積累;使用評估就是讓用戶通過一段時間的使用對信息資源進行評價,信息采集人員通過統(tǒng)計分析后判斷資源的利用價值,從而最終取舍;專家推薦法是由地學專家向圖書館推薦高質量的圖書、電子數據庫和免費網站。
利用數據挖掘技術對Internet上無序的地學信息采集和分類,使圖書館的信息資源更加豐富。數據挖掘包括數據抽取、數據分類、數據聚類和數據關聯四個方面:(1)數據抽取是從無限龐雜的信息源中以多維的數據分析方法抽取與地學有關的信息數據。(2)數據分類是對網絡中發(fā)現的相關數據進行分析、比較、識別、分類和整理,從大量的信息中剝離出與地學主題或子題類目有密切關聯的數據。(3)數據聚類是將屬于地學主題和子題類目的各種數據,或近似類目的數據進行分析比較聚類。(4)數據關聯不僅將搜集到的有關地學各目錄的數據分類取舍、聚類于相應的類目中,還要將有關聯的其他學科的數據聚類于相應的類目之下,揭示邊緣交叉學科的一些理論與地學有關理論的關聯性,引導用戶把學科理論的研究推向更深、更廣。其中數據分析和歸類是最為重要的步驟。
如果沒有一個有效地工具,在網絡中查找信息就如同大海撈針。網絡搜索引擎為解決這一問題提供了非常有效地手段。網絡搜索引擎包括:分類式搜索引擎和關鍵詞搜索引擎。分類式搜索引擎的性能取決于如何獲得網絡信息和對已獲得的網絡信息怎樣進行分類。關鍵詞搜索引擎不是按主題來檢索信息,而是用提供關鍵詞的方法進行檢索。這兩種途徑在地學信息采集中都非常有效,兩者相互相成,為地學信息采集提供幫助。目前網上提供的搜索引擎不計其數,但任何一個搜索引擎只能側重于某幾個方面,難以面面俱到。以下是根據工作經驗,介紹幾種適合信息資源采集的學術搜索引擎:
(1)SCIRUS (http://www.scirus.com/).SCIRUS是由愛思唯爾科學公司(Elsevier Science)于2001年4月推出的、迄今為止國際互聯網上最全面的科技信息專用搜索引擎。它以自身擁有的資源為主體,對網上具有科學價值的資源進行整合,集聚了帶有科學內容的網站及與科學相關的網頁上的科學論文、科技報告、會議論文、專業(yè)文獻、預印本等。SCIRUS的檢索界面友好,簡潔方便。
(2)Google Scholar(http://scholar.google.cn/).Google scholar是由Google推出的免費學術搜索工具,可以幫助用戶快速查找學術資料,包括來自學術著作出版商、專業(yè)性社團、預印本、各大學及其他學術組織的經同行評論的文章、論文、圖書、摘要和技術報告。Google Scholar在索引中涵蓋了來自多方面的信息,信息來源包括萬方數據資源系統(tǒng)、維普資訊、主要大學發(fā)表的學術期刊、公開的學術期刊、中國大學的論文、中國國家數字圖書館的館藏圖書以及網上可以搜索到的各類文章。
(3)INFOMINE (http://infomine.ucr.edu/).INFO-MINE是為大學教師、學生和研究人員建立的網絡學術資源虛擬圖書館。它擁有電子期刊、電子圖書、公告欄、郵件列表、圖書館在線目錄、研究人員人名錄,以及其他類型的信息資源40000多個。INFOMINE對所有用戶免費開放,但是它提供的資源站點并不都是免費的,能否免費使用,取決于用戶所在圖書館是否擁有該資源的使用權。INFOMINE共有12個數據庫,其中包括地圖和地理信息系統(tǒng)(GIS)數據庫,物理、工程、計算機和數學數據庫。
地球科學數據信息導航 http://esdip.llas.ac.cn/SPT——Home.php是2002年9月由中國科學院批準的中國科學院知識創(chuàng)新工程重要方向項目。該項工作的目的是為集成揭示國內外主要地球科學數據資源提供深入的導航服務,宣傳和推介地球科學數據資源,積極有效地提高和促進用戶對地球科學基礎性數據的利用和共享。目前導航系統(tǒng)已經收集了5000余條國內外地球科學及其相關學科數據資源的元數據信息,并全部提供開放式服務。
國內著名的地學圖書館中國地質圖書館 http://124.42.30.4/ngds/.該庫以中國地質圖書館館藏期刊、圖書為主要數據源,收錄中文地球科學、土地科學及相關內容期刊、專著、匯編、會議論文集等文獻資料。
國外著名的大學和科研機構有:哈佛大學地質系http://www-eps.harvard.edu/;澳大利亞地球科學http://earthsci.org/;康奈爾大學地質科學系 http://www.eas.cornell.edu/;耶魯大學地質與地球物理系Department of Geology and Geophysics http://www.geology.yale.edu/;普林斯頓大學Princeton University Department of geosciences http://geoweb.princeton.edu/;華盛頓大學University of Washington Earth and Space Sciences(Geology,Geophysics,Geological Sciences)http://www.vsc.washington.edu/;斯坦福大學地球物理系Geophysics Departmenthttp://pangea.stanford.edu/GP/;斯坦福大學Geological&Environmental Sciences Department http://pangea.stanford.edu/GES/GES.html;斯坦福大學能源與資源工程系Energy Resources Engineering http://pangea.stanford.edu/ERE/;斯坦福大學地球科學學院SCHOOL OF EARTH SCIENCES http://pangea.stanford.edu/,等等。
專業(yè)期刊歷來都是學術資源的重要來源,其網絡版亦然。目前很多專業(yè)期刊都有網絡版,在其紙質版本上一般都有其網址的介紹。其中由中國地質大學主辦的《地球科學一一中國地質大學學報》是中國自然科學核心期刊,進入EI、CA,PX,CBST等世界著名國際檢索系統(tǒng)。
國外的地學類專業(yè)全文數據庫主要有:Geo-ScienceWorld數據庫,它是由7家地球科學領域的頂尖協(xié)會共同建立的非營利型組織,現已出版32種地球科學領域相關的期刊文獻。AGU(美國地球物理協(xié)會)是以地球科學為核心內容的跨學科的綜合性研究站點,信息來源于世界上117個國家的38000余個科學家的研究進展和研究成果。外文文摘數據庫主要有GEOREF,是由美國地質協(xié)會(American Geological Institute)編輯的地學數據庫。它收錄了1785年以來的北美地學文獻和1933年以來的全世界地學文獻,至1994年共計170萬條,現年遞增8萬條文獻。GEOREF收錄的文獻范圍很廣,包括期刊、會議錄、圖書、地形圖和地質圖、學位論文、報告、傳記等,70%的文獻來源于世界各國出版的4000余種期刊,2%的文獻來源于會議錄。
互聯網上有許多高質量的學術網站和論壇。如:自然資源與環(huán)境Natural Resources&Environment http://www.snre.umich.edu/;中國國家地理 http://www.dili360.com/;中國地學網 http://bbs.geonet.cn/;地學探索 http://www.geology.com.cn/forum/;礦物記實雜志http://www.minrec.org/;極光 http://www.geo.mtu.edu/weather/aurora/;火山世界 http://volcano.und.nodak.edu/;中國地震科普網http://www.dizhen.ac.cn;化石網 http://www.uua.cn;地質與板塊科學http://www.gps.caltech.edu/;試驗巖石學 http://expet.gps.caltech.edu/;地質網 http://geology.com/;地球科學世界 http://geology.geoscienceworld.org/;地質與板塊http://www.gps.caltech.edu/等等。
對采集到的資源按一定策略進行重組與發(fā)布,建立地學學科導航體系,提高資源的可用性。學科館員可以建立專業(yè)的地學網站來組織、存儲和發(fā)布采集到的信息,也可以利用一些成熟數據庫商提供的工具組織和存儲。如中國知網提供了機構館工具,學科館員可以建立地學專業(yè)機構館,利用“文獻管理和互聯網信息挖掘”欄目為讀者推送地學研究領域相關的學術網站,并可進行分類管理和利用。
當然由于網絡資源更新速度快,不斷有新的資源產生,也不斷有過時的資源從網絡上消失,因此,學科館員要跟蹤學科資源發(fā)展變化,及時更新資源鏈接及本地副本資源,保證信息的時效性。
[1]張顯忠.“地學信息港”專業(yè)網站建設初探[J].圖書館學研究,2003,(6).
[2]常 青.農業(yè)網絡信息資源的采集[J].情報雜志,2007,(9).
[3]馬翠鳳.地質圖書館的專題特色數據庫建設[J].圖書館學研究,2006,(11).
[4]馬 冰,劉洪光,金真針.國內外地學文獻的信息源[J].地質通報,2009,(1).
[5]李 萍.網絡信息資源的采集策略[J].科技情報開發(fā)與經濟,2006,(8).
[6]付光宇,劉克偉.試論網絡信息資源的采集策略[J].網絡財富,2008,(9).
[7]譚建豪.數據挖掘技術[M].北京:中國水利水電出版社,2009.
(編輯:陸繼玲)