[摘 要]傳統(tǒng)文獻的獲取模式并不完全適用于當前科技灰色文獻的獲取。針對這一問題,本文以“存在形態(tài)”為標準,對科技灰色文獻重新進行分類;根據(jù)每種形態(tài)文獻各自的外部特征、發(fā)布、傳播和獲取障礙,提出針對性較強的獲取策略、方法、技術和手段,形成具有實踐指導和理論探索意義的獲取模式。
[關鍵詞]科技灰色文獻;存在形態(tài);獲取模式
[中圖分類號]G25 [文獻標識碼]A [文章編號]1008-0821(2010)02-0158-04
Study on the Acquisition Patterns of Science Technology Grey LiteratureSun Bijiao
(Postgraduate Department,China Defence Science and Technology Information Center,Beijing 100142,China)
[Abstract]Acquisition patterns of traditional literatures do not apply to the Science Technology(ST)grey literature in some cases.In order to find a possible solution to the problem,this paper divided various ST grey literatures into four groups according to their existing forms and put forward corresponding strategies,methods,technologies and means of acquisition,based on the analysis of their differences in external features,issuing,diffusing and obstacles in the process of acquisition.The acquisition patterns expounded here can serve as guidance in practice and also be taken as an attempt in theory exploration.
[Keywords]ST grey literature;existing form;acquisition patterns
灰色文獻指“不經(jīng)營性出版機構控制,而由各級政府、科研院所、學術機構、工商業(yè)界等所發(fā)布的、不作為正常商業(yè)出版物發(fā)行的各類印刷版與電子版文獻資料”[1];Internet上廣泛存在的不經(jīng)營利性組織控制、未通過正規(guī)網(wǎng)絡出版發(fā)行渠道發(fā)布的電子資源及依托于網(wǎng)絡產(chǎn)生的新形態(tài)資源(如e-print、博客、OA資源等),也屬于灰色文獻的范疇[2]。與期刊、圖書等傳統(tǒng)文獻類型相比較,灰色文獻具備發(fā)布靈活、類型多樣、信息量豐富等特征,在推動經(jīng)濟、科技及社會發(fā)展、促進知識傳播與創(chuàng)新的過程中發(fā)揮著重要作用。
科技灰色文獻是灰色文獻資源的重要組成部分,通常是在自然學科、工程技術等領域或其它相關部門、組織中生成的灰色文獻。科技灰色文獻具備一般灰色文獻的共性特征,同時在內容的專業(yè)性、前沿性和創(chuàng)新性等方面表現(xiàn)更為突出,往往蘊含了大量科研、技術人員感興趣的數(shù)據(jù)、圖表、信息、知識或者頗具借鑒、啟迪價值的思維“火花”。因此,科技灰色文獻一直是專業(yè)信息機構重點關注和收集的資源類型。
鑒于科技灰色文獻在出版、發(fā)行、流通、管理等方面的一些特性以及內容、形式的不確定性和不規(guī)范性[3](在網(wǎng)絡灰色文獻中表現(xiàn)得尤為突出),以該類文獻為目標的資源獲取工作,不僅要克服管理壁壘、技術障礙帶來的負面影響,還要不斷更新理念,深化對網(wǎng)絡環(huán)境下資源獲取目標的認識和理解,減少對文獻潛在價值的誤判。從這個意義上講,傳統(tǒng)的文獻獲取模式尚不能完全適應科技灰色文獻工作的特殊要求。針對這一問題,本文嘗試從重新劃分科技灰色文獻存在形態(tài)的角度出發(fā),在深入分析不同形態(tài)文獻特征的基礎上,對相應的獲取模式進行探討,希望能夠得出一些有益的結論和啟示。
1 科技灰色文獻的存在形態(tài)
本文中所說的“存在形態(tài)”,主要是指科技灰色文獻的呈現(xiàn)形式(方式),包括文獻整合程度、依托載體(紙質或電子版)的屬性、主要存儲/運動平臺的(傳統(tǒng)信息交流平臺或網(wǎng)絡平臺)屬性等具體內容。與常規(guī)的文獻分類依據(jù)(載體形態(tài)、發(fā)布機構屬性等)相比,將“存在形態(tài)”作為劃分標準,有利于更清楚的揭示和體現(xiàn)灰色文獻在生成、存儲、發(fā)布、傳遞、擴散過程中的差異——這些差異直接決定資源獲取策略、方法、工具和手段的制定或選擇。
2.1 “產(chǎn)品化”科技灰色文獻
“產(chǎn)品化”科技灰色文獻,是指以“信息產(chǎn)品”形態(tài)存在的科技灰色文獻。與一般零散的灰色文獻相比,“產(chǎn)品化”科技灰色文獻中凝結了更多的信息勞動,是經(jīng)過組織、加工和整合的有序信息集合;發(fā)布主體一般是政府部門、科研院所、專業(yè)學(協(xié))會等具有一定規(guī)模的組織或機構,且有將其生產(chǎn)的灰色文獻作為一種“信息產(chǎn)品”并參與流通的意愿;發(fā)布通道多為機構出版物或官方網(wǎng)站。除了在形式上具備系統(tǒng)化、規(guī)范化、標準化等特征,“產(chǎn)品化”科技灰色文獻內容的權威性和專業(yè)性通常也超過其它類型灰色文獻。
常見的“產(chǎn)品化”科技灰色文獻包括科技報告、學位論文以及專業(yè)學(協(xié))會組織出版的科技會議錄等;近年來,一些學術機構、團體依托互聯(lián)網(wǎng)建設的機構知識庫、學科知識庫、預印本文庫等,同樣也可以納入“產(chǎn)品化”科技灰色文獻的范疇。
2.2 “dark grey(深灰色)”文獻
本文中提出的“dark grey”文獻,實際上是對兩種科技灰色文獻的統(tǒng)稱:
①與一般的科技灰色文獻相比,內容較為敏感、特殊,如涉及核能研究或者防御技術的科技灰色文獻;
②由于生成/發(fā)布主體的某些特殊規(guī)定或(管理層面/技術層面的)限制,從而使得部分信息機構或用戶無法直接獲取的科技灰色文獻。
“dark grey”文獻最突出的特征是管理嚴格,對發(fā)布/傳播通道和空間的限制更多。需要特別指出的是:本文中界定的“dark grey”文獻依然屬于灰色文獻的范疇,是不危害生成/發(fā)布主體根本、核心或重要利益的科技文獻資源;獲取這類文獻的行為亦不觸犯相關法律法規(guī);它們的“難于”獲得,也是相對而言的(某些機構訪問獲取這些資源并不受限)。
期科技灰色文獻獲取模式研究Feb.,2010Vol.30 No.22.3 “隱性”科技灰色文獻的界定“隱性”科技灰色文獻,是本文借鑒知識管理中“隱性知識”概念而提出的,指的是那些已經(jīng)生成、但尚未通過任何發(fā)布通道發(fā)布或交流,或者因為所依托的發(fā)布通道影響力和輻射范圍有限、未能實現(xiàn)更廣泛傳播與利用的科技灰色文獻?!半[性”科技灰色文獻以個人灰色文獻為主,如科研人員在技術論證、試驗或演示過程中形成的工作札記、工作總結等,此外還包括一些僅限內部交流的機構出版物等。
與“隱性知識”相似,雖然“隱性”科技灰色文獻尚未正式進入信息交流與共享的平臺,但不能因此忽視它們的存在,更不能否認其中可能蘊含了極具價值的信息和知識。一些重要的創(chuàng)新和突破,往往首先見諸于這類“隱性”科技灰色文獻;大量正規(guī)出版物不會收錄的珍貴數(shù)據(jù)、信息、程序代碼、實驗方法等,也可能僅以該形態(tài)的文獻存在。
2.4 “原生態(tài)”科技灰色文獻的界定
本文中所提出的“原生態(tài)”科技灰色文獻,在某種程度上可以視為與“產(chǎn)品化”科技灰色文獻對立的一種文獻存在形態(tài),是指基本沒有經(jīng)過規(guī)范化信息組織和加工的“原生”科技灰色文獻。這類文獻的發(fā)布主體絕大多數(shù)是從事科研工作的個人,發(fā)布通道以網(wǎng)絡為主??萍紝I(yè)論壇、科研人員電子郵件組、IM聊天群組以及web2.0環(huán)境下興起的學術博客、微博客、維基等網(wǎng)絡平臺中,都集聚了海量“原生態(tài)”灰色文獻。
從形式上看,“原生態(tài)”科技灰色文獻最顯著的特點是隨機性,它的生成和發(fā)布幾乎不受任何“標準”或“規(guī)范”的制約(雖然有些博客網(wǎng)站要求必須添加tag,但由作者本人決定標注內容,無需參考主題詞表或敘詞表);從內容上看,“原生態(tài)”文獻中可能包含了頗具創(chuàng)新性的思想和方法,或者超越傳統(tǒng)媒體/媒介,首先介紹了某科研領域的發(fā)展動態(tài)和最新成果,但也可能充斥大量冗余、無關甚至錯誤信息,魚龍混雜、良莠不齊的問題同樣十分突出。此外,該類灰色文獻的發(fā)布通道和平臺大都具備較好的開放性和用戶友好性;部分可能需要注冊認證后才能訪問,但權限管理相對于“dark grey”文獻而言,一般比較寬松。
下表中給出了4種不同類型的科技灰色文獻及其存在形態(tài)的簡要描述,從中也可以它們之間的區(qū)別:表1 基于存在形態(tài)的科技灰色文獻類型劃分
科技灰色文獻類型存在形態(tài)概述“產(chǎn)品化”以成熟信息產(chǎn)品的形態(tài)存在;作為有序信息的集合,系統(tǒng)性、規(guī)范性、連續(xù)性、開放性(可訪問性與可獲取性)較強;“dark grey”多以限制訪問權限、獲取權限或傳播范圍的內部出版物、內部數(shù)據(jù)庫等形式存在; 開放性較差;“隱性”以尚未公開發(fā)布或傳播范圍有限的個人灰色文獻為主,也包括部分僅限于內部傳播、交流的科技信息資源;不易檢索、查詢;“原生態(tài)”未經(jīng)過信息組織和加工的灰色文獻;多依托于網(wǎng)絡平臺;開放性較強,但系統(tǒng)性、規(guī)范性較差
2 科技灰色文獻的獲取模式
2.1 “產(chǎn)品化”科技灰色文獻的直接獲取模式
直接獲取模式,是根據(jù)“產(chǎn)品化”科技灰色文獻的發(fā)布、傳播特征提出的,基本思想就是將獲取其它信息產(chǎn)品的策略與方法直接“移植”到這類灰色文獻的獲取過程中,即通過采購、訂閱、下載、交換、索取等信息產(chǎn)品獲取方法[4],從發(fā)布主體或一般的獲取通道直接獲取所需灰色文獻,如圖1所示。
圖1 “產(chǎn)品化”灰色文獻的直接獲取模式 直接獲取模式的常用方法主要有以下幾種:
①采購,通過向灰色文獻的生成或發(fā)布主體支付一定的費用,獲取所需文獻;
②訂閱,與期刊訂閱或者網(wǎng)站RSS服務定制相似,提出申請并經(jīng)允許后,獲取訪問或占有某種(類)灰色文獻的權限(可能需要交納一定的費用);
③下載,直接或交納費用后從發(fā)布灰色文獻資源的網(wǎng)站下載所需內容;某些網(wǎng)站發(fā)布通道允許運行網(wǎng)絡自動采集程序,可通過計算機系統(tǒng)批量下載;
④交換,同類組織或機構間常見的信息交流方式,通過相互交換(各自生產(chǎn)或占有的灰色文獻),獲取所需資源;
⑤索取,直接向灰色文獻的生成和發(fā)布主體索取所需資源,可能需要一定的人際網(wǎng)絡關系作為基礎。
直接獲取模式是在假定“產(chǎn)品化”科技灰色文獻的生成/發(fā)布主體愿意將這些文獻資源作為“產(chǎn)品”出售(非營利性)或交流的前提下提出的。因此,該模式的獲取效果在很大程度上取決于發(fā)掘工作是否能夠找到發(fā)布主體和發(fā)布通道。如果能夠準確鎖定發(fā)布主體和發(fā)布通道,并了解目標文獻的發(fā)布規(guī)律(如科技會議的召開時間、OA科技期刊的更新時間等),則直接獲取的成功率會比較高。此外,建立并維系有效的人際交流網(wǎng)絡,對于直接獲取來說也是非常重要的。
2.2 “dark grey”文獻的間接獲取模式
間接獲取模式,是針對“dark grey”文獻獲取過程中存在的種種問題提出的,其基本思想是“化直為曲”、“從簡入繁”,通過各種途徑和技術方法,有效地規(guī)避目標文獻生成/發(fā)布主體設置的限制和障礙,獲取所需文獻(如圖2所示)。
上圖直觀的給出了間接獲取模式的四種具體實現(xiàn)路徑:
①通過一個(或多個)提供專業(yè)科技文獻服務的信息中介(機構、組織、團體、企業(yè)等)獲取所需文獻;
②通過不公開的信息中介機構(圖中所示的“中介X”)獲取所需文獻;“中介X”的主要工作和職能并不是文獻服務,而是指在特定環(huán)境和條件下能夠在文獻獲取過程中發(fā)揮一定作用的機構;
③通過一個(或多個)中介人獲取所需文獻;這里的“中介人”與模式A中的通過人際關系直接索取不同:模式A中的“人際關系”是指來自發(fā)布主體所在機構或發(fā)布圖2 “dark grey”文獻的間接獲取模式 通道、可直接提供所需資源的人;這里的人際關系是指提供中介或橋梁作用的聯(lián)系人,他(們)本身并不占有資源;
④如果發(fā)布主體/發(fā)布通道對目標灰色文獻的訪問獲取權限實施分類管理,信息機構或用戶可以嘗試用“偽裝身份”(A→A′)或借助相關技術,獲得文獻的訪問與獲取權限。
間接獲取模式中,如果獲取目標是印刷型或off-line科技信息資源,可以通過委托中介,或者用“偽裝身份”獲取;如果獲取目標是網(wǎng)絡在線資源,只是因為某些特殊的限制而無法獲取,則可以通過采用一些技術手段嘗試獲取。比如某存儲灰色文獻的網(wǎng)絡平臺對允許訪問用戶的IP地址段有所限制,則在無法正常打開網(wǎng)頁的情況下,可以選擇使用代理服務器,間接獲取訪問權限。在平時的網(wǎng)絡資源自動采集過程中,也可以廣泛應用智能代理技術,根據(jù)不同平臺的限制,靈活的變換IP地址,調整采集指令,完成信息獲取。
間接獲取的效果主要取決于兩方面:①科技灰色文獻生成/發(fā)布主體的權限管理情況,如果管理嚴格,審查程序復雜,則最終獲取所需資源的難度較大;如果管理較寬松,則可以通過中介或采用一定的技術方法獲取所需資源;②信息中介的獲取能力與獲取“藝術”,不同的信息中介可能采用不同的路徑或方法,最終的效果也不盡相同。雖然間接獲取的過程中有很多不確定因素,但最終成功獲取的科技灰色文獻資源,其效用和價值通常也相對較高。
在科技信息跨地域、跨學科、無障礙共享已經(jīng)成為大趨勢的時代背景下,科技灰色文獻中的dark grey并不多見,一般只集中在特定研究領域中。
2.3 “隱性”科技灰色文獻的“顯性”獲取模式
“顯性”獲取模式,同樣借鑒了知識管理中“隱性知識顯性化”的理念,其基本思想是從事科技信息服務的專業(yè)機構通過創(chuàng)造交流機會、搭建交流平臺等方式,吸引、鼓勵“隱性”科技灰色文獻的所有者主動發(fā)布、提交所掌握的資源;或者將原先依托于其它“弱勢”渠道或平臺的科技灰色文獻主動轉移到機構開發(fā)、維護、管理的新渠道/平臺中。在這樣一種工作模式下,以獲取目標文獻為最終目的的信息機構,其角色也發(fā)生了一定的變化,客觀上發(fā)揮了“信息中介(信息平臺搭建者)”的作用(如圖3所示)。
圖3 “隱性”灰色文獻的顯性獲取模式
實際操作過程中,“交流機會”的創(chuàng)造和“交流平臺”的建設可以很簡單(如在某專業(yè)論壇或電子郵件組中就近期關注的主題發(fā)起一次討論),也可以很復雜(如建立學科知識庫、組織召開大規(guī)模的學術交流會議及征文活動、建設并維護專業(yè)論壇等),應綜合考慮現(xiàn)實條件、獲取需求、可操作性等因素后再做定奪。
“顯性”獲取模式的核心是建立“隱性”灰色文獻的“顯性化”渠道和平臺,因此,所采用的技術、方法也需要根據(jù)具體的渠道和平臺而調整:
(1)如果渠道和平臺是依托于互聯(lián)網(wǎng)的,則需要運用網(wǎng)站設計、建構、管理、維護的相關技術和方法;
(2)如果是具有社會屬性的渠道和平臺,如研討會、征文等學術交流活動,則需要綜合運用管理學、心理學、社會學、統(tǒng)計學等多門學科的知識和方法,對“隱性”灰色文獻所有者的心理狀態(tài)、行為模式等進行分析、研究、預測和判斷,在此基礎上制定交流平臺建設規(guī)劃及實施細則,最大程度的調動其積極性和參與熱情。
“顯性”獲取模式可以充分體現(xiàn)信息機構的主觀能動作用和創(chuàng)造力;如果確實能夠建立起高質量的渠道和互動平臺,真正調動“隱性”灰色文獻所有者的積極性和參與性,獲取資源的數(shù)量和質量都是相當客觀的。更重要的是,這種模式下的“獲取”實際上是一種長期的、連續(xù)的過程,渠道/平臺的生存時間、發(fā)展狀態(tài)與吸納、獲取資源的數(shù)量和質量存在正相關關系。
3.4 “原生態(tài)”科技灰色文獻的二次獲取模式
根據(jù)對“原生態(tài)”灰色文獻形式、內容和發(fā)布通道特征的分析,可以得出這樣的結論:“原生態(tài)”灰色文獻的獲取,最大的困難不是“物理占有”,而是“價值占有”;也就是說,獲取的真正目標是蘊含在“原生態(tài)”灰色文獻中有價值、有意義的信息和知識,如新的實驗方法、經(jīng)過優(yōu)化的程序代碼、技術創(chuàng)新理念等。二次獲取模式,就是針對這樣的要求提出的:其基本思想是把獲取過程劃分為兩個階段,第一個階段首先進行大規(guī)模的資源搜集和初步遴選;在第二個階段(即“二次獲取”過程中),借助先進的人工智能技術,實現(xiàn)從“物理獲取”到“價值獲取”的轉變,將相對簡單、粗放型的“資源位移”式獲取,提升至相對復雜、集約型的“資源開發(fā)”式獲取。如圖4所示:
圖4 “原生態(tài)”灰色文獻的二次獲取模式
與其它模式相比較,二次獲取模式最大的特點在于增加了獲取系統(tǒng)對目標“價值”的分析與識別過程,是一種有“選擇性”的獲取方式。實際上,其它獲取模式中同樣存在選擇機制或選擇過程,只是這些“選擇”通常在信息源發(fā)掘階段已經(jīng)完成,而“原生態(tài)”科技灰色文獻因為其自身的特點,需要將“分析、判斷和選擇”貫徹始終。
以人工智能技術為基礎的“原生態(tài)”灰色文獻二次獲取模式,在具體的獲取實踐中,需要綜合運用包括專家系統(tǒng)、自然語言理解與處理、機器學習、神經(jīng)網(wǎng)絡、自動程序設計、自動推理與搜索、智能機器人、知識發(fā)現(xiàn)系統(tǒng)、自動采集與分類等在內的各種技術,提高對獲取目標的“價值”分析與判斷能力。從理論上分析,在人工智能技術發(fā)展到相當水平的基礎之上,二次獲取模式應該能夠完成對絕大多數(shù)“原生態(tài)”科技灰色文獻的識別、判斷和選擇,不但可以獲取真正有價值的信息資源,同時可以避免盲目獲取造成的資源耗費。
3 總 結
本文中詳細闡述的獲取模式,是在對(上接第161頁)
科技灰色文獻進行分類分析的基礎上提出的,既有對科技報告、學位論文、工作札記等傳統(tǒng)灰色文獻獲取工作實踐的概括和總結,也有對博客、機構知識庫、專業(yè)論壇等網(wǎng)絡環(huán)境下出現(xiàn)的新形態(tài)灰色文獻獲取模式的理論研究和探討。
鑒于科技灰色文獻運動狀態(tài)和運動環(huán)境的多樣性,本文以“存在形態(tài)”為依據(jù)進行的劃分并非是“完全排它性”的,也就是說某種特定形態(tài)的文獻在一定的運動階段和環(huán)境中,可能同時具備其它形態(tài)的特征。因此,獲取過程中的模式選擇和應用并不是絕對固化的,而應該根據(jù)文獻的實際存在/運動狀態(tài)靈活調整,實現(xiàn)最高的工作效費比。
參考文獻
[1]王應寬.什么是灰色文獻(Grey Literature) [EB/OL].http:∥www.sciencenet.cn/m/usercontent.aspx id=21494,2009-09-20.
[2]徐劉婧,劉細文.國外網(wǎng)絡灰色文獻開發(fā)利用模式及服務方式研究[J].圖書情報知識,2006,(1):78-80.
[3]馬學立.灰色文獻內涵與外延的辨析及界定——關于文獻等級結構研究系列之三[J].圖書館建設,2003,(1):13-15.
[4]姜華珍.信息時代如何開發(fā)利用灰色文獻[J].圖書館論壇,2001,21(4):72-74.
[5]張永紅.國外灰色文獻整理現(xiàn)狀及其啟示[J].大學圖書情報學刊,2006,24(2):89-92.
[6]傅翠曉,秦榮環(huán),陳冬梅.淺析網(wǎng)上灰色文獻的開發(fā)利用現(xiàn)狀[J].現(xiàn)代情報,2006,(3):153-155.
[7]王知津.論灰色文獻及其獲取[J].情報理論與實踐,1997,20(5):283-286.