文 / 唐長樂 張曉娟
國外社會科學(xué)數(shù)據(jù)檔案機構(gòu)的發(fā)展與研究現(xiàn)狀
文 / 唐長樂 張曉娟
文章探討了社會科學(xué)數(shù)據(jù)檔案這一術(shù)語的基本含義,對國外主要的社會科學(xué)檔案管理機構(gòu)的發(fā)展演變以及國際合作進行了梳理,并分析了2010年以來國外社會科學(xué)數(shù)據(jù)檔案的主要研究內(nèi)容。
社會科學(xué)數(shù)據(jù);數(shù)據(jù)檔案;社會科學(xué)數(shù)據(jù)檔案
社會科學(xué)數(shù)據(jù)對于社會科學(xué)領(lǐng)域的實證研究具有決定性意義。社會科學(xué)數(shù)據(jù)目前主要集中于經(jīng)濟、社會領(lǐng)域。其中使用最多的有兩類數(shù)據(jù):一類是國家統(tǒng)計部門的統(tǒng)計數(shù)據(jù), 另一類是為社會科學(xué)研究和政策制定而專門進行的調(diào)查數(shù)據(jù)[1]。這些數(shù)據(jù)因其具有極大的參考和利用價值而被作為歷史記錄保存下來,國外尤其是歐美國家很早就意識到了這些數(shù)據(jù)的重要性,并將它們作為專門性的檔案進行集中管理,設(shè)置了保管這類數(shù)據(jù)檔案的專業(yè)機構(gòu)——社會科學(xué)數(shù)據(jù)檔案館(Social Science Data Archives,SSDA),并配備專業(yè)的數(shù)據(jù)檔案工作者(Data Archivist)進行管理。
為了使國內(nèi)對國外社會科學(xué)檔案及機構(gòu)有系統(tǒng)的了解,以便于借鑒相關(guān)經(jīng)驗,本文在對SSDA這一術(shù)語進行分析定性的基礎(chǔ)上,系統(tǒng)梳理以歐美為代表的SSDA及其國際合作的發(fā)展歷史和現(xiàn)狀,分析了自2010年以來SSDA研究的主要內(nèi)容。
在國內(nèi),學(xué)者對SSDA這一術(shù)語存在不同的譯法,如“社科數(shù)據(jù)資料”、“社科資料檔案”、“社科數(shù)據(jù)資料中心”、“社科數(shù)據(jù)資源庫”、“社科資料檔案中心”、“社科數(shù)據(jù)存儲中心”等;維基百科對Social Science Data Archives也有定義“它是用于獲取、準(zhǔn)備、保存和傳播社會和行為數(shù)據(jù)的專業(yè)機構(gòu)”,并進一步指出Data Archives既可以指社會科學(xué)數(shù)據(jù)管理機構(gòu),也可以是自然科學(xué)數(shù)據(jù)管理機構(gòu),但后者通常使用“Data Centers”[2]。事實上,從機構(gòu)層面看,Archives這一名詞本身就有“檔案部門”、“檔案室”、“檔案館”的含義,所以SSDA應(yīng)屬于專門的檔案機構(gòu);從保存對象看,Archives也是“檔案”的含義,雖然 SSDA保管的對象不同于一般意義上以文書檔案保管為主的檔案館,但其所保存的社科數(shù)據(jù)也是專業(yè)社會科研活動的重要歷史數(shù)據(jù),具有唯一性和憑證性。所以SSDA應(yīng)當(dāng)被視為專門的社科數(shù)據(jù)檔案保管機構(gòu)或者專業(yè)的社科數(shù)據(jù)檔案,兩者根據(jù)語境,可分別從機構(gòu)和保存對象層面來理解。對于與SSDA相關(guān)的Data Archivist數(shù)據(jù)檔案工作者,其主要職責(zé)是協(xié)助研究人員鑒定數(shù)據(jù)的保存價值,記錄上下文信息,創(chuàng)建元數(shù)據(jù),確定數(shù)據(jù)的限制范圍以及保管的期限[3]。
SSDA在國外有著60多年的悠久歷史。社會調(diào)查方法和計算機技術(shù)的不斷創(chuàng)新是導(dǎo)致社會科學(xué)數(shù)據(jù)檔案發(fā)展的主要因素。在SSDA發(fā)展的早期,許多科研機構(gòu)設(shè)置了專門的社科數(shù)據(jù)檔案管理部門,用于管理來自社會調(diào)查和統(tǒng)計機構(gòu)的數(shù)據(jù)檔案,那時的社科數(shù)據(jù)主要保存在打孔卡、磁帶和磁盤上,需要專業(yè)人員進行管理和利用指導(dǎo)。但隨著計算機技術(shù)的發(fā)展和網(wǎng)絡(luò)技術(shù)普及,越來越多的SSDA建立了專門的社科數(shù)字?jǐn)?shù)據(jù)檔案庫。本文主要分析國外特別是歐美國家最具代表性的幾個SSDA的發(fā)展演變情況。
世界上最早的SSDA可以追溯到1947年美國初創(chuàng)的第一個數(shù)據(jù)檔案管理機構(gòu)——羅普中心(Roper Center)。1945年,調(diào)查研究創(chuàng)始人之一的Elmo Roper,將他從20世紀(jì)30年代中期開始積累起來的民意調(diào)查數(shù)據(jù)(用最早的IBM機器制作出來的成箱打孔卡片)捐贈給美國的威廉姆斯學(xué)院(Williams college),這一做法正是美國的傳統(tǒng):將重要的文獻資料捐贈給大學(xué)圖書館。他認(rèn)為這些數(shù)據(jù)應(yīng)作為檔案保存,因為它們具有很高的歷史價值,是未來歷史學(xué)家和當(dāng)前學(xué)者研究的寶庫??梢姡绹纳缈茢?shù)據(jù)檔案是作為大學(xué)圖書館的一部分發(fā)展起來的。直到1957年,威廉姆斯學(xué)院圖書館的這個專門部門才獨立出來,改名為“羅普公眾輿論研究中心”(Roper Center for Public Opinion Research);1977年的結(jié)構(gòu)重組導(dǎo)致中心搬遷到康涅狄格大學(xué),其收集和開放數(shù)據(jù)檔案的范圍亦擴大到世界范圍。2015年11月,羅普中心搬到了位于紐約州伊薩卡的康奈爾大學(xué),中心已經(jīng)收集超過22000多個來自美國和其他100多個國家的民意調(diào)查數(shù)據(jù)集,并以每年數(shù)百個的速度增長,建立了專注于公眾輿論調(diào)查和分析、世界領(lǐng)先的社會科學(xué)數(shù)據(jù)檔案庫。
羅普中心的建立帶動了美國其他社科數(shù)據(jù)檔案機構(gòu)的建立。1964年加州大學(xué)伯克利分校建立的國際數(shù)據(jù)圖書館和參考咨詢服務(wù)調(diào)查研究中心(International Data Library and Reference Service Center)收藏了抽樣調(diào)查數(shù)據(jù)和來自發(fā)展中國家的數(shù)據(jù)檔案,特別是拉丁美洲和亞洲的數(shù)據(jù)檔案,該校的洛杉磯分校1961年就開始社科數(shù)據(jù)的存檔工作,1972年成立調(diào)查研究中心(survey Research Center),1974年數(shù)據(jù)檔案轉(zhuǎn)移到新成立的社會科學(xué)研究所(Social Science Research,ISR),2010年又從ISR中分離成為現(xiàn)在的加州大學(xué)洛杉磯分校社會科學(xué)檔案館(Social Science Archive,SSDA);1965北卡羅來納州教堂山分校奧多姆研究所建立路易斯·哈里斯政治數(shù)據(jù)中心(The Louis Harris Political Data Center),專注于調(diào)查數(shù)據(jù)檔案的收藏,包括超過16萬份涉及諸如越南退伍軍人、西班牙裔、青少年和老年人群體的受訪者檔案,調(diào)查主題涵蓋了老齡化、環(huán)境問題、休閑藝術(shù)、總統(tǒng)評級、醫(yī)療保險等話題,這些檔案允許研究人員跟蹤公眾觀點和態(tài)度的變化[4];1962年在美國密歇根州安阿伯市,由美國全部高校合作成立了校際政治研究聯(lián)合會(The Inter-University Consortium for Political Research,ICPR),該組織于1975年更名為校際政治和社會研究聯(lián)合會(The Inter-University Consortium for Political and Social Research,ICPSR),目前作為密歇根大學(xué)社會研究所的一個單位。ICPSR是一個會員制組織,在世界各地約有760所會員學(xué)院和大學(xué)以及其他研究機構(gòu)。ICPSR維護并提供了大量的社會科學(xué)研究數(shù)據(jù)檔案,用于研究和教學(xué),目前擁有超過8000個離散研究/調(diào)查,具有超過65,000個數(shù)據(jù)集,為了確保數(shù)據(jù)資源可供下一代學(xué)者使用,ICPSR將其數(shù)據(jù)檔案遷移到新的存儲介質(zhì),并對文件格式進行轉(zhuǎn)換以確保技術(shù)變更后仍可利用。此外,ICPSR還提供用戶支持,幫助研究人員識別相關(guān)數(shù)據(jù)進行分析和開展研究項目[5]。
在歐洲,最早的社會科學(xué)數(shù)據(jù)檔案管理機構(gòu)是1960年德國科隆大學(xué)建立的社會研究中央檔案館(Zentralarchiv fur Empirische Sozialforschung of the University of Cologne,ZA)。該機構(gòu)由科隆大學(xué)經(jīng)濟學(xué)家Gint. Schmolders和社會實證研究所所長Erwin K. Scheuch向市政當(dāng)局建議創(chuàng)立,并由二人擔(dān)任正副館長,與美國的羅普中心不同的是,中央檔案館初期并不屬于大學(xué)圖書館,而是大學(xué)的一個獨立機構(gòu),因此它不必靠收取服務(wù)費用或外部資金維持運轉(zhuǎn),而享有預(yù)算配備和專職人員。這一機構(gòu)的中心思想是更加有效地利用收藏的社科數(shù)據(jù)檔案 ,使機構(gòu)的組織方式能夠有利于科研教學(xué)。1969年該館組建獨立的波恩社會科學(xué)信息中心(IZ),加強與其他國家的合作,包括建立與瑞士和奧地利等社科數(shù)據(jù)檔案機構(gòu)的數(shù)據(jù)聯(lián)網(wǎng)服務(wù)。1986年社會研究中央檔案館(ZA)、信息中心(IZ)與曼海姆調(diào)查研究方法中心(ZUMA)在德國社會科學(xué)基金會的協(xié)調(diào)下合并為一家,組建為德國社會科學(xué)基礎(chǔ)設(shè)施服務(wù)中心(Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen,GEISIS)。目前GEISIS已成為德國社會科學(xué)最大的基礎(chǔ)設(shè)施機構(gòu),擁有300多名員工,其數(shù)據(jù)檔案包含5000多個關(guān)于社會科學(xué)問題的研究,提供大量的國家和國際相關(guān)的研究型基礎(chǔ)設(shè)施服務(wù)[6]。
除此之外,歐洲還出現(xiàn)了其他的社會科學(xué)數(shù)據(jù)檔案館,如1964年由荷蘭阿姆斯特丹大學(xué)建立的斯坦因麥茨檔案館(Steinmetz Stichting),專門收藏民意調(diào)查數(shù)據(jù)檔案;1963年挪威卑爾根建立的克里斯蒂安·米切爾森研究所(Christian Michelsen Research Center),收藏大量的政府機構(gòu)實地調(diào)查和統(tǒng)計數(shù)據(jù),兩者的數(shù)據(jù)檔案原來都屬于年代較為長久的研究部門和傳統(tǒng)檔案部門管理[7];
英國數(shù)據(jù)檔案館(UK Data Archive,UKDA)是英國最大的社會科學(xué)和人文科學(xué)數(shù)據(jù)檔案存儲機構(gòu)。由于資助機構(gòu)和收集對象的變化,UKDA經(jīng)歷了數(shù)次名稱變動:其前身為1965年在社會和經(jīng)濟檔案委員會(Social and Economic Archive Committe)的幫助下成立的埃塞克斯大學(xué)社會研究中心;由于從調(diào)查、問卷或訪談中收集數(shù)據(jù)是一項艱苦的過程,而且為科研提供準(zhǔn)確的數(shù)據(jù)也并非易事,于是1967年由社會科學(xué)研究委員會(Social Science Research Council,SSRC)資助,成立了SSRC數(shù)據(jù)銀行(SSRC Data Bank);1972年,當(dāng)政府統(tǒng)計局允許其對政府調(diào)查進行存檔時,將其名稱從SSRC數(shù)據(jù)銀行更改為調(diào)查檔案館(Survey Archive);調(diào)查檔案館在1982年開始?xì)w檔更多類型的社科數(shù)據(jù)資源而不僅僅是調(diào)查數(shù)據(jù),并更名為SSRC數(shù)據(jù)檔案館(SSRC Data Archive);SSRC于1984年改名為經(jīng)濟和社會研究理事會(Economic and Social Research Council, ESRC)時,檔案館再次改名為ESRC數(shù)據(jù)檔案館(ESRC Data Archive); 1996年,英國數(shù)據(jù)存檔開始從聯(lián)合信息系統(tǒng)委員會(Joint Information Systems Committe,JISC)獲得直接資助,以表彰存檔對教學(xué)和學(xué)習(xí)提供的支持,并將ESRC從其名稱中刪除,成為數(shù)據(jù)檔案館(Data Archive);2000年,為了反映其在全英國的職權(quán)范圍和其在國際背景下的作用和重要性,該組織正式命名為英國數(shù)據(jù)檔案館(UK Data Archive);2005年UKDA被英國國家檔案館指定為數(shù)據(jù)托管和存儲處。UKDA將收集、存儲、組織和再利用社會科學(xué)數(shù)據(jù)作為自身的發(fā)展使命,數(shù)據(jù)檔案數(shù)量龐大、種類繁多,主要收藏人文社科領(lǐng)域的數(shù)據(jù),成為當(dāng)代研究人員、教師和學(xué)生重要的指導(dǎo)材料。
20世紀(jì)60年代初期,為獲得社會科學(xué)數(shù)據(jù)用于跨國和跨文化分析,一些學(xué)者努力推動社會科學(xué)數(shù)據(jù)檔案機構(gòu)的國際合作,他們說服由聯(lián)合國教科文組織下設(shè)的國際社會科學(xué)理事會(International Social Science Council,ISSC)建立這種具有實證性的社會研究基礎(chǔ)設(shè)施合作的重要性。
1962年在法國拉那波爾,國際社會科學(xué)理事會(International Social Science Council,ISSC)主持召開了社會科學(xué)數(shù)據(jù)檔案大會(Conference on Data Archives In The Social Sciences),大會建議聯(lián)合國教科文組織采取步驟,在國際層面上研究構(gòu)建社會科學(xué)數(shù)據(jù)檔案合作網(wǎng)絡(luò),探討利用社科數(shù)據(jù)檔案進行二次分析的問題和潛力。這次會議后,1963年6月在科隆大學(xué)召開了一次僅限于歐洲地區(qū)的社會科學(xué)數(shù)據(jù)檔案會議,目的是幫助歐洲的數(shù)據(jù)檔案機構(gòu)建立起一種集體觀念,會上介紹了美國羅普中心、德國科隆大學(xué)社會研究中央檔案館的經(jīng)驗,討論了調(diào)查數(shù)據(jù)、票選數(shù)據(jù)、基礎(chǔ)統(tǒng)計和定量研究數(shù)據(jù)的歸檔,社科數(shù)據(jù)檔案檢索系統(tǒng),跨國社科數(shù)據(jù)利用,以及建立國際社科數(shù)據(jù)檔案機構(gòu)合作的可能性[8]。
1964年在法國巴黎召開第二屆社會科學(xué)數(shù)據(jù)檔案大會,參會的包括歐洲和美國的社會科學(xué)家和社科數(shù)據(jù)檔案機構(gòu),會議討論了歐洲和美國的調(diào)查數(shù)據(jù)檔案的收集;數(shù)據(jù)的選擇、再擴散和利用;數(shù)據(jù)提供者、檔案館和用戶之間的關(guān)系;數(shù)據(jù)準(zhǔn)備、存儲、處理和檢索的程序; 檔案在研究生教育中的作用和建立檔案合作網(wǎng)絡(luò)[9]。
1966年在倫敦召開了第三屆社會科學(xué)數(shù)據(jù)檔案大會,由于擔(dān)心出現(xiàn)壟斷組織,歐洲社科數(shù)據(jù)檔案機構(gòu)以及全美校際政治研究聯(lián)合會(ICPR)一致否決了羅普中心建立國際性社會科學(xué)數(shù)據(jù)收集機構(gòu)的提議。會上成立了社會科學(xué)數(shù)據(jù)檔案常設(shè)委員會(Standing Committee on Data Archives),負(fù)責(zé)起草檔案收集方案和協(xié)調(diào)國際合作。會議涵蓋的主題包括歸檔數(shù)據(jù)的存儲、分類和檢索;要存儲的數(shù)據(jù)類型;檔案操作的財務(wù)基礎(chǔ);在沒有數(shù)據(jù)檔案機構(gòu)的國家拯救檔案的行動;存檔數(shù)據(jù)庫建設(shè);檔案組織之間的合作安排以及國際社會科學(xué)理事會和教科文組織的作用。會議成立了三個工作隊:第一個關(guān)于調(diào)查數(shù)據(jù)檔案目錄,由阿姆斯特丹大學(xué)的Marten Brouwer主導(dǎo):第二個關(guān)于生態(tài)檔案,由卑爾根克里斯蒂安﹒米切爾森研究所的Stein Rokkan主導(dǎo);第三個關(guān)于檔案信息檢索,由科隆大學(xué)的Erwin Scheuch主持[10]。第三屆社會科學(xué)數(shù)據(jù)檔案大會標(biāo)志著SSDA的國際合作步入正軌。
1976年在荷蘭阿姆斯特丹,社會科學(xué)數(shù)據(jù)檔案常設(shè)委員會召開了一次會議,會上羅普中心認(rèn)為應(yīng)建立全球性社科檔案數(shù)據(jù)庫并收取費,希望歐洲國家能將調(diào)查數(shù)據(jù)存入羅普中心,全美校際政治研究聯(lián)合對此表示支持,但歐洲國家一致反對美國這種壟斷做法,認(rèn)為應(yīng)該免費提供數(shù)據(jù),并且各個SSDA之間應(yīng)該屬于合作性質(zhì),不應(yīng)存在將數(shù)據(jù)集中到某個機構(gòu)的做法。這次互相對立的會議使得歐洲產(chǎn)生了憂患意識,為了確保歐洲的檔案在國際合作中不被其他國家盜用,會上成立了歐洲社會科學(xué)數(shù)據(jù)檔案委員會(Consortium of European Social Science Data Archives,CESSDA),以協(xié)調(diào)歐洲數(shù)據(jù)檔案機構(gòu)的國際合作,確保歐洲SSDA的共同利益。
1977年5月社會科學(xué)數(shù)據(jù)檔案常設(shè)委員會在比利時的新盧萬再次召開會議,除羅普中心以外,歐洲所有的以及美國的幾個較大的社科數(shù)據(jù)檔案機構(gòu)參加了這次國際會議,會上成立了國際社會科學(xué)數(shù)據(jù)組織聯(lián)合會(International Federation of Data Organizations for the Social Science, IFDO)取代“常設(shè)委員會”履行其大部分職能[11]。國際社會科學(xué)理事會很快就接受IFDO為其加盟成員。新盧萬會議標(biāo)志著社會科學(xué)數(shù)據(jù)檔案機構(gòu)國際合作的正規(guī)化。
CESSDA和IFDO兩大國際SSDA合作組織的成立,大大加強了社會科學(xué)數(shù)據(jù)檔案管理的國際性交流,使SSDA機構(gòu)有了正規(guī)的合作渠道。這兩大國際性組織,在機構(gòu)成員上大致相同,但兩者的職能有別,CESSDA屬于業(yè)務(wù)機構(gòu)性質(zhì),負(fù)責(zé)檔案機構(gòu)之間具體業(yè)務(wù)協(xié)調(diào)、統(tǒng)一的資料說明和元數(shù)據(jù)標(biāo)準(zhǔn)制定、檔案數(shù)據(jù)庫的運營;而SSDA 屬于政策機構(gòu)性質(zhì),負(fù)責(zé)各個檔案機構(gòu)之間合作政策的制定以及方案的審核。兩個組織都不接受個人會員性質(zhì)的成員加入。
據(jù)此,1977年美國一些數(shù)據(jù)機構(gòu)也組織了一個名為國際社會科學(xué)信息服務(wù)和技術(shù)協(xié)會(International Association for Social Science Information Services and Technology,IASSIST)的國際組織。IASSIST與CESSDA、IFDO不同,在成員性質(zhì)上,IASSIST的成員主要是單一的會員身份,目前擁有300多名來自各個機構(gòu)的會員,包括數(shù)據(jù)檔案館、統(tǒng)計機構(gòu)、研究中心、圖書館、學(xué)術(shù)部門、政府部門和非營利組織[12],而CESSDA和IFDO屬于組織聯(lián)盟;在組織性質(zhì)上,IASSST屬于社會科學(xué)信息情報組織,其目的是為圖書館員、檔案工作者、社會科學(xué)信息專家提供專業(yè)的發(fā)展、交流和會議機會,增強社會科學(xué)基礎(chǔ)實施建設(shè),而CESSDA與IFDO屬于專業(yè)的SSDA合作組織。
筆者統(tǒng)計了2010年以來與SSDA相關(guān)的研究文獻和資料,通過內(nèi)容分析,將其分為五個方面:
SSDA的發(fā)展影響了二十世紀(jì)后半葉社會科學(xué)、研究方法和數(shù)據(jù)標(biāo)準(zhǔn)的國際發(fā)展,也推動了數(shù)據(jù)密集型科學(xué)的產(chǎn)生。盡管SSDA的重要性毋庸置疑,他們的歷史卻從未被深入敘述和研究,特別是從知識基礎(chǔ)設(shè)施角度。Edwards將知識基礎(chǔ)設(shè)施定義為“生成,共享和維護人類和自然界特定知識的人、工件和機構(gòu)的強大網(wǎng)絡(luò)”[13]。今天,我們很容易理解這類基礎(chǔ)設(shè)施包括SSDA的網(wǎng)絡(luò)數(shù)字?jǐn)?shù)據(jù)存儲庫,但早期SSDA支持的打孔卡、磁帶驅(qū)動器收集和分發(fā)數(shù)據(jù)也屬于知識基礎(chǔ)設(shè)施。
Shankar指出,SSDA的發(fā)展歷史能夠反映社會科學(xué)領(lǐng)域“量化客觀性的歷史”[14]。在學(xué)科層面,社會科學(xué)將社科數(shù)據(jù)檔案作為實證研究的支撐,反映了提高自身在學(xué)科領(lǐng)域的話語權(quán)和地位的訴求;在國家層面,資助機構(gòu)對定量數(shù)據(jù)和實際結(jié)果的偏好,對提高理性和科學(xué)決策的期望,都導(dǎo)致了社科研究機構(gòu)對實證研究的熱衷,由此對定量數(shù)據(jù)歸檔和用于研究再利用的需求也愈發(fā)強烈。SSDA作為知識基礎(chǔ)設(shè)施的發(fā)展史是由多種因素共同塑造的,包括社會科學(xué)的量化訴求、數(shù)據(jù)檔案利用和用戶需求的聯(lián)動、資助來源和收入結(jié)構(gòu)的變化,以及SSDA之間合作關(guān)系和網(wǎng)絡(luò)結(jié)構(gòu)的演變。Shankar通過跟蹤IASSIST季刊(Journal International Association of Social Science Information Services and Technology Quarterly)中出現(xiàn)的SSDA機構(gòu)的活動進一步研究了SSDA機構(gòu)之間從1976年到2014年間的相互作用,以及如何維護和加強與其資助者的關(guān)系,并隨著時間的推移進行創(chuàng)新,增長它們的產(chǎn)品和服務(wù)[15]。
數(shù)據(jù)歸檔是一種保存珍貴研究資源并確保其研究潛力得到充分利用的方法[16]。雖然早期SSDA,特別是在政治科學(xué)和經(jīng)濟學(xué)領(lǐng)域,側(cè)重于量化型調(diào)查數(shù)據(jù)的歸檔,但在20世紀(jì)70年代,后結(jié)構(gòu)主義和定性調(diào)查方法(如訪談:座談會、專家意見)的崛起[17],導(dǎo)致了定性數(shù)據(jù)的增長。
非數(shù)字形式的定性調(diào)查數(shù)據(jù)(如文件、照片)長期以來一直有專門歸檔和保管,但第一個明確的數(shù)字定性數(shù)據(jù)的歸檔通常與現(xiàn)有的定量數(shù)據(jù)項目結(jié)合開展。例如,英國數(shù)據(jù)檔案館1994年開始的ESDS Qualidata(Economic and Social Data Service Qualidata)項目可被稱為定性數(shù)據(jù)數(shù)字歸檔的先驅(qū),已成為更大的主要定量UKDS檔案的一部分[18]。ESDS Qualidata獲得的數(shù)據(jù)是各種社會科學(xué)學(xué)科的當(dāng)代定性研究的一部分,來源于各種定性方法,如深入、半結(jié)構(gòu)化和結(jié)構(gòu)化的訪談、焦點小組、田野筆記、觀察、個人文件、照片和音頻,大多數(shù)采集的數(shù)據(jù)可以通過UKDA的在線目錄進行搜索和下載。Elman進一步指出定性數(shù)據(jù)檔案資源庫應(yīng)授權(quán)學(xué)者存儲、訪問和下載所有類型的電子定性數(shù)據(jù)。這包括訪問錄音帶、文本文件(來自訪談、焦點小組、口述歷史記錄、案例說明、會議紀(jì)要、研究日記等),報紙文章掃描、官方文件圖像、攝影、音頻和視頻材料[19]。
Cliggett以人種學(xué)研究中的定性數(shù)據(jù)的個人數(shù)字歸檔為切入點,分析了定性研究人員在考慮歸檔和數(shù)據(jù)共享時存在的一些障礙,包括對隱私的關(guān)注、關(guān)于數(shù)據(jù)所有權(quán)的考慮以及數(shù)據(jù)解釋的挑戰(zhàn),她提出定性研究人員開始在自己的研究方法中實施數(shù)字歸檔計劃,構(gòu)建一個數(shù)據(jù)定性檔案(A Digital Qualitative Archive)時可以采取的基本步驟,并認(rèn)為真正“數(shù)字原生代”的學(xué)生是完全實現(xiàn)數(shù)字存檔的最可能的人群[20]。定性數(shù)據(jù)的歸檔需要考慮每個研究的相對重要性、特定格式、所提供材料的可用性和條件、再利用潛力、版權(quán)和保密性問題。
DDI數(shù)據(jù)文檔計劃委員會(Data Document Initiative Committee)是由美國校際政治和社會研究聯(lián)合會(ICPSR)于1995年在美國國家科學(xué)基金會(The National Science Foundation, NSF)的支持下成立的,并于2003年成為一個自我支持的會員聯(lián)盟,有超過40名現(xiàn)任成員為制定標(biāo)準(zhǔn)做出貢獻[21]。它制定的DDI標(biāo)準(zhǔn)是一個公認(rèn)的國際標(biāo)準(zhǔn),用于記錄和管理來自社會、行為、經(jīng)濟和健康科學(xué)通過調(diào)查和其它觀察方法產(chǎn)生的數(shù)據(jù)。DDI的主要目標(biāo)是徹底記錄研究數(shù)據(jù)集和研究過程,以便數(shù)據(jù)可以獨立理解和發(fā)現(xiàn),優(yōu)點是元數(shù)據(jù)可機讀、可理解和可重用。DDI有兩個主要開發(fā)線:DDI Codebook,旨在記錄簡單的定量調(diào)查數(shù)據(jù); DDI生命周期標(biāo)準(zhǔn),其范圍更廣,涵蓋概念化、收集、處理、分發(fā)、發(fā)現(xiàn)、歸檔、發(fā)布等研究數(shù)據(jù)的生命周期[22]。統(tǒng)計領(lǐng)域的專家們,即國家統(tǒng)計機構(gòu)和國家數(shù)據(jù)檔案館的代表,以及關(guān)聯(lián)開放數(shù)據(jù)社區(qū)成員已經(jīng)開發(fā)了基于DDI子集的DDI-RDF發(fā)現(xiàn)詞匯,以支持發(fā)現(xiàn)統(tǒng)計數(shù)據(jù)和元數(shù)據(jù),這個詞匯支持以編程方式識別用于特定研究目的的相關(guān)數(shù)據(jù)集[23]。
DDI標(biāo)準(zhǔn)在SSDA中的應(yīng)用也越來越普遍。Iverson介紹了加州大學(xué)洛杉磯分校的社科數(shù)據(jù)檔案館引入基于DDI生命周期標(biāo)準(zhǔn)的統(tǒng)計和調(diào)查管理軟件Colectica的過程,當(dāng)時UCLA的SSDA人手不足,只有1名檔案保管員(Archivist),1名程序分析員和幾名實習(xí)生管理者從穿孔卡到云介質(zhì)上的社科數(shù)據(jù)檔案,而原有的系統(tǒng)無法滿足管理需求,考慮到記錄數(shù)據(jù)檔案管理的全生命周期以便于檔案的理解、查找和長期保存,他們選擇了基于DDI生命周期標(biāo)準(zhǔn)的Colectica作為SSDA管理系統(tǒng),系統(tǒng)應(yīng)用后大大促進了管理的效率的提升和標(biāo)準(zhǔn)化[24]。耶魯大學(xué)社會和政策研究所(The Institution for Social and Policy Studies, ISPS)和貧困行動創(chuàng)新組織(Innovations for Poverty Action,IPA)需要從社會科學(xué)研究中收集數(shù)據(jù),通過在現(xiàn)實世界中的隨機對照試驗來衡量干預(yù)措施的影響,如選民動員運動和小額供資計劃。為了更好地管理他們的調(diào)查和統(tǒng)計數(shù)據(jù)檔案(如ISPS Data Archive),他們正在與Colectica合作開發(fā)一個構(gòu)建數(shù)據(jù)策展工作流程的軟件平臺,功能包括檢查數(shù)據(jù)的保密性和完整性,創(chuàng)建保存格式,審查和驗證代碼。該軟件利用DDI生命周期標(biāo)準(zhǔn),將實現(xiàn)收集、處理、存檔和發(fā)布數(shù)據(jù)的無縫銜接[25]。
數(shù)據(jù)檔案可以被重用與研究,為政策提供信息,也可以用于研究方法的分析和教學(xué)[26]。英國數(shù)據(jù)檔案館通過英國數(shù)據(jù)服務(wù)(UK Data Service)從其數(shù)據(jù)收藏(Data Collections)中挑選制作了8個專門用于輔助定性方法教學(xué)的在線開放式教學(xué)資源,部分資源見表1,完整版可訪問其網(wǎng)站[27]。每個資源對定性研究方法進行描述,并提供來自數(shù)據(jù)檔案庫的檔案收藏作為研究實例,最重要的是,它們還包含了教師在課堂中需要開展的活動或內(nèi)容的建議。具體實踐方面,2010年埃塞克斯大學(xué)的犯罪學(xué)講師Jackie Turton與英國數(shù)據(jù)檔案館的ESDS Qualidata項目合作實施了教學(xué)與學(xué)習(xí)創(chuàng)新基金項目[28],檔案工作人員針對使用ESDS檔案的本科生開放教學(xué)資源。他們?yōu)榉缸锷鐣W(xué)模塊和衛(wèi)生政策中的社會學(xué)模塊制定了一個模型任務(wù),將研究方法的教學(xué)與訪問和分析ESDS存檔的定性數(shù)據(jù)檔案的實踐相結(jié)合,本科生需要審查檔案中使用的研究方法,考慮替代方法和研究問題,并為他們自己的第三年項目制定研究課題。布里斯托大學(xué)的Jo Haynes使用Qualidata的大量定性數(shù)據(jù)檔案來支持她數(shù)年的定性研究方法教學(xué),一個關(guān)鍵的動機是為學(xué)生提供數(shù)據(jù),利用更多的課堂時間開發(fā)數(shù)據(jù)分析技能[29]。
表1 英國數(shù)據(jù)檔案館提供的教學(xué)輔助資源
Neale從SSDA縱向定性數(shù)據(jù)應(yīng)用的角度探討了有效溝通和談判在研究人員和檔案工作者之間開展利益相關(guān)者合作的重要性,并介紹了2007年2月開始運行的Timescapes Archive項目[30]。它是英國經(jīng)濟和社會研究委員會(ESRC)資助的第一個主要的定性縱向數(shù)據(jù)應(yīng)用研究項目,探索個人和家庭關(guān)系如何隨著時間發(fā)展而變化,并已經(jīng)使用數(shù)據(jù)收藏來教授實質(zhì)性課程和方法課程[31]。
社會科學(xué)數(shù)據(jù)檔案機構(gòu)承擔(dān)著收集、組織、保存和利用數(shù)據(jù)檔案的任務(wù),國外社會科學(xué)數(shù)據(jù)檔案機構(gòu)歷經(jīng)60多年的發(fā)展,機構(gòu)性質(zhì)由依附于圖書館到逐漸形成獨立的數(shù)據(jù)檔案保管機構(gòu),收集范圍由社會科學(xué)研究到政府統(tǒng)計調(diào)查,館藏類型由實體形式到數(shù)字形式,合作規(guī)模由區(qū)域上升到國際。而數(shù)據(jù)檔案最新的研究內(nèi)容表明:專門檔案館的發(fā)展史能反映專門領(lǐng)域的發(fā)展脈絡(luò),SSDA的發(fā)展史正是研究社會科學(xué)發(fā)展史的重要一環(huán);專門檔案館館藏類型的變化能反映領(lǐng)域研究的趨勢,定性數(shù)據(jù)檔案歸檔的興起正是國外對社會科學(xué)定性研究方法日益重視的體現(xiàn);專門檔案的組織既需要符合專業(yè)領(lǐng)域規(guī)范又能與國際通用標(biāo)準(zhǔn)兼容,DDI元數(shù)據(jù)標(biāo)準(zhǔn)越來越普遍地應(yīng)用于社會科學(xué)數(shù)據(jù)檔案的組織正是其專業(yè)性和兼容性的體現(xiàn);專門檔案的利用方式需要不斷與時俱進,數(shù)據(jù)檔案的教學(xué)應(yīng)用正是發(fā)掘其新價值的體現(xiàn)。
[1]蔣穎.歐洲社會科學(xué)數(shù)據(jù)的服務(wù)與共享[J].國外社會科學(xué),2008,(5).
[2]Research Data Archiving[EB/OL].https://en.wikipedia.org/wiki/Research_data_archiving.
[3]Dooley J M.The Archival Advantage: Integrating Archival Expertise into Management of Born-Digital Library Materials[R].Dublin,OH: OCLC Research,2015:1-27.
[4]Odum Institute Archive Dataverse[EB/OL].http://www.irss.unc.edu/odum/contentSubpage.jsp?nodeid=79.
[5]The Inter-University Consortium for Political Research[EB/OL].http://www.icpsr.umich.edu/icpsrweb/content/about/history/.
[6]GESIS Data Archive Service[EB/OL].http://www.gesis.org/en/services/data-analysis/data-archive-service/.
[7]Scheuch E K.From A Data Archive to an Infrastructure for the Social Sciences[J].International Social Science Journal,1990,42(1):93-111.
[8]Rokkan S,Scheuch E K.Conference on Data Archives in the Social Sciences[J].Social Science Information,1963,2(4):109-114.
[9]Ruttenberg C L.Report on Data Archives in the Social Sciences[J].American Behavioral Scientist,1965,8(8):33-34.
[10]Bisco R L.Social Science Data Archives : Progress and Prospects[J].Social Science Information,1967,6(1):39-74.
[11]Scheuch E K.History and Visions in the Development of Data Services for the Social Sciences[J].International Social Science Journal,2003,55(177):385-399.
[12]International Association for Social Science Information Services and Technology[EB/OL].http://www.iassistdata.org/about/index.html.
[13]Edwards P N.A Vast Machine: Computer Models,Climate data,and the Politics of Global Warming[M].Mit Press,2010.
[14]Shankar K,Eschenfelder K R,Downey G.Studying the History of Social Science Data Archives as Knowledge Infrastructure[J].Science Technology & Society,2016.
[15]Shankar K,Eschenfelder.Social Science Data Archives: a Historical Social Network Analysis.[J].Iassist Quarterly,2016,1(40): 6-20.
[16]Louise Corti.Recent Developments in Archiving Social Research[J].International Journal of Social Research Methodology,2012,15(4):281-290.
[17]Corti L.The European Landscape of Qualitative Social Research Archives: Methodological and Practical Issues[J].Forum:Qualitative Social Research,2011,3(12): 1-26.
[18]Smioski A.Archiving Qualitative Data: Infrastructure,Acquisition,Documentation,Distribution.Experiences from WISDOM,the Austrian Data Archive[J].Forum Qualitative Sozialforschung,2011,12(3):141-150.
[19]Elman C,Kapiszewski D,Vinuela L.Qualitative Data Archiving: Rewards and Challenges[J].PS: Political Science &Politics,2010,43(1):23-27.
[20]Cliggett L.Qualitative Data Archiving in the Digital Age: Strategies for Data Preservation and Sharing[J].Qualitative Report,2013,18(How-to-Article):1-11.
[21]Green A,Humphrey C.Building the DDI[J].IASSIST Quarterly,2013,37(1): 36-44.
[22]The Data Documentation Initiative(DDI)[EB/OL].http://www.ddialliance.org/.
[23]Bosch T,Gregory A,Cyganiak R,et al.DDI-RDF Discovery Vocabulary: A Metadata Vocabulary for Documenting Research and Survey Data[C]// The Workshop on Linked Data on the Web.2013.
[24]Iverson,J,Elizabeth S.DDI-Lifecycle and Colectica at the UCLA Social Science Data Archive[C]// North American Data Documentation Initiative Conference(NADDI 2013),University of Kansas,Lawrence,Kansas,April 2,2013.http://hdl.handle.net/1808/11049.
[25]Peer L,Wykstra S,Iverson J,et al.Preparing to Share Social Science Data: An Open Source,DDI-based Curation System[c]// 7th Annual University of Massachusetts and New England Area Librarian e-Science Symposium.2015.
[26]Eynden VVD,Corti L.Advancing Research Data Publishing Practices for the Social Sciences: From Archive Activity to Empowering Researchers[J].International Journal on Digital Libraries,2016:1-9.
[27]UK Data Service Teaching Resources[EB/OL].https://www.ukdataservice.ac.uk/teaching-resources.
[28]Teaching Sociology at Essex with Archived Data - Summary Report ESDS Qualidata teaching resource: teaching sociology with archived data[EB/OL].[2017-02-20]http://www.data-archive.ac.uk/media/360421/talif_final_report.pdf.
[29]Libby B.Using Archived Qualitative Data for Teaching: Practical and Ethical Considerations[J].International Journal of Social Research Methodology,2012,15(4):341-350.
[30]Neale B,Bishop L.The Timescapes Archive: A Stakeholder Approach to Archiving Qualitative Longitudinal data[J].Qualitative Research,2012,12(1):53-65.
[31]Timescapes Archive[EB/OL].http://www.timescapes.leeds.ac.uk/archive/index.html.
G271.2
A
1005-9652(2017)03-0017-07
(責(zé)任編輯:虞志堅)
唐長樂,男,武漢大學(xué)檔案與政務(wù)信息系博士研究生,研究方向:數(shù)字檔案與技術(shù)、檔案學(xué)基礎(chǔ)原理、專門檔案管理。
張曉娟,女,武漢大學(xué)檔案與政務(wù)信息系教授,博士生導(dǎo)師,研究方向:數(shù)字檔案管理、知識管理和政府信息資源管理。