陳陽(yáng) 吳雁平 劉永
摘? 要:尋找檔案數(shù)據(jù)、數(shù)據(jù)檔案兩個(gè)概念的定義演進(jìn)變化趨勢(shì),為國(guó)內(nèi)該領(lǐng)域的未來(lái)研究提供參考。通過(guò)文本分析法和列舉法對(duì)中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)文獻(xiàn)中的檔案數(shù)據(jù)、數(shù)據(jù)檔案定義進(jìn)行梳理、列舉,歸納總結(jié)。定義演化過(guò)程可以看作尋找事物“屬”概念的過(guò)程,也可以看成是一事物尋找其歸屬的過(guò)程。檔案數(shù)據(jù)和數(shù)據(jù)檔案定義的演化過(guò)程,均可以用“1F2N2”概括,即同一起源、不同個(gè)階段、兩種觀點(diǎn)、N多屬概念、兩大類別。檔案數(shù)據(jù)由檔案到數(shù)據(jù),數(shù)據(jù)檔案由數(shù)據(jù)到檔案,彼此相向?qū)M(jìn),殊途同歸,是一個(gè)最終趨同融合的過(guò)程,二者本質(zhì)上是一事物概念(名稱)由種到屬的表述。
關(guān)鍵詞:數(shù)據(jù)檔案;檔案數(shù)據(jù);文本分析法
Abstract: To find the evolution trends of archival data and data archives, providing references for future research in this field in China. Through text analysis and enumeration method, this paper combs, lists and summarizes the definitions of the archival data and data archives in the CNKI database. Defining the evolution process can be seen as the process of searching for the concept of 'Belonging' of a thing, or as a process of finding its belonging. The evolution process of the definitions of archival data and data archives can be summarized by '1F2N2', that is, the same origin, different stages, two viewpoints, N concepts, and two major categories. Archival data is from archive to data, data archive is from data to archive, they are opposite to each other, different ways but to the same end and it is a process of convergence and integration in the final. They are all expressions of the concept (name) of a thing from species to genus essentially.
Keywords: Data archive; Archival data; Text analysis
2015年,國(guó)務(wù)院頒布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,檔案學(xué)界隨之掀起了數(shù)據(jù)研究的熱潮。有關(guān)檔案數(shù)據(jù)、數(shù)據(jù)檔案的文章逐年增多,但尚未有論文對(duì)二者的定義及相互關(guān)系進(jìn)行剖析。本文以中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)為依托,對(duì)論文中涉及“檔案數(shù)據(jù)”“數(shù)據(jù)檔案”概念的定義按照時(shí)間線進(jìn)行梳理,嘗試回答檔案數(shù)據(jù)、數(shù)據(jù)檔案從哪里來(lái)、是什么、到哪里去的三個(gè)問(wèn)題。由于可用樣本數(shù)量有限,使用時(shí)沒(méi)有采用綜述性研究時(shí)的歸納法,而是采用凡有不同表述能用盡用的方法,這種方法便于從細(xì)微的定義差異中,找到其演化的規(guī)律與趨勢(shì),但弊端在于定義中類似的表述重復(fù)率高。
1 檔案數(shù)據(jù)定義的演化
“檔案數(shù)據(jù)”作為名詞概念于1963年首次出現(xiàn)在文獻(xiàn)中但未做解釋。1995年出現(xiàn)“科技檔案數(shù)據(jù)”的定義,1998年首次賦予“檔案數(shù)據(jù)”明確的定義。27年間,“檔案數(shù)據(jù)”定義的演化過(guò)程可以用“1F2N2”來(lái)表示。“1”是從定義起源看,“檔案數(shù)據(jù)”發(fā)端于“科技檔案”;“F”指兩個(gè)不同方向的檔案數(shù)據(jù)定義經(jīng)歷的發(fā)展階段并不相同(檔案數(shù)據(jù)經(jīng)歷了4個(gè)階段:從個(gè)別開(kāi)始,個(gè)別到一般,一般到個(gè)別,個(gè)別到一般;數(shù)據(jù)檔案經(jīng)歷了3個(gè)階段:從個(gè)別開(kāi)始,個(gè)別到一般,一般到個(gè)別);首次出現(xiàn)的“2”是指兩派觀點(diǎn),即檔案數(shù)據(jù)是檔案,檔案數(shù)據(jù)是數(shù)據(jù);“N”是從檔案數(shù)據(jù)的屬概念來(lái)看,有檔案、數(shù)據(jù)、信息、文獻(xiàn)、文件、材料、資料、記錄、實(shí)體等多種;后一個(gè)“2”是從檔案數(shù)據(jù)產(chǎn)生的過(guò)程看,分加工和非加工(原始)兩類。
1.1 個(gè)別·實(shí)體·加工,科技檔案是認(rèn)識(shí)檔案數(shù)據(jù)的起點(diǎn),檔案數(shù)據(jù)是檔案。1991年,陸曙東提出:“檔案數(shù)據(jù)是運(yùn)動(dòng)員訓(xùn)練效果的反映,是檢查教練訓(xùn)練計(jì)劃是否合理的重要依據(jù)。”[1]嚴(yán)格意義上講,這個(gè)表述并沒(méi)有清晰明了地回答“檔案數(shù)據(jù)”是什么,只是十分籠統(tǒng)地指出“檔案數(shù)據(jù)”是訓(xùn)練效果的反映,強(qiáng)調(diào)了“檔案數(shù)據(jù)”的依據(jù)作用。類似地,周發(fā)強(qiáng)等認(rèn)為:“檔案數(shù)據(jù)主要是指電力系統(tǒng)的核心業(yè)務(wù)實(shí)體,如線路和臺(tái)區(qū)?!盵2]由這兩種定義,我們可知,從定義起源來(lái)看,“檔案數(shù)據(jù)”發(fā)端于科技檔案。最先試圖給“檔案數(shù)據(jù)”下定義的,往往不是專門從事檔案學(xué)理論研究與教學(xué)的學(xué)界,而是各行業(yè)中(包括高校)從事檔案工作及涉及檔案或檔案工作的實(shí)務(wù)界。這也進(jìn)一步印證了“新概念的產(chǎn)生源于實(shí)踐”的觀點(diǎn),檔案實(shí)務(wù)界對(duì)源于實(shí)踐的新概念下定義,雖然不一定符合下定義的學(xué)術(shù)規(guī)則,嚴(yán)謹(jǐn)性不足、規(guī)范性欠缺,但卻是我們認(rèn)識(shí)新事物的起點(diǎn)。對(duì)檔案數(shù)據(jù)的認(rèn)知亦是如此。
1995年,王英瑋認(rèn)為:“科技檔案數(shù)據(jù)是指經(jīng)過(guò)加工并輸入計(jì)算機(jī)的科技檔案二次信息。”[3]該定義中有五個(gè)基本要素:一是“科技檔案數(shù)據(jù)”來(lái)自“科技檔案”,即檔案數(shù)據(jù)是檔案的組成部分,檔案數(shù)據(jù)是檔案;二是經(jīng)過(guò)加工,表明科技檔案數(shù)據(jù)并非原始;三是能輸入計(jì)算機(jī),是為計(jì)算機(jī)使用而產(chǎn)生;四是二次信息,是科技檔案信息的形式轉(zhuǎn)換,即并非全部一次信息;五是科技檔案數(shù)據(jù)的屬概念是信息。
同年,劉軍將“文書檔案數(shù)據(jù)的前處理”定義為“對(duì)文書檔案進(jìn)行收集、分析、分類、組織、加工,最終將原始的文書檔案信息轉(zhuǎn)換成適合于輸入微機(jī)的形式的過(guò)程?!盵4]與王英瑋對(duì)“科技檔案數(shù)據(jù)”定義類似,“文書科技檔案數(shù)據(jù)”定義也具有五個(gè)基本要素,即文書檔案數(shù)據(jù)來(lái)自文書檔案;文書檔案數(shù)據(jù)經(jīng)過(guò)加工;適合于輸入微機(jī)(計(jì)算機(jī));是文書檔案信息的形式轉(zhuǎn)換;文書檔案數(shù)據(jù)的屬概念是信息。
1.2 由個(gè)別到一般,檔案數(shù)據(jù)認(rèn)知的升華,檔案數(shù)據(jù)亦可是數(shù)據(jù)。1998年至2006年間,“檔案數(shù)據(jù)”概念的定義認(rèn)知完成了由個(gè)別到一般的升華,并形成了“檔案數(shù)據(jù)是檔案”和“檔案數(shù)據(jù)是數(shù)據(jù)”的兩種代表性觀點(diǎn)。
(1)檔案數(shù)據(jù)是檔案。1998年,熊志云提出:“檔案數(shù)據(jù)是指所有存入計(jì)算機(jī)以便加工處理的檔案信息?!盵5]這是檔案界首次給予“檔案數(shù)據(jù)”明確的定義。這個(gè)定義在堅(jiān)持“檔案數(shù)據(jù)是檔案”觀點(diǎn)的同時(shí),與早期的定義有三處變化:一是不再單指某一類檔案,而是泛指所有檔案;二是不再?gòu)?qiáng)調(diào)輸入計(jì)算機(jī)和適合輸入計(jì)算機(jī),改用“存入”,由事后數(shù)據(jù)輸入轉(zhuǎn)為形成后直接保存;三是由強(qiáng)調(diào)輸入計(jì)算機(jī)的前加工,轉(zhuǎn)向強(qiáng)調(diào)存入計(jì)算機(jī)后的加工處理,加工的重點(diǎn)由輸入計(jì)算機(jī)轉(zhuǎn)為使用計(jì)算機(jī)處理。反映出檔案界對(duì)“檔案數(shù)據(jù)”的認(rèn)識(shí)從“點(diǎn)”到“線”的進(jìn)步,檔案數(shù)據(jù)使用由“點(diǎn)”到“線”的進(jìn)階。持這一觀點(diǎn)的還有陳香萍[6]等。
(2)檔案數(shù)據(jù)是數(shù)據(jù)。2004年,劉家真提出:“檔案數(shù)據(jù)是指那些具有長(zhǎng)期或永久保存價(jià)值,需要在檔案館或其他信息資源基地保存的數(shù)據(jù)?!盵7]該觀點(diǎn)一改之前“檔案數(shù)據(jù)源自檔案,由檔案加工而來(lái)”的觀點(diǎn)。將“具有長(zhǎng)期或永久保存價(jià)值”和“需要在檔案館或其他信息資源基地保存”作為“檔案數(shù)據(jù)”的標(biāo)準(zhǔn),不再?gòu)?qiáng)調(diào)是否源自檔案。同時(shí)將“檔案數(shù)據(jù)”的屬概念由信息拓展到數(shù)據(jù)。簡(jiǎn)言之,即檔案數(shù)據(jù)是數(shù)據(jù)的組成部分,其屬概念為數(shù)據(jù)。同意這種觀點(diǎn)的還有楊劍云、李啟坤等人[8]、黃南鳳[9]、周丹[10]、吳斌[11]、田華麗[12]等。2006年,劉家真、倪麗娟提出:“文獻(xiàn)的檔案數(shù)據(jù)是指那些具有長(zhǎng)期或永久保存價(jià)值、需要永續(xù)地發(fā)揮作用的電子文獻(xiàn)的數(shù)據(jù)?!盵13]這一定義仍然堅(jiān)持了“檔案數(shù)據(jù)”的屬概念是“數(shù)據(jù)”,即“檔案數(shù)據(jù)是數(shù)據(jù)”的觀點(diǎn),但將“檔案數(shù)據(jù)”的歸屬范圍擴(kuò)大至整個(gè)文獻(xiàn),實(shí)現(xiàn)了檔案數(shù)據(jù)由“線”到“面”的拓展。2008年,劉家真、許杰將該觀點(diǎn)簡(jiǎn)化為:“檔案數(shù)據(jù)指的是具有長(zhǎng)期保存價(jià)值的數(shù)據(jù)。”[14]
至此,檔案界對(duì)“檔案數(shù)據(jù)”的認(rèn)知明顯分成了“檔案數(shù)據(jù)是檔案”和“檔案數(shù)據(jù)是數(shù)據(jù)”兩種。
1.3 由一般到個(gè)別,檔案數(shù)據(jù)認(rèn)知的擴(kuò)展,檔案數(shù)據(jù)屬概念逐漸多樣化。2005年至2019年,是檔案數(shù)據(jù)認(rèn)知從一般到個(gè)別的擴(kuò)展階段。一方面,將對(duì)檔案數(shù)據(jù)的認(rèn)知從一般擴(kuò)展到地籍檔案數(shù)據(jù)、銀行客戶檔案數(shù)據(jù)、企業(yè)客戶檔案數(shù)據(jù)、客戶檔案數(shù)據(jù)、國(guó)土資源檔案數(shù)據(jù)、城市規(guī)劃?rùn)n案數(shù)據(jù)、醫(yī)院電子檔案數(shù)據(jù)、高校檔案數(shù)據(jù)、火災(zāi)檔案數(shù)據(jù)、城建檔案數(shù)據(jù)等個(gè)別、具體的行業(yè)。另一方面,檔案數(shù)據(jù)的屬概念也從檔案擴(kuò)展到文件、數(shù)據(jù)、數(shù)據(jù)庫(kù)、信息、信息條目、材料、資料、記錄等。
(1)文件說(shuō)。2005年,陳先偉、楊建平認(rèn)為:“檔案數(shù)據(jù)是指地籍檔案掃描后的電子文件。”[15]這個(gè)專指性明顯的檔案數(shù)據(jù)定義,保留了源自檔案、前加工兩個(gè)要素,省略了目的,將屬概念框在“電子文件”之內(nèi)。這種觀點(diǎn)在行業(yè)內(nèi)有一定的共鳴,比如黃道偉、任啟萍等人[16],以及王合群[17]、王大龍[18]等持相同觀點(diǎn)。
(2)數(shù)據(jù)說(shuō)。盡管2004年至2008年,也有學(xué)者提出“檔案數(shù)據(jù)是數(shù)據(jù)”的觀點(diǎn),但自2011年開(kāi)始,該觀點(diǎn)得到進(jìn)一步的升華。劉雅在其學(xué)位論文中提出:“歷史檔案數(shù)據(jù)主要是指國(guó)土資源管理部門在日常的信息處理過(guò)程中日積月累得到的數(shù)據(jù),它又可以稱為檔案數(shù)據(jù)。”[19]該觀點(diǎn)實(shí)質(zhì)上認(rèn)為檔案數(shù)據(jù)是數(shù)據(jù)的一部分。與之相似,2018年,鄭龍水在其學(xué)位論文中指出:“用戶檔案數(shù)據(jù)是指用戶在注冊(cè)社交網(wǎng)絡(luò)時(shí),根據(jù)社交網(wǎng)絡(luò)平臺(tái)所要求,用戶要提供的必填和選填數(shù)據(jù)?!盵20]檔案數(shù)據(jù)同時(shí)具有規(guī)定性與可選擇性,即檔案數(shù)據(jù)在“量”上不完全等于“檔案”。同年,劉薇則認(rèn)為:“檔案數(shù)據(jù)是指不以學(xué)術(shù)研究為最初收集目的的數(shù)據(jù)”,[21]強(qiáng)調(diào)了檔案數(shù)據(jù)的二次性。于英香則在數(shù)據(jù)與信息關(guān)系演化的基礎(chǔ)上分析討論了“檔案數(shù)據(jù)”概念的發(fā)展,將檔案數(shù)據(jù)定義為“一種具備檔案屬性的數(shù)據(jù)”。[22]2019年,譚淑紅提出:“城建檔案數(shù)據(jù)是指在城市建設(shè)過(guò)程中(涉及工民建、道路、橋涵、管線等),數(shù)字化具有保存價(jià)值的文件、圖樣、表冊(cè)、聲像等信息資料形成的電子數(shù)據(jù)。”[23]
(3)數(shù)據(jù)庫(kù)說(shuō)。2009年,孫明賢在其學(xué)位論文中指出“客戶檔案數(shù)據(jù)主要是指注冊(cè)公司的財(cái)務(wù)數(shù)據(jù)數(shù)據(jù)庫(kù)、基本情況數(shù)據(jù)庫(kù)等”,[24]將“檔案數(shù)據(jù)”屬概念定位為“數(shù)據(jù)庫(kù)”。
(4)信息說(shuō)。2007年,李廣都、羅輝提出:“銀行客戶檔案數(shù)據(jù)并不完全是指銀行客戶檔案中所記載的內(nèi)容,它還包括來(lái)源于銀行客戶并經(jīng)過(guò)再加工后形成的信息產(chǎn)品,因此也就決定了銀行客戶檔案數(shù)據(jù)所涵蓋的內(nèi)容與銀行客戶有著不可分割的關(guān)系?!盵25]該觀點(diǎn)認(rèn)為某個(gè)主體形成的檔案數(shù)據(jù)與該主體相關(guān),但不限于該主體所形成檔案的全部?jī)?nèi)容。同時(shí)強(qiáng)調(diào)了檔案數(shù)據(jù)經(jīng)過(guò)加工產(chǎn)生,其屬概念是信息。2008年,侍文庚提出:“企業(yè)客戶檔案數(shù)據(jù)是指存在于企業(yè)客戶檔案中以數(shù)據(jù)資料的形式存在的信息”,[26]將“檔案數(shù)據(jù)”的范圍縮小到“檔案中以數(shù)據(jù)資料的形式存在的”部分,同時(shí)指出“檔案數(shù)據(jù)的屬概念是信息”。2011年,高文君對(duì)城市規(guī)劃?rùn)n案數(shù)據(jù)進(jìn)行了定義,“指在規(guī)劃編制、規(guī)劃審批和規(guī)劃監(jiān)督過(guò)程中形成的各類檔案,主要包括規(guī)劃成果、建設(shè)用地規(guī)劃管理、建設(shè)工程規(guī)劃管理和建設(shè)工程規(guī)劃驗(yàn)收管理檔案等數(shù)據(jù)信息”,[27]強(qiáng)調(diào)了“城市規(guī)劃?rùn)n案數(shù)據(jù)”是在規(guī)劃編制、規(guī)劃審批和規(guī)劃監(jiān)督過(guò)程中形成的各類檔案,同時(shí)將“城市規(guī)劃?rùn)n案數(shù)據(jù)”的屬概念定為“信息”。
(5)信息條目說(shuō)。2011年,周丹在對(duì)“檔案數(shù)據(jù)”定義進(jìn)行評(píng)介時(shí)指出:“從‘檔案數(shù)據(jù)’這個(gè)概念上說(shuō),以往的檔案數(shù)據(jù)是指信息系統(tǒng)中處理的檔案信息條目,由不同的字段構(gòu)成?!盵28]
(6)材料說(shuō)。2013年,許建偉對(duì)醫(yī)院電子檔案數(shù)據(jù)進(jìn)行了定義,“醫(yī)院電子檔案數(shù)據(jù)是指醫(yī)院在醫(yī)療、科研科技、教學(xué)和基礎(chǔ)建設(shè)等活動(dòng)中,所形成的歸檔保存的文字、圖表、聲像等形態(tài)的科技文件材料”,[29]將醫(yī)院電子檔案數(shù)據(jù)的范圍規(guī)定在歸檔科技文件材料的范圍,其屬概念是材料。
(7)資料說(shuō)。2013年,何振才提出,“檔案數(shù)據(jù),是指在教學(xué)、科研、學(xué)生管理、學(xué)校各類事務(wù)管理等活動(dòng)中形成的以數(shù)據(jù)形式存在的,并且在網(wǎng)絡(luò)發(fā)布后,分別由文檔形成單位單獨(dú)保管及移交給檔案館后的數(shù)據(jù)資料”,[30]強(qiáng)調(diào)了“檔案數(shù)據(jù)”形成時(shí)的數(shù)據(jù)形式和保管移交,其屬概念為資料。
(8)記錄說(shuō)。2014年,王淑萍、張衛(wèi)兵、李銳認(rèn)為:“火災(zāi)檔案數(shù)據(jù)是指對(duì)歷史火災(zāi)所做的詳細(xì)記錄,經(jīng)驗(yàn)總結(jié)等。”[31]
1.4 由個(gè)別到一般,電子環(huán)境下“檔案數(shù)據(jù)是檔案”與“檔案數(shù)據(jù)是數(shù)據(jù)”趨同。2020年,金波、楊鵬從廣義和狹義兩個(gè)角度對(duì)“檔案數(shù)據(jù)”概念進(jìn)行了界定。[32]由此,檔案數(shù)據(jù)指的是“有保存和利用價(jià)值”,在“通信網(wǎng)絡(luò)上傳輸?shù)母黝愲娮游募捌湓獢?shù)據(jù)”,即在使用中的未歸檔保存的數(shù)據(jù)。這一觀點(diǎn),在學(xué)界有較高的認(rèn)同度。比如:劉延婷、朱家彪、陶珂、周彬認(rèn)為:“檔案數(shù)據(jù)是指從原始到更新結(jié)果的所有數(shù)據(jù),便于歷史回溯,可查找同一地塊發(fā)生多次變更的相關(guān)信息,以及某一時(shí)間段內(nèi)發(fā)生變化的地塊和相關(guān)信息?!盵33]展倩慧認(rèn)為:“檔案數(shù)據(jù)是指具備檔案屬性的數(shù)據(jù)和涵蓋電子文檔、數(shù)字資源以及在檔案業(yè)務(wù)活動(dòng)中產(chǎn)生的數(shù)據(jù)等。”[34]邢小美在其學(xué)位論文中提出:“檔案數(shù)據(jù)是指伴隨企業(yè)業(yè)務(wù)活動(dòng)而形成的原始、真實(shí)數(shù)據(jù)。”[35]“廣義的檔案數(shù)據(jù)是指各級(jí)各類檔案機(jī)構(gòu)收集保存的具有檔案性質(zhì)的數(shù)據(jù)記錄,包括各種數(shù)據(jù)形式的檔案資源,如各類數(shù)字檔案、多媒體檔案;也包括檔案管理與利用過(guò)程中產(chǎn)生的數(shù)據(jù),如檔案網(wǎng)站的瀏覽記錄、平臺(tái)日志、查閱服務(wù)數(shù)據(jù)、檔案統(tǒng)計(jì)數(shù)據(jù)等?!盵36]在這個(gè)觀點(diǎn)中,檔案數(shù)據(jù)指已歸檔的數(shù)據(jù)及由這些已歸檔的數(shù)據(jù)產(chǎn)生的“二代”數(shù)據(jù)。
這種以是否包含“二代”數(shù)據(jù)劃分狹義與廣義檔案數(shù)據(jù)的方法,有兩點(diǎn)需要注意:其一,這只是方法之一。如果以是否歸檔的數(shù)量來(lái)劃分,那么歸檔保存的有利用價(jià)值的,在通信網(wǎng)絡(luò)上傳輸?shù)母黝愲娮游募捌湓獢?shù)據(jù)的量,應(yīng)該大于已歸檔的數(shù)據(jù)及由這些已歸檔的數(shù)據(jù)產(chǎn)生的“二代”數(shù)據(jù)的量,因?yàn)橹灰坝形谋貦n”尚未實(shí)現(xiàn),檔案數(shù)據(jù)的“廣”與“狹”就會(huì)反轉(zhuǎn)。其二,這種劃分只針對(duì)電子環(huán)境下生成的應(yīng)歸和已歸的“增量”檔案數(shù)據(jù),沒(méi)有明確既有館藏“存量”非電子傳統(tǒng)檔案的數(shù)字化副本。相比之下,2021年,夏天、錢毅提出的有關(guān)檔案數(shù)據(jù)的表述更為準(zhǔn)確,即“檔案數(shù)據(jù)是指檔案機(jī)構(gòu)收集保存的各種數(shù)據(jù)形式的記錄,既包括電子檔案的內(nèi)容數(shù)據(jù)、傳統(tǒng)載體檔案的數(shù)字化副本,也包括管理和利用過(guò)程中產(chǎn)生的各類元數(shù)據(jù)”。[37]
綜上,我們可以較為清晰地看出,檔案數(shù)據(jù)概念的定義源于實(shí)體檔案的電子化應(yīng)用,長(zhǎng)于存量檔案數(shù)字化和增量電子檔案歸檔,“檔案數(shù)據(jù)是檔案”與“檔案數(shù)據(jù)是數(shù)據(jù)”的爭(zhēng)論,或因檔案數(shù)據(jù)化而最終消失。
2 數(shù)據(jù)檔案定義的演化
“數(shù)據(jù)檔案”概念的定義最早出現(xiàn)在1981年。從1981年到2021年,40年來(lái),“數(shù)據(jù)檔案”的定義過(guò)程同樣可以用“1F2N2”來(lái)表示?!?”是從定義的起源看,“數(shù)據(jù)檔案”定義同樣發(fā)端于“科技檔案”,“F”即從發(fā)展階段看,數(shù)據(jù)檔案的概念同樣從個(gè)別開(kāi)始,經(jīng)過(guò)由個(gè)別到一般,再?gòu)囊话阆騻€(gè)別擴(kuò)展的過(guò)程。前一個(gè)“2”即從數(shù)據(jù)與檔案的關(guān)系上分為“數(shù)據(jù)檔案是數(shù)據(jù)”“數(shù)據(jù)檔案是檔案”兩種觀點(diǎn);“N”即從數(shù)據(jù)檔案的屬概念上看,有數(shù)據(jù)、檔案、信息、記錄、文件、資料、數(shù)據(jù)庫(kù)等多種;后一個(gè)“2”即從數(shù)據(jù)檔案產(chǎn)生的來(lái)源看,分存量和增量?jī)深悺?/p>
2.1 管理·價(jià)值·歸檔,從個(gè)別(科技檔案)為認(rèn)識(shí)起點(diǎn),數(shù)據(jù)檔案是數(shù)據(jù)。有關(guān)“數(shù)據(jù)檔案”的個(gè)別論述,主要是湯其強(qiáng)在1981年和1982年發(fā)表的觀點(diǎn)。1981年,湯其強(qiáng)提出:“數(shù)據(jù)檔案是科技檔案的一個(gè)重要組成部分,是科技檔案的主要內(nèi)容之一?!盵38]“企業(yè)生產(chǎn)講核算必然講經(jīng)濟(jì)效果,產(chǎn)品數(shù)量的多少、質(zhì)量的好壞、成本的高低,以及產(chǎn)品的銷路和發(fā)展方向如何,都要進(jìn)行具體的分析,通過(guò)調(diào)查、解剖各個(gè)生產(chǎn)環(huán)節(jié)。要分析、要預(yù)測(cè)、要競(jìng)爭(zhēng)就要有憑據(jù)。這種憑據(jù)來(lái)源于生產(chǎn)中形成的技術(shù)文件材料,這種材料經(jīng)過(guò)加工整理即以圖表、表報(bào)形式轉(zhuǎn)化為數(shù)據(jù)檔案?!盵39]
1982年,湯其強(qiáng)基于企業(yè)科技檔案管理的視角,將“數(shù)據(jù)檔案”定義為“在現(xiàn)代化管理活動(dòng)中產(chǎn)生和形成的、具有查考利用價(jià)值的、按照一定的歸檔制度匯編保管起來(lái)的數(shù)據(jù)材料,叫作數(shù)據(jù)檔案”,[40]并闡述了數(shù)據(jù)材料轉(zhuǎn)化為數(shù)據(jù)檔案的三個(gè)條件。同時(shí),作者極具前瞻性地指出:“數(shù)據(jù)檔案產(chǎn)生的主要客觀基礎(chǔ)是管理手段和管理活動(dòng)的現(xiàn)代化。”[41]“數(shù)據(jù)檔案作為檔案的一個(gè)類別,它既具有檔案的共同屬性,也具有數(shù)據(jù)檔案的特殊屬性?!盵42]簡(jiǎn)言之,數(shù)據(jù)檔案是數(shù)據(jù),是數(shù)據(jù)的組成部分,是數(shù)據(jù)中歸檔保存的部分。
2.2 從個(gè)別到一般,數(shù)據(jù)檔案是數(shù)據(jù),用于保存。1987年,薩兆為提出:“數(shù)據(jù)檔案是指為一定目的而生產(chǎn)的有序數(shù)據(jù),經(jīng)使用之后還可以儲(chǔ)存起來(lái),形成為其他目的服務(wù)可以檢索的數(shù)據(jù)情報(bào)?!盵43]該定義中有五個(gè)要點(diǎn):一是數(shù)據(jù)檔案是數(shù)據(jù),二是數(shù)據(jù)檔案的產(chǎn)生是有目的的,三是數(shù)據(jù)檔案是有序的,四是數(shù)據(jù)檔案可以存儲(chǔ),五是可以服務(wù)其他目的。
2.3 由一般到個(gè)別,數(shù)據(jù)檔案應(yīng)用范圍不斷擴(kuò)展,數(shù)據(jù)檔案亦可是檔案。數(shù)據(jù)檔案范圍逐漸從單一門類拓展到多個(gè)門類。從時(shí)間線上看,觀點(diǎn)梳理如下。
2003年,張欣認(rèn)為:“數(shù)據(jù)檔案主要是指存儲(chǔ)會(huì)計(jì)數(shù)據(jù)和程序的軟盤和其他存儲(chǔ)介質(zhì)以及打印輸出的各種賬簿、報(bào)表、憑證。”[44]2009年,林玲提出:“咨詢統(tǒng)計(jì)檔案就是指以數(shù)字形式記錄的、按分類表格儲(chǔ)存起來(lái)的、可直觀反映咨詢總體面貌的、具有參考價(jià)值的統(tǒng)計(jì)數(shù)據(jù)檔案?!盵45]2010年,花文博提出:“基礎(chǔ)地理信息數(shù)據(jù)檔案是指具有利用和參考價(jià)值并作為檔案保存的數(shù)據(jù)成果和重要原始的基礎(chǔ)地理信息數(shù)據(jù)?!盵46]2012年,駱椒在其學(xué)位論文中認(rèn)為:“數(shù)據(jù)檔案是指通過(guò)計(jì)算機(jī)打印輸出的相關(guān)憑證、會(huì)計(jì)賬簿和會(huì)計(jì)報(bào)表?!盵47]2014年,李小娟認(rèn)為:“電子財(cái)務(wù)數(shù)據(jù)檔案是指在會(huì)計(jì)電算化的應(yīng)用中形成,可以直接打印、復(fù)制或傳出,所以存在財(cái)務(wù)數(shù)據(jù)泄露的潛在風(fēng)險(xiǎn)的存儲(chǔ)于硬盤、光盤等電子介質(zhì)中的各種票據(jù)、憑證、賬冊(cè)?!盵48]同年,董雷認(rèn)為:“數(shù)據(jù)檔案是指可能對(duì)產(chǎn)品質(zhì)量產(chǎn)生影響的原材料檔案和設(shè)備檔案?!盵49]2015年,梁好在其學(xué)位論文中認(rèn)為:“數(shù)據(jù)檔案管理是指在供電過(guò)程中設(shè)備實(shí)時(shí)運(yùn)行時(shí),將收集到的線路設(shè)備運(yùn)行信息進(jìn)行收集和管理?!盵50]
綜上,“數(shù)據(jù)檔案”亦可是檔案。如果將上述敘述中的“數(shù)據(jù)”隱去,無(wú)論是形成、來(lái)源、收集、管理任一環(huán)節(jié),得到的就是“檔案”是“檔案”這個(gè)句式。
2.4 數(shù)據(jù)檔案屬概念多樣化,信息化推動(dòng)數(shù)據(jù)檔案與檔案數(shù)據(jù)的融合。近些年,隨著涉及行業(yè)專業(yè)的不斷增加,“數(shù)據(jù)檔案”的屬概念范圍也不斷拓展,由原先的數(shù)據(jù)檔案是數(shù)據(jù)、檔案拓展為數(shù)據(jù)檔案是記錄、信息、資源、文件、資料、數(shù)據(jù)庫(kù)等。
(1)記錄說(shuō)。2014年,張繁偉在其學(xué)位論文中指出“數(shù)據(jù)檔案是指對(duì)食品從原輔料采購(gòu)、制成中間產(chǎn)品乃至最終產(chǎn)品,通過(guò)各種渠道進(jìn)入到最終零售環(huán)節(jié)的有關(guān)食品的產(chǎn)地、生產(chǎn)加工、物流和資金流等信息的記錄?!盵51]
(2)信息說(shuō)。2016年,孫俐麗、吳建華認(rèn)為:“數(shù)據(jù)檔案資源是指國(guó)家機(jī)構(gòu)等在活動(dòng)中產(chǎn)生的有價(jià)值的為數(shù)字形式的歷史信息,和由非數(shù)字檔案轉(zhuǎn)換而成的數(shù)字檔案?!盵52]
(3)資源說(shuō)。這種觀點(diǎn)又分兩分說(shuō)和三分說(shuō)。2016年,李夢(mèng)瑤、李廣都認(rèn)為:“數(shù)據(jù)檔案,是指以數(shù)據(jù)形式存在的具有保存和利用價(jià)值的數(shù)據(jù)資源?!盵53]“這類數(shù)據(jù)檔案是開(kāi)放獲取的,不受具體限制,是指各種具備國(guó)家檔案屬性的各類數(shù)據(jù)檔案資源。”[54]2018年,陳巖認(rèn)為:“數(shù)據(jù)檔案的實(shí)質(zhì)為一種檔案”,[55]分為公共性數(shù)據(jù)檔案、商業(yè)性數(shù)據(jù)檔案、私有性數(shù)據(jù)檔案三種。[56]
(4)文件說(shuō)。2017年,張宏磊、李正燕認(rèn)為:“體育傳統(tǒng)項(xiàng)目數(shù)據(jù)檔案是指體育傳統(tǒng)項(xiàng)目,如籃球、足球等,在日常訓(xùn)練、比賽、科研等過(guò)程中形成的具有保存價(jià)值的各類數(shù)據(jù)文件?!盵57]
(5)資料說(shuō)。2019年,劉麗敏認(rèn)為:“數(shù)據(jù)檔案是指通過(guò)U盤、磁盤、光碟等信息化手段錄入檔案資料,同傳統(tǒng)的紙張保存檔案既有區(qū)別又互相連通的系列數(shù)據(jù)資料的總和?!盵58]
(6)數(shù)據(jù)庫(kù)說(shuō)。2020年,鄧舒音在其學(xué)位論文中指出:“業(yè)務(wù)數(shù)據(jù)檔案是指機(jī)關(guān)在履職過(guò)程中通過(guò)業(yè)務(wù)系統(tǒng)形成的業(yè)務(wù)數(shù)據(jù)庫(kù)?!盵59]
綜上,我們可以比較清晰地看到,“數(shù)據(jù)檔案”概念的定義源于實(shí)體數(shù)據(jù)的歸檔,長(zhǎng)于電子數(shù)據(jù)歸檔,“數(shù)據(jù)檔案是檔案”與“數(shù)據(jù)檔案是數(shù)據(jù)”的爭(zhēng)論,或因數(shù)據(jù)檔案化而最終消失。
3 結(jié)語(yǔ)
檔案數(shù)據(jù)、數(shù)據(jù)檔案從哪里來(lái)的問(wèn)題,是一個(gè)起源問(wèn)題。檔案數(shù)據(jù)、數(shù)據(jù)檔案異名同源(均源自科技檔案)并非偶然,初看與提出者的專業(yè)、學(xué)科、職業(yè)、崗位等背景因素相關(guān),相關(guān)性的強(qiáng)度有待進(jìn)一步研究。
檔案數(shù)據(jù)、數(shù)據(jù)檔案是什么的問(wèn)題,實(shí)際上是一事物概念(名稱)由種到屬的表述??梢钥醋鲗ふ沂挛铩皩佟备拍钸^(guò)程,也可以看成是一事物尋找其歸屬的過(guò)程。從理論上論證需費(fèi)一番周折,限于篇幅,本文不作深究,另文再論。從實(shí)踐中區(qū)分,即為簡(jiǎn)單的先有“誰(shuí)”后有誰(shuí)的問(wèn)題。先有檔案,后有數(shù)據(jù),即為檔案數(shù)據(jù)。先有數(shù)據(jù),后有檔案(歸檔),即為數(shù)據(jù)檔案。
檔案數(shù)據(jù)、數(shù)據(jù)檔案到哪里去的問(wèn)題,是一個(gè)趨勢(shì)問(wèn)題。檔案數(shù)據(jù)、數(shù)據(jù)檔案分別從檔案和數(shù)據(jù)兩個(gè)起點(diǎn)出發(fā),經(jīng)由檔案到數(shù)據(jù)、由數(shù)據(jù)到檔案兩個(gè)方向?qū)M(jìn),殊途同歸,最終趨同融合。雖然兩者的表述、指向不同,但“通過(guò)對(duì)檔案或數(shù)據(jù)所承載信息的限制性使用,以維護(hù)信息所有者在競(jìng)爭(zhēng)中的優(yōu)勢(shì)”[60]的目的相同。
*本文系國(guó)家檔案局科技項(xiàng)目“面向治理體系現(xiàn)代化和應(yīng)急處置決策需求的檔案數(shù)據(jù)能力建設(shè)研究”(批準(zhǔn)編號(hào):2020-R-5)研究成果之一。
學(xué)術(shù)授信分析方法在采信學(xué)術(shù)評(píng)價(jià)信息時(shí)主張根據(jù)學(xué)術(shù)社區(qū)內(nèi)成員間的相互授信情況來(lái)鑒別有關(guān)信息的可信度,高度重視評(píng)價(jià)視域構(gòu)建和授信者分析問(wèn)題,力圖使“外行”也能擁有“內(nèi)行”的學(xué)術(shù)見(jiàn)識(shí)和判斷能力。將學(xué)術(shù)授信分析方法運(yùn)用到各種學(xué)術(shù)評(píng)價(jià)活動(dòng)中,是對(duì)學(xué)術(shù)授信評(píng)價(jià)理論的有力實(shí)踐。相關(guān)實(shí)踐表明,學(xué)術(shù)授信分析有助于提升學(xué)術(shù)評(píng)價(jià)及信息分析過(guò)程的透明度,能幫助用戶跟蹤相關(guān)信息的源流并評(píng)估其可信度,實(shí)用性較強(qiáng)。運(yùn)用學(xué)術(shù)授信分析方法時(shí)需先選定評(píng)價(jià)主體,標(biāo)記不同學(xué)術(shù)社區(qū)成員的學(xué)術(shù)地位,然后采用引文分析及Altmetrics等方法挖掘?qū)W術(shù)群體的學(xué)術(shù)授信信息,進(jìn)而開(kāi)展影響力分析、人才評(píng)價(jià)等應(yīng)用研究。從數(shù)據(jù)角度看,這種分析方法具有內(nèi)容不可篡改、可追溯、公開(kāi)透明等特點(diǎn),可較為客觀地反映評(píng)價(jià)對(duì)象給外界留下的穩(wěn)定印象,并用于測(cè)度學(xué)術(shù)聲譽(yù)、學(xué)術(shù)地位等原本難以量化的對(duì)象。
3 學(xué)術(shù)授信分析方法及應(yīng)用
3.1 Dh指數(shù)分析法。2005年,美國(guó)物理學(xué)家Hirsch提出可用于衡量科學(xué)家個(gè)人學(xué)術(shù)影響力的評(píng)價(jià)指標(biāo)——h指數(shù)[3]。該指標(biāo)在學(xué)術(shù)評(píng)價(jià)方面的有效性很快就在全球范圍內(nèi)得到廣泛認(rèn)可。但是,原初意義上的h指數(shù)是基于WoS數(shù)據(jù)庫(kù)的,不便于統(tǒng)計(jì),而且不能在領(lǐng)域、主題層面比較不同學(xué)者的影響力。為此,周春雷(2010)[4]提出一種適合程序處理的h指數(shù)計(jì)算方法——h指數(shù)批量統(tǒng)計(jì)法,兩年后將通過(guò)該方法計(jì)算出的數(shù)據(jù)正式命名為一種新的h指數(shù)衍生指標(biāo)——領(lǐng)域內(nèi)h指數(shù)(簡(jiǎn)稱Dh指數(shù))[5]。
從表面上看,這種指標(biāo)的計(jì)算方式與h指數(shù)相似,僅將來(lái)源數(shù)據(jù)中的數(shù)據(jù)庫(kù)調(diào)整為用戶指定的任意數(shù)據(jù)集。但是,這種調(diào)整非常有實(shí)際意義:不僅大大降低了統(tǒng)計(jì)成本,使通過(guò)程序批量計(jì)算大批學(xué)者在細(xì)分領(lǐng)域的h指數(shù)、g指數(shù)變得切實(shí)可行,而且能更好地反映不同評(píng)價(jià)對(duì)象在特定領(lǐng)域的學(xué)術(shù)影響力差異。相應(yīng)地,Dh指數(shù)分析法就是在特定數(shù)據(jù)集上利用Dh指數(shù)等指標(biāo)標(biāo)記全部評(píng)價(jià)對(duì)象的學(xué)術(shù)地位,然后根據(jù)其相互授信情況開(kāi)展各種深度信息分析工作的方法。通過(guò)使用Dh指數(shù)、Dg指數(shù)等公信力較強(qiáng)的指標(biāo)對(duì)特定領(lǐng)域內(nèi)的全部學(xué)者進(jìn)行批量標(biāo)記,我們可以根據(jù)學(xué)術(shù)影響、學(xué)術(shù)聲望差異將特定群體快速分層,同時(shí)也讓學(xué)者們?cè)陬I(lǐng)域內(nèi)的身份更加透明、信息行為更易追蹤,可用來(lái)研究專家、新手等群體的學(xué)術(shù)判斷能力、預(yù)測(cè)能力、信息敏感性差異,觀察、預(yù)測(cè)特定學(xué)術(shù)群體的研究路徑等。例如,筆者團(tuán)隊(duì)利用這一方法對(duì)Price獎(jiǎng)得主進(jìn)行了模擬分析,嘗試?yán)肈h指數(shù)、Dg指數(shù)識(shí)別國(guó)際科學(xué)計(jì)量學(xué)領(lǐng)域內(nèi)的專家群體,然后根據(jù)其引文信息預(yù)測(cè)潛在的Price獎(jiǎng)得主[6]。筆者團(tuán)隊(duì)在文獻(xiàn)中提出了基于領(lǐng)域?qū)<乙暯堑腄h-Dg指數(shù)分析法,并于2016年12月預(yù)測(cè)了表1所列榜單前30名中被引量較高但尚未獲獎(jiǎng)的學(xué)者,如Bornmann、Abramo、Meyer、Burrell、Schreiber、Waltman、Bar-Ilan、Porter、Kostof、Chen、Jacso、Tijssen、VanLeeuwen等,他們都可能是未來(lái)競(jìng)爭(zhēng)Price獎(jiǎng)的有力人選,并且年輕學(xué)者似乎更有潛力。截至2021年10月,Bar-Ilan、Bornmann、Waltman分別成為2017年、2019年、2021年的Price獎(jiǎng)得主,這項(xiàng)研究有效檢驗(yàn)了挖掘、利用專家群體學(xué)術(shù)授信信息的價(jià)值。
表1 國(guó)際科學(xué)計(jì)量學(xué)專家群體學(xué)術(shù)授信的部分學(xué)者名單[6]
當(dāng)我們將Dh指數(shù)分析法應(yīng)用于人才評(píng)價(jià)時(shí),評(píng)價(jià)視域的大小非常關(guān)鍵,較大的評(píng)價(jià)視域有助于降低評(píng)估誤差并提升人才評(píng)價(jià)的準(zhǔn)確度?;陬I(lǐng)域?qū)<乙暯堑腄h-Dg指數(shù)分析法將定量評(píng)估技術(shù)與專家的定性評(píng)價(jià)有效地結(jié)合在一起模擬評(píng)價(jià)對(duì)象在專家群體中的聲望。該方法嘗試借助內(nèi)生于學(xué)術(shù)交流活動(dòng)的正常引用行為及專家的學(xué)術(shù)鑒賞力,深入挖掘?qū)<胰后w的施引信息,為評(píng)估不同學(xué)者的專業(yè)影響力提供客觀、準(zhǔn)確的依據(jù),既能降低同名者因素的影響,又能提高評(píng)價(jià)效率。Dh-Dg指數(shù)分析法的精髓在于可較為客觀地模擬專家群體的學(xué)術(shù)判斷意見(jiàn),具有操作簡(jiǎn)便、效果良好等優(yōu)勢(shì),可為各種學(xué)術(shù)大獎(jiǎng)的預(yù)測(cè)研究提供高價(jià)值參考信息。
鑒于h指數(shù)無(wú)法反映學(xué)者在不同時(shí)期的學(xué)術(shù)影響力升降情況,筆者團(tuán)隊(duì)還提出了能解決這一問(wèn)題的TDh指數(shù)[7]。若學(xué)者的TDh指數(shù)持續(xù)上升,說(shuō)明學(xué)者學(xué)術(shù)生命力旺盛,可在未來(lái)成為領(lǐng)域內(nèi)的高影響力學(xué)者;反之,當(dāng)TDh指數(shù)呈下降趨勢(shì)時(shí),意味著該學(xué)者的研究不再是領(lǐng)域內(nèi)關(guān)注的熱點(diǎn),或其學(xué)術(shù)生命已近尾聲。TDh指數(shù)可客觀反映學(xué)者在領(lǐng)域內(nèi)所獲關(guān)注情況,能讓不同學(xué)者在相同條件下進(jìn)行比較。
此外,根據(jù)學(xué)者的TDh指數(shù)變化情況,可有效探測(cè)研究主題的冷熱趨勢(shì)。蔡程瑞曾利用TDh指數(shù)和群組分析法探討了圖情領(lǐng)域期刊高頻編委群體的集體學(xué)術(shù)授信對(duì)領(lǐng)域的影響,發(fā)現(xiàn)圖情領(lǐng)域高頻編委不斷發(fā)展壯大學(xué)科內(nèi)核進(jìn)而推動(dòng)學(xué)科發(fā)展[8]。
綜上所述,TDh指數(shù)能有效區(qū)分學(xué)者之間的影響力差異,對(duì)學(xué)者的學(xué)術(shù)生涯變化進(jìn)行有效預(yù)測(cè)及分析,并可根據(jù)學(xué)者學(xué)術(shù)地位的變化,發(fā)現(xiàn)領(lǐng)域內(nèi)研究主題的變化趨勢(shì),若將其與年度Z指數(shù)有效結(jié)合起來(lái),對(duì)研究主題及學(xué)者學(xué)術(shù)生涯的監(jiān)測(cè)將更為方便。
3.2 引薦分析法。在學(xué)術(shù)評(píng)價(jià)中,實(shí)施同行評(píng)議的難點(diǎn)通常在于尋找合適的同行專家。從引文分析角度看,對(duì)引文數(shù)據(jù)進(jìn)行挖掘有助于尋找同行專家,評(píng)價(jià)對(duì)象的施引者可在一定程度上被視為“同行”。引用認(rèn)同理論認(rèn)為,一個(gè)作者所參考的全部學(xué)者都是其引用認(rèn)同的對(duì)象[9],通過(guò)分析某作者的引用認(rèn)同,可了解其學(xué)術(shù)視野。但是,這種觀點(diǎn)若應(yīng)用于學(xué)術(shù)評(píng)價(jià)則存在明顯的瑕疵,會(huì)因大量的偶然引用沖淡評(píng)價(jià)結(jié)果的可信度。
從學(xué)術(shù)授信角度看,引用認(rèn)同關(guān)于學(xué)術(shù)認(rèn)可的判斷標(biāo)準(zhǔn)過(guò)于寬泛。事實(shí)上,只有高頻引證行為才具有明顯的學(xué)術(shù)認(rèn)可含義。因此,基于學(xué)術(shù)授信評(píng)價(jià)理論的引薦分析法將某一學(xué)者對(duì)同一評(píng)價(jià)對(duì)象的多次引用行為界定為“引薦”,表示其認(rèn)可被引者的學(xué)術(shù)能力和學(xué)術(shù)觀點(diǎn)[10]?!痘谝]分析的國(guó)內(nèi)引用認(rèn)同領(lǐng)域分析》一文運(yùn)用引薦分析法研究了國(guó)內(nèi)引用認(rèn)同領(lǐng)域,發(fā)現(xiàn)該方法在識(shí)別重要研究者、受關(guān)注研究主題方面效果良好[11]。周春雷等研究了CNKI收錄的國(guó)內(nèi)檔案學(xué)博碩士學(xué)位論文的施引及被引信息分析,發(fā)現(xiàn)學(xué)位論文是否開(kāi)放直接影響到研究生群體對(duì)朋輩學(xué)術(shù)成果的感知和利用[12]。引薦分析法通過(guò)從施引作者入手,不斷地尋找其領(lǐng)域同行、同行的同行來(lái)繪制整個(gè)領(lǐng)域的研究結(jié)構(gòu)圖,可用于發(fā)現(xiàn)領(lǐng)域新秀、高影響力學(xué)者。
3.3 鏈接內(nèi)容分析法。鏈接分析的思想最早由Mckiernan[13]提出。網(wǎng)站研究與鏈接分析法息息相關(guān),是鏈接分析法的主要應(yīng)用領(lǐng)域[14],但目前對(duì)鏈接內(nèi)容的研究較少。鏈接內(nèi)容分析法是把鏈接所指內(nèi)容作為基本分析單元,將指向同一內(nèi)容的多個(gè)鏈接進(jìn)行語(yǔ)義級(jí)合并,然后將對(duì)鏈接形式的分析轉(zhuǎn)化為對(duì)鏈接指向內(nèi)容的分析。基于這種思路,周春雷(2012)[15]以科學(xué)網(wǎng)博客為研究對(duì)象提出“被好友”指標(biāo),以衡量學(xué)術(shù)博客在博客社區(qū)內(nèi)的影響力。
此外,博文閱讀量、評(píng)論量等也可用于衡量博文質(zhì)量。周春雷、王涵墨(2015)以博文閱讀量、評(píng)論量、推薦數(shù)以及博主發(fā)文量、好友數(shù)、學(xué)歷及職稱等指標(biāo)分析了科學(xué)網(wǎng)博文質(zhì)量,發(fā)現(xiàn)在博文評(píng)價(jià)當(dāng)中,博文閱讀量、推薦數(shù)可以高效合理地篩選出符合一定質(zhì)量標(biāo)準(zhǔn)的博文,對(duì)評(píng)論進(jìn)行語(yǔ)義分析可用于輔助識(shí)別質(zhì)量不高的博文[16]。博客、博文與傳統(tǒng)的期刊、論文差別很大,不能直接套用引文環(huán)境中發(fā)展出來(lái)的方法開(kāi)展研究,需要采用一些新的指標(biāo)進(jìn)行的過(guò)渡與轉(zhuǎn)換。在分析手段上,需要從引文分析走向鏈接分析和學(xué)術(shù)授信分析。
3.4 Z指數(shù)分析法。本文所稱的Z指數(shù)是筆者2010年提出的一個(gè)h指數(shù)衍生指標(biāo),該指標(biāo)由全體評(píng)價(jià)對(duì)象通過(guò)相互授信而產(chǎn)生,可用于揭示個(gè)體學(xué)者在資深學(xué)者群體中的學(xué)術(shù)影響力和相對(duì)學(xué)術(shù)聲望,其應(yīng)用步驟分為收集數(shù)據(jù)、賦值、Z變換、數(shù)據(jù)清理、批量h變換[17]。Z指數(shù)分析法可用于圖書評(píng)價(jià)、期刊評(píng)價(jià)以及博客評(píng)價(jià)等研究。
3.4.1 圖書評(píng)價(jià)。目前使用類h指數(shù)模型及多維視角影響力評(píng)價(jià)體系等方法雖能在某些方面反映出圖書價(jià)值,但權(quán)重系數(shù)劃分主觀、評(píng)價(jià)主體模糊,實(shí)踐性較差。結(jié)合上述原因,筆者嘗試根據(jù)圖書獲得專家學(xué)術(shù)授信情況測(cè)度其學(xué)術(shù)影響力和學(xué)術(shù)價(jià)值,提出圖書Z指數(shù)[17],即某圖書被至少Z名學(xué)術(shù)地位不低于Z的學(xué)者引用。圖2展示了圖書Z指數(shù)的計(jì)算過(guò)程。
圖2 圖書Z指數(shù)的計(jì)算流程圖[17]
圖書Z指數(shù)可在一定程度上揭示圖書的學(xué)術(shù)價(jià)值。例如,出自同一作者的圖書A和B的被引次數(shù)分別為52和145次,其圖書Z指數(shù)分別為6、5。從施引者規(guī)模、學(xué)術(shù)地位層次角度看,圖書A比B更能得到同行專家的認(rèn)可,其學(xué)術(shù)價(jià)值自然更大。與被引指標(biāo)僅能描述學(xué)術(shù)成果在學(xué)術(shù)界的知名度相比,圖書Z指數(shù)在測(cè)度影響力深度方面顯然更勝一籌。邢變變等(2019)[18]以圖書Z指數(shù)為量化指標(biāo)從學(xué)術(shù)書評(píng)角度比較了不同檔案學(xué)經(jīng)典著作的價(jià)值,認(rèn)為圖書Z指數(shù)能在兼顧量化指標(biāo)的基礎(chǔ)上彰顯不同學(xué)術(shù)圖書的質(zhì)量差異。陳艷云(2019)[19]利用圖書Z指數(shù)構(gòu)建了圖書影響力評(píng)價(jià)模型。
此外,圖書Z指數(shù)可以描述高影響力施引群體的規(guī)模及學(xué)術(shù)地位,為評(píng)估不同圖書的學(xué)術(shù)影響力以及由此而衍生的作者及機(jī)構(gòu)聲譽(yù)提供了較為精細(xì)的測(cè)度工具,故在學(xué)者、機(jī)構(gòu)影響力評(píng)價(jià)方面也有一定的應(yīng)用價(jià)值。
3.4.2 研究主題預(yù)測(cè)。從學(xué)術(shù)授信分析角度看,特定研究主題之所以能夠快速發(fā)展,一個(gè)很重要的原因是其獲得了足夠多的學(xué)者的關(guān)注及參與。為測(cè)度特定研究主題對(duì)內(nèi)行群體的學(xué)術(shù)吸引力,周春雷等(2019)[20]提出了一個(gè)名為“年度Z指數(shù)”的量化測(cè)度指標(biāo),用于反映特定主題每年吸引到的參與者規(guī)模及層次。當(dāng)某年的年度Z指數(shù)與之前相比明顯下降,或年度Z指數(shù)雖有回升但不能超過(guò)前高時(shí),該主題很可能在未來(lái)一段時(shí)間內(nèi)變冷;反之,當(dāng)年度Z指數(shù)持續(xù)增長(zhǎng),說(shuō)明該主題的研究熱度會(huì)上升。利用年度Z指數(shù)預(yù)測(cè)研究主題變化趨勢(shì)的流程如圖3所示。
圖3研究主題預(yù)測(cè)流程圖
筆者使用年度Z指數(shù)對(duì)研究主題進(jìn)行學(xué)術(shù)授信分析識(shí)別“曇花一現(xiàn)”型研究主題,結(jié)果顯示,可通過(guò)考察領(lǐng)域內(nèi)主要作者的規(guī)模及學(xué)術(shù)地位變化特征和經(jīng)典論文的年度Z指數(shù)變化來(lái)觀察研究力量的變化并預(yù)測(cè)研究主題的冷熱趨勢(shì)。值得注意的是,研究主題的冷熱程度與其重要程度并無(wú)直接關(guān)系,故不能將各種學(xué)術(shù)資源配置工作與研究主題的冷熱過(guò)度掛鉤。
3.5 群組分析法。對(duì)群組進(jìn)行深入分析能夠發(fā)現(xiàn)其中的內(nèi)行群體,而揭示、利用他們所看重的信息對(duì)開(kāi)展學(xué)術(shù)評(píng)價(jià)研究十分有益。群組分析法是一種從發(fā)文或引文角度研究群組學(xué)術(shù)授信成果、探究學(xué)科領(lǐng)域研究熱點(diǎn)或引證規(guī)律的數(shù)據(jù)挖掘方法[21]。群組分析法通過(guò)分析高水平群體的學(xué)術(shù)行為來(lái)研究、利用其中蘊(yùn)藏的集體智慧。
3.5.1 期刊評(píng)價(jià)。在期刊評(píng)價(jià)方面,群組分析法著重挖掘?qū)W者群體以發(fā)文或引用形式表達(dá)出的學(xué)術(shù)授信信息,以此評(píng)價(jià)期刊的學(xué)術(shù)影響力等方面。筆者結(jié)合群組分析法及Dh指數(shù)分析法分析了《人大復(fù)印報(bào)刊資料<圖書館學(xué)情報(bào)學(xué)>》的選文特征[22],發(fā)現(xiàn)圖情類入選論文的發(fā)表載體較為權(quán)威,選文作者的學(xué)術(shù)影響力基本處于中上水平,建議以《資料》為代表的二次文獻(xiàn)機(jī)構(gòu)廣泛吸納單篇論文評(píng)價(jià)成果及學(xué)術(shù)共同體的意見(jiàn),為選稿專家提供更加豐富的支持信息,進(jìn)一步提高選文質(zhì)量?!兑囊暯窍碌?lt;檔案管理>學(xué)術(shù)影響力探討》[23]一文對(duì)期刊的施引群體和作者群體進(jìn)行了比較,探討了作者回報(bào)率問(wèn)題,發(fā)現(xiàn)該刊部分高產(chǎn)作者的引文回報(bào)率較低,建議獎(jiǎng)勵(lì)重要貢獻(xiàn)者。作者回報(bào)率的計(jì)算方式如下:
R_AB=[(G_BA+C_BA)/T_BA ]×100%(1)
其中,R_AB是A期刊的B作者回報(bào)率;G_BA為B作者在A期刊所發(fā)文章的總被引次數(shù);C_BA是B作者對(duì)A期刊的施引次數(shù);T_BA是B作者在A期刊的發(fā)文篇數(shù)。
通過(guò)使用作者回報(bào)率指標(biāo)能夠幫助期刊找到對(duì)擴(kuò)大其學(xué)術(shù)影響力作出貢獻(xiàn)的學(xué)者,但該文同時(shí)指出采用CSSCI引文數(shù)據(jù)計(jì)算作者回報(bào)率可能存在的偏頗之處,可能助長(zhǎng)某些未必合理的措施,建議各方辯證看待,謹(jǐn)慎使用。另外在該文的研究中發(fā)現(xiàn)提升期刊影響力的關(guān)鍵在于獲得專業(yè)群體的學(xué)術(shù)授信??傊?,利用群組分析法對(duì)期刊進(jìn)行評(píng)價(jià),可有效揭示專業(yè)群體對(duì)特定期刊的真實(shí)學(xué)術(shù)授信情況,避免尋常量化指標(biāo)易受操控之弊。
表2 2002—2014年河南省社會(huì)科學(xué)優(yōu)秀成果獎(jiǎng)[24]
注:表2中曾屬機(jī)構(gòu)與現(xiàn)屬機(jī)構(gòu)合并居中表示機(jī)構(gòu)未發(fā)生變動(dòng)。
3.5.2 成果影響力評(píng)價(jià)。群組分析法從學(xué)者群體的學(xué)術(shù)授信情況分析學(xué)術(shù)成果的影響力。周春雷、曹玲靜(2017)以2002—2014年的河南省社會(huì)科學(xué)優(yōu)秀成果獎(jiǎng)的獲獎(jiǎng)信息為研究對(duì)象,并與教育部高校社科優(yōu)秀成果獎(jiǎng)進(jìn)行了對(duì)比(見(jiàn)表2),探討獲獎(jiǎng)成果的學(xué)術(shù)影響力,[24]研究發(fā)現(xiàn)河南省優(yōu)秀成果獎(jiǎng)的影響力圈子相對(duì)封閉,影響群體集中在河南省內(nèi),獲獎(jiǎng)?wù)叩膶W(xué)術(shù)影響力有限,獲獎(jiǎng)機(jī)構(gòu)分布不均衡且存在人才外流現(xiàn)象。
此外,通過(guò)深入研究獲獎(jiǎng)?wù)呗臍v發(fā)現(xiàn),21名獲獎(jiǎng)?wù)咧杏?人的所屬機(jī)構(gòu)發(fā)生了變化,例如丁建定、解志熙和柯平,均轉(zhuǎn)向經(jīng)濟(jì)發(fā)達(dá)地區(qū)發(fā)展。由于社會(huì)科學(xué)領(lǐng)域?qū)W術(shù)人才的成長(zhǎng)周期較長(zhǎng),這種高層次學(xué)術(shù)人才大規(guī)模外流現(xiàn)象對(duì)河南省哲學(xué)社會(huì)科學(xué)的發(fā)展非常不利,相關(guān)管理者應(yīng)予以重視。同時(shí),該研究還發(fā)現(xiàn),原信陽(yáng)職業(yè)技術(shù)學(xué)院的楊明星是河南省??圃盒+@得高校社科獎(jiǎng)的第一人,但當(dāng)時(shí)未曾獲得河南省社科獎(jiǎng)二等獎(jiǎng)以上獎(jiǎng)項(xiàng)并據(jù)此認(rèn)為“此例也許足以警示依出身論學(xué)術(shù)成果等級(jí)的觀點(diǎn)不可取”,建議有關(guān)部門慎重考慮各種報(bào)獎(jiǎng)門檻問(wèn)題,還建議梳理評(píng)審標(biāo)準(zhǔn)中是否存在不利于優(yōu)秀成果脫穎而出的限制。目前,該學(xué)者為鄭州大學(xué)特聘教授、中國(guó)外交話語(yǔ)研究院主任。不難看出,學(xué)術(shù)授信分析在人才識(shí)別與管理、評(píng)獎(jiǎng)管理等方面的潛在價(jià)值。
3.5.3 機(jī)構(gòu)評(píng)價(jià)??蒲袡C(jī)構(gòu)的學(xué)術(shù)聲望,對(duì)其知識(shí)生產(chǎn)效率和建立合作伙伴關(guān)系均有較大的影響。為觀察各科研機(jī)構(gòu)獲得的合作伙伴學(xué)術(shù)授信情況并定量評(píng)價(jià)其在科研朋友圈中的學(xué)術(shù)聲望,評(píng)估其學(xué)術(shù)關(guān)系網(wǎng)絡(luò)中的社會(huì)資本豐裕程度,筆者從被引角度提出了機(jī)構(gòu)論文SCAN指數(shù)[25]。該指數(shù)的計(jì)算流程如圖4所示。
圖4SCAN指數(shù)的計(jì)算流程[25]
SCAN指數(shù)能體現(xiàn)出評(píng)價(jià)對(duì)象的科研實(shí)力、學(xué)術(shù)聲望及其學(xué)術(shù)合作網(wǎng)絡(luò)的整體價(jià)值。SCAN指數(shù)與QS排名相關(guān)性很高,與各高校的學(xué)科實(shí)力排名也較為吻合,可有效揭示各高校學(xué)術(shù)論文合作網(wǎng)絡(luò)的社會(huì)資本價(jià)值。具體而言,SCAN指數(shù)在機(jī)構(gòu)評(píng)價(jià)方面的應(yīng)用潛力體現(xiàn)在以下方面:①預(yù)測(cè)高潛力科研機(jī)構(gòu)。可以利用SCAN指數(shù)比較不同科研機(jī)構(gòu)的合作價(jià)值并發(fā)現(xiàn)高潛力科研機(jī)構(gòu)。②學(xué)術(shù)合作網(wǎng)絡(luò)分析。利用SCAN指數(shù)對(duì)某科研機(jī)構(gòu)的學(xué)術(shù)合作網(wǎng)絡(luò)進(jìn)行價(jià)值分析,更好地挖掘、利用學(xué)術(shù)合作網(wǎng)絡(luò)中蘊(yùn)藏的社會(huì)資本。
4 總結(jié)與展望
本文系統(tǒng)總結(jié)了筆者團(tuán)隊(duì)在學(xué)術(shù)授信分析方面的研究成果,展示了該方法在成果影響力評(píng)價(jià)、人才評(píng)價(jià)及評(píng)獎(jiǎng)?lì)A(yù)測(cè)、研究主題預(yù)測(cè)、期刊評(píng)價(jià)和圖書評(píng)價(jià)等方面的應(yīng)用潛力。這種新型信息分析方法主張以更加合理的方式使用量化分析技術(shù)及其結(jié)果,建議優(yōu)先采信那些經(jīng)過(guò)專業(yè)群體學(xué)術(shù)授信的可靠信息。這種強(qiáng)調(diào)證據(jù)可驗(yàn)證性的信息分析技術(shù)與區(qū)塊鏈思想有較多相通之處,有望在紛繁復(fù)雜的開(kāi)放環(huán)境下找到更多用武之地。
*基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“學(xué)術(shù)圖書價(jià)值揭示方法研究”(項(xiàng)目編號(hào):21BTQ067)。
參考文獻(xiàn):
[[1]陸曙東.怎樣搞好業(yè)余訓(xùn)練[J].體育與科學(xué),1991(02):47.
[2]周發(fā)強(qiáng),王慶.在線監(jiān)測(cè)數(shù)據(jù)分析下的配電網(wǎng)降損增效研究[J].通訊世界,2018(03):282-283.
[3]王英瑋.科技檔案管理學(xué)自學(xué)輔導(dǎo)答疑[J].北京檔案,1995(05):27-30.
[4]劉軍.用微機(jī)管理文書檔案的幾個(gè)重要環(huán)節(jié)[J].南都學(xué)壇,1995(03):67-70.
[5]熊志云.計(jì)算機(jī)輔助檔案管理概述[J].成人教育學(xué)報(bào),1998(01):29-31.
[6]陳香萍.論辦公自動(dòng)化條件下的高校檔案管理策略[J].湘南學(xué)院學(xué)報(bào),2005(04):108-109.
[7]劉家真.檔案數(shù)據(jù)備份選擇[J].浙江檔案,2004(01):20.
[8]楊劍云,李啟坤,王巍.汶川地震給檔案數(shù)據(jù)備份帶來(lái)的新思考[J].蘭臺(tái)世界,2008(21):51.
[9]黃南鳳.檔案數(shù)據(jù)備份研究[D].蘇州大學(xué),2009.
[10]周丹.關(guān)于檔案登記備份制度的理論思考[D].浙江大學(xué),2011.
[11]吳斌.試論檔案數(shù)據(jù)的備份[J].辦公室業(yè)務(wù),2013(03):182.
[12]田華麗.淺談學(xué)校檔案管理工作現(xiàn)狀及對(duì)策[J].科學(xué)咨詢(科技·管理),2015(04):42.
[13]劉家真,倪麗娟.創(chuàng)建我國(guó)文獻(xiàn)的檔案數(shù)據(jù)災(zāi)備基地的構(gòu)想[J].檔案學(xué)研究,2006(04):47-52.
[14]劉家真,許杰.影響我國(guó)數(shù)字信息長(zhǎng)期保存的問(wèn)題與解決方案[J].檔案學(xué)研究,2008(04):50-55.
[15]陳先偉,楊建平.成都市中心城區(qū)地籍?dāng)?shù)據(jù)庫(kù)建設(shè)的設(shè)計(jì)與實(shí)踐[C].中國(guó)土地學(xué)會(huì)?中國(guó)土地勘測(cè)規(guī)劃院?國(guó)土資源部土地利用重點(diǎn)實(shí)驗(yàn)室.新技術(shù)在土地調(diào)查中的應(yīng)用與土地科學(xué)技術(shù)發(fā)展-2005年中國(guó)土地學(xué)會(huì)學(xué)術(shù)年會(huì)論文集.中國(guó)土地學(xué)會(huì)?中國(guó)土地勘測(cè)規(guī)劃院?國(guó)土資源部土地利用重點(diǎn)實(shí)驗(yàn)室:中國(guó)土地學(xué)會(huì),2005:181-186.
[16]黃道偉,任啟萍,張小宏.以MAPGIS為平臺(tái)建立城鎮(zhèn)地籍?dāng)?shù)據(jù)庫(kù)的探討[J].青??萍迹?010,17(01):45-49.
[17]王合群.淺談第二次土地調(diào)查中城鎮(zhèn)地籍更新調(diào)查數(shù)據(jù)庫(kù)建設(shè)[J].科技信息,2010(23):445+515.
[18]王大龍.淺談在地籍調(diào)查中的幾個(gè)問(wèn)題[J].新疆有色金屬,2011,34(S2):38-41.
[19]劉雅.數(shù)據(jù)共享技術(shù)在縣級(jí)國(guó)土資源“一張圖”中應(yīng)用研究[D].長(zhǎng)安大學(xué),2011.
[20]鄭龍水.跨平臺(tái)的社交網(wǎng)絡(luò)用戶身份識(shí)別技術(shù)研究[D].西南科技大學(xué),2018.
[21]劉薇.會(huì)計(jì)研究現(xiàn)狀梳理及會(huì)計(jì)信息化研究借鑒[J].會(huì)計(jì)之友,2018(10):110-114.
[22]于英香.從數(shù)據(jù)與信息關(guān)系演化看檔案數(shù)據(jù)概念的發(fā)展[J].情報(bào)雜志,2018,37(11):150-155.
[23]譚淑紅.基于“圖查檔案”的城建檔案管理應(yīng)用[J].城建檔案,2019(04):52-53.
[24]孫明賢.業(yè)務(wù)決策支持系統(tǒng)的研究與設(shè)計(jì)[D].江南大學(xué),2009.
[25]李廣都,羅輝.銀行客戶檔案的數(shù)據(jù)安全問(wèn)題[J].中國(guó)檔案,2007(10):32-33.
[26]侍文庚.淺析企業(yè)客戶檔案的數(shù)據(jù)管理[J].蘭臺(tái)世界,2008(13):31-32.
[27]高文君.關(guān)于城市規(guī)劃數(shù)據(jù)標(biāo)準(zhǔn)化的研究與實(shí)踐[C].中國(guó)城市規(guī)劃學(xué)會(huì)?南京市政府.轉(zhuǎn)型與重構(gòu)——2011中國(guó)城市規(guī)劃年會(huì)論文集.中國(guó)城市規(guī)劃學(xué)會(huì)?南京市政府:中國(guó)城市規(guī)劃學(xué)會(huì),2011:2330-2340.
[28]周丹.關(guān)于檔案登記備份制度的理論思考[D].浙江大學(xué),2011.
[29]許建偉.醫(yī)院電子檔案管理存在的問(wèn)題與思考[J].社區(qū)醫(yī)學(xué)雜志,2013,11(15):17-19.
[30]何振才.智慧校園建設(shè)中的檔案數(shù)據(jù)備份淺析[J].蘭臺(tái)世界,2013(05):25-26.
[31]王淑萍,張衛(wèi)兵,李銳.森林防火信息管理系統(tǒng)的構(gòu)建[C].中國(guó)地球物理學(xué)會(huì)國(guó)家安全地球物理專業(yè)委員會(huì)?陜西省地球物理學(xué)會(huì)軍事地球物理專業(yè)委員會(huì).國(guó)家安全地球物理叢書(十)——地球物理環(huán)境與國(guó)家安全.中國(guó)地球物理學(xué)會(huì)國(guó)家安全地球物理專業(yè)委員會(huì)?陜西省地球物理學(xué)會(huì)軍事地球物理專業(yè)委員會(huì):中國(guó)地球物理學(xué)會(huì),2014:417-421.
[32][36]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(04):29-37.
[33]劉延婷,朱家彪,陶珂,周彬.基于國(guó)土空間基礎(chǔ)信息平臺(tái)更新土地利用規(guī)劃[J].地理空間信息,2020,18(09):36-39+51+6.
[34]展倩慧.協(xié)同治理視域下檔案數(shù)據(jù)開(kāi)發(fā)模式探究[J].檔案與建設(shè),2020(04):33-37.
[35]邢小美.工業(yè)大數(shù)據(jù)背景下的鋼鐵企業(yè)檔案管理研究[D].河北大學(xué),2021.
[37]夏天,錢毅.面向知識(shí)服務(wù)的檔案數(shù)據(jù)語(yǔ)義化重組[J].檔案學(xué)研究,2021(02):36-44.
[38][39]湯其強(qiáng).談?wù)剶?shù)據(jù)檔案[J].檔案工作,1981(03):19-20.
[40][41][42]湯其強(qiáng).試論數(shù)據(jù)檔案——兼談工業(yè)企業(yè)數(shù)據(jù)檔案的收集和分類[J].湖南檔案,1982(04):10-12.
[43]薩兆為.數(shù)據(jù)性文摘初探[J].北京社會(huì)科學(xué),1987(03):155-159.
[44]張欣.試論會(huì)計(jì)電算化環(huán)境下企業(yè)的內(nèi)部控制[J].華東經(jīng)濟(jì)管理,2003(S1):160-161.
[45]林玲.高校圖書館應(yīng)加強(qiáng)參考咨詢檔案的收集與管理工作[J].蘭臺(tái)世界,2009(16):70-71.
[46]花文博.淺論基礎(chǔ)地理信息數(shù)據(jù)檔案的管理[J].蘭臺(tái)世界,2010(S2):128-129.
[47]駱椒.ERP環(huán)境下的會(huì)計(jì)信息系統(tǒng)內(nèi)部控制研究[D].湖南大學(xué),2012.,.
[48]李小娟.淺談電子財(cái)務(wù)數(shù)據(jù)檔案的管理與保存[J].西部財(cái)會(huì),2014(03):44-45.
[49]董雷.質(zhì)量管理數(shù)據(jù)標(biāo)準(zhǔn)為大[J].印刷技術(shù),2014(03):26-28.
[50]梁好.縣(區(qū))級(jí)供電公司供電檢修計(jì)劃管理系統(tǒng)的研究與分析[D].云南大學(xué),2015.
[51]張繁偉.基于供應(yīng)鏈的食品安全保障體系構(gòu)建研究[D].成都理工大學(xué),2014.
[52]孫俐麗,吳建華.關(guān)于國(guó)家數(shù)字檔案資源整合與服務(wù)機(jī)制頂層設(shè)計(jì)的初步思考[J].檔案學(xué)研究,2016(01):57-61.
[53][54]李夢(mèng)瑤,李廣都.大數(shù)據(jù)時(shí)代利用移動(dòng)終端獲取數(shù)據(jù)檔案模式研究[J].北京檔案,2016(10):22-23.
[55][56]陳巖.大數(shù)據(jù)和泛在知識(shí)背景下的中國(guó)數(shù)據(jù)檔案發(fā)展研究[J].云南檔案,2018(08):54-59.
[57]張宏磊,李正燕.大數(shù)據(jù)思維下體育傳統(tǒng)項(xiàng)目數(shù)據(jù)檔案系統(tǒng)的建設(shè)[J].山西檔案,2017(01):142-144.
[58]劉麗敏.淺析信息化項(xiàng)目建設(shè)中的檔案電子化管理[J].臨床醫(yī)藥實(shí)踐,2019,28(11):879-880.
[59]鄧舒音.黑龍江省縣級(jí)機(jī)關(guān)數(shù)字檔案管理現(xiàn)狀調(diào)研[D].黑龍江大學(xué),2020.
[60]吳雁平.大成編客.檔案數(shù)據(jù)研究與實(shí)踐.[EB/OL]2021-02-11[2021-10-07].https://bianke.cnki.net/home/corpus/25530.html.
(作者單位:陳陽(yáng),中山大學(xué)信息管理學(xué)院;吳雁平,開(kāi)封市檔案館;劉永,鄭州航空工業(yè)管理學(xué)院 來(lái)稿日期:2022-02-19)
[5]周春雷.領(lǐng)域內(nèi)h指數(shù)及其應(yīng)用研究[J].圖書情報(bào)工作,2012,56(10):45-49.
[6]Zhou C L,Kong X Y,Lin Z P.Research on Derek John de Solla Price Medal Prediction Based on Academic Credit Analysis[J].2019,118(01):159-175.
[7]周春雷,蔡程瑞,張?zhí)梗?國(guó)內(nèi)圖情學(xué)者歷時(shí)h指數(shù)研究[J].圖書情報(bào)工作,2017,61(19):96-101.
[8]蔡程瑞.國(guó)內(nèi)圖情期刊高頻編委群體學(xué)術(shù)影響力研究[D].鄭州大學(xué),2018.
[9]White,HD.Authors as Citers Over Time[J].Journal of American Society for Information Science and Technology,2001,52(02):,87-108.
[10]周春雷.引薦分析法:一種新的引文分析法[J].情報(bào)學(xué)報(bào),2010,29(04):671-678.
[11]周春雷,李冰瑩.基于引薦分析的國(guó)內(nèi)引用認(rèn)同領(lǐng)域分析[J].數(shù)字圖書館論壇,2015,(01):26-29.
[12]周春雷,蔡程瑞.基于CNKI的國(guó)內(nèi)檔案學(xué)博碩士學(xué)位論文研究[J].檔案管理,2017(01):37-39.
[13]McKiernan G.Automated categorisation of web resources:a profile of selected projects,research,products,and services[J].New review of information networking.1996,2(01):15-40.
[14]盧文輝,葉繼元.鏈接分析法在國(guó)內(nèi)網(wǎng)站實(shí)證研究中的應(yīng)用現(xiàn)狀分析[J].圖書情報(bào)工作,2019,63(18):119-130.
[15]周春雷.鏈接內(nèi)容分析視角下的科學(xué)網(wǎng)博客評(píng)價(jià)探索.圖書情報(bào)知識(shí),2012,(04):11-17.
[16]周春雷,王涵墨.科學(xué)網(wǎng)博文質(zhì)量評(píng)價(jià)研究[J].圖書館學(xué)研究,2015(23):94-101.
[17]周春雷,陳艷云,蔡程瑞.圖書Z指數(shù)及在其影響力評(píng)價(jià)研究中的應(yīng)用[J]圖書情報(bào)工作,2018,62(14):106-115.
[18]邢變變,各玉杰.檔案學(xué)經(jīng)典著作學(xué)術(shù)授信評(píng)價(jià)研究——以學(xué)術(shù)書評(píng)為分析樣本[J].檔案學(xué)研究,2019,(03):83-88.
[19]陳艷云.學(xué)術(shù)授信評(píng)價(jià)視角下的圖書影響力研究[D].鄭州大學(xué),2019.
[20]周春雷,師文欣,王小凱.學(xué)術(shù)授信視角下的“曇花一現(xiàn)”型研究主題識(shí)別方法研究[J].情報(bào)雜志,2019,38(08):68-74,89.
[21]王涵墨.基于學(xué)術(shù)授信的群組分析法研究[D].鄭州大學(xué),2017.
[22]周春雷,孟麗慧,李正南.人大復(fù)印報(bào)刊資料《圖書館學(xué)情報(bào)學(xué)》選文特征分析[J].情報(bào)雜志,2021,40(08):159-163,封三.
[23]周春雷,陳瑩.引文視角下的《檔案管理》學(xué)術(shù)影響力探討[J].檔案管理,2021,(02):97-99.
[24]周春雷,曹玲靜.河南省社會(huì)科學(xué)優(yōu)秀成果獎(jiǎng)學(xué)術(shù)影響力研究[J].中國(guó)科技期刊研究,2017,28(08):748-756.
[25]周春雷,周慧芳.學(xué)術(shù)網(wǎng)絡(luò)社會(huì)資本視角下的學(xué)科評(píng)價(jià)指標(biāo)探索[J].現(xiàn)代情報(bào),2018,38(09):79-86.
(作者單位:周春雷,李彥博,曾慶坤鄭州大學(xué)信息管理學(xué)院;孟麗慧,鄭州市數(shù)據(jù)科學(xué)研究中心來(lái)稿日期:2021-12-20)
問(wèn)題及其解決[J].山西檔案,2017(06):11-16.
[21]李明德,趙琛.新媒體時(shí)代“四力”的突圍與跨越——基于“十三五”時(shí)期中國(guó)新媒體發(fā)展的幾個(gè)焦點(diǎn)[J].編輯之友,2021(01):12-20.
(作者單位:南昌大學(xué)人文學(xué)院 來(lái)稿日期:2021-07-28)
[18]蔣志清.企業(yè)業(yè)務(wù)流程設(shè)計(jì)與管理[M].北京:電子工業(yè)出版社,2002:15-16.
[19][20][25]王建仁,王錦,趙斌,段剛龍.基于業(yè)務(wù)流程生命周期的流程知識(shí)分類及管理[J].情報(bào)雜志,2006(02):72-74.
[21]張臻.文件生命周期理論研究進(jìn)展[J].蘭臺(tái)世界,2017(13):10-16.
[22]王英瑋,金凡.記錄連續(xù)體的構(gòu)成要素內(nèi)涵與創(chuàng)新研究[J].檔案學(xué)研究,2019(01):4-10.
[24]尹鵬程,李鋼,黃亮,喻存國(guó).土地業(yè)務(wù)全程管理模式研究[J].中國(guó)土地科學(xué),2009,23(10):59-65.
[26][29][38]馮惠玲.電子文件管理教程[M].北京:中國(guó)人民大學(xué)出版社,2001:2-161.
[27][40]薛四新.云計(jì)算環(huán)境下電子文件管理的實(shí)現(xiàn)機(jī)理研究[D].北京:中國(guó)人民大學(xué),2012.
[28]盧藝豐,徐躍權(quán).“互聯(lián)網(wǎng)+”環(huán)境下信息鏈的重構(gòu)——交互式信息鏈[J].情報(bào)科學(xué),2020,38(06):32-37.
[30]IBM商業(yè)價(jià)值研究院.組件化模型[EB/OL].[2021-01-10].https://wenku.baidu.com/view/e566f422af45b307e8719717.html.
[31]于英香,孫遜.從文件結(jié)構(gòu)演化看電子文件數(shù)據(jù)化管理的發(fā)展——基于技術(shù)變遷的視角[J].檔案學(xué)通訊,2019(05):20-26.
[33]陳永生,楊茜茜,王沐暉,蘇煥寧.基于互聯(lián)網(wǎng)政務(wù)服務(wù)平臺(tái)的文件歸檔與管理:記錄觀[J].檔案學(xué)研究,2019(03):16-23.
[34][36]陳永生,蘇煥寧,楊茜茜,王沐暉.基于互聯(lián)網(wǎng)政務(wù)服務(wù)平臺(tái)的文件歸檔與管理:全程觀[J].檔案學(xué)研究,2018(04):4-12.
[35]許民利,齊鑫,簡(jiǎn)惠云.不同權(quán)力(權(quán)利)結(jié)構(gòu)下考慮價(jià)值共創(chuàng)的閉環(huán)供應(yīng)鏈決策研究[J].工業(yè)技術(shù)經(jīng)濟(jì),2020,39(08):62-71.
[37]任紅,邢一杰.“華龍一號(hào)”文檔管理體系構(gòu)建[J].中國(guó)檔案,2017(03):61-63.
[39]吳志杰,王強(qiáng).組織機(jī)構(gòu)視角下的業(yè)務(wù)系統(tǒng)電子文件歸檔:?jiǎn)栴}?理念與策略框架[J].檔案學(xué)通訊,2020(04):79-86.
[41]Henry J P,祁天嬌,嘎拉森.從紙質(zhì)到增值:渥太華市的信息治理和電子文件[J].檔案學(xué)通訊,2020(02):26-31.
[42]Standards.Australia.HB5031-2011 Records Classification[S].Sydney:SAI Global Limited,2011.
(作者單位:李喆、陳瑩,福建福清核電有限公司;任琳琳,中國(guó)人民大學(xué)信息資源管理學(xué)院 來(lái)稿日期:2021-05-13)