陳銘 葉繼元
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展和普及,人類社會(huì)的交流方式發(fā)生了巨大變化。特別是大量社交媒體平臺(tái)出現(xiàn)后,由于其使用便捷且成本低廉,成為數(shù)以萬計(jì)的普通公眾進(jìn)行信息、思想和知識(shí)等交流的主要方式,這其中也包括了科研工作者們對(duì)于學(xué)術(shù)知識(shí)和思想的傳播交流。這不但促進(jìn)了學(xué)術(shù)信息更廣泛的交流,也實(shí)現(xiàn)了學(xué)術(shù)研究成果的多元化評(píng)價(jià)。Altmetrics正是在這樣的背景下悄然誕生,促成了計(jì)量學(xué)學(xué)科結(jié)合社交媒體在線交流特點(diǎn)進(jìn)行了Web2.0的創(chuàng)新和革命,也成為圖書情報(bào)領(lǐng)域的研究熱點(diǎn),產(chǎn)生了巨大的影響??蒲袡C(jī)構(gòu)、科研人員以及出版商都紛紛通過社交網(wǎng)絡(luò)如推特(Twitter)、小木蟲、臉書(Facebook)等分享交流科研成果,Altmetrics已普遍被研究機(jī)構(gòu)和研究人員看作是一種基于社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行科研交流、傳播和評(píng)價(jià)的新型計(jì)量學(xué),旨在通過其建立的快速、全面和新型的科研評(píng)價(jià)體系補(bǔ)充僅僅依靠傳統(tǒng)引文指標(biāo)或同行評(píng)議的科研評(píng)價(jià)體系。
源于科學(xué)在線交流環(huán)境中誕生的Altmetrics新型計(jì)量學(xué)的運(yùn)行基礎(chǔ)是各類型學(xué)術(shù)成果(如論文、圖書、數(shù)據(jù)集、程序、視頻等)在各種社交網(wǎng)絡(luò)平臺(tái)中發(fā)生交互而不斷產(chǎn)生并逐步積累的網(wǎng)絡(luò)數(shù)據(jù),即學(xué)術(shù)成果的Altmetrics指標(biāo)測(cè)量的是其在主流新聞媒體、社交媒體或在線社區(qū)被下載、提及、分享、點(diǎn)贊和評(píng)論次數(shù)等的關(guān)注度和影響力。所以通過Altmetrics 獲得可以進(jìn)行指標(biāo)分析的數(shù)據(jù)受到以下兩方面的影響: 一是研究成果所出現(xiàn)的各種社交網(wǎng)絡(luò)平臺(tái),這是Altmetrics原始數(shù)據(jù)源的產(chǎn)生地,具體來說可細(xì)分為以下六類:①社交媒體網(wǎng)站,國(guó)外有谷歌加(Google+)、Facebook、Twitter等,國(guó)內(nèi)有微信、微博、知乎等;②在線學(xué)術(shù)網(wǎng)站,國(guó)外有Scopus、Web of Science、EBSCO ,國(guó)內(nèi)有中國(guó)知網(wǎng)、萬方數(shù)據(jù)庫等期刊綜合網(wǎng)站等;③新聞媒體網(wǎng)站,國(guó)外有科學(xué)新聞(Science News)、時(shí)代新聞(Time News),國(guó)內(nèi)有科學(xué)網(wǎng)等;④文獻(xiàn)管理平臺(tái),國(guó)外有CiteULike、Mendeley等,國(guó)內(nèi)有道客巴巴、百度文庫、豆丁網(wǎng)等;⑤學(xué)術(shù)社區(qū)網(wǎng)站,國(guó)外有F1000等,國(guó)內(nèi)有丁香園、小木蟲等;⑥百科平臺(tái),國(guó)外有維基百科(Wikipedia)等,國(guó)內(nèi)有MBA 智庫百科等。二是統(tǒng)計(jì)各種社交網(wǎng)絡(luò)平臺(tái)上的研究成果及其“活躍”情況,如在小木蟲上對(duì)某一研究成果的評(píng)論數(shù)或在Mendeley上對(duì)某一出版物的保存量[1]。
目前對(duì)于Altmetrics的一種主要研究方法是通過收集社交網(wǎng)絡(luò)平臺(tái)上的數(shù)據(jù)進(jìn)行實(shí)證評(píng)價(jià)分析得出相應(yīng)結(jié)論。因此,實(shí)時(shí)快速收集數(shù)據(jù)并保證這些數(shù)據(jù)的準(zhǔn)確性、一致性、全面性和有效性就顯得非常重要。但是由于不同的社交網(wǎng)絡(luò)平臺(tái)數(shù)量眾多,各平臺(tái)的使用率和普及率差別很大,在這些社交網(wǎng)絡(luò)平臺(tái)上進(jìn)行交流傳播產(chǎn)生的大量網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)出龐大、多態(tài)、異構(gòu)、不穩(wěn)定和繁雜的特征,且各平臺(tái)的數(shù)據(jù)和指標(biāo)都存在一定的差異,導(dǎo)致數(shù)據(jù)去重和整合的難度很大。
鑒于以上情況,很多科研人員雖然已廣泛使用各社交網(wǎng)絡(luò)上的數(shù)據(jù)來進(jìn)行基于Altmetrics的評(píng)價(jià)研究,但是在做研究時(shí)只能選取不同的有代表性的社交網(wǎng)絡(luò)平臺(tái)來采集、處理和匯總平臺(tái)數(shù)據(jù),難以形成統(tǒng)一的標(biāo)準(zhǔn),這必將嚴(yán)重影響評(píng)價(jià)結(jié)果的準(zhǔn)確性和全面性,也會(huì)限制Altmetrics的長(zhǎng)期可持續(xù)發(fā)展。因此為了在Web2.0 環(huán)境下,保證科學(xué)評(píng)價(jià)和計(jì)量研究的準(zhǔn)確性和影響力,最理想化的方式是構(gòu)建有一致性和通用意義的Altmetrics社交網(wǎng)絡(luò)標(biāo)準(zhǔn)化數(shù)據(jù)框架和評(píng)價(jià)體系,并按照一致性的標(biāo)準(zhǔn)建設(shè)能融合各社交網(wǎng)絡(luò)平臺(tái)上的Altmetrics數(shù)據(jù)的整合分析平臺(tái)。目前尚未有一個(gè)能把各種零散的社交網(wǎng)絡(luò)數(shù)據(jù)整合起來的中文平臺(tái)出現(xiàn),這在一定程度上會(huì)影響這種創(chuàng)新評(píng)價(jià)方式的發(fā)展和開放數(shù)據(jù)的有效使用。因此建立中文Altmetrics數(shù)據(jù)整合分析平臺(tái)是必須且緊迫的。
目前國(guó)外已有針對(duì)Altmetrics數(shù)據(jù)的整合分析平臺(tái),其本身不產(chǎn)生互動(dòng)數(shù)據(jù),而是匯聚并整合了多個(gè)不同社交網(wǎng)絡(luò)平臺(tái)的原始數(shù)據(jù)源。國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)主要包括Altmetric.com、PLoS ALM、PlumX、Kudos、ImpactStory 和Webometrics Analyst等,是由不同的出版商或服務(wù)商在不同時(shí)間開發(fā)的。通過對(duì)上述平臺(tái)網(wǎng)站的調(diào)研,總結(jié)了一些可以借鑒的經(jīng)驗(yàn)。
(1)數(shù)據(jù)來源和成果類型較豐富。國(guó)外Altmetrics整合分析平臺(tái)的數(shù)據(jù)來源廣泛,大部分來自于社交媒體網(wǎng)站、在線學(xué)術(shù)網(wǎng)站、文獻(xiàn)管理平臺(tái)、學(xué)術(shù)社區(qū)網(wǎng)站、新聞媒體網(wǎng)站和百科平臺(tái)等,Altmetric.com 和PLoS ALM 覆蓋的數(shù)據(jù)源最為全面,囊括了上述六種社交網(wǎng)絡(luò)平臺(tái)二十種左右的原始數(shù)據(jù)源。數(shù)據(jù)來源越廣泛多樣,評(píng)價(jià)數(shù)據(jù)就越能準(zhǔn)確科學(xué)地反映被評(píng)價(jià)對(duì)象的影響力。評(píng)價(jià)的成果類型也是多種多樣的,從學(xué)術(shù)論文到博客、數(shù)據(jù)集、軟件、程序代碼以及圖片等都囊括其中,其中PlumX評(píng)價(jià)的成果類型最多,高達(dá)27 種。
(2)通過DOI等標(biāo)識(shí)符來識(shí)別學(xué)術(shù)成果。數(shù)字對(duì)象唯一標(biāo)識(shí)符(Digital Object Identifier,DOI)是國(guó)外最常用的一種標(biāo)識(shí)符技術(shù),Altmetrics 數(shù)據(jù)的準(zhǔn)確性主要取決于文獻(xiàn)的DOI,DOI 是否可用在很大程度上決定了Altmetrics數(shù)據(jù)的質(zhì)量表現(xiàn)[2]。學(xué)術(shù)文獻(xiàn)還有一些其他的標(biāo)識(shí)符,如PMID,ArXiv ID和SlideShare的統(tǒng)一資源定位符(Uniform Resource Locator,URL)等[3]。國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)通過學(xué)術(shù)成果的DOI等統(tǒng)一標(biāo)識(shí)符來實(shí)時(shí)追蹤各社交網(wǎng)絡(luò)平臺(tái)上的Altmetrics數(shù)據(jù),保證了在網(wǎng)絡(luò)環(huán)境下對(duì)學(xué)術(shù)文獻(xiàn)對(duì)象的準(zhǔn)確識(shí)別,有效地避免了重復(fù)。
(3)建立了系統(tǒng)的指標(biāo)體系。國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)都建立了系統(tǒng)的指標(biāo)體系和一致的評(píng)分系統(tǒng),然后以報(bào)告或者評(píng)分的形式對(duì)某一項(xiàng)科研成果的社會(huì)影響力進(jìn)行評(píng)價(jià)。因此可以提供相對(duì)系統(tǒng)和標(biāo)準(zhǔn)化的可用數(shù)據(jù),為科研人員的研究和科研機(jī)構(gòu)的評(píng)價(jià)提供數(shù)據(jù)維度的方便和實(shí)時(shí)的支持,科研人員可以在其平臺(tái)工具上一站式查詢Altmetrics數(shù)據(jù),省去了在多個(gè)社交平臺(tái)尋找數(shù)據(jù)的麻煩。
由于易用性和開放性的特征,國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)受到了學(xué)界的歡迎,為精準(zhǔn)的科學(xué)評(píng)價(jià)和合理的科技政策的制定提供了全面參考,對(duì)Altmetrics 的發(fā)展也起到了重要作用。
從理論上來說,不同Altmetrics數(shù)據(jù)整合分析平臺(tái)應(yīng)該提供一致的Altmetrics數(shù)據(jù),但是由于Altmetrics數(shù)據(jù)本身的多源性和復(fù)雜性,現(xiàn)在國(guó)外也還沒有一家Altmetrics數(shù)據(jù)整合分析平臺(tái)能夠涵蓋所有社交網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù),并且各數(shù)據(jù)整合分析平臺(tái)的數(shù)據(jù)源存在著以下不一致的問題。
(1)數(shù)據(jù)來源不一致。目前各個(gè)國(guó)外Altmetrics整合分析平臺(tái)的數(shù)據(jù)來源不一樣,所收集數(shù)據(jù)的策略不一樣,其在發(fā)展過程中根據(jù)自身目標(biāo)和愿景形成了獨(dú)具特色的數(shù)據(jù)源[4],比如Altmetric.com對(duì)博客文章的收集最多,而PlumX更多采集來自新聞媒體的數(shù)據(jù)[5]。這些平臺(tái)還制定了各不相同的數(shù)據(jù)提取清洗政策,這對(duì)數(shù)據(jù)的使用產(chǎn)生了很大影響。
(2)指標(biāo)聚合方式不一致。各數(shù)據(jù)整合分析平臺(tái)所提供的Altmetrics指標(biāo)有些直接來自某個(gè)社交網(wǎng)絡(luò)平臺(tái)應(yīng)用程序編程接口(Application Programming Interface,API)提供的一個(gè)字段,有些是多個(gè)字段的組合形成的一個(gè)新的指標(biāo)[6],以滿足評(píng)價(jià)的需求。這些指標(biāo)只有名稱,并沒有說明是如何構(gòu)建的。所以到目前為止這些數(shù)據(jù)整合分析平臺(tái)都還不能夠提供準(zhǔn)確、全面和一致的Altmetrics 指標(biāo)。這些都會(huì)影響評(píng)價(jià)的準(zhǔn)確性。
(3)數(shù)據(jù)更新速度不一致。不同的數(shù)據(jù)整合分析平臺(tái)對(duì)不同來源數(shù)據(jù)的更新頻率不一致。比如Altmetric.com平臺(tái)中聲明對(duì)Twitter、Scopus、Wikipedia的數(shù)據(jù)是實(shí)時(shí)更新的,而Facebook、YouTube、Mendeley等是每天更新。實(shí)時(shí)更新的具體含義以及如何實(shí)現(xiàn)、每日更新的方式和具體時(shí)間等都是不透明的,這也是導(dǎo)致Altmetrics數(shù)據(jù)整合分析平臺(tái)數(shù)據(jù)質(zhì)量的問題之一。
國(guó)外常用的Altmetrics數(shù)據(jù)整合分析平臺(tái)都以尋找更多樣和全面的社交網(wǎng)絡(luò)數(shù)據(jù)源為主要目標(biāo),比如Altmetric.com整合分析平臺(tái)還收錄了新浪微博數(shù)據(jù),未來各平臺(tái)將會(huì)收集到更全面的社交網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)。而且不同的數(shù)據(jù)整合分析平臺(tái)之間是具有互補(bǔ)關(guān)系的,不同平臺(tái)之間的數(shù)據(jù)如果可以相互融合,那么所能提供的數(shù)據(jù)就會(huì)更加準(zhǔn)確和全面,可以認(rèn)為這是Altmetrics數(shù)據(jù)整合分析平臺(tái)的發(fā)展趨勢(shì),也是建立中文Altmetrics數(shù)據(jù)整合分析平臺(tái)的目標(biāo)。
在中文環(huán)境下,首先要考察學(xué)術(shù)成果受到哪些中文社交網(wǎng)絡(luò)平臺(tái)的關(guān)注;其次要盡可能尋找多樣化和全面性的學(xué)術(shù)成果網(wǎng)絡(luò)社交數(shù)據(jù)源,借鑒國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)的經(jīng)驗(yàn);再次能提供的Altmetrics指標(biāo)需要有詳細(xì)統(tǒng)一的標(biāo)準(zhǔn),要能避免如上所述國(guó)外各Altmetrics數(shù)據(jù)整合分析平臺(tái)現(xiàn)存的問題。最后這個(gè)平臺(tái)的數(shù)據(jù)不能單靠高成本和低效率的人工方式收集,需要設(shè)計(jì)專業(yè)和智能的數(shù)據(jù)收集工具,快速準(zhǔn)確地通過API接口從相關(guān)平臺(tái)獲取網(wǎng)絡(luò)數(shù)據(jù),并對(duì)其進(jìn)行清洗、格式轉(zhuǎn)換和特征提取等工作。而這些工作如果由圖書館這樣的社會(huì)公共服務(wù)機(jī)構(gòu)進(jìn)行領(lǐng)導(dǎo)和組織,將能取得比較好的效果。筆者深入訪談了10位圖書館學(xué)界和業(yè)界的專家,對(duì)圖書館界是否適合承擔(dān)建立中文Altmetrics數(shù)據(jù)整合分析平臺(tái)領(lǐng)導(dǎo)組織的角色、圖書館界應(yīng)在數(shù)據(jù)整合分析平臺(tái)中提供什么樣的服務(wù)向?qū)<疫M(jìn)行了詳細(xì)的咨詢?cè)L談(訪談提綱見附錄)。根據(jù)對(duì)專家意見的整理和綜合,筆者認(rèn)為在建立中文Altmetrics數(shù)據(jù)整合分析平臺(tái)時(shí),由圖書館界來組織實(shí)施是非常必要且可行的。
3.1.1 圖書館作為社會(huì)公共服務(wù)機(jī)構(gòu)的必然使命
數(shù)據(jù)作為獲取知識(shí)和開展知識(shí)服務(wù)的重要性和價(jià)值已經(jīng)引起全球的重視,它被認(rèn)為是世界上最有價(jià)值的資源并且改變了競(jìng)爭(zhēng)的本質(zhì)[7]?!伴_放數(shù)據(jù)”在維基百科中的定義是:“不受任何知識(shí)產(chǎn)權(quán)和管理機(jī)制的限制,是經(jīng)過挑選與許可的數(shù)據(jù),可以免費(fèi)開放給公眾,任何人都可以自由使用[8]?!遍_放數(shù)據(jù)包括開放的館藏?cái)?shù)據(jù)、科研數(shù)據(jù)、政府?dāng)?shù)據(jù)、商業(yè)數(shù)據(jù)和一些用戶產(chǎn)生的數(shù)據(jù)等。公眾對(duì)開放數(shù)據(jù)需求的不斷增加促進(jìn)了開放數(shù)據(jù)運(yùn)動(dòng)的長(zhǎng)足發(fā)展,隨著越來越多數(shù)據(jù)的開放,開放數(shù)據(jù)的種類不斷增長(zhǎng),開放數(shù)據(jù)的良好環(huán)境逐步形成。
Altmetrics社交網(wǎng)絡(luò)數(shù)據(jù)屬于用戶產(chǎn)生的數(shù)據(jù),但由于均被托管給了第三方,所以在授權(quán)的情況下也可以認(rèn)為轉(zhuǎn)變?yōu)橐环N商業(yè)數(shù)據(jù),因此它也屬于開放數(shù)據(jù)。根據(jù)開放的理念和思維以及開放數(shù)據(jù)的內(nèi)涵,Altmetrics社交網(wǎng)絡(luò)數(shù)據(jù)應(yīng)該免費(fèi)開放給公眾讓其自由使用。但是大部分社交網(wǎng)絡(luò)平臺(tái)是營(yíng)利性質(zhì)的,數(shù)據(jù)還未能無條件地提供給大眾使用。把受限制的數(shù)據(jù)無條件地向任何人開放,也是用戶擁有“數(shù)據(jù)開放權(quán)”的最高目標(biāo)。雖然在開放數(shù)據(jù)環(huán)境下如何對(duì)開放數(shù)據(jù)進(jìn)行知識(shí)產(chǎn)權(quán)保護(hù)尚沒有明確的法律條文,但在對(duì)Altmetrics數(shù)據(jù)進(jìn)行整合管理的過程中,圖書館界也可以借鑒國(guó)外如德國(guó)國(guó)家圖書館、英國(guó)大英圖書館、學(xué)術(shù)出版與學(xué)術(shù)資源聯(lián)盟等制定的對(duì)于開放數(shù)據(jù)在館內(nèi)應(yīng)用及許可協(xié)議,明確使用者與數(shù)據(jù)提供體系之間的關(guān)系,促成用戶與原始數(shù)據(jù)之間的對(duì)接與再利用[9]。
國(guó)外Altmetrics的數(shù)據(jù)整合分析平臺(tái)開發(fā)商大多是出版商或服務(wù)商,比如Altmetric.com、PlumX、Kudos、ImpactStory 和Webometrics Analyst都是由服務(wù)商提供的, PLoS ALM是由出版商提供的[10]。由于具有商業(yè)性質(zhì),所以其提供的數(shù)據(jù)服務(wù)大多不是免費(fèi)的,比如PlumX和ImpactStory都是收費(fèi)的,Altmetric.com也是部分收費(fèi)的,這將極大制約Altmetrics的推廣和應(yīng)用。因此國(guó)內(nèi)整合中文Altmetrics數(shù)據(jù)來開發(fā)建立整合分析平臺(tái)不適合由商業(yè)盈利機(jī)構(gòu)來主導(dǎo)。并且圖書館作為社會(huì)公共服務(wù)機(jī)構(gòu)有義務(wù)有責(zé)任承擔(dān)開放數(shù)據(jù)管理和領(lǐng)導(dǎo)組織的角色,負(fù)責(zé)對(duì)社交網(wǎng)絡(luò)開放數(shù)據(jù)進(jìn)行遴選、采集、描述、組織、分析與評(píng)價(jià),提高數(shù)據(jù)資源的可用性和價(jià)值性,給用戶免費(fèi)提供社交網(wǎng)絡(luò)數(shù)據(jù)的保存、檢索、分析挖掘等服務(wù),并根據(jù)數(shù)據(jù)連續(xù)使用的視角提供數(shù)據(jù)關(guān)聯(lián)、標(biāo)識(shí)和發(fā)布等服務(wù)[11]。此外,圖書館相比于商業(yè)機(jī)構(gòu)也更有利于對(duì)這些開放數(shù)據(jù)進(jìn)行長(zhǎng)期保存。
3.1.2 開放數(shù)據(jù)環(huán)境下的責(zé)任推動(dòng)
數(shù)據(jù)已成為體現(xiàn)圖書館服務(wù)水平和核心競(jìng)爭(zhēng)力的重要因素,是涉及圖書館服務(wù)模式創(chuàng)新、提高個(gè)性化服務(wù)能力和增強(qiáng)服務(wù)透明度的戰(zhàn)略資源。數(shù)據(jù)也是圖書館發(fā)現(xiàn)用戶需求、進(jìn)行服務(wù)決策和評(píng)估服務(wù)有效性的直接依據(jù),是圖書館用戶服務(wù)“數(shù)據(jù)權(quán)”和“知情權(quán)”的有效載體[12]。圖書館很早就開始進(jìn)行科學(xué)數(shù)據(jù)的管理和政府開放數(shù)據(jù)的整合管理,如美國(guó)卡內(nèi)基圖書館整合了農(nóng)業(yè)、教育、建筑、衛(wèi)生等多類別的政府開放數(shù)據(jù)于平臺(tái)上供人們隨時(shí)下載分享[13]。國(guó)外的知名高校如哈佛大學(xué)、斯坦福大學(xué)、劍橋大學(xué)等都有針對(duì)本??蒲袛?shù)據(jù)整合管理的平臺(tái)[14]。我國(guó)雖然起步較晚,但近幾年也越來越重視對(duì)開放數(shù)據(jù)的整合管理,國(guó)內(nèi)的“雙一流”大學(xué)如北京大學(xué)、武漢大學(xué)、復(fù)旦大學(xué)等也都建立了科學(xué)數(shù)據(jù)的共享平臺(tái)[15]。2014年國(guó)內(nèi)9家高校圖書館還在復(fù)旦大學(xué)的牽頭下共同發(fā)起成立了“中國(guó)高校圖書館研究數(shù)據(jù)管理推進(jìn)工作組”,并建立了能夠?qū)崿F(xiàn)科研數(shù)據(jù)存儲(chǔ)、發(fā)布、交換、共享與在線分析等功能的復(fù)旦社會(huì)科學(xué)數(shù)據(jù)平臺(tái)[16]。Altmetrics數(shù)據(jù)屬于開放數(shù)據(jù),是一種公共資源,這種類型數(shù)據(jù)的開放和加工整合能為圖書館服務(wù)質(zhì)量的提高提供強(qiáng)有力的數(shù)據(jù)資源支持。因此,圖書館的Altmetrics社交網(wǎng)絡(luò)數(shù)據(jù)的整合開放是否可用、安全和具有公信力,將會(huì)對(duì)圖書館服務(wù)模式的有效性以及用戶權(quán)益的保障產(chǎn)生很大影響。圖書館界在這樣的新契機(jī)下要充分發(fā)揮自身價(jià)值和功能,以用戶為中心,以開放的姿態(tài)利用復(fù)雜多樣的社交網(wǎng)絡(luò)數(shù)據(jù)滿足用戶多元化的需求,跟上時(shí)代發(fā)展的潮流,使圖書館與社會(huì)的關(guān)系更加緊密,從而提高圖書館的地位,實(shí)現(xiàn)圖書館的積極轉(zhuǎn)型,推動(dòng)圖書館事業(yè)的跨越式發(fā)展。
3.1.3 圖書館實(shí)現(xiàn)創(chuàng)新信息資源建設(shè)的途徑
Altmetrics的發(fā)展為圖書館實(shí)現(xiàn)創(chuàng)新的信息資源建設(shè)、開展數(shù)據(jù)相關(guān)的服務(wù)提供了新的機(jī)遇。圖書館的信息資源建設(shè)對(duì)象除了有紙質(zhì)資源和數(shù)據(jù)庫資源外,數(shù)據(jù)也已成為圖書館信息資源建設(shè)中的重要組成部分。社交網(wǎng)絡(luò)數(shù)據(jù)是重要的數(shù)據(jù)資源,對(duì)于科研人員開展評(píng)價(jià)活動(dòng)具有重要作用。國(guó)家圖書館已收藏了新浪微博上的2000億條博文,美國(guó)國(guó)會(huì)圖書館也已收錄了千億條Twitter上的推文[17]。圖書館必須把社交網(wǎng)絡(luò)數(shù)據(jù)納入到資源建設(shè)的范疇,圖書館要改變傳統(tǒng)的資源建設(shè)思想和建設(shè)模式,整合各社交平臺(tái)上大量的Altmetrics數(shù)據(jù),提高社交數(shù)據(jù)資源的利用率,進(jìn)而提高圖書館的服務(wù)水平和服務(wù)效率。這有利于推動(dòng)整個(gè)社會(huì)開放共享的形成,也讓公民更了解圖書館的價(jià)值所在。
3.2.1 圖書館具有豐富的信息和數(shù)據(jù)服務(wù)經(jīng)驗(yàn)
隨著社會(huì)的快速發(fā)展,數(shù)據(jù)時(shí)代的到來帶給圖書館巨大的變革,圖書館不再只是存儲(chǔ)紙質(zhì)文獻(xiàn)的場(chǎng)所,圖書館本身的紙質(zhì)館藏資源就很豐富,并在經(jīng)過多年的數(shù)字圖書館建設(shè)后,已擁有大量各種類型的數(shù)字化資源,是最適合承擔(dān)大數(shù)據(jù)時(shí)代數(shù)據(jù)開放與整合的實(shí)踐者。而且圖書館作為信息和知識(shí)的保存和傳播機(jī)構(gòu),具有面向公眾開展信息資源服務(wù)的豐富經(jīng)驗(yàn)。這些經(jīng)驗(yàn)完全可以移植到數(shù)據(jù)服務(wù)方面。這也是圖書館界相比于商業(yè)機(jī)構(gòu)更適合整合中文Altmetrics數(shù)據(jù)的優(yōu)勢(shì)之一。圖書館界組織協(xié)調(diào)開發(fā)的、可以供用戶免費(fèi)使用的項(xiàng)目將會(huì)有更多的利用率。各圖書館也不需要額外斥巨資向商業(yè)機(jī)構(gòu)購買這樣的整合平臺(tái)。國(guó)外圖書館在數(shù)據(jù)服務(wù)方面已開展了較多實(shí)踐[18],其以開放數(shù)據(jù)為原則推動(dòng)圖書館把現(xiàn)有的數(shù)字資源轉(zhuǎn)變?yōu)殚_放數(shù)據(jù)資源,并將社會(huì)各方豐富的公開數(shù)據(jù)資源納入館藏資源體系,如政府?dāng)?shù)據(jù)、氣象數(shù)據(jù)、人文數(shù)據(jù)、科學(xué)數(shù)據(jù)和商業(yè)數(shù)據(jù)等,加強(qiáng)開放數(shù)據(jù)資源之間的融合與關(guān)聯(lián),打破時(shí)空對(duì)于公眾獲取數(shù)字資源和服務(wù)的限制,為用戶提供特色數(shù)據(jù)服務(wù),滿足公眾對(duì)于數(shù)據(jù)資源的個(gè)性化需求。
3.2.2 科技發(fā)展使圖書館具有數(shù)據(jù)加工分析的能力
圖書館從發(fā)展初期開始就持續(xù)追蹤讀者使用館藏資源的情況,從基礎(chǔ)簡(jiǎn)單的讀者調(diào)查到書籍期刊資源的使用追蹤,再到用計(jì)算機(jī)來進(jìn)行圖書館借閱統(tǒng)計(jì)分析,直至到出現(xiàn)電子資源后進(jìn)行電子資源使用情況的復(fù)雜分析,因此圖書館具有分析整合用戶數(shù)據(jù)的經(jīng)驗(yàn)和能力。隨著科技的發(fā)展進(jìn)步,圖書館的信息化設(shè)備已經(jīng)十分完備,具有先進(jìn)的計(jì)算機(jī)設(shè)備和高速的網(wǎng)絡(luò)設(shè)施,以及成熟的數(shù)據(jù)采集加工能力,與圖書館相關(guān)的用戶使用資源的數(shù)據(jù)分析模型也越來越多樣化,并且圖書館采集、存儲(chǔ)和整合數(shù)據(jù)的成本也逐漸降低。因此由圖書館來進(jìn)行整合各中文社交網(wǎng)絡(luò)平臺(tái)上的Altmetrics數(shù)據(jù)具有充分的可行性。
3.3.1 COUNTER和DRAA成功運(yùn)作的啟示
網(wǎng)絡(luò)電子資源在線利用統(tǒng)計(jì)(Counting Online Usage of Net-worked Electronic Resources,COUNTER)是規(guī)范電子資源使用統(tǒng)計(jì)報(bào)告數(shù)據(jù)處理、審核和提交的國(guó)際化標(biāo)準(zhǔn),其目的是為在線信息服務(wù)商和用戶提供可靠的、一致的、兼容的使用統(tǒng)計(jì)標(biāo)準(zhǔn)和方案。2019年,COUNTER發(fā)布了第五版《COUNTER電子資源使用統(tǒng)計(jì)實(shí)施規(guī)范》(以下簡(jiǎn)稱COUNTER R5)。COUNTER R5采用了新的報(bào)告體系,新的元素和屬性,以及新的報(bào)告格式和獲取方式[19]。
高校圖書館數(shù)字資源采購聯(lián)盟(Digital Resource Acquisition Alliance of Chinese Academic Libraries,DRAA)是由中國(guó)部分高等學(xué)校圖書館共同發(fā)起成立的,目的是合作開展引進(jìn)數(shù)字資源的采購工作,規(guī)范集團(tuán)采購行為,通過聯(lián)盟的努力為成員館引進(jìn)數(shù)字學(xué)術(shù)資源謀求最優(yōu)價(jià)格和最佳服務(wù)。DRAA于2013年初開始支持通過標(biāo)準(zhǔn)化的電子資源使用統(tǒng)計(jì)獲取協(xié)議(The Standardized Usage Statistics Harvesting Initiative,SUSHI)自動(dòng)獲取COUNTER格式報(bào)告。2015年9月正式成立DRAA使用統(tǒng)計(jì)工作組,目的一是促進(jìn)數(shù)據(jù)庫商配合收集數(shù)據(jù)庫的使用數(shù)據(jù);二是建立收集使用數(shù)據(jù)的長(zhǎng)效機(jī)制,并對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查;三是深入研究COUNTER規(guī)范,實(shí)現(xiàn)對(duì)使用數(shù)據(jù)統(tǒng)計(jì)的進(jìn)一步應(yīng)用。DRAA使用統(tǒng)計(jì)模塊分為數(shù)據(jù)獲取、數(shù)據(jù)處理和報(bào)告展示三個(gè)層次來進(jìn)行使用數(shù)據(jù)統(tǒng)計(jì)的管理[20]。
COUNTER項(xiàng)目對(duì)于圖書館開展整合Altmetrics數(shù)據(jù)具有很大的啟發(fā)。COUNTER最重要的組成部分是圖書館聯(lián)盟,它還整合了電子資源從生產(chǎn)到利用環(huán)節(jié)的出版商、資源提供商和行業(yè)組織等。新的COUNTER R5報(bào)告體系除了依舊保持了詳細(xì)的統(tǒng)計(jì)術(shù)語和嚴(yán)格的報(bào)告撰寫標(biāo)準(zhǔn)外,還拓展了數(shù)據(jù)類型,比如數(shù)據(jù)集、音頻、視頻和圖片等,并更精準(zhǔn)和更新定義了計(jì)量類型、訪問類型和訪問方式等。DRAA通過引入了全新的SUSHI協(xié)議,直接自動(dòng)收割COUNTER的電子資源使用統(tǒng)計(jì)報(bào)告,可以使圖書館高效地獲取更準(zhǔn)確的電子資源使用數(shù)據(jù),而不需要登錄多個(gè)數(shù)據(jù)庫商的網(wǎng)站下載COUNTER使用數(shù)據(jù),加強(qiáng)了圖書館和數(shù)據(jù)庫商對(duì)于資源使用評(píng)估的互動(dòng),為各圖書館制定科學(xué)有效的采購策略提供了方便[21]。因此由圖書館聯(lián)盟來進(jìn)行多方參與和協(xié)調(diào)發(fā)展電子資源使用數(shù)據(jù)的統(tǒng)計(jì),制定統(tǒng)計(jì)的格式、內(nèi)容和術(shù)語,并控制數(shù)據(jù)質(zhì)量方面是有成功典范的,而且自動(dòng)化收割和整合管理使用數(shù)據(jù)還極大地方便了圖書館自身使用這些數(shù)據(jù)來更好地開展服務(wù)。這也更證明了數(shù)據(jù)時(shí)代由圖書館界整合中文Altmetrics數(shù)據(jù)的可行性。
3.3.2 圖書館界在中文Altmetrics數(shù)據(jù)整合中的角色及可提供的服務(wù)
圖書館界在中文Altmetrics數(shù)據(jù)整合中應(yīng)借鑒國(guó)際上COUNTER項(xiàng)目和我國(guó)DRAA統(tǒng)計(jì)工作組項(xiàng)目的成功實(shí)施經(jīng)驗(yàn),充分發(fā)揮其在數(shù)據(jù)整合過程中協(xié)調(diào)組織的作用,確立其協(xié)調(diào)者、組織者、建設(shè)者和服務(wù)提供者的角色。Altmetrics數(shù)據(jù)整合項(xiàng)目可以由中國(guó)圖書館學(xué)會(huì)(以下簡(jiǎn)稱中圖學(xué)會(huì))或教育部高等學(xué)校圖書情報(bào)工作指導(dǎo)委員會(huì)(以下簡(jiǎn)稱高校圖工委)來牽頭組織,聯(lián)合主要的省級(jí)公共圖書館、高校圖書館或圖書館聯(lián)盟,以及部分社交網(wǎng)絡(luò)平臺(tái)的企業(yè)代表等共同開展此項(xiàng)工作。經(jīng)費(fèi)可以由各參與的圖書館繳納的會(huì)費(fèi)并結(jié)合中圖學(xué)會(huì)或高校圖工委下?lián)艿牟糠盅芯拷?jīng)費(fèi)組成,并爭(zhēng)取以項(xiàng)目方式獲得一些基金的資助。對(duì)于每一家參加數(shù)據(jù)整合項(xiàng)目的圖書館要明確分工職責(zé),分別負(fù)責(zé)統(tǒng)計(jì)標(biāo)準(zhǔn)的制定、Altmetrics數(shù)據(jù)的采集、Altmetrics數(shù)據(jù)的加工處理、Altmetrics數(shù)據(jù)的保存和發(fā)布、與社交網(wǎng)絡(luò)企業(yè)溝通等。
最終應(yīng)能建立起Altmetrics數(shù)據(jù)整合分析平臺(tái),平臺(tái)需要讓用戶自由查詢所需要文獻(xiàn)的Altmetrics全面數(shù)據(jù),還要能定期提供多樣化的統(tǒng)計(jì)報(bào)告,包括按時(shí)間、內(nèi)容、類型劃分等。對(duì)于參與Altmetrics數(shù)據(jù)整合項(xiàng)目的圖書館,可以優(yōu)先使用Altmetrics數(shù)據(jù),該圖書館可以在第一時(shí)間把Altmetrics數(shù)據(jù)整合分析平臺(tái)推送到該館的主頁,讓用戶根據(jù)需要進(jìn)行瀏覽和獲取。對(duì)于未參與的圖書館,由該館與項(xiàng)目負(fù)責(zé)人進(jìn)行聯(lián)系,取得Altmetrics數(shù)據(jù)整合分析平臺(tái)的使用授權(quán)后,為該館用戶提供服務(wù)。Altmetrics數(shù)據(jù)整合分析平臺(tái)工作流程和服務(wù)要點(diǎn)的架構(gòu)見圖1。
圖1 Altmetrics數(shù)據(jù)整合分析平臺(tái)工作流程和服務(wù)要點(diǎn)
Altmetrics強(qiáng)調(diào)對(duì)多類型學(xué)術(shù)成果的認(rèn)可和評(píng)價(jià),不僅需要格式多樣,還需要內(nèi)容多樣。所以在格式上學(xué)術(shù)成果不僅是傳統(tǒng)論文的文本格式,還可以是圖片、視頻等。內(nèi)容上除了學(xué)術(shù)論文外,程序片段、數(shù)據(jù)算法和科學(xué)數(shù)據(jù)集等新型的學(xué)術(shù)成果也是重要的需要被關(guān)注的類型[3]。比如關(guān)于科學(xué)數(shù)據(jù)集,可以利用數(shù)據(jù)引證的方式來評(píng)估科學(xué)數(shù)據(jù)集的價(jià)值,但由于過于局限于規(guī)范的學(xué)術(shù)論文,無法捕捉所有科學(xué)數(shù)據(jù)集被廣泛應(yīng)用的情況和多元化的價(jià)值[22]。因此用Altmetrics的指標(biāo)來測(cè)量科學(xué)數(shù)據(jù)集在社交網(wǎng)絡(luò)平臺(tái)的提及、下載等情況,可反映其被分享和應(yīng)用的情況[23]。但由于不同學(xué)科的科研人員對(duì)于社交網(wǎng)絡(luò)平臺(tái)的使用偏好具有較大差別,當(dāng)前Altmetrics的指標(biāo)涉及的研究成果以適用于科學(xué)、技術(shù)、工程與數(shù)學(xué)(Science,Technology,Engineering,Mathematics,STEM)領(lǐng)域的學(xué)術(shù)論文偏多,而人文藝術(shù)社會(huì)科學(xué)領(lǐng)域的很多研究成果(如唱曲、畫作、雕刻)很難在社交網(wǎng)絡(luò)平臺(tái)上通過定量數(shù)據(jù)來衡量其影響力[24]。
研究者往往希望Altmetrics數(shù)據(jù)整合分析平臺(tái)能夠全面評(píng)價(jià)成果的多種影響力,這就需要通過不同類型的多樣化的數(shù)據(jù)源來支撐,才能實(shí)現(xiàn)精準(zhǔn)和全面的統(tǒng)計(jì)和評(píng)價(jià)。因此圖書館界在進(jìn)行中文Altmetrics數(shù)據(jù)整合時(shí)要盡量拓展原始數(shù)據(jù)源,尋找和收集格式多樣化(文本、圖片及視頻等)和內(nèi)容多樣化(學(xué)術(shù)論文、程序片段、數(shù)據(jù)算法、科學(xué)數(shù)據(jù)集等)的學(xué)術(shù)成果。
國(guó)外的Altmetrics 數(shù)據(jù)整合分析平臺(tái)在統(tǒng)計(jì)學(xué)術(shù)成果的Altmetrics數(shù)據(jù)時(shí),一般是基于學(xué)術(shù)成果的唯一標(biāo)識(shí)符來獲取論及這篇學(xué)術(shù)成果的數(shù)據(jù)。發(fā)達(dá)國(guó)家數(shù)字對(duì)象唯一標(biāo)識(shí)符(Digital Object Unique Identifier,DOI)的普及率非常高,而大多數(shù)發(fā)展中國(guó)家還沒有普及DOI。DOI系統(tǒng)是由國(guó)際DOI基金會(huì)(International DOI Foundation,IDF)進(jìn)行全球分布式管理,2007年3月,IDF正式授權(quán)中國(guó)科技信息研究所和萬方數(shù)據(jù)成立中文DOI注冊(cè)機(jī)構(gòu)[25]。我國(guó)中文社交網(wǎng)絡(luò)平臺(tái)的中文學(xué)術(shù)成果很少有標(biāo)注來源出處的唯一標(biāo)識(shí),甚至有一些連URL都沒有,所以無法通過DOI來追蹤中文學(xué)術(shù)成果的社交網(wǎng)絡(luò)痕跡。因此圖書館界在整合Altmetrics數(shù)據(jù)時(shí)需要將不同標(biāo)識(shí)符的相同目標(biāo)文獻(xiàn)采用一致的方法進(jìn)行聚合,從而確定指標(biāo)的一致性,保證數(shù)據(jù)的質(zhì)量。圖書館界可以呼吁和敦促相關(guān)出版機(jī)構(gòu)和期刊編輯機(jī)構(gòu)盡快加入DOI系統(tǒng),并提供相關(guān)技術(shù)支持和服務(wù),促進(jìn)DOI的普及使用。
Altmetrics的評(píng)價(jià)和研究離不開高質(zhì)量的Altmetrics數(shù)據(jù)。Altmetrics數(shù)據(jù)質(zhì)量問題主要發(fā)生在社交網(wǎng)絡(luò)平臺(tái)、數(shù)據(jù)整合分析平臺(tái)和用戶三個(gè)層面,如前所述,社交網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)的差異、數(shù)據(jù)的不穩(wěn)定性、數(shù)據(jù)的不一致性和數(shù)據(jù)的覆蓋率不同會(huì)影響Altmetrics數(shù)據(jù)的質(zhì)量,數(shù)據(jù)整合分析平臺(tái)中數(shù)據(jù)的來源不一致、聚合方式不一致以及數(shù)據(jù)更新速度不一致也會(huì)影響Altmetrics數(shù)據(jù)的質(zhì)量。所以Altmetrics數(shù)據(jù)的準(zhǔn)確性、一致性、動(dòng)態(tài)性和持續(xù)性成為圖書館界在進(jìn)行數(shù)據(jù)整合分析時(shí)最需要關(guān)注的問題。
圖書館界作為Altmetrics數(shù)據(jù)整合分析的主導(dǎo)者,應(yīng)當(dāng)重視數(shù)據(jù)質(zhì)量的問題。首先通過與整合分析平臺(tái)的開發(fā)者進(jìn)行深入溝通和協(xié)調(diào),制定統(tǒng)一的Altmetrics的數(shù)據(jù)標(biāo)準(zhǔn),合理遴選各社交網(wǎng)絡(luò)平臺(tái)的Altmetrics數(shù)據(jù),保證整合分析平臺(tái)采集并記錄到的數(shù)據(jù)與來源社交網(wǎng)絡(luò)平臺(tái)真實(shí)的原始數(shù)據(jù)相一致,保證各來源社交網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù)相統(tǒng)一,保證各數(shù)據(jù)更新的頻率相一致。其次科學(xué)地設(shè)計(jì)整合分析平臺(tái)中的數(shù)據(jù)指標(biāo)。由于各網(wǎng)絡(luò)社交平臺(tái)功能相近,許多Altmetrics指標(biāo)界線模糊,在評(píng)價(jià)時(shí)會(huì)存在含義重合或者相似的情況,因此有必要區(qū)分不同類型的指標(biāo),把同類型的指標(biāo)進(jìn)行整合。比如出版商PLoS以及服務(wù)商ImpactStory將Altmetrics指標(biāo)分為訪問、引用、討論、推薦和保存五類,PlumX將指標(biāo)分為使用、獲取、提及、社交媒體以及引用五類。國(guó)內(nèi)有學(xué)者將Altmetrics計(jì)量指標(biāo)分為傳播、獲取、利用三個(gè)層次[26]。因此在聚合過程中圖書館界需要選取更具代表性、覆蓋范圍更大以及使用頻率較高的指標(biāo)作為評(píng)價(jià)指標(biāo)。最后還需要注意一些保證Altmetrics數(shù)據(jù)質(zhì)量的關(guān)鍵問題,比如數(shù)據(jù)整合分析平臺(tái)的性能問題,這樣才能更好地促進(jìn)Altmetrics 平臺(tái)的開發(fā)與應(yīng)用,提升圖書館界對(duì)于Altmetrics數(shù)據(jù)管理的有效性。
圖書館界對(duì)于Altmetrics數(shù)據(jù)的使用需要重視數(shù)據(jù)從采集、處理到轉(zhuǎn)換等各個(gè)階段的數(shù)據(jù)質(zhì)量,并且在每個(gè)階段能夠采取合適的方法和策略避免容易產(chǎn)生問題的因素。
在數(shù)據(jù)收集階段,圖書館界要根據(jù)數(shù)據(jù)規(guī)劃要求,多渠道籌措資金提供數(shù)據(jù)整合分析平臺(tái)的建設(shè)資金,設(shè)計(jì)開放數(shù)據(jù)服務(wù)機(jī)制,完成數(shù)據(jù)收集前的準(zhǔn)備工作。然后可以通過元數(shù)據(jù)收割協(xié)議,對(duì)各社交網(wǎng)絡(luò)平臺(tái)進(jìn)行元數(shù)據(jù)收割。在對(duì)Altmetrics數(shù)據(jù)進(jìn)行收集時(shí)要注意實(shí)現(xiàn)登錄接口、入口的設(shè)置。
在數(shù)據(jù)處理階段,首先要進(jìn)行數(shù)據(jù)清洗。在此過程中圖書館員將社交網(wǎng)絡(luò)平臺(tái)上的初始數(shù)據(jù)通過API進(jìn)行提取,然后根據(jù)規(guī)劃的需求,利用合適的數(shù)據(jù)清洗工具以可靠性、真實(shí)性和唯一性為原則核實(shí)數(shù)據(jù)的來源,剔除不一致、重復(fù)、不準(zhǔn)確的數(shù)據(jù),修正不精準(zhǔn)的數(shù)據(jù),保證Altmetrics數(shù)據(jù)質(zhì)量。其次進(jìn)行數(shù)據(jù)加工。圖書館界在數(shù)據(jù)加工前要?jiǎng)?chuàng)建元數(shù)據(jù)框架,基于已有元數(shù)據(jù),確定字段結(jié)構(gòu),統(tǒng)一標(biāo)準(zhǔn),制定元數(shù)據(jù)規(guī)范和關(guān)聯(lián)數(shù)據(jù)應(yīng)用;實(shí)現(xiàn)元數(shù)據(jù)的錄入、排序、補(bǔ)充和存儲(chǔ),便于數(shù)據(jù)資源的關(guān)聯(lián)、分析和應(yīng)用等。圖書館界應(yīng)創(chuàng)新開放數(shù)據(jù)格式,使其朝著資源描述框架(Resource Description Framework,RDF) 格式轉(zhuǎn)變,重視API 標(biāo)準(zhǔn)化;還應(yīng)實(shí)現(xiàn)開放數(shù)據(jù)管理的通用設(shè)計(jì),方便各專業(yè)背景的用戶使用,讓開放數(shù)據(jù)轉(zhuǎn)變?yōu)楦奖闶褂玫暮?jiǎn)單數(shù)據(jù)。
在數(shù)據(jù)轉(zhuǎn)換階段,Altmetrics數(shù)據(jù)通過清洗、加工之后成為結(jié)構(gòu)化的干凈數(shù)據(jù),但是還要通過數(shù)據(jù)轉(zhuǎn)換才能利用API 接口對(duì)外開放。圖書館員可以和技術(shù)人員協(xié)作,利用RDF 格式轉(zhuǎn)變工具把數(shù)據(jù)轉(zhuǎn)換存儲(chǔ)到RDF存儲(chǔ)庫中。然后再利用統(tǒng)一或者分類的開放方式對(duì)外開放[27]。
在實(shí)現(xiàn)數(shù)據(jù)從采集、處理到轉(zhuǎn)換等階段后,圖書館界應(yīng)基于在文獻(xiàn)資源管理方面的經(jīng)驗(yàn),進(jìn)行數(shù)據(jù)平臺(tái)的數(shù)據(jù)存儲(chǔ)、分類、組織、檢索、管理等,使用戶可利用圖書館的“一站式”檢索平臺(tái)一鍵快速搜索到自己所需的數(shù)據(jù)資源,并完成基于數(shù)據(jù)共享框架下的智能判斷和決策。圖書館界應(yīng)對(duì)開放全程實(shí)時(shí)監(jiān)管,當(dāng)發(fā)現(xiàn)錯(cuò)誤或不精確的數(shù)據(jù)時(shí),應(yīng)及時(shí)對(duì)其進(jìn)行修改。
圖書館界對(duì)于Altmetrics數(shù)據(jù)的開放、整合、管理應(yīng)廣泛聽取用戶和社會(huì)的意見,了解其需求,堅(jiān)持公開、透明、可擴(kuò)展和合作的原則,合理選擇數(shù)據(jù)開放的對(duì)象、內(nèi)容和方式,不斷增強(qiáng)Altmetrics數(shù)據(jù)整合分析平臺(tái)的可用性和價(jià)值密度,最終實(shí)現(xiàn)數(shù)據(jù)的開放性增值。各圖書館之間應(yīng)加強(qiáng)合作,對(duì)Altmetrics數(shù)據(jù)進(jìn)行采集整合不是某一家圖書館的事,而是整個(gè)圖書館界的責(zé)任,需要各圖書館之間協(xié)作來完成。圖書館界需協(xié)調(diào)各方開展對(duì)數(shù)據(jù)標(biāo)準(zhǔn)、采集整合方法工具和策略的研究。
圖書館界還需加強(qiáng)與社交網(wǎng)絡(luò)平臺(tái)企業(yè)的聯(lián)系和合作,作為Altmetrics數(shù)據(jù)的來源,要想獲得準(zhǔn)確可靠的數(shù)據(jù)不能僅靠API自動(dòng)收集,特別是一些企業(yè)沒有開放給大眾的數(shù)據(jù),可以由圖書館界與這些企業(yè)進(jìn)行溝通協(xié)商,從利益相關(guān)者的角度出發(fā),提出解決方案以便獲得這些數(shù)據(jù)??傊訌?qiáng)圖書館界與社會(huì)各部門的聯(lián)系,促使圖書館作為公共文化服務(wù)機(jī)構(gòu)能更好地完成Altmetrics數(shù)據(jù)整合分析的工作,開展創(chuàng)新性的由數(shù)據(jù)驅(qū)動(dòng)的公共服務(wù),從而也可以擴(kuò)大圖書館的社會(huì)影響力。
Altmetrics數(shù)據(jù)中包含著社交網(wǎng)絡(luò)平臺(tái)用戶大量的閱讀內(nèi)容、參與內(nèi)容、社會(huì)關(guān)系和地理位置等個(gè)體特征和行為數(shù)據(jù)。雖然社交網(wǎng)絡(luò)數(shù)據(jù)權(quán)屬于數(shù)據(jù)收集的企業(yè)一方,但是這些包含大量個(gè)人數(shù)據(jù)的隱私也是需要被保護(hù)的。在采集利用Altmetrics數(shù)據(jù)過程中如果圖書館界對(duì)用戶Altmetrics數(shù)據(jù)資源進(jìn)行無限制地完全開放,一些用戶不想公開的隱私和個(gè)人信息就會(huì)被泄露[28]。圖書館界應(yīng)加強(qiáng)Altmetrics數(shù)據(jù)開放過程中用戶的隱私保護(hù),確保數(shù)據(jù)提供服務(wù)具有較高的安全性并能保障用戶的名譽(yù)權(quán)。首先,圖書館界應(yīng)保證用戶擁有對(duì)自身社交行為數(shù)據(jù)采集、使用和共享的知情權(quán)與決定權(quán),讓用戶依據(jù)保護(hù)的需求決定開放的內(nèi)容、程度和方式。其次,圖書館界在Altmetrics數(shù)據(jù)開放過程中,應(yīng)采用對(duì)用戶隱私信息匿名,或轉(zhuǎn)為采集用戶群體特征的數(shù)據(jù),力爭(zhēng)在能保持?jǐn)?shù)據(jù)價(jià)值、可用性和開放性的前提下保護(hù)用戶的隱私安全。最后,圖書館界還應(yīng)根據(jù)發(fā)展變化中的用戶隱私保護(hù)需求,不斷更新完善相關(guān)的行業(yè)規(guī)范和政策法規(guī),確保用戶隱私保護(hù)可及時(shí)被評(píng)估和界定[29]。因?yàn)閳D書館界對(duì)于用戶隱私數(shù)據(jù)的判定標(biāo)準(zhǔn)也是關(guān)乎用戶隱私保護(hù)有效性和可控性的重要因素。
Altmetrics的長(zhǎng)期可持續(xù)發(fā)展能夠保證科學(xué)評(píng)價(jià)和計(jì)量研究的準(zhǔn)確性和影響力,能夠給科研人員和公眾提供更好的開放數(shù)據(jù)服務(wù),因此建立中文Altmetrics數(shù)據(jù)整合分析平臺(tái)勢(shì)在必行。作為社會(huì)公共服務(wù)機(jī)構(gòu)的圖書館界最適合承擔(dān)牽頭組織的角色,前有COUNTER項(xiàng)目和DRAA成功運(yùn)用的經(jīng)驗(yàn)借鑒,后有圖書館界豐富的信息和數(shù)據(jù)服務(wù)的經(jīng)驗(yàn),圖書館界可以充分發(fā)揮組織協(xié)調(diào)作用,把握整合分析的要點(diǎn),避免國(guó)外Altmetrics數(shù)據(jù)整合分析平臺(tái)存在的問題,協(xié)調(diào)各方力量做好Altmetrics數(shù)據(jù)整合分析平臺(tái)。