李雁鳴
摘 要:文獻(xiàn)計量作為量化情報信息的重要手段,在科研評價、館藏核心測定、前沿發(fā)展方面發(fā)揮著重要作用。本文從文獻(xiàn)計量的特性出發(fā),研究了數(shù)據(jù)可視化技術(shù)、語義處理技術(shù)、文獻(xiàn)計量與信息檢索整合三個方面的研究技術(shù)展望,探討了文獻(xiàn)計量在我國現(xiàn)階段圖書情報領(lǐng)域中核心期刊測定、熱點研究、科學(xué)評價、館藏建設(shè)四個方面的應(yīng)用,為我國提高圖書情報工作質(zhì)量提供了很多幫助。
關(guān)鍵詞:量化;文獻(xiàn)計量;應(yīng)用
一、文獻(xiàn)計量研究背景與研究意義
文獻(xiàn)計量由文獻(xiàn)學(xué)發(fā)展而來,從最初比較出版物、統(tǒng)計書目到采用統(tǒng)計學(xué)計算方法、整合文獻(xiàn)事實研究及計量表征,發(fā)展到涵蓋情報信息分布層次、數(shù)量變化、規(guī)律測試的指導(dǎo)、探討科研熱點、結(jié)構(gòu)、特征的學(xué)科。我國文獻(xiàn)計量起步于上世紀(jì)六十年代,發(fā)展于八十年代后期,經(jīng)過數(shù)十年發(fā)展,基本形成了符合我國科研環(huán)境的文獻(xiàn)計量理論、方法、實踐經(jīng)驗的知識體系,為我國情報信息處理提供了有力支撐,成為圖書情報與科學(xué)評價領(lǐng)域中一個重要的分支學(xué)科。
文獻(xiàn)計量通過探索與完善表征詞頻分布或文獻(xiàn)分散規(guī)律的實踐方法,實現(xiàn)數(shù)學(xué)、統(tǒng)計、文獻(xiàn)學(xué)的有機(jī)結(jié)合,將文獻(xiàn)評價、出版物確定、文獻(xiàn)利用率等機(jī)能日益完善,為實現(xiàn)圖書情報的科學(xué)管理提供了有利條件。文獻(xiàn)計量對實現(xiàn)情報網(wǎng)絡(luò)建設(shè)、情報處理效率、文獻(xiàn)服務(wù)利弊等方面的提升產(chǎn)生深遠(yuǎn)影響。但隨著近年來圖書情報領(lǐng)域不斷發(fā)展,尤其當(dāng)前 “大數(shù)據(jù)”、云計算、人工智能成為研究熱點,呈現(xiàn)的文獻(xiàn)數(shù)量以指數(shù)型增長,文獻(xiàn)系統(tǒng)固有的不確定因素日益凸顯,造成我國現(xiàn)階段圖書情報工作仍存在宏觀定律依賴數(shù)學(xué)統(tǒng)計,微觀依賴同行評價的舊弊,影響到學(xué)科評價的客觀性。在此種情形下,如何正確地評價分析文獻(xiàn)計量在圖書情報領(lǐng)域的應(yīng)用,充分發(fā)揮文獻(xiàn)計量的優(yōu)勢,以量化指標(biāo)全面評價某領(lǐng)域科研效率、研究能力、挖掘深度,實現(xiàn)數(shù)學(xué)理論與方法運用相結(jié)合,以定性過渡到定量,以科學(xué)方法探尋情報信息本質(zhì),從而提升我國圖書情報信息分析質(zhì)量。
二、文獻(xiàn)計量在圖書情報特性研究
當(dāng)前,我國文獻(xiàn)計量學(xué)研究范圍已涉及社會網(wǎng)絡(luò)映射、數(shù)據(jù)采集分析、標(biāo)準(zhǔn)制定與研究以及智庫機(jī)構(gòu)量化信息、引文量化分析等,研究方法中可視化、數(shù)據(jù)挖掘技術(shù)運用廣泛,文獻(xiàn)計量凸顯技術(shù)與定量的實現(xiàn)趨勢,其在圖書情報領(lǐng)域體現(xiàn)以下特點。
1.指示目標(biāo)的明確性
文獻(xiàn)計量的指示目標(biāo)必須遵循互斥、排他原則,即構(gòu)建指示目標(biāo)的明確性,作為文獻(xiàn)計量指示的基礎(chǔ),明確性必須根植于情報信息內(nèi)容與分析趨勢,此要求包含以下方面:(1)科學(xué)指示,即指標(biāo)在主題、內(nèi)涵、容量、時間、計算單位、方法有明確的定義與要求,排除可能引發(fā)歧義的概念,以期減少收集數(shù)據(jù)的偏差、誤差;(2)可測量操作,文獻(xiàn)計量認(rèn)為是一種量化方法,具備工具化、模型化的數(shù)學(xué)特點,因此其指標(biāo)的設(shè)定前提必須是直接度量的、滿足一定條件的、排除可能引發(fā)計算方法偏離的值域或閥值;(3)評價導(dǎo)向性,指示目標(biāo)的學(xué)科評價必須具備正確的、同方向、持續(xù)性的引導(dǎo)與鼓勵,計量不是為“文獻(xiàn)打分”,而是歸納文獻(xiàn)的學(xué)科發(fā)展,明確學(xué)科的導(dǎo)向功能,體現(xiàn)絕對的文獻(xiàn)價值。
2.評價的結(jié)構(gòu)層次性
學(xué)科評價是文獻(xiàn)計量的重要功能,智庫機(jī)構(gòu)往往通過學(xué)科評價確定該信息的價值導(dǎo)向,而學(xué)科評價具備明確指向性的特點。組織作為要素基礎(chǔ),合理組織并建立評價體系模型至關(guān)重要,其關(guān)鍵在于模型結(jié)構(gòu)的設(shè)計,對結(jié)構(gòu)繼續(xù)分解定義,賦予分層層數(shù)、各層定義和組合因素、層遞關(guān)系明確的意義與內(nèi)容。優(yōu)秀的指標(biāo)評價結(jié)構(gòu)體系必須具備以下特點:(1)層次鮮明,即評價分層分析,因?qū)臃治?,按層分析,既可以保證評價的嚴(yán)謹(jǐn)又能夠保證評價目標(biāo)及時更新;(2)主題一致性,即整體評價的指標(biāo)與目標(biāo)統(tǒng)一,層次目標(biāo)與指標(biāo)一致;(3)層次數(shù)量適度,即滿足指標(biāo)體系的及時創(chuàng)新及完善,層次銜接緊湊,分析內(nèi)容緊密契合,易量化操作;(4)目標(biāo)完備,即體系結(jié)構(gòu)協(xié)調(diào)、齊整,評價目標(biāo)完整、全面。
3.計量閥值的選擇性
文獻(xiàn)計量過程所設(shè)計、選擇的單一指標(biāo)可能會出現(xiàn)不符合指標(biāo)原則的情況,出現(xiàn)評價指標(biāo)的互相矛盾、相互掣肘、交叉、因果等不恰當(dāng)關(guān)系,這種不確定關(guān)系給圖書情報工作者造成干擾,嚴(yán)重的可能會出現(xiàn)重大決策失誤。因此明確文獻(xiàn)計量的指示目標(biāo)必須設(shè)定一定的閥值、參數(shù)來進(jìn)行計量選擇。
計量閾值是指量化指標(biāo)中數(shù)量關(guān)系、時間參數(shù)的設(shè)定值,即可理解為互斥條件。而科學(xué)選擇閾值應(yīng)綜合考慮學(xué)科評價機(jī)理、內(nèi)涵因素、特點屬性等方面,學(xué)科代表性是當(dāng)前計量閥值設(shè)定的基本思想。閥值設(shè)定思路包括:(1)以概念為設(shè)定閥值,即概念自身定義所隱藏、表征的數(shù)量、時間參數(shù),如“年份” “關(guān)鍵詞”;(2)以參考定理原理為設(shè)定閥值。即“影響因子”“期刊比重”所代表的學(xué)科核心定義選擇,如“ISTP”“ESI”;(3)以隨機(jī)區(qū)間、范圍為設(shè)定閥值,即評價的“置信區(qū)間”可以涵蓋足夠的文獻(xiàn),如“某年份、某國”、前“n%”等區(qū)間參數(shù)。
三、文獻(xiàn)計量主要研究技術(shù)與發(fā)展趨勢
1.數(shù)據(jù)可視化技術(shù)
數(shù)據(jù)可視化技術(shù)是文獻(xiàn)計量過程重要的實現(xiàn)工具,通過文獻(xiàn)計量的引文方法、內(nèi)容分析法、元分析法相融合的途徑,實現(xiàn)了計量數(shù)據(jù)的深度挖掘。根植于數(shù)據(jù)挖掘、文本分解的分析軟件在開發(fā)之初就將計量可視化思想進(jìn)一步表述,如基于語義計算的Autonomy 軟件,將概念與語義關(guān)聯(lián)實現(xiàn)對信息的自動理解,自動篩選聚類信息及超鏈接,其核心IDOL(智能信息操作層),能夠挖掘非結(jié)構(gòu)數(shù)據(jù),實現(xiàn)數(shù)據(jù)積累。可視化分析看似重點在于利于交互的界面建立,其實核心在于其中的分析手段、數(shù)據(jù)梳理方法,及其相應(yīng)的計量理論??梢暬夹g(shù)幫助用戶從龐大的非結(jié)構(gòu)數(shù)據(jù)中抽脫出來,分離復(fù)雜的數(shù)據(jù)關(guān)系,理解推理結(jié)果及明確策略走向。應(yīng)當(dāng)強(qiáng)調(diào)的是可視化技術(shù)與信息可視化有所區(qū)別,信息可視化僅僅是實現(xiàn)計算機(jī)在網(wǎng)絡(luò)環(huán)境下自動生成信息交互表現(xiàn)形式的開發(fā)、運用,缺少了可視化分析知識發(fā)現(xiàn)、梳理、甄別的過程,而可視化技術(shù)更側(cè)重自動分析方法及算法研究。只有可視化技術(shù)選擇與恰當(dāng)信息自動化相結(jié)合、相輔助,情報信息的推送才能更好地完成用戶決策。
2.語義處理技術(shù)
語義處理技術(shù)主要整合信息評價提取、自然語言(NLP)處理建模、AI應(yīng)用、數(shù)據(jù)庫(DT)等智能處理方法,其主要表現(xiàn)為數(shù)據(jù)表征與涵義提取為機(jī)器語言,利用計算機(jī)對語言結(jié)構(gòu)進(jìn)行分析,使得機(jī)器能夠識別、理解語言并能夠精確搜索、準(zhǔn)確定義。語言處理技術(shù)向機(jī)器理解數(shù)據(jù)語義、完善語義技術(shù)應(yīng)用范疇、完成結(jié)構(gòu)化的語義數(shù)據(jù)采集分析的方向發(fā)展,語義處理技術(shù)成為當(dāng)前語言處理技術(shù)難點,針對現(xiàn)有情報研究對象(核心期刊、專利、專著等文獻(xiàn))計量,雖已現(xiàn)存較為成熟的分析軟件與工具,可以類聚關(guān)聯(lián)鏈接,卻仍舊缺少深層次語義支撐,仍需要耗費較多人力資源對設(shè)定進(jìn)行評價,基于語義處理技術(shù)研究支持工具與技術(shù)還有提升的空間。
3.基于大數(shù)據(jù)背景下的發(fā)展態(tài)勢
大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,打破了情報學(xué)信息檢索與文獻(xiàn)計量兩大分支的鴻溝,實現(xiàn)了兩者的并行發(fā)展,信息檢索中的信息查詢技術(shù)智能化程度,“關(guān)鍵詞”自動化提取能力有著顯著提高,是進(jìn)一步彌補(bǔ)文獻(xiàn)計量中檢索時間過長缺陷的重要補(bǔ)充手段。信息檢索能夠?qū)崿F(xiàn)文獻(xiàn)計量全過程的學(xué)術(shù)信息交互、使用,涵蓋用戶行為中的瀏覽記錄、下載鏈接、期刊收錄、科研評價、學(xué)術(shù)引用等方面,實現(xiàn)全時期、全空間的計量。大數(shù)據(jù)背景下,信息檢索根植于文獻(xiàn)計量,通過信息檢索能夠保存文獻(xiàn)計量的樣本,自動為文獻(xiàn)計量提取樣本,形成文獻(xiàn)圖譜,促使文獻(xiàn)計量向網(wǎng)絡(luò)計算發(fā)展,從而形成指標(biāo)閥值基于個性化檢索、精確推薦的文獻(xiàn)計量指標(biāo)體系。
四、現(xiàn)階段文獻(xiàn)計量在我國圖書情報領(lǐng)域的應(yīng)用
1.在學(xué)科核心期刊測定方面的應(yīng)用
核心期刊代表著某學(xué)科科技前沿、研究前站,是該學(xué)科專業(yè)情報信息量最豐富、質(zhì)量最高的主要刊物,是文獻(xiàn)情報最重要的來源。文獻(xiàn)計量在學(xué)科核心期刊“量化”“測定”方面應(yīng)用出現(xiàn)較早,影響較為廣泛,理論較為成熟,期刊測定是文獻(xiàn)計量工具化直接的應(yīng)用。實踐方面,圖書情報單位建立本機(jī)構(gòu)館藏核心、研究人員科學(xué)獲得高質(zhì)量密度情報源、論文撰寫參閱專業(yè)期刊文獻(xiàn)等文獻(xiàn)引用操作,都離不開核心期刊科學(xué)、合理、恰當(dāng)?shù)販y定與評價。文獻(xiàn)計量為核心期刊測定形成一種普遍、廣泛的評價體系,從早期簡單考慮單因素的百分比法、累計法,到結(jié)合論文引用率、利用率的文摘法、引文法,再到具體問題數(shù)據(jù)處理的精確計算法,如權(quán)重目標(biāo)法、“無量綱灰色關(guān)聯(lián)法”。例如,“無量綱灰色關(guān)聯(lián)法”將“引文量”“摘要詞頻”“流通數(shù)量”進(jìn)行無量綱化,通過灰色關(guān)聯(lián)系數(shù)ξ(Xi)構(gòu)建灰色關(guān)聯(lián)模型,比較研究對象與各影響因素的因子值貼近度,由此貼近度獲得影響因子與待識別對象的關(guān)聯(lián)度大小,從而將關(guān)聯(lián)度絕對值作為核心期刊的測定值,我們通過絕對值大小來測定該期刊的質(zhì)量是否滿足評價要求。
2.在熱點研究與科技前沿方面的應(yīng)用
文獻(xiàn)計量的基礎(chǔ)來源于文獻(xiàn)事實研究,文獻(xiàn)研究古老而生命力頑強(qiáng),往往帶來新思想、新技術(shù)的萌芽,這種萌芽不僅能夠促進(jìn)學(xué)科的正循環(huán)發(fā)展,更能夠進(jìn)一步演示學(xué)科領(lǐng)域的發(fā)展方向。尤其近年來,數(shù)據(jù)庫技術(shù)的應(yīng)用,文獻(xiàn)數(shù)量得到極大豐富,文獻(xiàn)目錄、引文歸集的統(tǒng)計分析方法向計量學(xué)方向完善,計量分析在某學(xué)科熱點確認(rèn)、學(xué)科研究發(fā)展、學(xué)科預(yù)測等方面得到有效運用。目前,文獻(xiàn)計量對學(xué)科動態(tài)理論、文獻(xiàn)產(chǎn)出率與現(xiàn)階段成果、發(fā)展變化與聯(lián)系、詞頻變化與科技發(fā)展變化關(guān)系等進(jìn)行切實可行、靈活多樣的事實研究,其中包括了對該學(xué)科范圍內(nèi)論文、專著數(shù)量、作者分布概型、期刊組成、關(guān)鍵詞頻率、時空參數(shù)等全方位、多角度分析,對學(xué)科研究現(xiàn)狀及發(fā)展趨勢進(jìn)行客觀評價。如我國數(shù)字圖書館核心館藏數(shù)據(jù)庫建立研究的論著中,研究者主要利用“SCI”“JCR”等工具,運用“引文”間接分析法,通過引文量化頻次、數(shù)量、刊物來源,由“引文量分布”“引文篇數(shù)分布”獲得引文的集中離散規(guī)律,研究該主題文獻(xiàn)量化規(guī)律及客戶需求規(guī)律,從而為數(shù)字化圖書館核心館藏庫建立提供一定的參考價值。
3.在科研評價的應(yīng)用
我國定性評價方式長期存在于學(xué)科研究過程中,其中同行評議的方式固然有著專業(yè)、權(quán)威、隱匿的優(yōu)勢,但主觀性、保守性同樣存在,不利于科研能力的客觀評估。而文獻(xiàn)是學(xué)科研發(fā)的事實依據(jù)、固有成果、過程體現(xiàn),基于文獻(xiàn)計量相關(guān)理論的“定量”分析,是將文獻(xiàn)產(chǎn)出“數(shù)量”“引文頻次”數(shù)量作為科研評價的量化標(biāo)準(zhǔn),將作者文獻(xiàn)作為科研產(chǎn)能,文獻(xiàn)引用頻次作為科研質(zhì)量,在一定范圍內(nèi)提供科研評價參考。隨著影響因子與混合量化指標(biāo)理念的提出與完善,文獻(xiàn)計量由單一指標(biāo),向復(fù)合計算演進(jìn),通過指數(shù)的量來預(yù)測、輔助同行評價,由作者核心論文作品集進(jìn)行科研能力評估,從而建立起完整的科研評價體系。在科研評價過程中,把文獻(xiàn)作為結(jié)構(gòu)性資源,將其基于一般統(tǒng)計、回歸計算等數(shù)學(xué)方法,納入計量系統(tǒng)工程系統(tǒng),糾正單一指標(biāo)所帶來的評價偏差,把科研團(tuán)隊、學(xué)術(shù)期刊績效形成適用性報告,客觀的把期刊影響因子、引文、h指數(shù)有機(jī)結(jié)合起來,從而形成科學(xué)地科研評價結(jié)果。
4.在圖書館藏建設(shè)中的應(yīng)用
文獻(xiàn)計量在我國圖書情報的實踐還體現(xiàn)在圖書情報科學(xué)分析管理方面,并涉及到圖書科學(xué)管理系統(tǒng)的建立,如圖書流量、圖書選訂、館藏定量、流通分析、用戶評價等多個方面,而且館購圖書文獻(xiàn)質(zhì)量也影響本機(jī)構(gòu)圖書情報資源建設(shè)與發(fā)展。圖書館在采購文獻(xiàn)時,可以使用文獻(xiàn)計量中的“引文”法對文獻(xiàn)收集、期刊訂閱、館藏核心進(jìn)行確認(rèn),即通過學(xué)科期刊中所內(nèi)含的文獻(xiàn)“引用量”“衰退周期率”進(jìn)行分析,確定圖書館文獻(xiàn)資源管理內(nèi)容。國內(nèi)眾多高校選擇本校師生論文為研究樣本,統(tǒng)計近年來本校師生發(fā)表的論文中引用的參考文獻(xiàn),并結(jié)合本校現(xiàn)階段館藏建設(shè),采用“一次引文法”,以期獲得基于本校用戶行為的圖書情報信息,促進(jìn)館藏更好的建設(shè)。館藏建設(shè)在核心期刊計量方面,明確文獻(xiàn)知識累積性、發(fā)展性、衰老性,推送給用戶的信息必須是正確的、完整的、匹配的,從而構(gòu)建基于“數(shù)據(jù)庫資源”匹配的個性化推送模型,進(jìn)而構(gòu)建基于文獻(xiàn)計量的“被引分析”“詞頻類聚”“h指數(shù)”的架構(gòu)模型。同時在情報信息整合方面,圖書館要繼續(xù)關(guān)注強(qiáng)化詞頻與自動化標(biāo)注技術(shù)研究,完善定量評價與檢索體系,同時借助大數(shù)據(jù)、云服務(wù)、數(shù)字圖書館聯(lián)盟中海量的數(shù)據(jù)進(jìn)行文獻(xiàn)新整合,全面開展學(xué)科方向趨勢與科研決策信息服務(wù),深挖用戶行為信息數(shù)據(jù),推廣科學(xué)的文獻(xiàn)服務(wù)管理,謀求當(dāng)前圖書館創(chuàng)新轉(zhuǎn)型。
五、總結(jié)
我國文獻(xiàn)計量學(xué)已經(jīng)積累了相當(dāng)多的理論與實踐經(jīng)驗,文學(xué)計量相關(guān)應(yīng)用在圖書情報科學(xué)管理方面取得很大的進(jìn)展,對情報服務(wù)實際工作、各圖書情報機(jī)構(gòu)信息處理發(fā)揮了舉足輕重的作用。但是我們應(yīng)該看到現(xiàn)階段文獻(xiàn)計量中重要的理論指導(dǎo)、重要計量可視化軟件大多為西方國家創(chuàng)建,這就要求我們從國內(nèi)實際出發(fā),腳踏實地研究文獻(xiàn)計量學(xué)原理,進(jìn)一步提升我國現(xiàn)階段文獻(xiàn)計量水平,從而做好新時期圖書情報學(xué)應(yīng)用與管理
工作。
參考文獻(xiàn):
[1]朱 亮,孟憲學(xué).文獻(xiàn)計量法與內(nèi)容分析法比較研究[J].圖書館工作與研究,2013
[2]董 琳.使用文獻(xiàn)計量法開展學(xué)科研究[J].情報雜志,2013
[3]陳廉芳.高校圖書館文獻(xiàn)計量類型梳理與融合策略研究[J]. 圖書館工作與研究,2019
[4]王節(jié)祥,蔡 寧.平臺研究的流派、趨勢與理論框架———基于文獻(xiàn)計量和內(nèi)容分析方法的詮釋[J].商業(yè)經(jīng)濟(jì)與管理,2018
(作者單位:棗莊學(xué)院)