亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于麥肯錫核心概念的國內(nèi)圖書館大數(shù)據(jù)技術(shù)研究狀態(tài)量化描述

        2014-09-22 16:11:18桂羅敏
        圖書館界 2014年4期
        關(guān)鍵詞:量化大數(shù)據(jù)技術(shù)大數(shù)據(jù)

        [摘要]在大數(shù)據(jù)成為熱議話題的當(dāng)下,人們對于國內(nèi)圖書館界對大數(shù)據(jù)技術(shù)應(yīng)用狀況,未曾有過可行的量化測度。本文基于麥肯錫全球研究院發(fā)布的大數(shù)據(jù)核心技術(shù)概念,結(jié)合社會學(xué)和文獻計量學(xué)等相關(guān)方法,嘗試將抽象問題轉(zhuǎn)化為可操作性問題,量化描述圖書館界的大數(shù)據(jù)技術(shù)運用狀態(tài)。

        [關(guān)鍵詞] 麥肯錫報告;MGI;大數(shù)據(jù);大數(shù)據(jù)技術(shù);量化

        [分類號] G256

        1.問題的提出

        自2011年5月麥肯錫將“大數(shù)據(jù)”帶入大眾視野,從國家層面到基礎(chǔ)行業(yè)[1],都對此表現(xiàn)出全所未有的興趣。媒體如火如荼的參與和渲染,更是讓這個技術(shù)概念轉(zhuǎn)化成炙手可熱的時尚名詞。其實,“大數(shù)據(jù)”概念包括大數(shù)據(jù)理念和大數(shù)據(jù)技術(shù)兩個層面的內(nèi)涵,前者是引發(fā)社會轟動效應(yīng)的根源,而后者才是“大數(shù)據(jù)”概念的實質(zhì)性內(nèi)涵。

        在這股大數(shù)據(jù)熱潮中,圖書館業(yè)界也表現(xiàn)出不小的熱情。通過觀察圖書館界這些年的研究和實踐可以發(fā)現(xiàn),圖書館界其實一直追隨著大數(shù)據(jù)技術(shù)的步伐前行,只是限于自身的一些不利條件,對大數(shù)據(jù)技術(shù)的應(yīng)用和開發(fā)相對還是緩慢的。

        那么,國內(nèi)圖書館界對于大數(shù)據(jù)技術(shù)的應(yīng)用到底處于怎樣的一個狀態(tài)?對于這個問題,目前尚未有人能夠做出清晰的量化描述。但作為與信息技術(shù)發(fā)展休戚相關(guān)的行業(yè),圖書館有必要對自身與現(xiàn)代技術(shù)之間的距離有更為直觀的了解,作為行業(yè)發(fā)展規(guī)劃的依據(jù)。簡言之,我們需要找到一個可行的方法,對圖書館大數(shù)據(jù)技術(shù)的運用狀態(tài)進行量化的描述。

        2.研究方法的探討

        社會學(xué)在研究社會現(xiàn)象時,通常將某些抽象問題轉(zhuǎn)化為相對容易測量的具體問題,繼而將定性研究推進到定量分析。[2]本文借鑒此類解決問題的方法,并結(jié)合文獻計量學(xué),對上述問題進行量化研究。

        2.1 將抽象問題具體化

        對于抽象問題“國內(nèi)圖書館界對大數(shù)據(jù)技術(shù)的運用狀態(tài)”,首先將之轉(zhuǎn)化為更為具體的問題——“國內(nèi)圖書館領(lǐng)域論文對大數(shù)據(jù)技術(shù)的關(guān)涉程度”。之所以這樣轉(zhuǎn)換,是因為關(guān)于某領(lǐng)域的學(xué)術(shù)論文基本上可以代表該領(lǐng)域的理論水平,對此的考量是觀察該領(lǐng)域發(fā)展?fàn)顩r的重要角度;而“關(guān)涉程度”指的是圖書館領(lǐng)域論文所涉及大數(shù)據(jù)技術(shù)的程度,可以將之分為更小的指標(biāo)進行定量觀察和分析。

        2.2 測量指標(biāo)的確定

        所謂指標(biāo)就是概念內(nèi)涵的指示標(biāo)志。對于“國內(nèi)圖書館界學(xué)術(shù)論文對大數(shù)據(jù)技術(shù)的關(guān)涉程度”這個問題,需要將“大數(shù)據(jù)技術(shù)”這個大概念分解為更為細小的內(nèi)涵指標(biāo)體系。

        有學(xué)者通過論文關(guān)鍵詞共詞分析法,得出過大數(shù)據(jù)技術(shù)的核心詞匯。[1]但本文考慮到權(quán)威性和可信度,以2011年5月由麥肯錫全球研究院(MGI)發(fā)布的研究報告《大數(shù)據(jù): 創(chuàng)新、競爭和生產(chǎn)力的下一個新領(lǐng)域》作為基本依據(jù)。[3]同時,采用賽迪智庫翻譯的中譯本[4]為權(quán)威中文版。麥肯錫是全球最大的咨詢公司,屬下的MGI擁有一支實力雄厚的專家團隊,它所發(fā)布的報告具有較高的權(quán)威性。賽迪智庫是中國工業(yè)和信息化領(lǐng)域的知名思想庫[5],它所發(fā)布的譯叢具有較高的信度。在這個著名的報告中,研究人員羅列了構(gòu)成大數(shù)據(jù)核心技術(shù)的54個概念,其中應(yīng)用于大數(shù)據(jù)分析的關(guān)鍵技術(shù)詞匯(概念)28個,應(yīng)用于整合、處理、管理和分析大數(shù)據(jù)的關(guān)鍵技術(shù)詞匯(概念)26個,并對這些核心詞匯(概念)一一給予明確的定義。

        本文正是以MGI 的這套詞匯(概念)作為測量和分析大數(shù)據(jù)技術(shù)的內(nèi)涵指標(biāo)體系,考察圖書館界對于這些指標(biāo)的運用狀況和程度。

        2.3 測度方法

        測度是對測量指標(biāo)做量化測定。本文以論文數(shù)量作為測量值。論文數(shù)量大小雖然不能反映論文的質(zhì)量和深度,但可以反映研究人員對某研究主題的重視和關(guān)注程度,以此來測定“圖書館領(lǐng)域?qū)Υ髷?shù)據(jù)的關(guān)涉程度”存在一定合理性。

        論文數(shù)量則通過論文關(guān)鍵詞檢索出相關(guān)論文,并做統(tǒng)計后獲得。選擇關(guān)鍵詞為檢索詞的原因是,論文關(guān)鍵詞作為論文標(biāo)識之一,代表了該論文的研究主題和研究范疇。為了便于論文被引用和查找,論文作者一般都會被要求使用盡量規(guī)范的關(guān)鍵詞來進行標(biāo)注。[6]雖然關(guān)鍵詞目前很難做到統(tǒng)一和規(guī)范,但關(guān)鍵詞仍然是眼下概括和描述論文內(nèi)容的重要標(biāo)識,查準(zhǔn)率相對較高的工具。

        本文通過以MGI大數(shù)據(jù)核心詞匯為檢索詞,分別統(tǒng)計出圖書館界大數(shù)據(jù)核心技術(shù)的論文篇數(shù)和排名,大技術(shù)核心技術(shù)論文總篇數(shù),以及論文數(shù)量排名前五領(lǐng)域的大數(shù)據(jù)技術(shù)論文數(shù)量。并在這些數(shù)據(jù)之間做出比較和測量。

        2.4 考察范圍

        因為本研究主要是國內(nèi)圖書館業(yè)界的大數(shù)據(jù)技術(shù)運用狀況,所以考察對象的范圍設(shè)定在圖書館情報學(xué)范疇內(nèi)的論文。

        《中國知網(wǎng)》是國內(nèi)收錄中文論文最全面和最權(quán)威的數(shù)據(jù)庫之一,自身攜帶有統(tǒng)計和分析工具,為文獻計量研究提供了便捷。鑒于這兩個因素,選擇《中國知網(wǎng)》來考察、衡量和比對大數(shù)據(jù)技術(shù)在圖書館界的應(yīng)用狀況。

        3.獲取統(tǒng)計數(shù)據(jù)

        以MGI公布的大數(shù)據(jù)核心詞匯作為關(guān)鍵詞進檢索,并借助中國知網(wǎng)的部分統(tǒng)計功能,獲得以這些關(guān)鍵詞為標(biāo)識的論文數(shù)量。但在檢索過程中,由于關(guān)鍵詞的習(xí)慣用法與MGI核心詞匯之間并非完全一致,為了提高查全率,根據(jù)MGI報告來增加同義詞匯檢索,比如“AB測試”同義詞為“分離測試”和“水桶測試”,“數(shù)據(jù)聚類”同義詞為“聚類”,等等。對檢索結(jié)果也需要根據(jù)大數(shù)據(jù)技術(shù)的相關(guān)知識,剔除其中有歧義的部分,比如“優(yōu)化”概念,在教育學(xué)中的優(yōu)化并非大數(shù)據(jù)的優(yōu)化;“情緒分析”,要剔除醫(yī)學(xué)和心理學(xué)上論文。在獲取圖書館領(lǐng)域大數(shù)據(jù)論文數(shù)量,也收集論文數(shù)量排名,以及量值最高的前五個領(lǐng)域的論文數(shù)等。下面是將檢索所獲取的數(shù)據(jù)以表格形式呈現(xiàn)。由于中國知網(wǎng)的數(shù)據(jù)每日更新,本文的檢索結(jié)果和數(shù)據(jù)獲取的時間點為2014年5月10日。

        軍:軍事,測:自然地理與測繪,圖:圖書情報與數(shù)字圖書館,化:化學(xué),建:建筑,運:運輸,心:心理學(xué),醫(yī):醫(yī)學(xué),儀:儀器儀表,社:社會學(xué)和統(tǒng)計學(xué),材:材料,環(huán):環(huán)境

        4. 結(jié)論和描述:

        分析上述表格中的論文數(shù)量值,能夠?qū)?“圖書館領(lǐng)域?qū)Υ髷?shù)據(jù)技術(shù)在學(xué)術(shù)上的關(guān)涉程度”有一個大致的數(shù)量描述。

        4.1 MGI大數(shù)據(jù)核心詞匯論文數(shù)量分布領(lǐng)域

        從兩個表格中可以看出,1960年到 2014年包含大數(shù)據(jù)核心詞匯的論文總量約有485509篇,涉及的領(lǐng)域很廣,從論文數(shù)量值的總體分布來看,主要在計算機、數(shù)學(xué)、經(jīng)濟、自動化、電信、互聯(lián)網(wǎng)等等領(lǐng)域,基本印證了MGI報告中有關(guān)于大數(shù)據(jù)技術(shù)淵源以及其主要運用領(lǐng)域的定性描述[5]。從表格中也能看出,每個詞匯的論文數(shù)量差異也較大,有的有幾萬篇,有的只有幾篇,則從一個側(cè)面反映了各種技術(shù)研究的成熟度和應(yīng)用廣度存在著較大差異。同時,還可以從表格中看出,各個大技術(shù)核心概念與各個領(lǐng)域之間的親疏關(guān)系。

        4.2 MGI大數(shù)據(jù)核心詞匯在圖書館研究中的運用

        從兩個表格中可以看到,圖書館領(lǐng)域的大數(shù)據(jù)核心詞匯的論文數(shù)量總共5764篇,約占總量的1.2[WTB2][WTBZ]。圖書館作為信息行業(yè),該比值并不算高。說明大數(shù)據(jù)技術(shù)在圖書館領(lǐng)域得到了不小的關(guān)注,但相對于大數(shù)據(jù)技術(shù)的發(fā)展速度,其應(yīng)用與開發(fā)的力度還是比較欠缺。

        從表一可看到,有11個MGI大數(shù)據(jù)分析技術(shù)詞匯被涉及和應(yīng)用,占39[WTB2][WTBZ]。其中,包含數(shù)據(jù)挖掘、統(tǒng)計、自然語言處理、關(guān)聯(lián)規(guī)則挖掘、可視化技術(shù)論文數(shù)量較高,反映了圖書館在這幾個方面做了較多的研究。

        從表二可看到,有16個MGI大數(shù)據(jù)處理詞匯被使用,占67[WTB2][WTBZ]。其中包含元數(shù)據(jù)、云計算、數(shù)據(jù)倉庫、SQL、關(guān)系型數(shù)據(jù)庫等關(guān)鍵詞的圖書館領(lǐng)域論文數(shù)量都較高,并在同一詞匯的論文總量里占較大比例,這說明有關(guān)于數(shù)據(jù)資源整合管理的大數(shù)據(jù)技術(shù)在圖書館研究領(lǐng)域比較受重視。

        大部份大數(shù)據(jù)核心技術(shù)概念在圖書館領(lǐng)域并沒有得到使用,有的概念屬于比較專業(yè)無法被運用,比如信號處理。有的概念可以在圖書館領(lǐng)域應(yīng)用但未得到重視,比如“優(yōu)化”,論文數(shù)量為0。優(yōu)化主要指對模型的優(yōu)化,說明圖書館領(lǐng)域在建立模型方面比較欠缺,應(yīng)該引起研究人員的重視。

        5.存在問題和展望

        上述以MGI核心概念為關(guān)鍵詞的論文數(shù)量匯總、比較和分析方法,對大數(shù)據(jù)技術(shù)在圖書館界的應(yīng)用有了一個宏觀上的測度。雖然這種方法把一個抽象問題予以具體化,但是該測量方法得到的是比較淺表的、框架性的結(jié)論。自然,有志于進一步探索的研究者可以作進一步優(yōu)化和細化。

        5.1 優(yōu)化方向

        對本測量方法的優(yōu)化,可從兩個角度考慮。一是提高查全率。使用關(guān)鍵詞檢索文獻具有較高的查準(zhǔn)率,但是查全率會受到不小的損失。若能同時考慮查準(zhǔn)和查全率,擴大合理的檢索途徑,將可能增加本測量方法的信度。

        另外,隨著學(xué)科的交叉發(fā)展,許多概念可能會被下位概念或同位概念所取代。如果能監(jiān)控概念之間的關(guān)系變化,作為因素加以考慮,建立一個動態(tài)的測量模型,將可能增加測量的效度。

        5.2 細化方向

        可以從兩個維度進行細化研究。一個維度是將概念進一步細化,比如“分類算法”下有許多子概念:貝葉斯分類、后向傳播分類、k-最鄰近分類等,可以專門對分類算法在圖書館領(lǐng)域的使用做研究,預(yù)先建立數(shù)據(jù)挖掘的核心詞匯表,再作量化比較。另一個維度是對圖書館領(lǐng)域的進一步細化,可以考察和分析各個具體研究方向中大數(shù)據(jù)核心技術(shù)詞匯的運用。

        [參考文獻]

        1.楊繹. 基于文獻計量的“大數(shù)據(jù)”研究[J]. 圖書館雜志, 2012(9):29-32

        2.袁方. 社會研究方法教程[M]. 北京:北京大學(xué)出版,1997(2):175

        3.MGI.Big data:The next frontier for innovation,competition,and, productivity [R/OL]. [2014-5-4].http://wenku.baidu.com/view/6c9b66edb8f67c1cfad6b873.html

        4. 麥肯錫全球研究院. 大數(shù)據(jù): 創(chuàng)新、競爭和生產(chǎn)力的下一個新領(lǐng)域[R/OL]. [2014-5-4]. http://wenku.baidu.com/view/2e494d6d9b6648d7c1c746a7.html

        5. 賽迪智庫. 介紹[EB/OL]. [2014-5-4]. http://www.ccidthinktank.com/plus/list.php?tid=2

        6. 趙宗蔚. 提高期刊論文關(guān)鍵詞索引質(zhì)量——自然語言與人工語言的結(jié)合[J]. 圖書館論壇,2005(5):119-121

        附簡歷

        桂羅敏,女,博士,副研究館員,圖書館學(xué)。

        迄今在核心及重要期刊上已發(fā)表的圖書情報專業(yè)論文有:《先秦軍事情報學(xué)概述》、《〈貞觀政要〉問世冷遇考》、《〈群書目錄〉未獲褒獎原因考》、《兩唐書經(jīng)籍藝文志目錄類證辨》、《對〈古今書錄序〉的幾點駁正》、《網(wǎng)絡(luò)閱讀古籍的幾個問題和建議》、《武則天著作目錄證辨釋論》、《〈文獻通考·經(jīng)籍考〉分類法新探》、《對開元《群書目錄》的重新審視》、《從正史藝文志探究儒家經(jīng)典的數(shù)目變化》、《<三教珠英>考辨》、《<修文殿御覽>考辨》、《知識分類對天人秩序的映照——以類書《北堂書鈔》為例》等30余篇。

        4. 結(jié)論和描述:

        分析上述表格中的論文數(shù)量值,能夠?qū)?“圖書館領(lǐng)域?qū)Υ髷?shù)據(jù)技術(shù)在學(xué)術(shù)上的關(guān)涉程度”有一個大致的數(shù)量描述。

        4.1 MGI大數(shù)據(jù)核心詞匯論文數(shù)量分布領(lǐng)域

        從兩個表格中可以看出,1960年到 2014年包含大數(shù)據(jù)核心詞匯的論文總量約有485509篇,涉及的領(lǐng)域很廣,從論文數(shù)量值的總體分布來看,主要在計算機、數(shù)學(xué)、經(jīng)濟、自動化、電信、互聯(lián)網(wǎng)等等領(lǐng)域,基本印證了MGI報告中有關(guān)于大數(shù)據(jù)技術(shù)淵源以及其主要運用領(lǐng)域的定性描述[5]。從表格中也能看出,每個詞匯的論文數(shù)量差異也較大,有的有幾萬篇,有的只有幾篇,則從一個側(cè)面反映了各種技術(shù)研究的成熟度和應(yīng)用廣度存在著較大差異。同時,還可以從表格中看出,各個大技術(shù)核心概念與各個領(lǐng)域之間的親疏關(guān)系。

        4.2 MGI大數(shù)據(jù)核心詞匯在圖書館研究中的運用

        從兩個表格中可以看到,圖書館領(lǐng)域的大數(shù)據(jù)核心詞匯的論文數(shù)量總共5764篇,約占總量的1.2[WTB2][WTBZ]。圖書館作為信息行業(yè),該比值并不算高。說明大數(shù)據(jù)技術(shù)在圖書館領(lǐng)域得到了不小的關(guān)注,但相對于大數(shù)據(jù)技術(shù)的發(fā)展速度,其應(yīng)用與開發(fā)的力度還是比較欠缺。

        從表一可看到,有11個MGI大數(shù)據(jù)分析技術(shù)詞匯被涉及和應(yīng)用,占39[WTB2][WTBZ]。其中,包含數(shù)據(jù)挖掘、統(tǒng)計、自然語言處理、關(guān)聯(lián)規(guī)則挖掘、可視化技術(shù)論文數(shù)量較高,反映了圖書館在這幾個方面做了較多的研究。

        從表二可看到,有16個MGI大數(shù)據(jù)處理詞匯被使用,占67[WTB2][WTBZ]。其中包含元數(shù)據(jù)、云計算、數(shù)據(jù)倉庫、SQL、關(guān)系型數(shù)據(jù)庫等關(guān)鍵詞的圖書館領(lǐng)域論文數(shù)量都較高,并在同一詞匯的論文總量里占較大比例,這說明有關(guān)于數(shù)據(jù)資源整合管理的大數(shù)據(jù)技術(shù)在圖書館研究領(lǐng)域比較受重視。

        大部份大數(shù)據(jù)核心技術(shù)概念在圖書館領(lǐng)域并沒有得到使用,有的概念屬于比較專業(yè)無法被運用,比如信號處理。有的概念可以在圖書館領(lǐng)域應(yīng)用但未得到重視,比如“優(yōu)化”,論文數(shù)量為0。優(yōu)化主要指對模型的優(yōu)化,說明圖書館領(lǐng)域在建立模型方面比較欠缺,應(yīng)該引起研究人員的重視。

        5.存在問題和展望

        上述以MGI核心概念為關(guān)鍵詞的論文數(shù)量匯總、比較和分析方法,對大數(shù)據(jù)技術(shù)在圖書館界的應(yīng)用有了一個宏觀上的測度。雖然這種方法把一個抽象問題予以具體化,但是該測量方法得到的是比較淺表的、框架性的結(jié)論。自然,有志于進一步探索的研究者可以作進一步優(yōu)化和細化。

        5.1 優(yōu)化方向

        對本測量方法的優(yōu)化,可從兩個角度考慮。一是提高查全率。使用關(guān)鍵詞檢索文獻具有較高的查準(zhǔn)率,但是查全率會受到不小的損失。若能同時考慮查準(zhǔn)和查全率,擴大合理的檢索途徑,將可能增加本測量方法的信度。

        另外,隨著學(xué)科的交叉發(fā)展,許多概念可能會被下位概念或同位概念所取代。如果能監(jiān)控概念之間的關(guān)系變化,作為因素加以考慮,建立一個動態(tài)的測量模型,將可能增加測量的效度。

        5.2 細化方向

        可以從兩個維度進行細化研究。一個維度是將概念進一步細化,比如“分類算法”下有許多子概念:貝葉斯分類、后向傳播分類、k-最鄰近分類等,可以專門對分類算法在圖書館領(lǐng)域的使用做研究,預(yù)先建立數(shù)據(jù)挖掘的核心詞匯表,再作量化比較。另一個維度是對圖書館領(lǐng)域的進一步細化,可以考察和分析各個具體研究方向中大數(shù)據(jù)核心技術(shù)詞匯的運用。

        [參考文獻]

        1.楊繹. 基于文獻計量的“大數(shù)據(jù)”研究[J]. 圖書館雜志, 2012(9):29-32

        2.袁方. 社會研究方法教程[M]. 北京:北京大學(xué)出版,1997(2):175

        3.MGI.Big data:The next frontier for innovation,competition,and, productivity [R/OL]. [2014-5-4].http://wenku.baidu.com/view/6c9b66edb8f67c1cfad6b873.html

        4. 麥肯錫全球研究院. 大數(shù)據(jù): 創(chuàng)新、競爭和生產(chǎn)力的下一個新領(lǐng)域[R/OL]. [2014-5-4]. http://wenku.baidu.com/view/2e494d6d9b6648d7c1c746a7.html

        5. 賽迪智庫. 介紹[EB/OL]. [2014-5-4]. http://www.ccidthinktank.com/plus/list.php?tid=2

        6. 趙宗蔚. 提高期刊論文關(guān)鍵詞索引質(zhì)量——自然語言與人工語言的結(jié)合[J]. 圖書館論壇,2005(5):119-121

        附簡歷

        桂羅敏,女,博士,副研究館員,圖書館學(xué)。

        迄今在核心及重要期刊上已發(fā)表的圖書情報專業(yè)論文有:《先秦軍事情報學(xué)概述》、《〈貞觀政要〉問世冷遇考》、《〈群書目錄〉未獲褒獎原因考》、《兩唐書經(jīng)籍藝文志目錄類證辨》、《對〈古今書錄序〉的幾點駁正》、《網(wǎng)絡(luò)閱讀古籍的幾個問題和建議》、《武則天著作目錄證辨釋論》、《〈文獻通考·經(jīng)籍考〉分類法新探》、《對開元《群書目錄》的重新審視》、《從正史藝文志探究儒家經(jīng)典的數(shù)目變化》、《<三教珠英>考辨》、《<修文殿御覽>考辨》、《知識分類對天人秩序的映照——以類書《北堂書鈔》為例》等30余篇。

        4. 結(jié)論和描述:

        分析上述表格中的論文數(shù)量值,能夠?qū)?“圖書館領(lǐng)域?qū)Υ髷?shù)據(jù)技術(shù)在學(xué)術(shù)上的關(guān)涉程度”有一個大致的數(shù)量描述。

        4.1 MGI大數(shù)據(jù)核心詞匯論文數(shù)量分布領(lǐng)域

        從兩個表格中可以看出,1960年到 2014年包含大數(shù)據(jù)核心詞匯的論文總量約有485509篇,涉及的領(lǐng)域很廣,從論文數(shù)量值的總體分布來看,主要在計算機、數(shù)學(xué)、經(jīng)濟、自動化、電信、互聯(lián)網(wǎng)等等領(lǐng)域,基本印證了MGI報告中有關(guān)于大數(shù)據(jù)技術(shù)淵源以及其主要運用領(lǐng)域的定性描述[5]。從表格中也能看出,每個詞匯的論文數(shù)量差異也較大,有的有幾萬篇,有的只有幾篇,則從一個側(cè)面反映了各種技術(shù)研究的成熟度和應(yīng)用廣度存在著較大差異。同時,還可以從表格中看出,各個大技術(shù)核心概念與各個領(lǐng)域之間的親疏關(guān)系。

        4.2 MGI大數(shù)據(jù)核心詞匯在圖書館研究中的運用

        從兩個表格中可以看到,圖書館領(lǐng)域的大數(shù)據(jù)核心詞匯的論文數(shù)量總共5764篇,約占總量的1.2[WTB2][WTBZ]。圖書館作為信息行業(yè),該比值并不算高。說明大數(shù)據(jù)技術(shù)在圖書館領(lǐng)域得到了不小的關(guān)注,但相對于大數(shù)據(jù)技術(shù)的發(fā)展速度,其應(yīng)用與開發(fā)的力度還是比較欠缺。

        從表一可看到,有11個MGI大數(shù)據(jù)分析技術(shù)詞匯被涉及和應(yīng)用,占39[WTB2][WTBZ]。其中,包含數(shù)據(jù)挖掘、統(tǒng)計、自然語言處理、關(guān)聯(lián)規(guī)則挖掘、可視化技術(shù)論文數(shù)量較高,反映了圖書館在這幾個方面做了較多的研究。

        從表二可看到,有16個MGI大數(shù)據(jù)處理詞匯被使用,占67[WTB2][WTBZ]。其中包含元數(shù)據(jù)、云計算、數(shù)據(jù)倉庫、SQL、關(guān)系型數(shù)據(jù)庫等關(guān)鍵詞的圖書館領(lǐng)域論文數(shù)量都較高,并在同一詞匯的論文總量里占較大比例,這說明有關(guān)于數(shù)據(jù)資源整合管理的大數(shù)據(jù)技術(shù)在圖書館研究領(lǐng)域比較受重視。

        大部份大數(shù)據(jù)核心技術(shù)概念在圖書館領(lǐng)域并沒有得到使用,有的概念屬于比較專業(yè)無法被運用,比如信號處理。有的概念可以在圖書館領(lǐng)域應(yīng)用但未得到重視,比如“優(yōu)化”,論文數(shù)量為0。優(yōu)化主要指對模型的優(yōu)化,說明圖書館領(lǐng)域在建立模型方面比較欠缺,應(yīng)該引起研究人員的重視。

        5.存在問題和展望

        上述以MGI核心概念為關(guān)鍵詞的論文數(shù)量匯總、比較和分析方法,對大數(shù)據(jù)技術(shù)在圖書館界的應(yīng)用有了一個宏觀上的測度。雖然這種方法把一個抽象問題予以具體化,但是該測量方法得到的是比較淺表的、框架性的結(jié)論。自然,有志于進一步探索的研究者可以作進一步優(yōu)化和細化。

        5.1 優(yōu)化方向

        對本測量方法的優(yōu)化,可從兩個角度考慮。一是提高查全率。使用關(guān)鍵詞檢索文獻具有較高的查準(zhǔn)率,但是查全率會受到不小的損失。若能同時考慮查準(zhǔn)和查全率,擴大合理的檢索途徑,將可能增加本測量方法的信度。

        另外,隨著學(xué)科的交叉發(fā)展,許多概念可能會被下位概念或同位概念所取代。如果能監(jiān)控概念之間的關(guān)系變化,作為因素加以考慮,建立一個動態(tài)的測量模型,將可能增加測量的效度。

        5.2 細化方向

        可以從兩個維度進行細化研究。一個維度是將概念進一步細化,比如“分類算法”下有許多子概念:貝葉斯分類、后向傳播分類、k-最鄰近分類等,可以專門對分類算法在圖書館領(lǐng)域的使用做研究,預(yù)先建立數(shù)據(jù)挖掘的核心詞匯表,再作量化比較。另一個維度是對圖書館領(lǐng)域的進一步細化,可以考察和分析各個具體研究方向中大數(shù)據(jù)核心技術(shù)詞匯的運用。

        [參考文獻]

        1.楊繹. 基于文獻計量的“大數(shù)據(jù)”研究[J]. 圖書館雜志, 2012(9):29-32

        2.袁方. 社會研究方法教程[M]. 北京:北京大學(xué)出版,1997(2):175

        3.MGI.Big data:The next frontier for innovation,competition,and, productivity [R/OL]. [2014-5-4].http://wenku.baidu.com/view/6c9b66edb8f67c1cfad6b873.html

        4. 麥肯錫全球研究院. 大數(shù)據(jù): 創(chuàng)新、競爭和生產(chǎn)力的下一個新領(lǐng)域[R/OL]. [2014-5-4]. http://wenku.baidu.com/view/2e494d6d9b6648d7c1c746a7.html

        5. 賽迪智庫. 介紹[EB/OL]. [2014-5-4]. http://www.ccidthinktank.com/plus/list.php?tid=2

        6. 趙宗蔚. 提高期刊論文關(guān)鍵詞索引質(zhì)量——自然語言與人工語言的結(jié)合[J]. 圖書館論壇,2005(5):119-121

        附簡歷

        桂羅敏,女,博士,副研究館員,圖書館學(xué)。

        迄今在核心及重要期刊上已發(fā)表的圖書情報專業(yè)論文有:《先秦軍事情報學(xué)概述》、《〈貞觀政要〉問世冷遇考》、《〈群書目錄〉未獲褒獎原因考》、《兩唐書經(jīng)籍藝文志目錄類證辨》、《對〈古今書錄序〉的幾點駁正》、《網(wǎng)絡(luò)閱讀古籍的幾個問題和建議》、《武則天著作目錄證辨釋論》、《〈文獻通考·經(jīng)籍考〉分類法新探》、《對開元《群書目錄》的重新審視》、《從正史藝文志探究儒家經(jīng)典的數(shù)目變化》、《<三教珠英>考辨》、《<修文殿御覽>考辨》、《知識分類對天人秩序的映照——以類書《北堂書鈔》為例》等30余篇。

        猜你喜歡
        量化大數(shù)據(jù)技術(shù)大數(shù)據(jù)
        ?;髽I(yè)提高現(xiàn)場應(yīng)急處置能力的對策措施研究
        警察院校量化考核制度
        東方教育(2016年3期)2016-12-14 22:34:14
        論大數(shù)據(jù)技術(shù)在智能電網(wǎng)中的應(yīng)用
        高校檔案管理信息服務(wù)中大數(shù)據(jù)技術(shù)的應(yīng)用
        大數(shù)據(jù)技術(shù)在電氣工程中的應(yīng)用探討
        大數(shù)據(jù)技術(shù)在商業(yè)銀行中的應(yīng)用分析
        讓“量化”更加的“亮化”
        考試周刊(2016年79期)2016-10-13 23:39:31
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        欧美老妇多毛xxxxx极瑞视频| 国产剧情av麻豆香蕉精品| 亚洲国产精品av麻豆一区| 精品久久久久久电影院| 色婷婷色99国产综合精品| 亚洲精品美女久久久久99| 日韩精品一区二区三区四区五区六| 午夜黄色一区二区不卡| 亚洲人妻御姐中文字幕| 精品中文字幕在线不卡| 99久久99久久久精品蜜桃| 日韩欧美一区二区三区免费观看| 日韩一区二区三区无码影院| 色天使综合婷婷国产日韩av | 国内国外日产一区二区| 青青操视频手机在线免费观看| 日韩女同在线免费观看| 国产一区二区视频免费在| 欧美肥妇毛多水多bbxx水蜜桃| 欧美猛少妇色xxxxx猛交| 亚洲精品suv精品一区二区 | 亚洲熟女少妇一区二区| 三级国产女主播在线观看| 亚洲蜜芽在线精品一区| 按摩少妇高潮在线一区| 国产精品无码制服丝袜| 亚洲av永久无码精品古装片| 国产男小鲜肉同志免费| 精品国产aⅴ无码一区二区| 国产在线不卡AV观看| 中文无码日韩欧免费视频| 国产视频一区二区三区在线看| 精品一区二区av在线| 色综合久久中文娱乐网| 亚洲精品乱码久久久久久蜜桃不卡| 亚洲AV无码久久久一区二不卡| 欧美亚洲国产精品久久久久| 精品国产一区二区三广区| 国产精品成人一区二区在线不卡| 黄片视频免费在线播放观看| 精品无码国产一区二区三区av|