亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        搜索引擎的學(xué)術(shù)應(yīng)用對(duì)圖書館數(shù)據(jù)服務(wù)的啟示

        2017-10-11 04:00:02羅曉蘭
        數(shù)字圖書館論壇 2017年8期
        關(guān)鍵詞:搜索引擎百度圖書館

        羅曉蘭

        (上海中醫(yī)藥大學(xué)圖書館,上海 201203)

        搜索引擎的學(xué)術(shù)應(yīng)用對(duì)圖書館數(shù)據(jù)服務(wù)的啟示

        羅曉蘭

        (上海中醫(yī)藥大學(xué)圖書館,上海 201203)

        開放數(shù)據(jù)是科研重要的數(shù)據(jù)來源,但在目前的科研數(shù)據(jù)開放共享中卻被忽視。本文以科研中常用的搜索引擎數(shù)據(jù)為例,分析科研成果對(duì)開放數(shù)據(jù)的使用情況。從中國知網(wǎng)和萬方數(shù)據(jù)庫獲取國內(nèi)以谷歌和百度產(chǎn)品為研究數(shù)據(jù)來源的期刊論文(4 212篇)作為研究數(shù)據(jù),通過人工標(biāo)引和詞頻統(tǒng)計(jì)的方式,對(duì)國內(nèi)科研論文中對(duì)搜索引擎產(chǎn)品數(shù)據(jù)使用情況進(jìn)行統(tǒng)計(jì),分析搜索引擎數(shù)據(jù)的使用特點(diǎn)、研究領(lǐng)域和發(fā)展趨勢,為圖書館制定合理的科研開放數(shù)據(jù)服務(wù)政策、構(gòu)建合適的科研數(shù)據(jù)服務(wù)模式提出建議。

        學(xué)術(shù)研究;搜索引擎;開放數(shù)據(jù);圖書館

        1 研究背景

        開放數(shù)據(jù)在政策、經(jīng)濟(jì)和社會(huì)發(fā)展條件的不斷促進(jìn)下,已具備深厚的數(shù)據(jù)積累。數(shù)據(jù)開放要求政府重視數(shù)據(jù)的搜集、公布、開放和運(yùn)用[1],促使政府自身或大眾能較為便利地獲取和再利用這些信息[2]。數(shù)據(jù)共享讓大眾生活更加便利和智能,也為科學(xué)研究提供海量數(shù)據(jù)資源。促進(jìn)開放數(shù)據(jù)的利用有助于釋放大數(shù)據(jù)的能量,以大數(shù)據(jù)為動(dòng)力支持社會(huì)創(chuàng)新,以創(chuàng)新發(fā)展智能經(jīng)濟(jì)[3]。目前數(shù)據(jù)共享的研究主體主要是科研過程中產(chǎn)生的科學(xué)數(shù)據(jù)[4],但免費(fèi)公開獲取的開放數(shù)據(jù)源常被忽視。

        開放數(shù)據(jù)源涵蓋在科學(xué)研究中利用的開放數(shù)據(jù)集、公共搜索和統(tǒng)計(jì)服務(wù)、開放平臺(tái)和研究工具等,具有公開性、可得性、完整性、即時(shí)性等特點(diǎn),主要由政府、科研機(jī)構(gòu)、非政府組織、開放的商業(yè)平臺(tái)、互聯(lián)網(wǎng)應(yīng)用程序等提供[5]。在各學(xué)科領(lǐng)域都存在具有行業(yè)特色的開放數(shù)據(jù),這些數(shù)據(jù)被廣泛使用到科研項(xiàng)目中。另外,還存在部分各學(xué)科通用數(shù)據(jù),如搜索行為數(shù)據(jù)、在線社區(qū)文本、微博話題關(guān)注數(shù)據(jù)等。

        在開放數(shù)據(jù)集中,來自于搜索引擎的數(shù)據(jù)是常用數(shù)據(jù)類型,貫穿科研工作的始終。搜索引擎提供的開放數(shù)據(jù)具有使用范圍更廣、適用性更強(qiáng)、可獲得性更高等優(yōu)勢。尤其是在大數(shù)據(jù)科研理念下,基于用戶搜索行為、在線交互行為、健康行為、學(xué)術(shù)行為、網(wǎng)絡(luò)輿情等數(shù)據(jù)的數(shù)據(jù)量更大,更具有時(shí)效性。

        作為重要的公開信息資源,搜索引擎的學(xué)術(shù)應(yīng)用主要有兩種形式:一是以搜索引擎產(chǎn)品提供的數(shù)據(jù)作為研究數(shù)據(jù)來源,二是以搜索引擎提供的平臺(tái)或產(chǎn)品作為研究對(duì)象。其在科研中的應(yīng)用優(yōu)勢主要包括數(shù)據(jù)可獲得性高、數(shù)據(jù)覆蓋范圍廣、實(shí)時(shí)性強(qiáng)、數(shù)據(jù)的認(rèn)可度較高,還可通過實(shí)時(shí)、豐富的開放數(shù)據(jù)增加科研成果的創(chuàng)新程度。相關(guān)科研成果涉及輿情分析、反恐、人口統(tǒng)計(jì)和決策、金融投資、旅游服務(wù)、健康管理、教育教學(xué)等領(lǐng)域[6-7]。此外,搜索引擎也為科學(xué)研究提供許多高效實(shí)用的研究工具,如Google Earth、Google App Engine、百度云等。

        在目前科研數(shù)據(jù)共享的趨勢下,面對(duì)科研第四范式下科研人員對(duì)科學(xué)數(shù)據(jù)及其應(yīng)用的需求變化,作為數(shù)據(jù)資源服務(wù)方的圖書館須思考如何有效提升開放數(shù)據(jù)資源建設(shè)的服務(wù)能力,開展科學(xué)數(shù)據(jù)服務(wù)[8-9]。但與出版商和期刊雜志社相比,圖書館并沒有獲取科研數(shù)據(jù)的先天優(yōu)勢條件,由此在科研過程中產(chǎn)生的科研數(shù)據(jù)共享進(jìn)程也推進(jìn)緩慢。

        2 數(shù)據(jù)獲取及分析

        2.1 數(shù)據(jù)獲取及預(yù)處理

        在中國知網(wǎng)和萬方期刊文獻(xiàn)數(shù)據(jù)庫中檢索國內(nèi)利用百度、谷歌提供的工具、數(shù)據(jù)、資源(如谷歌趨勢、谷歌地圖、百度指數(shù))等進(jìn)行學(xué)術(shù)研究的期刊論文。檢索式為:篇名/題名 OR 文摘=百度 OR Baidu OR 谷歌 OR Google,搜索時(shí)間為2016年8月20—31日。通過題錄信息進(jìn)行初步篩選,保留有效題錄,包括利用搜索引擎提供數(shù)據(jù)和工具進(jìn)行研究、以搜索引擎產(chǎn)品為研究對(duì)象的論文,隨后刪除重復(fù)記錄,形成統(tǒng)一格式的有效文本集。

        對(duì)篩選過的文獻(xiàn)題錄進(jìn)行人工標(biāo)引,標(biāo)引格式為“技術(shù)/產(chǎn)品/數(shù)據(jù)—年代”,如Google Earth—2016。產(chǎn)品和數(shù)據(jù)編碼目錄來源于文獻(xiàn)篩選過程中對(duì)產(chǎn)品和數(shù)據(jù)類型的統(tǒng)計(jì)。

        為保證標(biāo)引質(zhì)量,進(jìn)行兩組人工標(biāo)引。人工標(biāo)引的評(píng)分者信度系數(shù)為0.986(P<0.01,Sig雙側(cè)為0),說明兩組標(biāo)引者一致性很高,但仍存在二者標(biāo)注不一致的情況。如對(duì)產(chǎn)品名稱描述的不一致、對(duì)多種數(shù)據(jù)共同使用的標(biāo)引缺失、標(biāo)引中的錯(cuò)誤等,隨后根據(jù)論文內(nèi)容進(jìn)一步確認(rèn)標(biāo)引信息,形成一致的結(jié)果。

        經(jīng)過篩選后的期刊文獻(xiàn)題錄數(shù)據(jù)共4 212條,基于百度提供的數(shù)據(jù)進(jìn)行研究的有1 121篇,基于谷歌數(shù)據(jù)的有3 091篇。從文獻(xiàn)量看,2001—2013年,利用百度或谷歌提供的數(shù)據(jù)進(jìn)行研究的成果處于上升態(tài)勢。

        2.2 搜索引擎在學(xué)術(shù)研究中應(yīng)用的頻次統(tǒng)計(jì)

        搜索引擎積累了大量的搜索行為數(shù)據(jù)、語料資源、具有社交屬性的用戶自生成內(nèi)容、搜索趨勢和地理信息數(shù)據(jù)。搜索引擎不僅可為科研活動(dòng)提供豐富的數(shù)據(jù),還能將部分服務(wù)或產(chǎn)品二次開發(fā)嵌入新的科學(xué)研究,降低科研初始開發(fā)的時(shí)間成本和經(jīng)濟(jì)成本,為科研工作創(chuàng)造更多可能性。谷歌和百度在平臺(tái)構(gòu)建和開發(fā)工具方面為廣大科研人員提供較大的擴(kuò)展空間,如谷歌地球、谷歌地圖和百度地圖等為地理、地質(zhì)、交通運(yùn)輸、航空航天、林業(yè)、畜牧業(yè)、農(nóng)業(yè)、資源環(huán)境等學(xué)科提供基礎(chǔ)資源數(shù)據(jù),一般研究模式是在免費(fèi)版的谷歌地球基礎(chǔ)上二次開發(fā),并與實(shí)際需求相結(jié)合進(jìn)行個(gè)性化加工,實(shí)現(xiàn)功能擴(kuò)展。

        根據(jù)數(shù)據(jù)分析結(jié)果,基于谷歌的學(xué)術(shù)研究常用資源有谷歌地球、谷歌地圖、谷歌搜索、谷歌數(shù)字圖書館、谷歌學(xué)術(shù)、谷歌安卓平臺(tái)、谷歌云計(jì)算等;基于百度的學(xué)術(shù)研究常用資源有百度搜索、百度地圖、百度指數(shù)、百度貼吧、百度文庫、百度百科、百度知道等。

        3 搜索引擎在學(xué)術(shù)研究中的應(yīng)用分析及討論

        3.1 搜索引擎在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計(jì)

        搜索引擎在學(xué)術(shù)研究中的應(yīng)用主要有搜索工具和統(tǒng)計(jì)、地理信息系統(tǒng)、在線文檔系統(tǒng)和百科類問答系統(tǒng)、社交互動(dòng)平臺(tái)、開發(fā)平臺(tái)及其他專業(yè)類數(shù)據(jù)(見表1)。作為獲取行為數(shù)據(jù)和查詢文獻(xiàn)信息的重要補(bǔ)充來源,搜索數(shù)據(jù)是研究中使用最多的數(shù)據(jù)來源,而地理信息系統(tǒng)在專業(yè)領(lǐng)域中使用最頻繁。

        (1)搜索應(yīng)用。學(xué)術(shù)研究常用的搜索應(yīng)用包括通用搜索、學(xué)術(shù)搜索、專業(yè)搜索、搜索指數(shù)和趨勢統(tǒng)計(jì),不同類型的搜索類產(chǎn)品在科研中的應(yīng)用情況,如表2所示。

        表1 搜索引擎在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計(jì)

        表2 搜索類產(chǎn)品在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計(jì)

        其中,在科研中常用的搜索趨勢統(tǒng)計(jì)數(shù)據(jù)是搜索服務(wù)的衍生品,常用于經(jīng)濟(jì)學(xué)、行為學(xué)和信息科學(xué)研究,如百度指數(shù)和谷歌趨勢。百度指數(shù)主要用于投資行為、旅游管理、流行病預(yù)測、產(chǎn)品關(guān)注度及變化趨勢、票房預(yù)測、房地產(chǎn)、就業(yè)、輿情分析、空氣質(zhì)量、食品監(jiān)管、城市發(fā)展研究、消費(fèi)者信心指數(shù)、受眾行為分析、出版發(fā)行等方面(見表3)。

        表3 百度指數(shù)在學(xué)術(shù)研究的應(yīng)用統(tǒng)計(jì)

        (2)地理信息系統(tǒng)。谷歌地球、谷歌地圖、百度地圖等是研究使用頻率最高的專業(yè)數(shù)據(jù)來源,主要應(yīng)用于地理、地質(zhì)、測繪、交通運(yùn)輸、電力工程、地球物理學(xué)、電信、建筑工程、林業(yè)、水利水電、氣象、資源環(huán)境以及教育培訓(xùn)等領(lǐng)域。研究模式主要有兩種:一種是通過谷歌地球等軟件的API及KML二次開發(fā)接口快速提取相關(guān)模型、數(shù)據(jù)和影像資料,實(shí)現(xiàn)工程設(shè)計(jì)的高度仿真,用于設(shè)計(jì)、施工、評(píng)估等多個(gè)階段;另一種是通過前期測量獲取數(shù)據(jù),將設(shè)計(jì)方案通過谷歌地圖或百度地圖提供的二次開發(fā)接口進(jìn)行加工呈現(xiàn),使設(shè)計(jì)方案可視化并可通過移動(dòng)客戶端進(jìn)行瀏覽和調(diào)用。

        地理信息系統(tǒng)作為谷歌和百度在學(xué)術(shù)應(yīng)用中數(shù)量最多的數(shù)據(jù)類型,存在嚴(yán)重“偏科”的特點(diǎn)。除測繪、地理信息、農(nóng)業(yè)、林業(yè)、牧業(yè)、漁業(yè)等學(xué)科外,社會(huì)科學(xué)的很多創(chuàng)新研究也可借助地理信息系統(tǒng)開展,如將百度地圖、谷歌地圖與圖書館的讀者服務(wù)、自助圖書館等結(jié)合起來,利用在線地圖構(gòu)建基于地理位置的用戶服務(wù)和用戶行為分析。

        (3)在線文檔系統(tǒng)和百科類問答系統(tǒng)。在線文檔系統(tǒng)及百科類問答系統(tǒng)為科研提供大量持續(xù)增長的研究數(shù)據(jù)和文本資料,是文本分析研究的常用數(shù)據(jù)來源。在線文檔系統(tǒng)是國內(nèi)近年來發(fā)展較快但頗受爭議的研究熱點(diǎn),主要用于文獻(xiàn)獲取,或作為課程教學(xué)資源數(shù)據(jù)庫使用[7],最受關(guān)注的是版權(quán)問題[10]。百度百科和百度知道是常用的百科類問答系統(tǒng),其產(chǎn)生的大量文本資源是很有價(jià)值的科研數(shù)據(jù)來源,主要用于問答系統(tǒng)的運(yùn)作模式和用戶行為[11]、網(wǎng)絡(luò)文本處理方法[12]、在線知識(shí)分享行為和模式[13-14]、網(wǎng)絡(luò)信息行為及信息擴(kuò)散研究[15]、在線問答系統(tǒng)的文本質(zhì)量[16]、語義分析和文本挖掘[17-18]等研究。從研究成果發(fā)布時(shí)間看,這類系統(tǒng)研究屬于比較新的研究領(lǐng)域,還有繼續(xù)深入研究的價(jià)值。

        (4)社交互動(dòng)數(shù)據(jù)。使用社交互動(dòng)平臺(tái)數(shù)據(jù)的研究主要集中在圖書館學(xué)、情報(bào)學(xué)、計(jì)算機(jī)科學(xué)、新聞傳播學(xué)和教育學(xué)。百度貼吧、百度知道等根據(jù)用戶需求對(duì)行業(yè)和學(xué)科類別進(jìn)行細(xì)分,形成數(shù)個(gè)聚集大量用戶且具有社交互動(dòng)性質(zhì)的平臺(tái)。在國內(nèi)期刊論文中使用百度貼吧的情況更多,主要用于研究電視節(jié)目關(guān)注與傳播[19]、網(wǎng)絡(luò)群體管理[20]、網(wǎng)絡(luò)語言傳播[21]、在線互動(dòng)行為[22-23]、網(wǎng)絡(luò)互動(dòng)文化[24]等。百度知道數(shù)據(jù)主要用于研究在線互動(dòng)平臺(tái)機(jī)制[25-26]、基于社交網(wǎng)絡(luò)的信息和知識(shí)傳播[27-28]等。由于這些產(chǎn)品的社交屬性不如微信、微博等社交媒體,因而并不是社交網(wǎng)絡(luò)研究的主流數(shù)據(jù)來源,研究領(lǐng)域較狹窄,數(shù)據(jù)被挖掘的程度不高。智能移動(dòng)終端普及以后,移動(dòng)終端使傳統(tǒng)論壇和互動(dòng)問答平臺(tái)的社交屬性更強(qiáng),便于繼續(xù)追蹤基于平臺(tái)APP的移動(dòng)使用行為數(shù)據(jù),開展研究工作。

        (5)開發(fā)平臺(tái)和工具。搜索引擎提供開源的平臺(tái)工具為科研和教學(xué)提供幫助,這些平臺(tái)和工具大致可為兩類,一是提供開發(fā)平臺(tái)或技術(shù)支持,二是共享資源和協(xié)作學(xué)習(xí)。如谷歌協(xié)作平臺(tái)是側(cè)重于團(tuán)隊(duì)協(xié)作的網(wǎng)站編輯工具,可幫助企業(yè)創(chuàng)建企業(yè)內(nèi)網(wǎng)、進(jìn)行項(xiàng)目管理跟蹤等,用戶通過谷歌協(xié)作平臺(tái)將所有類型的資源(包括文檔、視頻、圖片、日歷等)與好友、團(tuán)隊(duì)或網(wǎng)絡(luò)分享[29]?;诖颂匦?,谷歌協(xié)作平臺(tái)被應(yīng)用到“云計(jì)算輔助教學(xué)”實(shí)踐,并取得較好成效[30-31]。谷歌云計(jì)算開發(fā)平臺(tái)(Google App Engine)同樣在應(yīng)用軟件開發(fā)、教學(xué)課程資源庫建設(shè)、自主學(xué)習(xí)、協(xié)作學(xué)習(xí)、數(shù)字圖書館建設(shè)等領(lǐng)域中使用[32-33]。同樣,百度推出的同類產(chǎn)品(百度云、百度眾包平臺(tái)、百度開放服務(wù)平臺(tái)等)也在科研中得到應(yīng)用[34-35]。

        除以上列舉的主要應(yīng)用形式,在大數(shù)據(jù)決策的發(fā)展趨勢下,搜索引擎提供的相關(guān)數(shù)據(jù)平臺(tái)和服務(wù)(百度大數(shù)據(jù)+)、專業(yè)信息服務(wù)(百度健康、百度閱讀、百度旅游)、在線特色服務(wù)(谷歌線上藝術(shù)博物館)、在線特色小工具等都可成為可用的科研開放數(shù)據(jù)源,但目前鮮有成果出現(xiàn)。

        3.2 搜索引擎學(xué)術(shù)應(yīng)用總結(jié)

        基于搜索引擎的開放數(shù)據(jù)價(jià)值得到學(xué)界普遍認(rèn)可,但目前對(duì)開放數(shù)據(jù)的應(yīng)用程度還不夠深入,從目前國內(nèi)科學(xué)研究對(duì)搜索引擎數(shù)據(jù)的使用中發(fā)現(xiàn)以下兩個(gè)問題。

        (1)數(shù)據(jù)應(yīng)用層次太淺,只有部分?jǐn)?shù)據(jù)被有效利用。如利用谷歌和百度地理信息系統(tǒng)的相關(guān)研究約1 700條,占總體研究數(shù)量的40%,而60%中像百度拇指醫(yī)生、百度閱讀、谷歌眼鏡、谷歌線上虛擬博物館等未被開發(fā)利用的數(shù)據(jù)就有可能存在科研的創(chuàng)新點(diǎn)。未來基于不同平臺(tái)、不同場景的數(shù)據(jù)融合,將是科研數(shù)據(jù)利用的發(fā)展趨勢。

        (2)在學(xué)術(shù)研究中頻繁使用的數(shù)據(jù)存在偏好,基于同類型數(shù)據(jù)的研究設(shè)計(jì)、方法和過程雷同,科研創(chuàng)新性不高,如何讓有價(jià)值的數(shù)據(jù)在科研實(shí)踐中發(fā)揮更大的作用,在研究模式、方法和切入點(diǎn)上值得學(xué)者進(jìn)一步探索。

        4 討論及未來研究方向

        4.1 搜索引擎的學(xué)術(shù)應(yīng)用對(duì)圖書館數(shù)據(jù)服務(wù)的啟示

        從搜索引擎數(shù)據(jù)應(yīng)用的案例分析可見,開放數(shù)據(jù)在各學(xué)科學(xué)術(shù)研究中應(yīng)用廣泛,是可利用的有效科研創(chuàng)新資源。但國內(nèi)對(duì)開放數(shù)據(jù)的關(guān)注較少,成果的嚴(yán)重“偏科”也從側(cè)面說明部分學(xué)科對(duì)開放數(shù)據(jù)的應(yīng)用太少,開放數(shù)據(jù)的發(fā)現(xiàn)、抓取、整理、發(fā)布、利用和評(píng)估整個(gè)流程缺乏規(guī)范和指導(dǎo)。而資源獲取、整合和推廣等工作是圖書館的優(yōu)勢,因此可基于科研用戶對(duì)開放數(shù)據(jù)的使用特點(diǎn),在圖書館進(jìn)行館藏資源建設(shè)、特色數(shù)據(jù)庫開發(fā)和服務(wù),以及在資源整合過程中吸取有用經(jīng)驗(yàn),提供更人性化和個(gè)性化的資源服務(wù)。

        (1)構(gòu)建開放數(shù)據(jù)資源目錄,做好開放數(shù)據(jù)資源發(fā)現(xiàn)和導(dǎo)航工作,幫助用戶獲取更多開放數(shù)據(jù)用于科學(xué)研究,提升科研創(chuàng)新性。現(xiàn)階段科研數(shù)據(jù)共享工作提倡用戶公開共享科研活動(dòng)產(chǎn)生的數(shù)據(jù),但不能忽視開放數(shù)據(jù)的應(yīng)用。圖書館應(yīng)抓住大數(shù)據(jù)分析和決策的發(fā)展趨勢,更多應(yīng)用公開、易獲得的原始數(shù)據(jù),為學(xué)術(shù)研究和管理決策提供資源支持。圖書館雖然不擁有科研成果數(shù)據(jù)的版權(quán),但可根據(jù)用戶學(xué)科背景和需求,對(duì)公開研究數(shù)據(jù)集進(jìn)行搜集和加工,整理開放數(shù)據(jù)資源目錄,為用戶提供免費(fèi)數(shù)據(jù)參考咨詢和數(shù)據(jù)推薦服務(wù)。目前全球范圍內(nèi)有價(jià)值的開放數(shù)據(jù)集數(shù)量巨大,用戶在研究中所使用的占比較少,大部分有價(jià)值的開放數(shù)據(jù)還未被利用。此外,在開放數(shù)據(jù)主題新穎性、研究模式的創(chuàng)新等方面有待加強(qiáng)。

        (2)開展學(xué)科數(shù)據(jù)服務(wù),做好開放數(shù)據(jù)獲取的輔助工作。目前科研人員處于信息和數(shù)據(jù)海量增長的時(shí)代,圖書館可通過開展學(xué)科數(shù)據(jù)服務(wù)、嵌入式科研輔助服務(wù)等形式,幫助科研人員搜索可利用的開放數(shù)據(jù)、制定數(shù)據(jù)獲取方案、尋求最佳獲取途徑;此外,還可提供存儲(chǔ)空間和運(yùn)行設(shè)備,評(píng)估數(shù)據(jù)價(jià)值,輔助數(shù)據(jù)分析工作,實(shí)現(xiàn)科研貢獻(xiàn)和學(xué)術(shù)共享空間的職能。

        圖書館的信息資源、用戶行為數(shù)據(jù)、空間數(shù)據(jù)等也頗具研究價(jià)值,可開放給用戶進(jìn)行科學(xué)研究。如上海圖書館利用整理的家譜數(shù)據(jù)開展開放數(shù)據(jù)應(yīng)用開發(fā)競賽,力求更充分地釋放開放數(shù)據(jù)的價(jià)值,最大程度挖掘其背后的應(yīng)用潛力,激發(fā)創(chuàng)新能力,這種雙贏互動(dòng)的形式值得推廣。

        (3)建立開放數(shù)據(jù)獲取平臺(tái),整合學(xué)科資源、知識(shí)和數(shù)據(jù),加強(qiáng)不同層次資源和數(shù)據(jù)的關(guān)聯(lián)性??蒲泄ぷ餍枰墨I(xiàn)、知識(shí)、數(shù)據(jù)和工具等多種資源,但大部分資源分散在不同機(jī)構(gòu)和平臺(tái),并未進(jìn)行整合。圖書館可利用其在文獻(xiàn)資源整合管理方面的經(jīng)驗(yàn)和優(yōu)勢,將用戶所需科研資源、知識(shí)、數(shù)據(jù)和工具進(jìn)行整理和發(fā)布,利用關(guān)聯(lián)技術(shù)建立不同類型資源的聯(lián)系,構(gòu)建開放數(shù)據(jù)獲取平臺(tái),方便科研用戶使用;還可提供數(shù)據(jù)使用情況分析報(bào)告和研究進(jìn)展供科研人員參考,通過資源和服務(wù)整合提升科研成果創(chuàng)新。

        (4)做好對(duì)科研人員的數(shù)據(jù)素養(yǎng)培訓(xùn)。從搜索引擎數(shù)據(jù)在研究中使用可以發(fā)現(xiàn),學(xué)科、研究主題間差異明顯,部分學(xué)科并沒有利用可公開獲取的龐大數(shù)據(jù)進(jìn)行科研活動(dòng)。除學(xué)科特點(diǎn)有所不同,科研數(shù)據(jù)素養(yǎng)是限制國內(nèi)科研人員充分使用開放數(shù)據(jù)的制約條件之一,圖書館在進(jìn)行數(shù)據(jù)資源服務(wù)過程中可向用戶提供相關(guān)培訓(xùn),包括對(duì)相關(guān)研究設(shè)計(jì)、數(shù)據(jù)抓取、工具使用、數(shù)據(jù)可視化等進(jìn)行輔導(dǎo),結(jié)合圖書館提供的數(shù)據(jù)資源服務(wù),針對(duì)基于數(shù)據(jù)研究的發(fā)展趨勢,組織數(shù)據(jù)分析培訓(xùn)課程,更好地輔助教學(xué)科研。

        4.2 本文不足之處和未來研究方向

        公開的科研數(shù)據(jù)將有望成為圖書館在數(shù)據(jù)服務(wù)階段進(jìn)行深度挖掘和整合的服務(wù)資源,在學(xué)術(shù)研究中還有極大的價(jià)值等待挖掘。本文在樣本數(shù)據(jù)選取時(shí)只選取搜索引擎開放數(shù)據(jù),不夠全面。在下一步研究中應(yīng)將國內(nèi)學(xué)術(shù)研究中常用的搜索引擎服務(wù)、社交網(wǎng)絡(luò)數(shù)據(jù)、政府機(jī)構(gòu)和非營利機(jī)構(gòu)提供數(shù)據(jù)等的利用情況納入研究范圍,如豆瓣、微博、微信和行業(yè)特色數(shù)據(jù)源集等。然后,與國外研究情況進(jìn)行對(duì)比分析,獲取科研用戶使用行為特點(diǎn)和需求,為國內(nèi)基于開放數(shù)據(jù)的科學(xué)研究事業(yè)提供寶貴經(jīng)驗(yàn),為圖書館構(gòu)建開放數(shù)據(jù)資源服務(wù)目錄和服務(wù)體系提供支持。

        [1]張毅菁.從信息公開到數(shù)據(jù)開放的全球?qū)嵺`——兼對(duì)上海建設(shè)“政府?dāng)?shù)據(jù)服務(wù)網(wǎng)”的啟示[J].情報(bào)雜志,2014(10):175-178,183.

        [2]陳美.美國開放政府?dāng)?shù)據(jù)的保障機(jī)制研究[J].情報(bào)雜志,2013(7):148-153.

        [3]BERTOT J C,鄭磊,徐慧娜,等.大數(shù)據(jù)與開放數(shù)據(jù)的政策框架:問題、政策與建議[J].電子政務(wù),2014(1):6-14.

        [4]劉晶晶,馬建華.論科研數(shù)據(jù)開放共享的三種途徑[J].情報(bào)雜志,2015(10):146-150,96.

        [5]畢秋靈.數(shù)據(jù)新聞中的開放數(shù)據(jù)應(yīng)用[J].湖北社會(huì)科學(xué),2016(7):190-194.

        [6]楊濱.論云計(jì)算輔助教學(xué)(CCAI)中協(xié)作學(xué)習(xí)產(chǎn)生的設(shè)計(jì)機(jī)制——以Google sites下的協(xié)作學(xué)習(xí)為例[J].現(xiàn)代教育技術(shù),2009(11):95-99.

        [7]王玉龍.基于百度文庫的微課資源社區(qū)構(gòu)建策略研究[J].中國遠(yuǎn)程教育,2015(2):73-78.

        [8]黃金霞,馬雨萌.大數(shù)據(jù)時(shí)代開放信息資源的數(shù)據(jù)服務(wù)能力思考[J].數(shù)字圖書館論壇,2016(8):54-59.

        [9]陳建新.科學(xué)數(shù)據(jù)服務(wù):圖書館服務(wù)的新領(lǐng)域[J].圖書與情報(bào),2013(4):93-95.

        [10]張麗波,馬海群,周麗霞.避風(fēng)港原則適用性研究及立法建議——由百度文庫侵權(quán)案件說起[J].圖書情報(bào)知識(shí),2013(1):122-127.

        [11]常靜,楊建梅,歐瑞秋.基于TAM的百度百科用戶參與意向的影響因素研究[J].軟科學(xué),2010(12):34-37.

        [12]陸勇,章成志,侯漢清.基于百科資源的多策略中文同義詞自動(dòng)抽取研究[J].中國圖書館學(xué)報(bào),2010(1):56-62.

        [13]夏火松,王瑞新.百度百科詞條特性對(duì)知識(shí)共享意愿影響的實(shí)證研究[J].科學(xué)學(xué)研究,2010(12):1877-1883,1890.

        [14]黃令賀,朱慶華,沈超.差異與穩(wěn)定:網(wǎng)絡(luò)百科用戶興趣動(dòng)態(tài)變化研究[J].圖書情報(bào)知識(shí),2016(2):101-113.

        [15]張洋,盧橋.中文社會(huì)化媒體信息老化的計(jì)量分析[J].情報(bào)雜志,2015(3):77-84.

        [16]孫曉寧,趙宇翔,朱慶華.基于SQA系統(tǒng)的社會(huì)化搜索答案質(zhì)量評(píng)價(jià)指標(biāo)構(gòu)建[J].中國圖書館學(xué)報(bào),2015(4):65-82.

        [17]許坤,馮巖松,趙東巖,等.面向知識(shí)庫的中文自然語言問句的語義理解[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(1):85-92.

        [18]段利國,陳俊杰.綜合句法結(jié)構(gòu)及語義相似度的問題推薦技術(shù)[J].計(jì)算機(jī)科學(xué),2012(1):203-206.

        [19]張倩,戴建華,閆萌萌.基于電視劇網(wǎng)絡(luò)點(diǎn)播量分析的社會(huì)化媒體價(jià)值研究[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2013(11):59-62.

        [20]張郁文.淺析貼吧粉絲群體的管理——以“羅志祥吧”為例[J].新聞世界,2014(8):154-156.

        [21]賀潔.從大眾傳媒看“土豪”的傳播與發(fā)展[J].青年記者,2014(24):86-87.

        [22]萬力勇.網(wǎng)絡(luò)百科用戶協(xié)同創(chuàng)作的互動(dòng)機(jī)制研究——以百度百科貼吧為例[J].情報(bào)雜志,2014(1):167-172.

        [23]王國華,劉菊,楊騰飛,等.網(wǎng)絡(luò)空間中艾滋病的社會(huì)支持研究——以百度貼吧“HIV吧”為例[J].情報(bào)雜志,2015(11):105-110.

        [24]李可安.新媒體傳播方式下的粉絲文化——以新浪微博和百度貼吧為例[J].科技傳播,2015(12):92-93.

        [25]趙麗紅.互動(dòng)式知識(shí)問答分享平臺(tái)對(duì)虛擬參考咨詢服務(wù)的啟示[J].圖書館建設(shè),2009(5):62-64.

        [26]霍建梅,李書寧.圖書館數(shù)字館藏建設(shè)用戶參與激勵(lì)機(jī)制探究[J].圖書情報(bào)工作,2015(2):5-10.

        [27]寧寒松.線上互動(dòng)系統(tǒng)中“輿論領(lǐng)袖”的缺失及成因——以百度知道為例[J].新聞世界,2012(8):119-120.

        [28]王小立.百度“知道”知識(shí)傳播對(duì)個(gè)人數(shù)字圖書館資源共享的啟示——基于系統(tǒng)動(dòng)力學(xué)方法[J].圖書館,2016(2):83-87.

        [29]百度百科.Google Sites[2016-11-7].http://baike.baidu.com/link?url=osu 8ZSzbSC_yozf1NaziwxabhN79UBmlyhleJvg1OW3jlKneQVkshAvO1 Gah1uU5mI5n61Nu3t0YMsUUkxSQ1dldtesmhwsRiawt-xQ3vqu.

        [30]楊濱.論云計(jì)算輔助教學(xué)(CCAI)中協(xié)作學(xué)習(xí)產(chǎn)生的設(shè)計(jì)機(jī)制——以Google sites下的協(xié)作學(xué)習(xí)為例[J].現(xiàn)代教育技術(shù),2009(11):95-99.

        [31]徐瑞.Google協(xié)作平臺(tái)在中小學(xué)教師教育技術(shù)培訓(xùn)中的應(yīng)用探究[D].上海:華東師范大學(xué),2010.

        [32]劉曉剛.基于開源云計(jì)算的遠(yuǎn)程教育系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國教育信息化,2011(9):40-43.

        [33]王佳雋,呂智慧,吳杰,等.云計(jì)算技術(shù)發(fā)展分析及其應(yīng)用探討[J].計(jì)算機(jī)工程與設(shè)計(jì),2010(20):4404-4409.

        [34]陳霞,閔華清,宋恒杰.眾包平臺(tái)作弊用戶自動(dòng)識(shí)別[J].計(jì)算機(jī)工程,2016(8):139-145,152.

        [35]丁峰,梅曉亮,張麗.專業(yè)群教學(xué)資源信息化面向移動(dòng)APP題庫的設(shè)計(jì)及實(shí)現(xiàn)[J].信息系統(tǒng)工程,2016(5):148-149,152.

        Abstract:Open data is an important source of data for scientific research,but it is neglected in the scientific data sharing system.This study takes the search engine as an example to analyze the usage of open data in scientific research.4 212 items got from CNKI and Wanfang to analyze the Google and Baidu data use behavior by the way of manual indexing and word frequency statistics,including their characteristics,frequency and tendency.Based on this,the author made recommendations to develop open data service policy and service mode for library.

        Keywords:Academic Research;Search Engine;Open Data;Library

        The Academic Applications of Search Engine and Its Inspiration to Library Data Services

        LUO XiaoLan
        (Shanghai University of TCM Library,Shanghai 201203,China)

        G252.7

        10.3772/j.issn.1673-2286.2017.08.007

        羅曉蘭,女,1985年生,博士研究生,講師,研究方向:信息檢索、健康信息行為、技術(shù)采納與行為,E-mail:miaoqu11@126.com。

        2017-04-24)

        猜你喜歡
        搜索引擎百度圖書館
        Robust adaptive UKF based on SVR for inertial based integrated navigation
        圖書館
        百度年度熱搜榜
        飛躍圖書館
        百度遭投行下調(diào)評(píng)級(jí)
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        百度“放衛(wèi)星”,有沒有可能?
        太空探索(2014年4期)2014-07-19 10:08:58
        去圖書館
        廣告主與搜索引擎的雙向博弈分析
        精品一区二区三区国产av| 男女男在线精品网站免费观看| 亚洲阿v天堂2018在线观看| 在线亚洲国产一区二区三区| 色婷婷久久亚洲综合看片| 成年女人色毛片| 爱我久久国产精品| 人妻少妇精品视频中文字幕国语| 国产国拍精品亚洲av在线观看| 国产乱了真实在线观看| 午夜一级韩国欧美日本国产| 亚洲女同一区二区久久| av中国av一区二区三区av| 人妻少妇偷人精品无码| 2021国产视频不卡在线| 热热久久超碰精品中文字幕| 久久国产黄色片太色帅| 99久久婷婷国产综合精品电影| 亚洲AV永久青草无码性色av| 国产三级在线观看不卡| 五月色丁香婷婷网蜜臀av| 午夜亚洲www湿好爽| 久久免费精品国产72精品剧情| 亚洲hd高清在线一区二区| 台湾佬中文网站| 初尝黑人嗷嗷叫中文字幕| 亚洲成片在线看一区二区| 中文字幕乱码熟女人妻在线| 国产精品夜间视频香蕉| 欧美高清视频一区| 蜜臀人妻精品一区二区免费| 欧美丰满熟妇bbb久久久| 国产一品道av在线一二三区| 免费的黄网站精品久久| 亚洲av熟女少妇久久| 三年片免费观看大全国语| 亚洲AⅤ樱花无码| 久久这里都是精品99| 中文字幕乱偷无码av先锋蜜桃| 国产精品美女久久久久久大全| 少妇被躁到高潮和人狍大战|