亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科學(xué)數(shù)據(jù)分類研究述評(píng)

        2020-05-12 07:51:08黃國彬
        圖書館論壇 2020年5期
        關(guān)鍵詞:權(quán)威性使用者維度

        閆 鑫,黃國彬

        0 引言

        近年隨著信息技術(shù)普及,以數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)為主的科學(xué)研究新范式興起。國內(nèi)外關(guān)于科學(xué)數(shù)據(jù)概念的界定有很多,本研究認(rèn)為科學(xué)數(shù)據(jù)是指在科技活動(dòng)中(實(shí)驗(yàn)觀測調(diào)查等)或通過其他方式所獲取的反映客觀世界本質(zhì)特征變化規(guī)律等的原始基本數(shù)據(jù),以及根據(jù)不同科技活動(dòng)需要,進(jìn)行系統(tǒng)加工整理的各類數(shù)據(jù)集??茖W(xué)數(shù)據(jù)因其實(shí)用性、經(jīng)濟(jì)性、珍稀性等特點(diǎn)有極高的利用價(jià)值。作為科技論文的核心論據(jù),科學(xué)數(shù)據(jù)的傳播引用已越來越受到重視??茖W(xué)數(shù)據(jù)作為科學(xué)研究中重要的科研資源正逐漸成為學(xué)界研究關(guān)注的熱點(diǎn)。

        當(dāng)前有關(guān)科學(xué)數(shù)據(jù)分類體系的研究較少,而研究科學(xué)數(shù)據(jù)分類有利于促進(jìn)對科學(xué)數(shù)據(jù)的組織,讓科學(xué)數(shù)據(jù)的管理更加有序。研究科學(xué)數(shù)據(jù)分類,有利于完善科學(xué)數(shù)據(jù)的檢索分類,使科學(xué)數(shù)據(jù)能通過更多更有效的渠道被檢索發(fā)現(xiàn);有利于完善科學(xué)元數(shù)據(jù)的設(shè)計(jì),構(gòu)建更完整有效的元數(shù)據(jù)框架體系;能夠推動(dòng)揭示科學(xué)數(shù)據(jù)的特殊性與差異性,更方便科學(xué)數(shù)據(jù)的管理;對科學(xué)數(shù)據(jù)的管理機(jī)構(gòu)、研究機(jī)構(gòu)、高校以及科學(xué)數(shù)據(jù)發(fā)布平臺(tái)等機(jī)構(gòu)開展科學(xué)數(shù)據(jù)的管理有直接的幫助。本研究對國內(nèi)外目前關(guān)于科學(xué)數(shù)據(jù)分類的文獻(xiàn)內(nèi)容進(jìn)行梳理歸納,評(píng)析當(dāng)前科學(xué)數(shù)據(jù)分類維度與分類結(jié)果,以期進(jìn)一步提升對科學(xué)數(shù)據(jù)的管理與使用水平。

        1 國內(nèi)外研究現(xiàn)狀

        1.1 數(shù)據(jù)獲取情況

        筆者以“科學(xué)數(shù)據(jù)”“科研數(shù)據(jù)”“研究數(shù)據(jù)”為關(guān)鍵詞在中國知網(wǎng)、Web of science 與Scopus等數(shù)據(jù)庫進(jìn)行文獻(xiàn)檢索。經(jīng)過對檢索得到的文獻(xiàn)結(jié)果進(jìn)行整理與分析,以了解當(dāng)前研究中科學(xué)數(shù)據(jù)的分類方式與分類結(jié)果的研究現(xiàn)狀。國內(nèi)研究方面,2019年3月21日,筆者在中國知網(wǎng)圖情領(lǐng)域上,以“科學(xué)數(shù)據(jù)”“科研數(shù)據(jù)”“研究數(shù)據(jù)”為篇名檢索詞,通過瀏覽文獻(xiàn)中關(guān)于科學(xué)數(shù)據(jù)定義與類型等模塊的內(nèi)容,去除分類混亂或者表達(dá)不明晰的文獻(xiàn),最終篩選出介紹科學(xué)數(shù)據(jù)分類維度和分類類型的文獻(xiàn)共94篇。國外研究方面,2019 年3 月22 日,筆者分別在Web of science 與Scopus 兩個(gè)數(shù)據(jù)庫以“science data”“researchdata”“data types”“data forms”“data classifications”“data genres”為檢索詞,瀏覽與科學(xué)數(shù)據(jù)分類相關(guān)并且去分類混亂或者表達(dá)不夠明晰的文獻(xiàn),最終篩選出介紹科學(xué)數(shù)據(jù)分類維度和分類類型的文獻(xiàn)共86篇。本文調(diào)研國內(nèi)外關(guān)于科學(xué)數(shù)據(jù)的文獻(xiàn)中提及科學(xué)數(shù)據(jù)分類與類型的文獻(xiàn)共180篇。這些研究中,有具體介紹科學(xué)數(shù)據(jù)不同的分類方式與分類結(jié)果的文獻(xiàn)不足30篇,其余均簡略地提及某一種分類方式,后續(xù)論文中關(guān)于文獻(xiàn)數(shù)量的統(tǒng)計(jì)均與上述兩次檢索時(shí)間一致。目前研究中提及科學(xué)數(shù)據(jù)分類類型的文獻(xiàn)內(nèi)容所占篇幅較少。可以看出當(dāng)前學(xué)界對科學(xué)數(shù)據(jù)分類情況的相關(guān)研究關(guān)注較少,關(guān)于科學(xué)數(shù)據(jù)分類的研究有待深入。

        1.2 科學(xué)數(shù)據(jù)分類研究現(xiàn)狀

        目前科學(xué)數(shù)據(jù)的分類方式大多從科學(xué)數(shù)據(jù)內(nèi)容相關(guān)性、數(shù)據(jù)完整性與數(shù)據(jù)可靠性等角度進(jìn)行劃分,對依據(jù)科學(xué)數(shù)據(jù)其他性質(zhì)如數(shù)據(jù)權(quán)威性進(jìn)行分類的研究較少。常見的科學(xué)數(shù)據(jù)分類方式包括:(1)內(nèi)容相關(guān)性。指科學(xué)數(shù)據(jù)所在的領(lǐng)域與使用者需求內(nèi)容所在領(lǐng)域的匹配情況。周力虹、Borgman等從與科學(xué)數(shù)據(jù)相關(guān)的內(nèi)容領(lǐng)域?qū)茖W(xué)數(shù)據(jù)進(jìn)行分類[1-2]。(2)數(shù)據(jù)完整性。指在整個(gè)科學(xué)數(shù)據(jù)生命周期中數(shù)據(jù)內(nèi)容保存的準(zhǔn)確與完整。Palmer、公曉從數(shù)據(jù)內(nèi)容類型與數(shù)據(jù)格式類型完整的角度對科學(xué)數(shù)據(jù)進(jìn)行分類[3-4]。(3)數(shù)據(jù)可靠性。指數(shù)據(jù)來源渠道的可靠性與數(shù)據(jù)處理過程中數(shù)據(jù)的準(zhǔn)確性與時(shí)效性。周倩、Lan Z等從科學(xué)數(shù)據(jù)獲取的來源渠道的可靠程度等角度對科學(xué)數(shù)據(jù)進(jìn)行分類[5-6]。(4)數(shù)據(jù)權(quán)威性。指一些科學(xué)數(shù)據(jù)因內(nèi)外部因素影響而具有代表性、典型性。李志芳等以不同類型組織機(jī)構(gòu)的權(quán)威程度不同的思路出發(fā),按組織機(jī)構(gòu)類型對科學(xué)數(shù)據(jù)進(jìn)行分類[7]。另外,Sinnott 等人基于科學(xué)數(shù)據(jù)的開放程度對科學(xué)數(shù)據(jù)進(jìn)行分類[8]。

        針對科學(xué)數(shù)據(jù)分類方式與分類結(jié)果,當(dāng)前研究欠缺從使用者的思維邏輯角度出發(fā),依據(jù)使用者選擇數(shù)據(jù)的判斷過程作比較系統(tǒng)的考慮??茖W(xué)數(shù)據(jù)使用者的思維邏輯是指使用者在選擇匹配自己需求的科學(xué)數(shù)據(jù)時(shí)進(jìn)行判斷與篩選的邏輯過程。

        使用者的目的不同,對科學(xué)數(shù)據(jù)的需求也不同。筆者結(jié)合選擇科學(xué)數(shù)據(jù)過程的經(jīng)驗(yàn),一般情況下使用者選擇科學(xué)數(shù)據(jù)時(shí)會(huì)首先考慮科學(xué)數(shù)據(jù)的內(nèi)容與需求的相關(guān)程度,其次是科學(xué)數(shù)據(jù)的完整程度,接著是科學(xué)數(shù)據(jù)的準(zhǔn)確程度與時(shí)效性等角度,最后會(huì)考慮科學(xué)數(shù)據(jù)的權(quán)威程度等。在有多種科學(xué)數(shù)據(jù)可供選擇的情況下,使用者會(huì)傾向于選擇具有權(quán)威的科學(xué)數(shù)據(jù)。

        目前關(guān)于科學(xué)數(shù)據(jù)分類的研究中較多是單從某一個(gè)或某幾個(gè)性質(zhì)出發(fā)對科學(xué)數(shù)據(jù)進(jìn)行分類,而不是按照科學(xué)數(shù)據(jù)使用者的邏輯判斷順序系統(tǒng)地對科學(xué)數(shù)據(jù)進(jìn)行分類與管理。本文對當(dāng)前科學(xué)數(shù)據(jù)分類情況進(jìn)行分析與述評(píng),梳理科學(xué)數(shù)據(jù)的分類體系,以期為科學(xué)數(shù)據(jù)的元數(shù)據(jù)設(shè)計(jì)與面向科學(xué)數(shù)據(jù)的智能檢索等提供有價(jià)值的理論支撐。

        圖1 科學(xué)數(shù)據(jù)分類維度

        2 研究方法

        首先,通過整理篩選出的國內(nèi)外文獻(xiàn)的分類維度和分類類型,一共總結(jié)出13 個(gè)分類維度。其次,按照分類維度對所提及的文獻(xiàn)進(jìn)行統(tǒng)計(jì)。由于有些文章含有多個(gè)分類維度,所以會(huì)出現(xiàn)一篇文章在不同分類維度中被多次統(tǒng)計(jì)的情況。最后,按照13個(gè)分類維度,依次對相應(yīng)的研究分類情況進(jìn)行整理、分析與述評(píng),以期對當(dāng)前科學(xué)數(shù)據(jù)分類研究有綜合性的梳理總結(jié)。

        對科學(xué)數(shù)據(jù)進(jìn)行分類是為了更好地組織數(shù)據(jù)與使用數(shù)據(jù)。使用科學(xué)數(shù)據(jù)時(shí),使用者有自己的邏輯判斷順序,會(huì)考慮數(shù)據(jù)的內(nèi)容相關(guān)性、數(shù)據(jù)完整性、數(shù)據(jù)可靠性與數(shù)據(jù)權(quán)威性等性質(zhì)來選擇合適的數(shù)據(jù)??茖W(xué)數(shù)據(jù)分類也可以從科學(xué)數(shù)據(jù)的這幾個(gè)性質(zhì)出發(fā),按照不同維度對科學(xué)數(shù)據(jù)進(jìn)行分類。通過研究按照科學(xué)數(shù)據(jù)的性質(zhì)進(jìn)行分類的文獻(xiàn)內(nèi)容,也可以反映出當(dāng)前使用者在使用科學(xué)數(shù)據(jù)時(shí)優(yōu)先考慮順序的。

        3 科學(xué)數(shù)據(jù)分類體系

        3.1 科學(xué)數(shù)據(jù)類型劃分框架

        通過對當(dāng)前國內(nèi)外科學(xué)數(shù)據(jù)分類相關(guān)研究的梳理,本文從科學(xué)數(shù)據(jù)內(nèi)容相關(guān)性、數(shù)據(jù)完整性、數(shù)據(jù)可靠性與數(shù)據(jù)權(quán)威性等4 個(gè)角度出發(fā),對13個(gè)科學(xué)數(shù)據(jù)分類維度進(jìn)行評(píng)析。梳理總結(jié)得到的科學(xué)數(shù)據(jù)分類維度如圖1所示。依據(jù)4個(gè)性質(zhì)梳理總結(jié)出13個(gè)科學(xué)數(shù)據(jù)分類維度。其中白色框圖的維度是當(dāng)前研究中已提到的分類維度,灰色框圖的維度是當(dāng)前研究中還沒有提到但出于更好地管理與使用科學(xué)數(shù)據(jù)等目的,本文建議補(bǔ)充的科學(xué)數(shù)據(jù)分類維度。圖1展示的4個(gè)科學(xué)數(shù)據(jù)性質(zhì)與13個(gè)科學(xué)數(shù)據(jù)分類維度的涵意介紹如下:

        (1)內(nèi)容相關(guān)性。科學(xué)數(shù)據(jù)內(nèi)容相關(guān)性是指科學(xué)數(shù)據(jù)內(nèi)容所在領(lǐng)域與使用者需求內(nèi)容所在領(lǐng)域的匹配情況??茖W(xué)數(shù)據(jù)的學(xué)科是指科學(xué)數(shù)據(jù)所在的科學(xué)研究領(lǐng)域??茖W(xué)數(shù)據(jù)的主題是指研究專業(yè)、行業(yè)、領(lǐng)域中具體研究某一方面內(nèi)容所形成的特征詞匯。

        (2)數(shù)據(jù)完整性??茖W(xué)數(shù)據(jù)完整性是指在一個(gè)細(xì)分主題下的分類通用的完整性,體現(xiàn)在某一維度下子主題的完整性,常見如時(shí)間、地理、手段以及對象等。從計(jì)算機(jī)可處理角度對科學(xué)數(shù)據(jù)分類是指依據(jù)科學(xué)數(shù)據(jù)的內(nèi)容特征與結(jié)構(gòu)特征,從科學(xué)數(shù)據(jù)可被計(jì)算機(jī)處理的科學(xué)數(shù)據(jù)類型角度出發(fā)的一種分類維度??茖W(xué)數(shù)據(jù)的出現(xiàn)位置是指科學(xué)數(shù)據(jù)生成、處理與存儲(chǔ)所在的位置及其載體形式。從分類后可涵蓋研究對象全樣本的角度對科學(xué)數(shù)據(jù)進(jìn)行分類是指科學(xué)數(shù)據(jù)通過某種劃分方式分類后,分類結(jié)果總體可涵蓋全部科學(xué)數(shù)據(jù)。按科學(xué)數(shù)據(jù)的地理維度分類是指按科學(xué)數(shù)據(jù)所在的空間范圍進(jìn)行不同維度的分類。按科學(xué)數(shù)據(jù)的時(shí)間維度分類是指按科學(xué)數(shù)據(jù)出現(xiàn)的時(shí)間范圍進(jìn)行不同維度的分類。

        (3)數(shù)據(jù)可靠性。數(shù)據(jù)可靠性包括數(shù)據(jù)準(zhǔn)確性和數(shù)據(jù)時(shí)效性,在數(shù)據(jù)完整的基礎(chǔ)上保證數(shù)據(jù)質(zhì)量,使更多優(yōu)質(zhì)數(shù)據(jù)被發(fā)現(xiàn)與利用。科學(xué)數(shù)據(jù)獲取是指獲取科學(xué)數(shù)據(jù)的方法、途徑??茖W(xué)數(shù)據(jù)的來源是指產(chǎn)生科學(xué)數(shù)據(jù)的系統(tǒng)或包含數(shù)據(jù)的記錄集,科學(xué)數(shù)據(jù)的獲取方法是指獲取科學(xué)數(shù)據(jù)采用的技術(shù)手段??茖W(xué)數(shù)據(jù)處理是指按照不同的需求采用不同的方式和工具對科學(xué)數(shù)據(jù)進(jìn)行加工處理的過程。

        (4)數(shù)據(jù)權(quán)威性??茖W(xué)數(shù)據(jù)權(quán)威性是指數(shù)據(jù)代表性和典型性。權(quán)威性數(shù)據(jù)具有輻射性廣、實(shí)用性大、論證性強(qiáng)等功能。依據(jù)科學(xué)數(shù)據(jù)組織機(jī)構(gòu)分類屬于依據(jù)機(jī)構(gòu)權(quán)威程度對科學(xué)數(shù)據(jù)進(jìn)行分類。數(shù)據(jù)被引情況是指搜索者使用數(shù)據(jù)搜索引擎即利用現(xiàn)有的數(shù)據(jù)庫,根據(jù)自身需求檢索并引用數(shù)據(jù)的情況。依據(jù)科學(xué)數(shù)據(jù)的資助機(jī)構(gòu)對其進(jìn)行分類,可以反映科學(xué)數(shù)據(jù)的權(quán)威性程度與影響力范圍。根據(jù)科學(xué)數(shù)據(jù)發(fā)布人的權(quán)威性對科學(xué)數(shù)據(jù)進(jìn)行分類,也可以反映出科學(xué)數(shù)據(jù)的權(quán)威性程度。

        3.2 當(dāng)前研究中科學(xué)數(shù)據(jù)類型的分類維度剖析

        3.2.1 內(nèi)容相關(guān)性

        科學(xué)數(shù)據(jù)的內(nèi)容相關(guān)性越高,科學(xué)數(shù)據(jù)內(nèi)容與使用者需求內(nèi)容的匹配程度越高,說明越符合使用者的需求。通過文獻(xiàn)閱讀梳理,表1為依據(jù)內(nèi)容相關(guān)性對科學(xué)數(shù)據(jù)分類的文獻(xiàn)及其分類結(jié)果。

        (1)學(xué)科。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按學(xué)科分類的文獻(xiàn)共24 篇,國外研究的文獻(xiàn)共12 篇。全學(xué)科分類是指對所有學(xué)科進(jìn)行分類。對具體學(xué)科進(jìn)行分類是針對某一具體學(xué)科進(jìn)行分類。由表1可以看到,提出學(xué)科分類依據(jù)對科學(xué)數(shù)據(jù)進(jìn)行分類,保證了不同學(xué)科間使用數(shù)據(jù)時(shí)的通用性與互操作性;列舉部分學(xué)科名稱進(jìn)行分類是依據(jù)普遍常見的學(xué)科進(jìn)行總結(jié)歸類。結(jié)果種類較多,不夠統(tǒng)一,提出學(xué)科分類依據(jù)的劃分方式更具有普適性。

        國內(nèi)外研究對比,從分類方式看,全學(xué)科分類角度中,國內(nèi)外分類相似,國外研究比國內(nèi)研究較少提出學(xué)科分類依據(jù)。從分類結(jié)果看,國內(nèi)外研究在全學(xué)科角度分類中較為相似,具體學(xué)科角度分類根據(jù)學(xué)科特點(diǎn)而不同。

        (2)主題。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按主題分類的文獻(xiàn)共8篇,國外研究共20篇。目前研究中,分類方式不夠統(tǒng)一,比較雜亂。按科學(xué)數(shù)據(jù)外部特征分類方面,錢鵬等[18]基于科學(xué)數(shù)據(jù)元數(shù)據(jù)中描述其外部特征的項(xiàng)進(jìn)行分類維度的劃分。這種方法對科學(xué)數(shù)據(jù)的分類就會(huì)比較全面,且獲得數(shù)據(jù)時(shí)也具有通用性與可操作性。還有些其他研究列舉科學(xué)數(shù)據(jù)的可分類的外部特征項(xiàng),這種方式不夠全面與系統(tǒng),建議可直接依據(jù)元數(shù)據(jù)外部屬性項(xiàng)確定劃分方式。另外,還有研究專門針對社會(huì)屬性這一外部特征進(jìn)行分類,這是一般元數(shù)據(jù)協(xié)議時(shí)不會(huì)設(shè)置的元數(shù)據(jù)項(xiàng),建議根據(jù)研究需要與事先調(diào)研,補(bǔ)充其他的元數(shù)據(jù)標(biāo)準(zhǔn)中沒有涉及但研究需要的科學(xué)數(shù)據(jù)外部特征,進(jìn)而對科學(xué)數(shù)據(jù)進(jìn)行分類。

        國內(nèi)外研究對比,從分類方式看,國內(nèi)研究依據(jù)科學(xué)數(shù)據(jù)的內(nèi)容特征與外部特征進(jìn)行分類,而國外研究更關(guān)注依據(jù)內(nèi)容特征,從某一具體主題進(jìn)行分類,按外部特征進(jìn)行分類的研究 較 少 。 Showalter 等[20]、 Henderson 等[21]和Wulbrecht等[22]分別對行星數(shù)據(jù)、癌癥數(shù)據(jù)與生命科學(xué)數(shù)據(jù)等具體主題進(jìn)行分類。從分類結(jié)果看,國外研究專指性較強(qiáng),依據(jù)主題特點(diǎn)不同分類結(jié)果也不同。

        3.2.2 數(shù)據(jù)完整性

        完整的科學(xué)數(shù)據(jù)在數(shù)據(jù)集合中有較全面的數(shù)據(jù),能完整地描述數(shù)據(jù)情況以支持各種統(tǒng)計(jì)分析等應(yīng)用。在使用者選擇科學(xué)數(shù)據(jù)時(shí),完整性數(shù)據(jù)有助于使用者正確地進(jìn)行分析與決策,缺失數(shù)據(jù)可能會(huì)對決策帶來干擾甚至誤判。通過文獻(xiàn)閱讀梳理,表2為依據(jù)數(shù)據(jù)完整性對科學(xué)數(shù)據(jù)分類的文獻(xiàn)及其分類結(jié)果。

        (1)計(jì)算機(jī)可處理。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按數(shù)據(jù)內(nèi)容類型分類的文獻(xiàn)共27篇,國外研究共31篇??茖W(xué)數(shù)據(jù)的內(nèi)容類型是指表達(dá)數(shù)據(jù)內(nèi)容的基本交流形式的類別以及數(shù)據(jù)內(nèi)容被使用者感知的感官類別??茖W(xué)數(shù)據(jù)的格式類型是指結(jié)合數(shù)據(jù)內(nèi)容的瀏覽、播放、運(yùn)行等活動(dòng)所需設(shè)備的類型,其反映數(shù)據(jù)存儲(chǔ)媒介格式以及數(shù)據(jù)載體裝置的類型。按科學(xué)數(shù)據(jù)內(nèi)容類型分類的研究對科學(xué)數(shù)據(jù)分類結(jié)果多樣,建議按照公曉[4]的分類結(jié)果,根據(jù)研究需求與研究領(lǐng)域科學(xué)數(shù)據(jù)特點(diǎn),建立科學(xué)數(shù)據(jù)內(nèi)容類型劃分標(biāo)準(zhǔn)。按科學(xué)數(shù)據(jù)格式類型分類的研究可以看作是基于數(shù)據(jù)內(nèi)容類型的數(shù)據(jù)存儲(chǔ)硬件類型的分類。衛(wèi)軍朝和蔚海燕[38]的分類結(jié)果有些簡略。

        表2 依據(jù)數(shù)據(jù)完整性的科學(xué)數(shù)據(jù)分類結(jié)果

        國內(nèi)外研究對比,從科學(xué)數(shù)據(jù)內(nèi)容類型看,國外研究主要從基本科學(xué)數(shù)據(jù)內(nèi)容類型和具體領(lǐng)域科學(xué)數(shù)據(jù)內(nèi)容類型等兩個(gè)類別進(jìn)行分類,且更多的研究是從具體類型列舉展開。從科學(xué)數(shù)據(jù)格式類型看,國外一些研究會(huì)提出具體分類依據(jù),如 Blower 等[39]與 Koziana 等[40]列舉了 NetCDF、HDF、Sensor和ASCII FIT等數(shù)據(jù)格式;分類結(jié)果方面,國內(nèi)研究比國外研究有更多更詳細(xì)的分類類型。另外,國內(nèi)研究比國外研究更經(jīng)常提及列舉具體格式。

        (2)數(shù)據(jù)出現(xiàn)位置。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按數(shù)據(jù)存儲(chǔ)位置分類的文獻(xiàn)共7篇,國外研究共4篇。科技文獻(xiàn)出現(xiàn)位置分類角度,張迎等[30]的劃分方式是依據(jù)科學(xué)數(shù)據(jù)出現(xiàn)位置與文獻(xiàn)相關(guān)聯(lián)的類型進(jìn)行劃分,這種方式比單純考慮與文獻(xiàn)關(guān)系要更加詳細(xì)描述科學(xué)數(shù)據(jù)在文獻(xiàn)中的作用。數(shù)據(jù)庫中存儲(chǔ)位置分類角度,張新興[31]提出按照科學(xué)數(shù)據(jù)出現(xiàn)的位置盡量全面列舉來分類。

        國內(nèi)外研究對比,從分類方式看,科技文獻(xiàn)出現(xiàn)位置分類角度中較少有文獻(xiàn)內(nèi)部的分類方式;從分類結(jié)果看,國內(nèi)研究比國外研究有更詳細(xì)的分類類型;從研究數(shù)量與分類方式結(jié)果等可以看出,按照科學(xué)數(shù)據(jù)存儲(chǔ)位置分類國內(nèi)研究比國外研究更深入。

        (3)分類結(jié)果涵蓋研究對象全樣本。從這個(gè)角度出發(fā)對科學(xué)數(shù)據(jù)進(jìn)行分類可以體現(xiàn)科學(xué)數(shù)據(jù)的完整性。關(guān)于科學(xué)數(shù)據(jù),從分類后可涵蓋研究對象全樣本的角度對科學(xué)數(shù)據(jù)進(jìn)行分類常見的具體分類維度有科學(xué)數(shù)據(jù)結(jié)構(gòu)化程度??茖W(xué)數(shù)據(jù)的結(jié)構(gòu)化程度是指數(shù)據(jù)梳理的標(biāo)準(zhǔn)規(guī)范化程度,其反映的是對科學(xué)數(shù)據(jù)進(jìn)行描述與揭示的字段的豐富程度。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按數(shù)據(jù)內(nèi)容類型分類的文獻(xiàn)共5篇,國外研究共4篇。國內(nèi)外研究對比,分類方式與分類結(jié)果都較為一致,均按照科學(xué)數(shù)據(jù)結(jié)構(gòu)化程度將其分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)等。

        (4)地理維度。在自然地理方面,數(shù)據(jù)的地理維度是指數(shù)據(jù)的自然區(qū)域,可分為綜合自然地理區(qū)以及對數(shù)據(jù)所在區(qū)域按某一自然要素分區(qū)。在行政地理方面,數(shù)據(jù)的地理維度是指數(shù)據(jù)的政治經(jīng)濟(jì)區(qū)域。不同范疇的數(shù)據(jù)區(qū)域,其性質(zhì)和數(shù)據(jù)范圍也不同。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按區(qū)域分類的文獻(xiàn)共4篇。常見的從自然地理維度分類分為青藏高原科學(xué)數(shù)據(jù)、極地科學(xué)數(shù)據(jù)等,這種劃分方式是列舉常見的自然區(qū)域科學(xué)數(shù)據(jù),不夠全面系統(tǒng)。常見的從行政地理維度分類分為省市級(jí)的科學(xué)數(shù)據(jù),這種劃分方式也是列舉常見的行政區(qū)域科學(xué)數(shù)據(jù),不夠全面系統(tǒng)。但是由于行政地理已有劃分好的行政區(qū)域,所以便于系統(tǒng)地組織按照科學(xué)數(shù)據(jù)行政區(qū)域分類的結(jié)果類型。張新興[41]提出從空間位置維度,通過地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)提供即點(diǎn)即找檢索功能,即通過在頁面中點(diǎn)擊空間位置進(jìn)行數(shù)據(jù)的查找。

        通過文獻(xiàn)調(diào)研發(fā)現(xiàn),目前關(guān)于按照地理維度對科學(xué)數(shù)據(jù)進(jìn)行分類的研究較少。按照地理維度對科學(xué)數(shù)據(jù)進(jìn)行分類,可以更好地保證科學(xué)數(shù)據(jù)的空間覆蓋完整性,并且找到更有地理位置針對性的科學(xué)數(shù)據(jù)資源,有利于使用者篩選出更完整優(yōu)質(zhì)的又滿足自己需求的數(shù)據(jù)資源。

        3.2.3 數(shù)據(jù)可靠性

        在使用者選擇科學(xué)數(shù)據(jù)時(shí),數(shù)據(jù)越可靠越有助于使用者分析后得到可靠的結(jié)果。當(dāng)前研究中按科學(xué)數(shù)據(jù)可靠性劃分的維度包括獲取數(shù)據(jù)過程的可靠性與處理數(shù)據(jù)過程的可靠性等。數(shù)據(jù)獲取強(qiáng)調(diào)數(shù)據(jù)來源渠道的可靠性,數(shù)據(jù)處理強(qiáng)調(diào)數(shù)據(jù)處理過程的可靠性。通過文獻(xiàn)閱讀梳理,表3為依據(jù)數(shù)據(jù)可靠性對科學(xué)數(shù)據(jù)分類的文獻(xiàn)及其分類結(jié)果。

        (1)數(shù)據(jù)獲取。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按數(shù)據(jù)獲取過程可靠性分類的文獻(xiàn)共35篇,國外研究共9篇。目前按照科學(xué)數(shù)據(jù)獲取分類的研究中,按數(shù)據(jù)生成方式分類是指按照數(shù)據(jù)生成的方式對科學(xué)數(shù)據(jù)進(jìn)行分類,這種分類方式是基于科學(xué)數(shù)據(jù)獲取方法總結(jié)補(bǔ)充產(chǎn)生。按數(shù)據(jù)來源渠道分類是指按科學(xué)數(shù)據(jù)獲得的來源途徑對科學(xué)數(shù)據(jù)進(jìn)行分類。由表3可以看到,目前研究中按照數(shù)據(jù)生成方式分類的研究較多且分類結(jié)果較統(tǒng)一全面,其主要依據(jù)數(shù)據(jù)生成方法進(jìn)行歸類。而當(dāng)前按照數(shù)據(jù)來源渠道分類的研究較少,且分類結(jié)果比較雜,主要是列舉獲取相關(guān)研究領(lǐng)域科學(xué)數(shù)據(jù)的渠道,缺乏統(tǒng)一的數(shù)據(jù)來源渠道劃分標(biāo)準(zhǔn)。

        表3 依據(jù)數(shù)據(jù)可靠性的科學(xué)數(shù)據(jù)分類結(jié)果

        國內(nèi)外研究對比,從分類方式看,國外研究較少關(guān)于基本類型的分類方式;從分類結(jié)果看,國內(nèi)外按科學(xué)數(shù)據(jù)獲取分類的研究均較多,且常見分類結(jié)果相似,互有補(bǔ)充。

        (2)數(shù)據(jù)處理。本研究中國內(nèi)研究科學(xué)數(shù)據(jù)按數(shù)據(jù)處理分類的文獻(xiàn)共20篇,國外研究共6篇。從資源利用角度對科學(xué)數(shù)據(jù)分類是指依據(jù)數(shù)據(jù)不同階段的利用價(jià)值不同而對數(shù)據(jù)進(jìn)行分類:從生產(chǎn)階段角度對科學(xué)數(shù)據(jù)分類是指對數(shù)據(jù)從產(chǎn)生到最終整個(gè)生產(chǎn)過程進(jìn)行劃分。由表3 可以看到,目前研究中按照資源利用與生產(chǎn)階段對科學(xué)數(shù)據(jù)進(jìn)行分類的分類結(jié)果重疊部分較多,分類結(jié)果相似度較高。本文認(rèn)為當(dāng)前研究對其分類太過細(xì)碎與重復(fù),分類結(jié)果可統(tǒng)一為原始數(shù)據(jù)、加工數(shù)據(jù)與最終數(shù)據(jù)。另外,依據(jù)處理層次對科學(xué)數(shù)據(jù)進(jìn)行分類強(qiáng)調(diào)的是科學(xué)數(shù)據(jù)獲得時(shí)被加工的狀態(tài),當(dāng)前研究中依據(jù)處理層次對科學(xué)數(shù)據(jù)分類的研究較少。

        國內(nèi)外研究對比,國內(nèi)研究調(diào)研并借鑒國外研究分類方式。國內(nèi)外研究相互交流,所以從分類方式與分類結(jié)果來看,國內(nèi)外研究均較為相似。

        3.2.4 數(shù)據(jù)權(quán)威性

        在使用者選擇數(shù)據(jù)時(shí),考慮數(shù)據(jù)權(quán)威性有助于數(shù)據(jù)使用結(jié)果更有典型性和代表性。當(dāng)前研究中按科學(xué)數(shù)據(jù)權(quán)威性對科學(xué)數(shù)據(jù)進(jìn)行分類的研究較少。通過文獻(xiàn)閱讀梳理,表4為依據(jù)數(shù)據(jù)權(quán)威性對科學(xué)數(shù)據(jù)分類的文獻(xiàn)及其分類結(jié)果。

        科學(xué)數(shù)據(jù)的組織機(jī)構(gòu)是指發(fā)布和使用科學(xué)數(shù)據(jù)的單位。當(dāng)前國內(nèi)外研究對科學(xué)數(shù)據(jù)按組織機(jī)構(gòu)分類的文獻(xiàn)較少。本研究中,國內(nèi)相關(guān)研究按組織機(jī)構(gòu)分類的文獻(xiàn)共7篇。目前國內(nèi)多數(shù)學(xué)者按常見的組織機(jī)構(gòu)對科學(xué)數(shù)據(jù)進(jìn)行分類,但卻缺乏統(tǒng)一的組織機(jī)構(gòu)劃分標(biāo)準(zhǔn)。另外,目前研究行業(yè)內(nèi)組織機(jī)構(gòu)類型不夠完善,建議行業(yè)內(nèi)組織機(jī)構(gòu)可按科研、企業(yè)、高校、政府機(jī)關(guān)等維度進(jìn)行劃分。

        國內(nèi)外研究對比,國外比國內(nèi)從科學(xué)數(shù)據(jù)組織機(jī)構(gòu)分類的研究少,總體來看,科學(xué)數(shù)據(jù)從組織機(jī)構(gòu)角度進(jìn)行分類的研究比較缺乏。

        表4 依據(jù)數(shù)據(jù)權(quán)威性的科學(xué)數(shù)據(jù)分類結(jié)果

        4 研究發(fā)現(xiàn)

        當(dāng)前有關(guān)科學(xué)數(shù)據(jù)分類的研究,主要基于科學(xué)數(shù)據(jù)的內(nèi)容相關(guān)性與數(shù)據(jù)完整性等角度,而從科學(xué)數(shù)據(jù)的時(shí)間維度、數(shù)據(jù)被引情況、資助機(jī)構(gòu)以及發(fā)布人等維度來進(jìn)行科學(xué)數(shù)據(jù)類型劃分的研究仍未出現(xiàn)。如圖1所示,灰色框圖是本文建議補(bǔ)充的科學(xué)數(shù)據(jù)分類維度。本文依據(jù)科學(xué)數(shù)據(jù)性質(zhì)依次對建議補(bǔ)充的科學(xué)數(shù)據(jù)分類維度進(jìn)行評(píng)析。

        4.1 數(shù)據(jù)完整性

        (1)時(shí)間維度。時(shí)間維度對科學(xué)數(shù)據(jù)分類與管理、選擇優(yōu)質(zhì)科學(xué)數(shù)據(jù)是一個(gè)重要的影響因素。首先,時(shí)間連續(xù)性對有些研究十分重要,例如化學(xué)實(shí)驗(yàn)中,實(shí)驗(yàn)室獲取的原始數(shù)據(jù)需要是從實(shí)驗(yàn)開始到突變再到實(shí)驗(yàn)結(jié)束這整個(gè)時(shí)間段的全紀(jì)錄,如果缺失了某部分實(shí)驗(yàn)數(shù)據(jù)就可能影響整個(gè)實(shí)驗(yàn)的分析判斷。另外,不同時(shí)間段對研究的開展與分析也有深遠(yuǎn)影響。歷史上不同時(shí)間階段的器物上的化學(xué)物理數(shù)據(jù)均可反映其所在時(shí)間階段的發(fā)展特征,時(shí)間階段對于歷史研究十分重要。使用者比較關(guān)心科學(xué)數(shù)據(jù)的時(shí)間連續(xù)性與階段性,但是目前研究中關(guān)于按照時(shí)間維度對科學(xué)數(shù)據(jù)進(jìn)行分類的劃分方式比較少,對于科學(xué)數(shù)據(jù)的分類方式還有待于進(jìn)一步完善,并且對于科學(xué)數(shù)據(jù)的充分利用還有待于進(jìn)一步提升。

        (2)分類結(jié)果涵蓋研究對象全樣本。當(dāng)前研究中從分類結(jié)果涵蓋研究對象全樣本角度對科學(xué)數(shù)據(jù)分類的分類維度,只有按科學(xué)數(shù)據(jù)結(jié)構(gòu)化程度這一個(gè)維度。實(shí)際上考慮分類結(jié)果涵蓋科學(xué)數(shù)據(jù)全樣本的分類維度還有很多,有待于進(jìn)一步發(fā)現(xiàn)。

        4.2 數(shù)據(jù)權(quán)威性

        當(dāng)前研究中按科學(xué)數(shù)據(jù)權(quán)威性對科學(xué)數(shù)據(jù)進(jìn)行分類的研究較少。依據(jù)科學(xué)數(shù)據(jù)管理與科學(xué)數(shù)據(jù)篩選過程,本文認(rèn)為,從數(shù)據(jù)權(quán)威性的角度進(jìn)行分類,可以從科學(xué)數(shù)據(jù)的機(jī)構(gòu)權(quán)威程度、數(shù)據(jù)被引情況、資助機(jī)構(gòu)與發(fā)布人等維度考慮。

        (1)機(jī)構(gòu)權(quán)威程度??茖W(xué)數(shù)據(jù)分類可以根據(jù)其所在機(jī)構(gòu)權(quán)威程度進(jìn)行分類,進(jìn)而揭示科學(xué)數(shù)據(jù)的權(quán)威性程度及影響力范圍。上述科學(xué)數(shù)據(jù)按組織機(jī)構(gòu)分類屬于依據(jù)機(jī)構(gòu)權(quán)威程度對科學(xué)數(shù)據(jù)進(jìn)行分類,但當(dāng)前關(guān)于按組織機(jī)構(gòu)對科學(xué)數(shù)據(jù)分類的劃分方式與結(jié)果還不夠完善,有待進(jìn)一步的發(fā)展。

        (2)數(shù)據(jù)被引情況。數(shù)據(jù)被引情況包括獲取某個(gè)數(shù)據(jù)倉儲(chǔ)、機(jī)構(gòu)或個(gè)人的數(shù)據(jù)被引情況。數(shù)據(jù)被引情況可以反映出數(shù)據(jù)的影響力程度,按照數(shù)據(jù)被引情況對科學(xué)數(shù)據(jù)分類可以更好地組織影響力范圍更廣的數(shù)據(jù),幫助使用者使用優(yōu)質(zhì)數(shù)據(jù)。但目前按照數(shù)據(jù)被引情況對科學(xué)數(shù)據(jù)分類的研究較少,難點(diǎn)在于數(shù)據(jù)被引渠道的標(biāo)準(zhǔn)化以及數(shù)據(jù)被引量級(jí)的確定。

        (3)資助機(jī)構(gòu)。按照科學(xué)數(shù)據(jù)的資助機(jī)構(gòu)對其進(jìn)行分類,可以反映科學(xué)數(shù)據(jù)的權(quán)威性程度與影響力范圍。當(dāng)前研究中主要是針對資助機(jī)構(gòu)資助的科研項(xiàng)目規(guī)模對科學(xué)數(shù)據(jù)進(jìn)行分類的。科學(xué)數(shù)據(jù)的產(chǎn)生有一部分來源于科研項(xiàng)目。按照科研項(xiàng)目的規(guī)??梢詫茖W(xué)數(shù)據(jù)進(jìn)行分類。當(dāng)前研究中科學(xué)數(shù)據(jù)按照其項(xiàng)目規(guī)??煞譃閮深悾阂活愒从诖罂茖W(xué)研究,大都有著完善的管理與維護(hù)機(jī)制;另一類源于小科學(xué)研究,往往存儲(chǔ)于研究者個(gè)人計(jì)算機(jī)和服務(wù)器中,缺乏統(tǒng)一標(biāo)準(zhǔn)與分享機(jī)制,更缺乏長期利用和共享策略。目前高校、科研院所等的研究實(shí)踐更具小科學(xué)研究的特點(diǎn),急需有效的數(shù)據(jù)轉(zhuǎn)換、保存、組織與管理服務(wù)機(jī)制[2,46-47]。

        (4)發(fā)布人。發(fā)布人權(quán)威性評(píng)價(jià)指標(biāo)包括其所屬機(jī)構(gòu)、職稱以及學(xué)術(shù)權(quán)威(包括研究數(shù)量與質(zhì)量等)等。根據(jù)科學(xué)數(shù)據(jù)發(fā)布人的權(quán)威性對科學(xué)數(shù)據(jù)進(jìn)行分類,有利于從創(chuàng)建者角度對數(shù)據(jù)權(quán)威性程度進(jìn)行劃分。但目前按照科學(xué)數(shù)據(jù)發(fā)布人對科學(xué)數(shù)據(jù)分類的研究較少,難點(diǎn)在于發(fā)布人權(quán)威性評(píng)價(jià)指標(biāo)的標(biāo)準(zhǔn)化以及各指標(biāo)量級(jí)的確定。

        5 結(jié)語

        通過對國內(nèi)外科學(xué)數(shù)據(jù)分類的文獻(xiàn)梳理后,可以發(fā)現(xiàn)當(dāng)前從內(nèi)容相關(guān)性與數(shù)據(jù)完整性等角度對科學(xué)數(shù)據(jù)分類的研究較多,而從數(shù)據(jù)權(quán)威性角度對科學(xué)數(shù)據(jù)分類還沒有引起學(xué)界足夠的關(guān)注。另外,當(dāng)前研究也較少從數(shù)據(jù)完整性中的時(shí)間維度出發(fā)對科學(xué)數(shù)據(jù)進(jìn)行分類。

        關(guān)于科學(xué)數(shù)據(jù)分類維度與分類結(jié)果的國內(nèi)外研究對比,可以發(fā)現(xiàn):(1)依據(jù)內(nèi)容相關(guān)性與數(shù)據(jù)完整性對科學(xué)數(shù)據(jù)分類的國內(nèi)外分類維度與分類結(jié)果相似,國外研究比國內(nèi)研究更注重具體領(lǐng)域內(nèi)的科學(xué)數(shù)據(jù)分類。(2)依據(jù)數(shù)據(jù)可靠性對科學(xué)數(shù)據(jù)分類,國內(nèi)研究比國外研究深入,分類維度更多。國內(nèi)外研究關(guān)于科學(xué)數(shù)據(jù)分類方式會(huì)相互交流、互相補(bǔ)充,并且數(shù)據(jù)可靠性是研究數(shù)據(jù)質(zhì)量學(xué)者常會(huì)關(guān)注的問題,在科學(xué)數(shù)據(jù)實(shí)際應(yīng)用中,數(shù)據(jù)平臺(tái)設(shè)計(jì)者也會(huì)通過系統(tǒng)方式控制。(3)國內(nèi)外研究中,依據(jù)數(shù)據(jù)權(quán)威性對科學(xué)數(shù)據(jù)分類的研究均較少。除了國內(nèi)比國外研究關(guān)于依據(jù)科學(xué)數(shù)據(jù)組織機(jī)構(gòu)分類的研究更多以外,其余的維度國內(nèi)外研究均較少開展。

        關(guān)于從使用者思維習(xí)慣的角度對科學(xué)數(shù)據(jù)分類,對目前科學(xué)數(shù)據(jù)分類研究的文獻(xiàn)整理總結(jié)可以發(fā)現(xiàn):(1)當(dāng)前的科學(xué)數(shù)據(jù)分類體系部分體現(xiàn)了使用者的思維邏輯。首先考慮的是內(nèi)容相關(guān)性、數(shù)據(jù)完整性與數(shù)據(jù)可靠性角度的科學(xué)數(shù)據(jù)分類維度較完善,之后考慮的數(shù)據(jù)權(quán)威性角度的科學(xué)數(shù)據(jù)分類維度較少。(2)本文調(diào)研的依據(jù)科學(xué)數(shù)據(jù)性質(zhì)分類的文獻(xiàn)數(shù)量反映了使用者的思維習(xí)慣。目前研究反映了使用者選擇科學(xué)數(shù)據(jù)時(shí)的思維邏輯順序,從內(nèi)容相關(guān)性與數(shù)據(jù)完整性等角度開展科學(xué)數(shù)據(jù)分類的研究已較多,關(guān)于順序靠后的從數(shù)據(jù)權(quán)威性角度開展科學(xué)數(shù)據(jù)分類的研究還有待進(jìn)一步深入。

        隨著科學(xué)數(shù)據(jù)的發(fā)展,對科學(xué)數(shù)據(jù)的分類組織不再只是為了更全面完整地管理科學(xué)數(shù)據(jù),還需要從數(shù)據(jù)質(zhì)量、數(shù)據(jù)影響力以及數(shù)據(jù)權(quán)威程度等角度對科學(xué)數(shù)據(jù)進(jìn)行分類組織。通過完善科學(xué)數(shù)據(jù)分類體系,有助于構(gòu)建更完整有效的元數(shù)據(jù)框架體系,有助于完善科學(xué)數(shù)據(jù)檢索系統(tǒng)及其索引目錄,有助于推動(dòng)揭示科學(xué)數(shù)據(jù)的特殊性、差異性,以便從更多維度、更好地管理科學(xué)數(shù)據(jù)。

        猜你喜歡
        權(quán)威性使用者維度
        科技類出版社專業(yè)工具書出版的路徑優(yōu)化
        “法定許可”情況下使用者是否需要付費(fèi)
        淺論詩中“史”識(shí)的四個(gè)維度
        中華詩詞(2019年7期)2019-11-25 01:43:00
        新型拼插休閑椅,讓人與人的距離更近
        好日子(2018年5期)2018-05-30 16:24:04
        抓拍神器
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        權(quán)威的證成困境及其解決——對《法律的權(quán)威性:基于實(shí)踐哲學(xué)的研究》的評(píng)析
        “五個(gè)維度”解有機(jī)化學(xué)推斷題
        “全媒體”語境下黨報(bào)更應(yīng)堅(jiān)守權(quán)威性
        新聞傳播(2015年12期)2015-07-18 11:02:40
        人生三維度
        吐魯番(2014年2期)2014-02-28 16:54:43
        日本一区二区三区四区高清不卡| 久久国产成人午夜av影院| 玩弄人妻少妇精品视频| 国产高清av在线播放| 无码成人一区二区| 国产一起色一起爱| 一区二区三区在线视频免费观看| 无码啪啪人妻| 亚洲熟女一区二区三区不卡| 国产亚洲精品综合一区二区| 日本人妻三级在线观看| 国产精品一区二区蜜臀av| 丝袜美腿亚洲综合一区| 国产一区二区三区在线视频观看| 久久精品国产久精国产爱| 在线中文字幕乱码英文字幕正常 | 久久中文精品无码中文字幕下载| 无码人妻精品一区二区三18禁 | 日本一区二区在线看看| 国产午夜福利av在线麻豆| 亚洲最大一区二区在线观看| 一区二区三区四区在线观看日本| 国产自拍偷拍精品视频在线观看| 97精品国产一区二区三区| 国产免费爽爽视频在线观看 | 风韵丰满熟妇啪啪区99杏| 亚洲av永久无码天堂网小说区| 国产一区二区精品久久| 丰满少妇被猛烈进入| 午夜福利电影| 亚洲综合偷自成人网第页色| 日本av一区二区播放| 久久亚洲春色中文字幕久久久综合| 国产成人美涵人妖视频在线观看| 亚洲国产91精品一区二区| 国产一级一级内射视频| 五月丁香综合激情六月久久| 亚洲精品欧美二区三区中文字幕| 欧洲人妻丰满av无码久久不卡| 亚洲人成人网毛片在线播放| 成美女黄网站18禁免费|