亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        特藏資源知識(shí)挖掘方法及實(shí)證研究

        2024-04-03 06:36:05張美琦龍世彤田曉迪趙星楊春燕
        蘭臺(tái)內(nèi)外 2024年7期

        張美琦 龍世彤 田曉迪 趙星 楊春燕

        摘 要:深度挖掘特藏資源的價(jià)值是提高特藏資源利用率的重要途徑之一。當(dāng)前,特藏資源的宣傳推廣材料多為大段文字和文獻(xiàn)的照片,鮮有可視化的圖片。為解決這一局限性,將知識(shí)圖譜工具VOSviewer引入特藏資源建設(shè)領(lǐng)域,通過可視化分析充分展示特藏資源的亮點(diǎn)、重點(diǎn)和全景,以促進(jìn)讀者使用特藏資源。首先,利用Excel數(shù)據(jù)整理功能,將特藏資源數(shù)據(jù)文件改寫為與WOS純文本數(shù)據(jù)文件主要字段一致的過渡性文件;其次,通過自編Python程序,將過渡性文件轉(zhuǎn)換為VOSviewer支持的WOS純文本數(shù)據(jù)文件,從而實(shí)現(xiàn)對(duì)特藏資源數(shù)據(jù)的作者分布、出版社分布、出版地合作和術(shù)語共現(xiàn)分析。通過實(shí)證分析可知,該方法效果良好,可以為特藏資源的深度挖掘提供新的思路,具有一定的現(xiàn)實(shí)意義。

        關(guān)鍵詞:特藏資源;知識(shí)挖掘;可視化分析;蒙學(xué)讀本;VOSviewer

        中圖分類號(hào):G353.1 文獻(xiàn)標(biāo)識(shí)碼:A

        特藏資源具有獨(dú)特性、珍貴性和歷史性等特點(diǎn),具有核心競(jìng)爭(zhēng)力。當(dāng)前,特藏資源建設(shè)在重點(diǎn)揭示、亮點(diǎn)突出、全貌展示等方面還有提升的空間。一般情況下,特藏資源的宣傳推廣材料多為大段的文字和文獻(xiàn)的照片,鮮有可視化的圖片,讀者難以在短時(shí)間內(nèi)了解該資源的全貌,不能感受到強(qiáng)烈的視覺沖擊,難以被激發(fā)出強(qiáng)烈的閱讀興趣。雖然文字是傳遞信息最常用的載體,但是,在當(dāng)前信息爆炸的時(shí)代,人們接收信息的速度已經(jīng)小于信息產(chǎn)生的速度,尤其是文本信息。當(dāng)大段的文字?jǐn)[在面前,已經(jīng)很少有人耐心認(rèn)真地把它讀完,經(jīng)常是先找文中的圖片來看。一方面,說明人們對(duì)圖形的接受程度比枯燥的文字要高很多;另一方面,說明人們急需更高效的信息接收方式,“一圖勝千言”我們深有體會(huì),教材里的解釋圖、筆記里總結(jié)的知識(shí)結(jié)構(gòu)圖,一直到現(xiàn)在經(jīng)常用的思維導(dǎo)圖等,其實(shí)都是簡(jiǎn)單、實(shí)用的文本可視化。在特藏資源建設(shè)領(lǐng)域,知識(shí)圖譜工具正是解決這種需求的一種工具與技術(shù),其突出特征在于把一個(gè)知識(shí)領(lǐng)域里浩如煙海的文獻(xiàn)數(shù)據(jù),以一種多元、分時(shí)、動(dòng)態(tài)的可視化語言,通過巧妙的空間布局,將該領(lǐng)域的演進(jìn)歷程集中展現(xiàn)在一幅幅網(wǎng)絡(luò)的知識(shí)圖譜上。知識(shí)圖譜工具的特點(diǎn)可以概括為“一圖展春秋,一覽無余;一圖勝萬言,一目了然”。

        VOSviewer作為一款知識(shí)圖譜工具,采用可視化手段呈現(xiàn)知識(shí)單元之間的結(jié)構(gòu)和演化關(guān)系圖譜,對(duì)于直觀認(rèn)識(shí)知識(shí)結(jié)構(gòu)有重要價(jià)值。由于該軟件處理文獻(xiàn)信息的功能比較強(qiáng)大,而且開發(fā)者不斷更新升級(jí),一直以來都是免費(fèi)使用,越來越受到專家學(xué)者的青睞。目前,在文獻(xiàn)計(jì)量領(lǐng)域,絕大多數(shù)論文都是用VOSviewer分析期刊論文數(shù)據(jù)或?qū)W位論文數(shù)據(jù),鮮有用來分析特藏資源數(shù)據(jù)的研究。而在特藏資源建設(shè)領(lǐng)域,利用流行知識(shí)圖譜工具實(shí)現(xiàn)可視化的研究并不多見,只有利用Gephi對(duì)梅蘭芳的民國(guó)報(bào)紙資源開展知識(shí)圖譜構(gòu)建的文獻(xiàn),但該研究?jī)H從主題一個(gè)維度實(shí)現(xiàn)可視化分析。本研究把VOSviewer引入特藏資源建設(shè)領(lǐng)域,從主題、作者、出版地以及出版社實(shí)現(xiàn)多維度可視化呈現(xiàn),為特藏資源的知識(shí)挖掘提供新的思路。

        一、研究設(shè)計(jì)

        1.理論假設(shè)

        VOSviewer可以分析文獻(xiàn)中的作者、機(jī)構(gòu)、國(guó)家、期刊、關(guān)鍵詞和術(shù)語等知識(shí)單元,可以構(gòu)建合作網(wǎng)絡(luò)、共詞網(wǎng)絡(luò)、文獻(xiàn)引證網(wǎng)絡(luò)、文獻(xiàn)共被引網(wǎng)絡(luò)和術(shù)語共現(xiàn)網(wǎng)絡(luò)等知識(shí)網(wǎng)絡(luò)類型。該軟件的分析原理是:分析某個(gè)知識(shí)單元,軟件會(huì)自動(dòng)讀取該知識(shí)單元的數(shù)據(jù),之后匯聚分析。例如,如果要展開“作者”的分析,軟件會(huì)自動(dòng)讀取“作者”字段的數(shù)據(jù);如果要做“機(jī)構(gòu)”的分析,則自動(dòng)讀取“機(jī)構(gòu)”字段的數(shù)據(jù);要構(gòu)建術(shù)語共現(xiàn)網(wǎng)絡(luò),則自動(dòng)讀取“題名”或“摘要”字段的數(shù)據(jù)等。以此類推,不論數(shù)據(jù)來源是什么,只要轉(zhuǎn)換成VOSviewer支持的數(shù)據(jù)格式,就可以分析數(shù)據(jù),繪制成知識(shí)圖譜。

        VOSviewer支持以下三類數(shù)據(jù)的分析:(1)從文獻(xiàn)數(shù)據(jù)庫導(dǎo)出的數(shù)據(jù),如Web of Science、Scopus、Dimensions、Lens、PubMed;(2)從參考文獻(xiàn)管理軟件導(dǎo)出的數(shù)據(jù),如RIS、EndNote、RefWorks;(3)通過API獲得的數(shù)據(jù),如Crossref、OpenAlex、Europe PMC、Semantic Scholar、OCC、COCI、Wikidata。除此之外,非上述三類數(shù)據(jù),如果可以轉(zhuǎn)換成上述三類數(shù)據(jù)中的任意一種,就可以間接利用VOSviewer展開分析。由于Web of Science數(shù)據(jù)庫(以下簡(jiǎn)稱WOS)的普及度和接受度相對(duì)較廣,因此,將從WOS導(dǎo)出的純文本數(shù)據(jù)文件作為目標(biāo)數(shù)據(jù)文件,擬將特藏資源數(shù)據(jù)文件轉(zhuǎn)換為目標(biāo)數(shù)據(jù)文件,然后利用VOSviewer的分析功能展開分析和挖掘。

        2.實(shí)現(xiàn)流程

        上述轉(zhuǎn)換過程具體分為以下三步:第一,從特藏資源數(shù)據(jù)文件中選取需要的字段,獲得原始.xlsx數(shù)據(jù)文件。只需挑選正題名、副題名、交替題名、叢書題名、主題詞、全部作者、出版社、出版地以及出版日期9個(gè)字段;第二,將原始.xlsx數(shù)據(jù)文件的字段重組并重新命名,獲得與WOS純文本數(shù)據(jù)字段一致的過渡.xlsx數(shù)據(jù)文件;第三,通過Python自編程序?qū)⑦^渡.xlsx數(shù)據(jù)文件轉(zhuǎn)換為文本格式.txt數(shù)據(jù)文件,獲WOS純文本數(shù)據(jù)文件,將WOS純文本數(shù)據(jù)文件導(dǎo)入VOSviewer,利用分析功能展開知識(shí)挖掘。

        二、特藏資源知識(shí)挖掘方法實(shí)證

        1.數(shù)據(jù)和方法

        “美國(guó)殖民到現(xiàn)代的蒙學(xué)讀本”特藏資源是由美國(guó)教育家理查德·威內(nèi)斯基牽頭,從美國(guó)十余家圖書館特藏中甄選出來的兒童早期閱讀課本,共包括842冊(cè)圖書。這些讀本的時(shí)間跨度較大,從美洲殖民時(shí)代的1711年一直延續(xù)到現(xiàn)代的1943年。這些讀本對(duì)于研究美國(guó)閱讀教育的源頭,并由此思考其對(duì)我國(guó)閱讀教育的啟示等具有重要的學(xué)術(shù)價(jià)值。對(duì)“美國(guó)殖民到現(xiàn)代的蒙學(xué)讀本”特藏資源展開知識(shí)挖掘很有必要,可以促進(jìn)人文學(xué)者對(duì)美國(guó)閱讀教育源頭文獻(xiàn)的分析和研究。

        2.時(shí)間特征挖掘

        讀本出版的歷史性變化趨勢(shì),可從一個(gè)側(cè)面反映讀本的發(fā)展?fàn)顩r?!懊绹?guó)殖民到現(xiàn)代的蒙學(xué)讀本”整體跨度為233年,大致可以分為以下5個(gè)時(shí)期。

        (1)起步期:1711年~1782年,共9冊(cè)讀本。美洲殖民地的教育并非從零開始,而是以英國(guó)和歐洲教育演進(jìn)的最優(yōu)成果為起點(diǎn)繼續(xù)前進(jìn)的。從源頭上講,英國(guó)教育是美國(guó)教育的主要源泉,因?yàn)楫?dāng)時(shí)居民80%來自英國(guó),其閱讀教育更多從宗主國(guó)移植而來。在這樣的背景下,美國(guó)閱讀課本逐漸起步。

        (2)蓬勃發(fā)展期:1783年~1837年,共155冊(cè)讀本。美國(guó)獨(dú)立戰(zhàn)爭(zhēng)期間,與英國(guó)的貿(mào)易交往被中斷,導(dǎo)致美國(guó)國(guó)內(nèi)的閱讀課本非常短缺。美國(guó)正式成立后,美國(guó)的教育方向發(fā)生了時(shí)代性的轉(zhuǎn)變,從殖民時(shí)期以培養(yǎng)效忠英王為目標(biāo)改為以培養(yǎng)優(yōu)秀的公民和增強(qiáng)國(guó)家凝聚力為職責(zé)。教育方向的轉(zhuǎn)變也導(dǎo)致了閱讀教學(xué)的根本性轉(zhuǎn)變,從以往以宗教教育為主轉(zhuǎn)向以道德教育為主。

        (3)停滯期:1838年~1865年,共111冊(cè)讀本。隨著19世紀(jì)三四十年代普通學(xué)校運(yùn)動(dòng)的蔓延,讀本的出版成為一項(xiàng)重要的獨(dú)立業(yè)務(wù),配有專門的出版社和銷售隊(duì)伍。該階段的前期,閱讀課本仍保持上升的勢(shì)頭,但后期由于1861至1865美國(guó)南北戰(zhàn)爭(zhēng)的爆發(fā),閱讀課本的數(shù)量發(fā)生了斷崖式下降。

        (4)快速發(fā)展期:1866年~1920年,共446冊(cè)讀本。美國(guó)南北戰(zhàn)爭(zhēng)后教育的巨大浪潮創(chuàng)造了對(duì)讀本的創(chuàng)紀(jì)錄需求,閱讀課本進(jìn)入一個(gè)快速發(fā)展的時(shí)期。該時(shí)期叢書讀本的發(fā)展初具規(guī)模,與現(xiàn)在的分級(jí)讀本相似,一般包括初級(jí)讀本和5~6本分級(jí)讀本,還有的包括一本拼寫書。

        (5)穩(wěn)定發(fā)展期:1921年~1943年,共121冊(cè)讀本。20世紀(jì)初期,由于教育心理學(xué)從普通心理學(xué)中分離出來,對(duì)閱讀教育產(chǎn)生了強(qiáng)烈影響,因此,標(biāo)準(zhǔn)化的閱讀測(cè)試對(duì)閱讀教材也產(chǎn)生了較大影響。

        3.空間特征挖掘

        對(duì)于讀本出版空間的研究有助于探尋讀本出版中心的變遷規(guī)律。“美國(guó)殖民到現(xiàn)代的蒙學(xué)讀本”的出版地絕大多數(shù)在美國(guó),也有少數(shù)在英國(guó)或加拿大??v觀讀本出版地的地理空間變化,不難發(fā)現(xiàn)美國(guó)是從東北部大西洋沿岸城市逐漸向北部、南部、西部擴(kuò)展的軌跡。在殖民時(shí)期和建國(guó)初期,費(fèi)城、紐約、波士頓、伍斯特和巴爾的摩等地出版的讀本比較多。美國(guó)南北戰(zhàn)爭(zhēng)前期,美國(guó)西部圖書貿(mào)易的資本已經(jīng)轉(zhuǎn)移到辛辛那提。到了現(xiàn)代,讀本出版比較活躍的城市除了紐約、芝加哥、波士頓之外,又增加了亞特蘭大,達(dá)拉斯、舊金山等城市。

        4.主題特征挖掘

        “美國(guó)殖民到現(xiàn)代的蒙學(xué)讀本”的主題聚類圖可以劃分為7個(gè)聚類,如圖1所示,受篇幅所限,選取規(guī)模最大的4個(gè)聚類如下。

        第一,以美國(guó)建國(guó)初期諾亞·韋伯斯特的《美國(guó)拼寫書(The Americanspelling book)》讀本為主。1783年美國(guó)獨(dú)立革命的成功,開啟了美國(guó)本土閱讀課本大量涌現(xiàn)的時(shí)期,這時(shí)期的讀本充滿了強(qiáng)烈的民族主義精神,課文中的宗教內(nèi)容越來越少。第一本由美國(guó)人自己編寫和出版的拼寫書是韋伯斯特的《美國(guó)拼寫書(The American spelling book)》。

        第二,以美國(guó)內(nèi)戰(zhàn)前期的《麥克古菲讀本(McGuffey Readers)》為主。韋伯斯特的《美國(guó)拼寫書》要求兒童背誦很多標(biāo)注音節(jié)的單詞,這種死記硬背使兒童對(duì)閱讀產(chǎn)生抵觸和厭惡情緒,于是《邁克古菲讀本》應(yīng)運(yùn)而生,逐漸取代了《美國(guó)拼寫書》的市場(chǎng)。

        第三,以美洲殖民地時(shí)期最暢銷的《新英格蘭初級(jí)讀本(New England Primer)》為主。殖民地時(shí)期,學(xué)校缺乏課本,讓學(xué)生從家里自帶書籍,當(dāng)時(shí)很多家庭唯一的書籍就是《圣經(jīng)》。當(dāng)時(shí)的書籍大部分都是從英國(guó)進(jìn)口的,少數(shù)在殖民地印制的讀本也是模仿英國(guó)讀本而寫的。殖民地時(shí)期普及度最廣的讀本就是《新英格蘭初級(jí)讀本(The New England Primer)》。

        第四,主要以美國(guó)現(xiàn)代的暢銷書《迪克和簡(jiǎn)(Dick and Jane)》為主。1930年,新一代的基礎(chǔ)分級(jí)讀本《迪克和簡(jiǎn)》逐漸取代了《邁克古菲讀本》。這系列讀本講述一個(gè)典型的美國(guó)中產(chǎn)家庭的故事,其中的主人公有爸爸、媽媽、哥哥Dick、姐姐Jane、妹妹Sally 。

        5.作者的學(xué)術(shù)群分布

        美洲殖民時(shí)期,由于條件所限,因此,大部分讀本來自宗主國(guó)英國(guó)進(jìn)口,大多是英國(guó)作者。美國(guó)建國(guó)初期,讀本的主要作者大多來自新英格蘭,他們受過高等教育,大部分是新教徒,以古典閱讀教育為導(dǎo)向。當(dāng)時(shí),絕大部分作者不是作者,而是編者。未經(jīng)許可也未聯(lián)合署名就大段摘抄的現(xiàn)象并不少見,而且美國(guó)國(guó)內(nèi)外讀本的重印均無須支付費(fèi)用,直至19世紀(jì)末美國(guó)實(shí)施國(guó)際版權(quán)法,這些現(xiàn)象才停止。

        6.出版社的演化

        “美國(guó)殖民到現(xiàn)代的蒙學(xué)讀本”出版社的發(fā)展,經(jīng)歷了印刷與出版一體化、印刷與出版分離、出版業(yè)蓬勃壯大三個(gè)階段。殖民地時(shí)期,印刷業(yè)都是手工作坊,當(dāng)時(shí)印刷和出版不分家。到了19世紀(jì)30年代,手工印刷業(yè)開始向工業(yè)化轉(zhuǎn)型,再也不需要熟練工人和那么多的學(xué)徒工。到了美國(guó)內(nèi)戰(zhàn)前期,由于印刷廠的啟動(dòng)成本很高,絕大多數(shù)工廠選擇印刷與出版分離,專門做印刷才能盈利。于是,出版商接管了宣傳商、編輯、營(yíng)銷人員的角色,只把圖書生產(chǎn)的工作留給了印刷商。

        三、總結(jié)

        當(dāng)前,特藏資源的宣傳推廣環(huán)節(jié)鮮有文本可視化技術(shù)的應(yīng)用,在特藏資源建設(shè)領(lǐng)域引入知識(shí)圖譜工具VOSviewer,為特藏資源實(shí)施學(xué)術(shù)畫像,用一幅幅知識(shí)圖譜展示重點(diǎn)、亮點(diǎn)和全景。本研究創(chuàng)新性地通過改寫和轉(zhuǎn)換特藏資源數(shù)據(jù)來實(shí)現(xiàn)可視化分析,針對(duì)數(shù)據(jù)獲取和文獻(xiàn)清理的復(fù)雜性工作,采用Python代碼實(shí)現(xiàn)數(shù)據(jù)的快速批量轉(zhuǎn)換,極大地提高了研究效率,為特藏資源的知識(shí)挖掘提供了新思路。

        需要說明的是,該方法不僅適用于圖書類特藏資源,還適用于報(bào)紙類、期刊類、文書類等其他特藏資源。只要特藏資源的元數(shù)據(jù)具備4個(gè)W要素,即What(對(duì)象)、Where(地點(diǎn))、When(時(shí)間)、Who(人員)等,就可以通過上述步驟利用VOSviewer實(shí)現(xiàn)可視化分析。該方法的不足之處在于,數(shù)據(jù)清理的工作量會(huì)較大。例如,由于特色資源中的責(zé)任者,其責(zé)任方式可能有著、編、審、校、譯等多種,所以,數(shù)據(jù)清理時(shí)需要較大的耐心和細(xì)心。另外,特色資源的主題詞/關(guān)鍵詞字段,需要細(xì)粒度的揭示,生成的知識(shí)圖譜會(huì)更有解讀性。

        參考文獻(xiàn):

        [1]李 杰,陳超美. CiteSpace科技文本挖掘及可視化(第一版)[M].首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2016.

        [2]劉則淵.視覺思維、數(shù)學(xué)思維和哲學(xué)思維的集成之作——陳超美著《科學(xué)前沿圖譜》中譯本推介[J].科學(xué)與管理,2014,34(03):25-26.

        [3]李 杰.中國(guó)新冠安全、風(fēng)險(xiǎn)、災(zāi)害與危機(jī)的研究態(tài)勢(shì)[J].科學(xué)觀察,2022,17(03),15-22.

        [4]沈 旺,陳玖瑜,潘夢(mèng)雅.數(shù)字人文視域下民國(guó)報(bào)紙知識(shí)圖譜構(gòu)建研究[J].圖書館雜志,2022,41(09):105-112.

        [5]李 杰,魏瑞斌.VOSviewer應(yīng)用現(xiàn)狀及其知識(shí)基礎(chǔ)研究 [J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2022,34(06):61-71.

        [6]滕大春著.美國(guó)教育史(第二版)[M].北京人民教育出版社,2001.

        [7]練小川.美國(guó)兒童閱讀課本簡(jiǎn)史(三)[J].出版參考,2021(09):29-33.

        (作者單位:北京師范大學(xué)圖書館)

        基金項(xiàng)目:本文系北京高校圖書館研究基金項(xiàng)目“面向數(shù)字人文的縮微文獻(xiàn)文本挖掘與知識(shí)可視化研究”(項(xiàng)目編號(hào):BGT2021047)的研究成果之一。

        通訊作者:張美琦(1974—),女,漢族,山西大同人,碩士,副研究館員,研究方向:特藏資源建設(shè)。

        中文字幕无线码免费人妻| 国产一区二区黑丝美女| 亚洲不卡av二区三区四区| 无码一区二区三区| 国产成人av性色在线影院色戒 | 欧美狠狠入鲁的视频777色| 亚洲精品国精品久久99热一| 69天堂国产在线精品观看| 亚洲精品视频一区二区三区四区 | 日本一区二区啪啪视频| 亚洲av成人综合网成人| 中文字幕在线亚洲日韩6页| 日韩av在线毛片| 天天综合色中文字幕在线视频| 亚洲综合精品中文字幕| 欧美肥胖老妇做爰videos| 色窝窝无码一区二区三区2022| 少妇呻吟一区二区三区| 一边摸一边抽搐一进一出口述| 女厕厕露p撒尿八个少妇| 亚洲熟女av超清一区二区三区| 中文字幕在线亚洲精品一区| 亚洲理论电影在线观看| 天天操夜夜操| 秀人网嫩模李梓熙大尺度| 神马影院日本一区二区| 国产亚洲精品久久久ai换| 国产精品无码久久久久免费AV| 一区二区三区免费自拍偷拍视频| 内射中出日韩无国产剧情| 野外性史欧美k8播放| 国产亚洲曝欧美不卡精品| 中文字幕色偷偷人妻久久一区| 亚洲色大成网站www久久九九| 日韩二三区| 午夜视频手机在线免费观看| 四虎国产成人永久精品免费| 国产麻无矿码直接观看| 蜜桃网站在线免费观看视频 | 精品蜜臀国产av一区二区| 中文无码人妻有码人妻中文字幕|