亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國植物標(biāo)本館數(shù)字化發(fā)展的縮影

        2022-04-30 00:20:32劉啟新褚曉芳董曉宇惠紅周義峰
        廣西植物 2022年13期
        關(guān)鍵詞:江蘇省數(shù)據(jù)庫數(shù)字化

        劉啟新 褚曉芳 董曉宇 惠紅 周義峰

        摘 要:? 江蘇省中國科學(xué)院植物研究所標(biāo)本館(NAS)是中國最早的植物標(biāo)本館之一,也是國內(nèi)最早開展植物標(biāo)本數(shù)字化的標(biāo)本館,其標(biāo)本數(shù)字化發(fā)展經(jīng)歷了4個(gè)階段: 20世紀(jì)80年代后期嘗試的標(biāo)本文字信息數(shù)字化的起步階段;20世紀(jì)90年代末的標(biāo)本圖像數(shù)字化和文字信息數(shù)字化規(guī)范階段;2004年以后的標(biāo)本批量數(shù)字化與信息網(wǎng)絡(luò)共享快速發(fā)展階段;2018年后的標(biāo)本數(shù)字化信息維護(hù)與優(yōu)化階段。這一過程集中代表和反映了中國植物標(biāo)本數(shù)字化的發(fā)展歷程。此外,近年來開始了發(fā)掘和利用江蘇植物標(biāo)本的數(shù)字化信息工作,包括建設(shè)江蘇省級(jí)數(shù)字植物標(biāo)本館、開發(fā)江蘇省維管植物標(biāo)本時(shí)空分布可視化系統(tǒng)、開展標(biāo)本采集-入庫過程數(shù)字化等。今后,將不斷深化標(biāo)本數(shù)字化的工作,以期形成有NAS特色的數(shù)字化植物標(biāo)本館。

        關(guān)鍵詞: 江蘇省,? 植物標(biāo)本,? 標(biāo)本圖像,? 標(biāo)本信息, 數(shù)字化, 數(shù)據(jù)庫

        中圖分類號(hào):? Q94

        文獻(xiàn)標(biāo)識(shí)碼:? A

        文章編號(hào):? 1000-3142(2022)增刊1-0071-16

        收稿日期:? 2022-08-12

        基金項(xiàng)目:? 國家標(biāo)本資源共享平臺(tái)項(xiàng)目(2005DKA21400); 國家科技資源共享服務(wù)平臺(tái)項(xiàng)目(E2117G1001); 江蘇省省屬公益類科研院所植株科研課題(JSPKL202058)。

        第一作者: 劉啟新(1958-),碩士,研究員,主要研究方向?yàn)橹参锓诸悓W(xué),(E-mail)naslqx@qq.com。

        通信作者:? 周義峰,碩士,副研究員,研究方向?yàn)橹参镔Y源學(xué),(E-mail)njgzhou@163.com。

        Development epitome of digitization of plant specimens

        of herbaria in China: Herbarium of Institute

        of Botany, Jiangsu Province and Chinese

        Academy of Sciences (NAS)

        LIU Qixin, CHU Xiaofang, DONG Xiaoyu, HUI Hong, ZHOU Yifeng*

        ( Herbarium of Institute of Botany, Jiangsu Province and Chinese Academy of Sciences (Nanjing

        Botanical Garden Mem. Sun Yat-Sen), Nanjing 210014, China )

        Abstract:? The Herbarium of Institute of Botany, Jiangsu Province and Chinese Academy of Sciences (NAS) is one of the earliest herbarium in China, and it is also the earliest herbarium to carry out the digitization of plant specimens in China. The digitization development process has gone through four stages: the initial stage of trying to digitize the text information of specimens in the late 1980s, the standardization stage of digitization of specimen image and text information in the late 1990s, the stage of batch digitization of specimens and sharing specimens information on network after 2004, and the stage of maintenance and optimization to digitization information of specimen after 2018. This process concentratedly represents and reflects the development of digitization of specimens in Chinas herbaria. In addition, in recent years, digital information of plant specimens from Jiangsu Province has been excavated and utilized, including the construction of Jiangsu Virtual Herbarium, development of a visualization system for the temporal and spatial distribution of vascular plant specimens in Jiangsu Province, and digital management in the whole process from specimen collection to specimen warehousing. In the future, the work of specimen digitization will continue to deepen, with a view to forming a digital herbarium with NASs characteristics。

        Key words: Jiangsu Province, plant specimens, image of specimens, information of specimens, digitization, database

        植物標(biāo)本是開展植物學(xué)研究的一類重要實(shí)物材料,不僅承載了植物的形態(tài)特征和遺傳物質(zhì)信息,而且記錄或攜帶著植物的產(chǎn)地、采集和資源信息,甚或載有植物種類的鑒定信息、標(biāo)本研究信息以及鑒定與研究的歷史信息,在植物學(xué)研究領(lǐng)域,諸如植物分類、植物地理、植物區(qū)系等學(xué)科的研究中備受關(guān)注,特別是模式標(biāo)本,是植物種類及其名稱的唯一實(shí)物憑證,具有不可替代性,其地位尤其特殊和重要。因此,業(yè)界極為重視對(duì)于植物標(biāo)本的收集、保藏、研究與應(yīng)用。

        標(biāo)本館的重要任務(wù)之一,就是長期妥善保藏植物標(biāo)本,并為學(xué)術(shù)研究和社會(huì)利用提供支撐和服務(wù)。但是,植物標(biāo)本(尤其是臘葉標(biāo)本)具有隨著時(shí)間的延長而逐漸老化或極易破損的局限性,加之保存條件的不適或過多翻閱易造成標(biāo)本實(shí)體損壞,甚或天災(zāi)及人為失誤可造成標(biāo)本損毀或丟失,因此在實(shí)際工作中標(biāo)本的保護(hù)與利用往往產(chǎn)生矛盾,特別是對(duì)于保存時(shí)間久且已“老化”的標(biāo)本,矛盾愈顯突出。這一現(xiàn)象在很長一段時(shí)間內(nèi)困擾著標(biāo)本館管理人員,也是標(biāo)本館工作的難點(diǎn)和必須解決的問題。

        20世紀(jì)中后期,隨著計(jì)算機(jī)的普及與應(yīng)用,利用計(jì)算機(jī)技術(shù)將標(biāo)本信息數(shù)字化,為標(biāo)本館解決管理和應(yīng)用方面的矛盾和困難提供了十分有效的方法和途徑。數(shù)字化的植物標(biāo)本信息以數(shù)據(jù)庫的數(shù)字形式與標(biāo)本實(shí)體分離,不僅在一定程度上減少直接查閱植物標(biāo)本實(shí)物才能獲取相關(guān)信息的依賴性或局限性,而且可以減少人為活動(dòng)造成標(biāo)本損失,實(shí)現(xiàn)多人同時(shí)、多次、異地獲得完全相同的標(biāo)本信息。這是傳統(tǒng)方式管理植物標(biāo)本所不能及的,更能有效地延續(xù)實(shí)體標(biāo)本壽命。無疑,標(biāo)本的數(shù)字化為標(biāo)本的管理、檢索、利用和保護(hù)提供了嶄新的途徑。正因如此,計(jì)算機(jī)一經(jīng)引入標(biāo)本館管理,國內(nèi)外的主要標(biāo)本館都陸續(xù)啟用并迅速推進(jìn)館藏標(biāo)本的數(shù)字化工作(王利松等, 2010; Sobeeon, 1999; 李鳴光等, 1995; 馬波等, 2001)。

        江蘇省中國科學(xué)院植物研究所標(biāo)本館(NAS,原名為中國科學(xué)院南京中山植物園標(biāo)本館;以下簡稱“本館”)源于1923年的我國第一個(gè)生物研究機(jī)構(gòu)——中國科學(xué)社生物研究所和建立于1934年的原動(dòng)植物研究所的標(biāo)本室。與國內(nèi)其他植物標(biāo)本館相比,本館應(yīng)是我國最早的植物標(biāo)本館,至今已近百年,是國內(nèi)四大植物標(biāo)本館之一,也是華東地區(qū)最大的植物標(biāo)本館,保存有被子植物、裸子植物、蕨類植物及苔蘚植物的臘葉標(biāo)本80余萬份,模式標(biāo)本5 000余份。本館最大的保存特色和優(yōu)勢(shì)是有眾多模式標(biāo)本、大批20世紀(jì)20年代至40年代我國早期植物學(xué)家采集的標(biāo)本以及來自世界其他標(biāo)本館早年的標(biāo)本。中國植物學(xué)研究最早發(fā)起于南京和上海,我國早期植物學(xué)家在開展植物學(xué)研究過程中采集有許多植物標(biāo)本,如秦仁昌、方文培、耿以禮、蔣英、王啟無、蔡希陶、陳煥鏞、賀賢育等在我國植物分類學(xué)發(fā)展中做出杰出貢獻(xiàn)的專家和學(xué)者,他們?cè)谖髂希ǖ岽ㄙF)、華東、華南等地采集的大量標(biāo)本,多數(shù)保存于本館。此外,還有一些外國植物學(xué)家(如P. J. M. Delavay、C. C. Courtois、H. Migo、J. F. Rock、Y. Yabe等人)在中國各地采集的許多標(biāo)本和震旦博物院(Musee Heude)的館藏標(biāo)本等。這些都是新中國成立中國科學(xué)院時(shí)收藏的主要植物標(biāo)本,本所作為中國科學(xué)院專設(shè)的高等植物分類研究所將這部分標(biāo)本予以全盤接收并存于本館中。這些植物標(biāo)本經(jīng)歷了抗日戰(zhàn)爭期間從南京西遷至重慶、戰(zhàn)后又遷回的顛沛,以及“文革”時(shí)期的易地搬遷,保存至今,非常不易(薛攀皋, 1992)。上述標(biāo)本,許多僅保存于本館,在我國近代植物學(xué)研究中發(fā)揮了重要作用,具有特殊的地位和極高的價(jià)值,十分珍貴。如何妥善保存這些標(biāo)本是本館工作的重中之重,也成為本館積極開展標(biāo)本數(shù)字化工作最直接、最迫切的原動(dòng)力之一。

        除此之外,隨著學(xué)科的發(fā)展和信息化的深入,植物科學(xué)工作者,尤其是植物分類學(xué)家,除了到館實(shí)地查看植物標(biāo)本細(xì)節(jié),更希望通過網(wǎng)絡(luò)平臺(tái)獲取或關(guān)注標(biāo)本的相關(guān)信息,加之為了更好地全面保護(hù)館藏標(biāo)本,也為了讓人們更方便、有效地利用這些標(biāo)本的信息資源,在較大的范圍內(nèi)做到信息共享,本館不僅充分認(rèn)識(shí)到植物標(biāo)本數(shù)字化的重要性,而且及早開展標(biāo)本數(shù)字化工作,并在1984年就率先在國內(nèi)開始建設(shè)植物標(biāo)本數(shù)據(jù)庫,從此拉開了我國植物標(biāo)本館開展標(biāo)本信息化建設(shè)的序幕。

        1 本館標(biāo)本數(shù)字化的經(jīng)歷與發(fā)展

        階段

        縱觀中國植物標(biāo)本館將計(jì)算機(jī)技術(shù)應(yīng)用于植物標(biāo)本的管理并進(jìn)行標(biāo)本信息數(shù)字化的過程,本館最有代表性——開始于20世紀(jì)80年代,率先在國內(nèi)建立了植物標(biāo)本數(shù)據(jù)庫,歷經(jīng)了各個(gè)發(fā)展階段,成為我國植物標(biāo)本數(shù)字化平臺(tái)的重要參與單位,是國內(nèi)開展標(biāo)本數(shù)字化最早、歷程最長的標(biāo)本館?;仡櫛攫^植物標(biāo)本數(shù)字化過程以及開展的工作,即可管窺我國植物標(biāo)本館數(shù)字化的歷程,概為縮影。就本館開展的標(biāo)本數(shù)字化的工作與經(jīng)歷,大體可以分為4個(gè)階段。

        1.1 第一階段:率先在國內(nèi)嘗試將計(jì)算機(jī)應(yīng)用于標(biāo)本管理——建立植物模式標(biāo)本管理系統(tǒng)(MSBS)

        20世紀(jì)60年代開始,國外就將計(jì)算機(jī)技術(shù)應(yīng)用于植物標(biāo)本的管理,主要用于簡單的植物類群檢索系統(tǒng)和列表;20世紀(jì)70年代中期,一些有代表性的植物研究單位的標(biāo)本館根據(jù)各自的特點(diǎn)和優(yōu)勢(shì)獨(dú)立研發(fā),擴(kuò)大標(biāo)本信息的貯存和檢索功能,如密蘇里植物園的植物標(biāo)本數(shù)據(jù)庫(1970s)、愛丁堡皇家植物園植物標(biāo)本館的PANDORA項(xiàng)目(1986)、史密森研究院的植物標(biāo)本數(shù)據(jù)庫(1970s)(Shetler, 1973; Pankhurst, 1993; 李鳴光, 2000)。在此國際發(fā)展大趨勢(shì)的背景下,伴隨著密蘇里植物園與我國簽署編寫Flora of China的合作協(xié)議的逐步實(shí)施,本標(biāo)本館于1984年至1986年與南京工學(xué)院(現(xiàn)東南大學(xué))生物醫(yī)學(xué)工程系聯(lián)合研發(fā)了植物標(biāo)本計(jì)算機(jī)管理系統(tǒng),并利用該系統(tǒng)對(duì)125科290屬約2 000份模式標(biāo)本進(jìn)行了信息數(shù)字化(凌萍萍和湯儆杉, 1988)。這是我國標(biāo)本館第一次嘗試開發(fā)的植物標(biāo)本信息系統(tǒng),并開始標(biāo)本數(shù)字化管理。

        該系統(tǒng)實(shí)現(xiàn)了植物標(biāo)本信息的存貯、排序、查詢、檢索、增加和刪除等功能,顯著提高了植物標(biāo)本(特別是模式標(biāo)本)的管理水平。一方面避免了人工查閱標(biāo)本造成的磨損,能更有效地保護(hù)標(biāo)本,有利于標(biāo)本的長期保存;另一方面又可準(zhǔn)確、多次顯示植物標(biāo)本的信息,避免因人工觀察和記錄造成所獲信息的誤差,尤其是在進(jìn)行大量標(biāo)本查閱和涉及的分類群較多時(shí),人工查詢往往會(huì)產(chǎn)生各種差錯(cuò),而且工作量大。此外,實(shí)現(xiàn)了標(biāo)本信息的異地查閱,可以大幅度節(jié)省研究費(fèi)用,縮短查閱時(shí)長。

        由于技術(shù)的限制,當(dāng)年所有標(biāo)本信息首先采用人工登記(圖1),再通過人工將這些信息錄入計(jì)算機(jī)(微機(jī))系統(tǒng)中。整個(gè)標(biāo)本管理系統(tǒng)軟件是在IBM-PC/XT計(jì)算機(jī)和Lotus 1-2-3集成軟件基礎(chǔ)上開發(fā)的(圖2),資料數(shù)據(jù)的輸入工作以Lotus 1-2-3的編輯方式進(jìn)行,輸入?yún)^(qū)、輸出區(qū)和標(biāo)準(zhǔn)查詢區(qū)的范圍用資料命令功能塊進(jìn)行制作,而應(yīng)用程序則用宏匯編進(jìn)行編制。用戶可以通過顯示屏窗口查看數(shù)據(jù)庫的內(nèi)容, 包括標(biāo)本信息和操作程序,使得植物標(biāo)本管理實(shí)現(xiàn)了計(jì)算機(jī)化。

        本館標(biāo)本數(shù)字化最早使用的是美國國際商用機(jī)器公司(IBM)于1983年發(fā)布的個(gè)人電腦產(chǎn)品IBM PC/XT臺(tái)式計(jì)算機(jī),這是當(dāng)時(shí)比較先進(jìn)的硬件設(shè)備,采取XT設(shè)計(jì),使用了Intel的8088芯片,引入了標(biāo)準(zhǔn)的16位ISA總線以及采用了當(dāng)時(shí)最新的英特爾80286處理器,硬盤為10 MB,預(yù)裝了DOS 2.0系統(tǒng),支持“文件”的概念,并以“目錄樹”形式存儲(chǔ)文件。這是硬盤第一次成為PC的標(biāo)準(zhǔn)配置。標(biāo)本數(shù)據(jù)貯存器是5.25 in的軟磁盤(1.2 M),后期改用了3.5 in軟磁盤(圖3)。

        該系統(tǒng)將所有標(biāo)本分別存放于11個(gè)信息庫中,每份標(biāo)本信息包括(標(biāo)本館)標(biāo)本流水號(hào),標(biāo)本植物隸屬的科號(hào)、科名、屬名和種名,種名的異名或俗名,種名發(fā)表的原始文獻(xiàn),標(biāo)本采集的采集人、采集號(hào)、采集日期、產(chǎn)地、生境和海拔,植物的習(xí)性、葉、花、果、雄蕊、雌蕊、用途、分布,標(biāo)本的模式類型等等,共30項(xiàng)信息。

        用戶可以調(diào)用任何一個(gè)庫中的標(biāo)本信息,也可以隨時(shí)增加、刪除和修改這些信息,還可以根據(jù)需要對(duì)存放的標(biāo)本信息進(jìn)行檢索,不僅能對(duì)每份標(biāo)本進(jìn)行檢索,而且能從10個(gè)角度或方面查詢標(biāo)本。例如:①植物種名發(fā)表的原始文獻(xiàn);②植物標(biāo)本隸屬的科、屬、種的名稱;③標(biāo)本的采集人;④標(biāo)本的產(chǎn)地;⑤標(biāo)本的生境;⑥標(biāo)本采集地的海拔高度;⑦植物的性狀;⑧花色;⑨模式類型;⑩植物用途。也可以采取多種或復(fù)合條件進(jìn)行查詢,如查詢某人在某地、某生境下采集的某科草本植物標(biāo)本,還可以對(duì)植物標(biāo)本的科、屬、種的數(shù)目和標(biāo)本份數(shù)進(jìn)行統(tǒng)計(jì)。

        系統(tǒng)操作以“菜單”的選擇方式進(jìn)行。先顯示出文件索引(調(diào)檔)、統(tǒng)計(jì)、檢索、排序、打印、貯存、編輯等主菜單;選擇了主菜單的某菜單項(xiàng)后,可點(diǎn)擊它,以顯示出下級(jí)的子菜單;再根據(jù)需要,在子菜單中進(jìn)行選項(xiàng)操作;如此逐層往復(fù),直至完成一次檢索,系統(tǒng)會(huì)返回到主菜單。系統(tǒng)易于掌握,使用方便。

        根據(jù)標(biāo)本管理的要求,將植物標(biāo)本管理軟件系統(tǒng)劃分為資料數(shù)據(jù)庫、表格圖形區(qū)和應(yīng)用程序區(qū)3個(gè)主要部分:(1)資料數(shù)據(jù)庫可分為輸入、標(biāo)準(zhǔn)查詢和輸出3個(gè)區(qū),其中輸入?yún)^(qū)供用戶手工輸入每份標(biāo)本的30項(xiàng)信息;標(biāo)準(zhǔn)查詢區(qū)供用戶建立欄位的查詢標(biāo)準(zhǔn),以滿足用戶不同的查詢要求;輸出區(qū)供用戶顯示各種檢索結(jié)果,可在顯示器上視閱,也可打印輸出。(2)表格圖形區(qū)可將輸出的任意植物標(biāo)本中每一項(xiàng)信息填入表格中,得到標(biāo)本信息的表格形式,或者可將輸出的某些數(shù)據(jù)加以統(tǒng)計(jì),獲得直觀的圖形顯示,這些表格或圖形也可打印輸出。(3)應(yīng)用程序區(qū)供存放應(yīng)用程序,應(yīng)用程序?qū)①Y料數(shù)據(jù)庫與表格圖形區(qū)聯(lián)系在一起,組成層狀疊套的“菜單”工作方式,使系統(tǒng)能按一定方式自動(dòng)進(jìn)行(圖2)。

        但是,限于當(dāng)時(shí)的技術(shù)水平,該系統(tǒng)也有不足之處。一是系統(tǒng)使用的是英文;二是系統(tǒng)采用的Lotus集成軟件具有一定局限性,植物標(biāo)本信息需分別存放于若干個(gè)庫中,使用前要根據(jù)所查詢標(biāo)本所在的科或?qū)龠M(jìn)行調(diào)庫,操作基本上按庫進(jìn)行;三是打印信息只能按已編好的格式進(jìn)行,而且用戶自行進(jìn)行組織打印格式比較復(fù)雜;四是受限于當(dāng)時(shí)的計(jì)算機(jī)容量等硬件條件,該系統(tǒng)只有標(biāo)本的文字信息,缺乏標(biāo)本的圖像信息,不能直觀地看到標(biāo)本圖像。

        考慮到電子產(chǎn)品的性能具有一定不穩(wěn)定性和標(biāo)本數(shù)據(jù)庫軟件系統(tǒng)的安全性,本館在進(jìn)行標(biāo)本數(shù)字化時(shí)首先將標(biāo)本信息進(jìn)行文字紙質(zhì)記錄,以作為數(shù)字化信息的一種傳統(tǒng)備份形式。

        本館首次開展的標(biāo)本數(shù)字化僅涉及模式標(biāo)本。之所以如此,一是模式標(biāo)本是一類比普通標(biāo)本更加重要和特殊的標(biāo)本,二是本館的模式標(biāo)本是單庫另存,便于試點(diǎn)和操作。但是,如同所有標(biāo)本館一樣,本館保存最多的標(biāo)本是普通標(biāo)本,對(duì)標(biāo)本館的管理和標(biāo)本查詢而言,更需要對(duì)普通植物標(biāo)本信息進(jìn)行數(shù)字化。然而,本館這一時(shí)期開發(fā)的標(biāo)本數(shù)據(jù)庫未涉及普通標(biāo)本。同時(shí),此數(shù)據(jù)庫僅有標(biāo)本的文本信息,而且數(shù)據(jù)庫開發(fā)尚未采用Internet技術(shù)——可使世界各地的用戶通過網(wǎng)絡(luò)直接查詢數(shù)據(jù)庫信息,能在更大范圍、更有效地實(shí)現(xiàn)標(biāo)本信息資源共享。

        盡管如此,這項(xiàng)工作在我國具有開先河性,為本館以及我國植物標(biāo)本館開展植物標(biāo)本數(shù)字化建設(shè)奠定了基礎(chǔ),而且本館植物模式標(biāo)本數(shù)據(jù)庫(名為MSBS)也被美國IOPI網(wǎng)站收載。這是當(dāng)時(shí)我國唯一一個(gè)被國外知名網(wǎng)站收載的植物標(biāo)本信息管理系統(tǒng),說明該項(xiàng)工作跟上了國外標(biāo)本館現(xiàn)代化管理的發(fā)展潮流。此后,我國其他部分植物標(biāo)本館聞息或來訪交流后,逐漸開始了植物標(biāo)本數(shù)字化軟件的開發(fā)工作??梢姳攫^在我國館藏標(biāo)本數(shù)字化啟動(dòng)階段中起到了示范或促進(jìn)作用。

        1.2 第二階段:開始普通標(biāo)本圖像數(shù)字化和標(biāo)本數(shù)字化規(guī)范建設(shè)

        1.2.1 參與國家科技部首次啟動(dòng)的植物標(biāo)本數(shù)字化項(xiàng)目——館藏植物標(biāo)本圖文信息系統(tǒng)建設(shè) 20世紀(jì)90年代,伴隨著數(shù)碼相機(jī)和掃描儀的興起,標(biāo)本圖像數(shù)字化成為標(biāo)本數(shù)字化的重要內(nèi)容。此時(shí),國外標(biāo)本館愈加重視標(biāo)本的數(shù)字化,不僅有了標(biāo)本圖像信息,而且標(biāo)本數(shù)字化的規(guī)模也越來越大。如阿拉巴馬大學(xué)于20世紀(jì)80年代末牽頭建設(shè)了美國東南部地區(qū)各小型標(biāo)本館的植物標(biāo)本信息系統(tǒng)SERFIS;1991年賓夕法尼亞州Carnegie博物館開始建設(shè)植物標(biāo)本數(shù)據(jù)庫;20世紀(jì)90年代初加利福尼亞大學(xué)Berkeley分校牽頭的美國西部地區(qū)加利福尼亞植物標(biāo)本管理系統(tǒng)SMASCH等。在此期間,本館在原有數(shù)據(jù)庫基礎(chǔ)上,開始普通標(biāo)本的數(shù)字化工作,同期國內(nèi)其他植物標(biāo)本館也紛紛開始建立自己的標(biāo)本數(shù)字化軟件系統(tǒng),如1994年中山大學(xué)植物標(biāo)本館與美國阿拉巴馬大學(xué)合作研制植物標(biāo)本數(shù)據(jù)庫,1995年中國科學(xué)院華南植物研究所標(biāo)本館開始嘗試建立植物標(biāo)本館數(shù)據(jù)庫,1997年在國家自然科學(xué)基金的資助下,中山大學(xué)標(biāo)本館與廣西植物研究所標(biāo)本館聯(lián)合研制共享標(biāo)本數(shù)據(jù)庫。與此同時(shí),中國科學(xué)院植物研究所標(biāo)本館也開始研發(fā)植物標(biāo)本管理系統(tǒng)。

        20世紀(jì)90年代末,科技部首次啟動(dòng)標(biāo)本數(shù)字化建設(shè)項(xiàng)目。1999年科技部基礎(chǔ)司同時(shí)資助了與植物標(biāo)本館的標(biāo)本數(shù)據(jù)庫有關(guān)的4個(gè)基礎(chǔ)性工作項(xiàng)目(由華東地區(qū)的江蘇省中國科學(xué)院植物研究所、華南地區(qū)的中山大學(xué)、西南地區(qū)的四川大學(xué)和東北地區(qū)的東北師范大學(xué)等單位承擔(dān)),并加以合并,形成由4個(gè)單位共同參與建設(shè)的“植物標(biāo)本信息系統(tǒng)”項(xiàng)目,本館為參與單位之一。同年12月,科技部在中山大學(xué)主持召開了由廣東省科委、4個(gè)參建單位以及特邀的中國科學(xué)院植物研究所和華南植物研究所等單位的領(lǐng)導(dǎo)和科研人員(共36人)參加的專題討論會(huì),以期統(tǒng)一數(shù)據(jù)庫的規(guī)范,為今后數(shù)據(jù)共享打下基礎(chǔ),建成的信息系統(tǒng)可以在全國通用。會(huì)上同時(shí)演示了中山大學(xué)基于Access系統(tǒng)軟件和中國科學(xué)院植物研究所基于Foxfro系統(tǒng)軟件各自開發(fā)的植物標(biāo)本信息系統(tǒng)數(shù)據(jù)庫,2個(gè)軟件平臺(tái)各有利弊,但都能適應(yīng)或滿足當(dāng)時(shí)的發(fā)展需求,會(huì)議最后確定各單位可以根據(jù)自身需要任選其中之一。這次會(huì)議標(biāo)志著植物標(biāo)本數(shù)字化以及建立信息系統(tǒng)平臺(tái)引起了國家的重視,并有意向標(biāo)準(zhǔn)化、共享和普及推進(jìn),成為后來國家科技部啟動(dòng)植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)項(xiàng)目的基礎(chǔ)。

        隨后,項(xiàng)目組以中山大學(xué)生命科學(xué)學(xué)院標(biāo)本館為主,聯(lián)合研制了植物標(biāo)本信息共享數(shù)據(jù)庫,并擬定了植物標(biāo)本信息錄入內(nèi)容的試行標(biāo)準(zhǔn),以及可選項(xiàng)及其錄入內(nèi)容。

        在該項(xiàng)目支持下, 本館以此系統(tǒng)為基礎(chǔ)開展了館內(nèi)普通植物標(biāo)本的數(shù)字化——標(biāo)本文本和圖像數(shù)字化,其中植物標(biāo)本數(shù)據(jù)庫的錄入系統(tǒng)采用的是“植物標(biāo)本信息系統(tǒng)4.4”(李鳴光, 2000),共完成了4萬份普通標(biāo)本信息的錄入,包括標(biāo)本的文字信息和圖像信息,并采用光盤和硬盤保存。為了保證數(shù)據(jù)的安全,所有數(shù)據(jù)分別采用了系統(tǒng)、光盤和硬盤的雙備份(圖4)與之前本館開發(fā)的植物模式標(biāo)本數(shù)據(jù)庫相比,本數(shù)據(jù)庫具有如下的特點(diǎn)和改進(jìn):(1)為了適應(yīng)我國各標(biāo)本館仍以個(gè)人電腦為主的現(xiàn)狀,該數(shù)據(jù)庫基于個(gè)人電腦,并以微軟公司的Access軟件為平臺(tái)開發(fā)。(2)除了進(jìn)行標(biāo)本文字信息數(shù)字化,還對(duì)標(biāo)本圖像進(jìn)行數(shù)字化(數(shù)碼圖像),但受限于當(dāng)時(shí)數(shù)碼相機(jī)的成像技術(shù),圖片像素只有300萬。(3)標(biāo)本信息中增加了標(biāo)本鑒定的歷史記錄,即將標(biāo)本上不同時(shí)期的所有鑒定標(biāo)簽信息(包括學(xué)名、鑒定人和鑒定時(shí)間)均全部錄入數(shù)據(jù)庫。(4)數(shù)據(jù)庫服務(wù)器軟硬件配置有了明顯的提升。此時(shí)已有了Microsoft windows 2000 server version網(wǎng)絡(luò)服務(wù)器操作系統(tǒng)、Microsoft SQL Server數(shù)據(jù)庫管理系統(tǒng)、雙硬盤的服務(wù)器等,同時(shí)數(shù)據(jù)保存條件也有了極大改進(jìn),存貯性能和容量有明顯提高(如光盤和移動(dòng)硬盤)。(5)新開發(fā)的標(biāo)本數(shù)據(jù)庫是教學(xué)和科研兩大系統(tǒng)的多個(gè)單位合作形成的,兼顧多方需求和特點(diǎn),適應(yīng)性強(qiáng),便于推廣使用。

        1.2.2 參與中國科學(xué)院的生物標(biāo)本信息系統(tǒng)建設(shè)項(xiàng)目——江蘇省中國科學(xué)院植物研究所植物標(biāo)本數(shù)據(jù)庫建設(shè) 2000年,中國科學(xué)院生物局開展了生物標(biāo)本館網(wǎng)絡(luò)建設(shè)項(xiàng)目。本館作為參與建設(shè)單位承擔(dān)了本所標(biāo)本館網(wǎng)絡(luò)信息系統(tǒng)建設(shè)任務(wù),其中植物標(biāo)本數(shù)據(jù)庫建設(shè)作為獨(dú)立的部分,重點(diǎn)是進(jìn)行標(biāo)本數(shù)字化。由于該項(xiàng)目恰巧與科技部的“標(biāo)本館基礎(chǔ)設(shè)施維修改造及信息網(wǎng)絡(luò)建設(shè)”項(xiàng)目相銜接或相近,因此實(shí)際上這2個(gè)項(xiàng)目有部分套合,但又有所改進(jìn)。

        在該項(xiàng)目的錄入工作中,標(biāo)本文字信息或數(shù)據(jù)項(xiàng)共有20個(gè):標(biāo)本館代碼、標(biāo)本流水號(hào)(臺(tái)紙?zhí)枺?、拉丁科名、拉丁屬名、拉丁種名、種下等級(jí)拉丁名、定名人、模式標(biāo)本類型、采集人、采集號(hào)、采集時(shí)間、采集地[包括國家、省、縣、具體采集地(如鄉(xiāng)鎮(zhèn)、水系、山體、景區(qū)等)]、生境、海拔、經(jīng)度、緯度、鑒定人、鑒定日期、標(biāo)本照片、備注等。此外,數(shù)據(jù)庫中的標(biāo)本信息還包括圖像信息,其中普通標(biāo)本每個(gè)物種(包括種下等級(jí))須包括1張標(biāo)本整體實(shí)物照片,模式標(biāo)本原則上須附1張標(biāo)本整體實(shí)物照片。

        在該項(xiàng)目的支持下,本館共完成了8萬份標(biāo)本的數(shù)字化,包括館藏模式標(biāo)本、蕨類植物和裸子植物兩大類群的全部標(biāo)本以及被子植物部分科的部分標(biāo)本。每份標(biāo)本附圖片1張, 并且每份標(biāo)本附有唯一的條形碼,而標(biāo)本圖片與文字?jǐn)?shù)據(jù)通過標(biāo)本條形碼一一對(duì)應(yīng)。通過該項(xiàng)目,本館初步建設(shè)了具有一定規(guī)模的植物標(biāo)本信息數(shù)據(jù)庫,并且該數(shù)據(jù)庫可通過網(wǎng)絡(luò)進(jìn)行標(biāo)本信息查詢。

        此次開展的標(biāo)本數(shù)字化項(xiàng)目,與前述的兩次數(shù)據(jù)庫建設(shè)相比,在如下幾方面有不同或改進(jìn)。

        (1)在標(biāo)本信息內(nèi)容上有別于其他標(biāo)本館:① 將館代碼編入標(biāo)本條形碼中,即館代碼+8位數(shù)字編碼,如NAS00003450,以便與其他標(biāo)本館的標(biāo)本區(qū)別或進(jìn)行網(wǎng)絡(luò)平臺(tái)檢索時(shí)能區(qū)分出本館的標(biāo)本;② 增加了本館的標(biāo)本流水號(hào)(即臺(tái)紙編號(hào)),因?yàn)楸攫^的標(biāo)本臺(tái)紙流水號(hào)在館內(nèi)是唯一的,而且流水號(hào)的先后次序表明每一份標(biāo)本裝訂時(shí)的先后時(shí)間和次序,可以從一個(gè)側(cè)面反映標(biāo)本入館的時(shí)期和館藏的歷史階段;③ 增加了備注,用以記錄標(biāo)本上采集信息和鑒定信息以外的其他文字說明,以及錄入標(biāo)本信息時(shí)需要對(duì)標(biāo)本進(jìn)行必要的補(bǔ)充說明。

        (2)標(biāo)本信息全部提供給中國科學(xué)院的標(biāo)本信息網(wǎng)絡(luò)平臺(tái),供網(wǎng)絡(luò)查詢。

        (3)標(biāo)本實(shí)物采用數(shù)碼相機(jī)進(jìn)行拍攝記錄,圖片的像素達(dá)到500萬。但根據(jù)網(wǎng)絡(luò)平臺(tái)要求,限于平臺(tái)的容量,真正上網(wǎng)的圖片經(jīng)過壓縮,僅有200 K。

        (4)第一次采取了館內(nèi)與館外、在職與非在職人員相結(jié)合的方式共同開展和完成相關(guān)工作。

        (5)本館標(biāo)本的保存采用的是具軌集裝箱式密集柜方式,并且標(biāo)本庫內(nèi)空間有限,標(biāo)本數(shù)字化不宜在庫內(nèi)隨取隨錄,需在庫外進(jìn)行。因此,為了最大限度地保護(hù)標(biāo)本,減少標(biāo)本移動(dòng)次數(shù),在標(biāo)本的鑒定基礎(chǔ)上,采取標(biāo)本整理與標(biāo)本圖像拍攝合一、標(biāo)本文字信息直接錄自標(biāo)本圖片、文字信息校對(duì)直接參照標(biāo)本圖像信息的做法。只有當(dāng)錄入信息有誤時(shí),才按條形碼回庫查找標(biāo)本。

        (6)結(jié)合標(biāo)本數(shù)字化,對(duì)館內(nèi)標(biāo)本加強(qiáng)了精細(xì)化管理。在此次標(biāo)本數(shù)字化的過程中,除了對(duì)尚無種名的已裝訂標(biāo)本集中進(jìn)行物種鑒定,還對(duì)館內(nèi)已有種類鑒定信息的標(biāo)本進(jìn)一步精細(xì)化管理,重點(diǎn)開展了4個(gè)方面的工作: ① 對(duì)標(biāo)本上原有信息進(jìn)行審核認(rèn)定,查閱有關(guān)資料,弄清每個(gè)信息的來源和正誤,包括標(biāo)本上文字的書寫辨析和確認(rèn);② 結(jié)合標(biāo)本鑒定和標(biāo)本圖像采集,對(duì)館內(nèi)標(biāo)本進(jìn)行全面的次序整理,對(duì)于錯(cuò)誤鑒定的標(biāo)本,根據(jù)新定種名進(jìn)行必要的位置調(diào)整;③ 對(duì)于破損標(biāo)本進(jìn)行補(bǔ)救,尤其是有一些老標(biāo)本使用頻率高,加上早期保存條件有限,急需補(bǔ)損補(bǔ)缺;④ 對(duì)于早期標(biāo)本的采集信息,由于記載簡約、地名更替、記錄丟失等不同歷史原因,重點(diǎn)進(jìn)行了查考。

        (7)由于標(biāo)本信息數(shù)據(jù)量大,這些信息的保存開始采用了DVD光盤和大容量移動(dòng)硬盤。

        1.3 第三階段:植物標(biāo)本批量數(shù)字化與信息共享平臺(tái)的快速發(fā)展時(shí)期

        1.3.1 參與科技部的“植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)建設(shè)”項(xiàng)目(I期) 2004至2008年,本館參加了國家科技部項(xiàng)目“植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)建設(shè)”(I期)。對(duì)于本館而言,這是標(biāo)本數(shù)字化的第三階段。

        經(jīng)過近10年的發(fā)展,我國各個(gè)標(biāo)本館的標(biāo)本數(shù)字化軟件和硬件條件都得到了改善,植物標(biāo)本信息系統(tǒng)開發(fā)也逐漸成熟。在此期間,科技部更是積極推進(jìn)這項(xiàng)事業(yè)。在1999年啟動(dòng)了“植物標(biāo)本信息管理系統(tǒng)”項(xiàng)目之后,2000年又在四川大學(xué)主持召開了“實(shí)物數(shù)據(jù)共享研討會(huì)”,在原有參與單位的基礎(chǔ)上增加了中國科學(xué)院動(dòng)物研究所、中國科學(xué)院細(xì)胞研究所、中國醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所和中國地質(zhì)大學(xué)4個(gè)單位。本館參與了該會(huì)議。此會(huì)為科技部提出“植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)建設(shè)”項(xiàng)目做了充分的準(zhǔn)備。

        本館作為重要的參與單位之一參加了該項(xiàng)目。在此期間,根據(jù)項(xiàng)目的要求,標(biāo)本數(shù)字化采用的是中國科學(xué)院植物研究所生態(tài)中心包伯堅(jiān)先生等人研發(fā)的輸錄軟件系統(tǒng)——植物標(biāo)本數(shù)據(jù)管理軟件(網(wǎng)絡(luò)版) Davidia 2.0及Davidia 3.0(圖5),將植物標(biāo)本的采集信息、鑒定信息以及標(biāo)本的圖像信息進(jìn)行了數(shù)字化。在此期間,本館共完成了30萬份普通標(biāo)本的數(shù)字化。所有標(biāo)本的數(shù)據(jù)(文字和圖像)均提交至項(xiàng)目管理和共享平臺(tái)中心,其中本館的圖像數(shù)據(jù)均采用移動(dòng)硬盤保存。

        1.3.2 繼續(xù)參加“植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)建設(shè)”項(xiàng)目(Ⅱ期) 從2009年至今,本館繼續(xù)參與了科技部的標(biāo)本數(shù)字化項(xiàng)目(Ⅱ期),并成為國家數(shù)字植物標(biāo)本館(CVH)平臺(tái)建設(shè)的主要標(biāo)本館之一。通過該平臺(tái),本館完成的數(shù)字化標(biāo)本信息向社會(huì)公開,并借以此平臺(tái)與教學(xué)平臺(tái)和保護(hù)區(qū)平臺(tái)合并后構(gòu)建的國家標(biāo)本資源共享平臺(tái)NSII,進(jìn)一步擴(kuò)大了這些標(biāo)本的共享范圍和價(jià)值。

        從2009至2012年,本館標(biāo)本數(shù)字化錄入采用的是中國科學(xué)院植物研究所包伯堅(jiān)等人研發(fā)的植物標(biāo)本錄入查詢軟件Ginkgo 3(單機(jī)版)以及后期的在線錄入信息系統(tǒng),繼續(xù)對(duì)普通標(biāo)本進(jìn)行數(shù)字化。其中本館于2010年后開始在以往開展標(biāo)本數(shù)字化的基礎(chǔ)上,對(duì)原有數(shù)據(jù)進(jìn)行補(bǔ)充和修訂,以及數(shù)據(jù)庫的維護(hù)和升級(jí)。2013年開始,重點(diǎn)開展了下列多類標(biāo)本的圖文數(shù)字化,包括全部單子葉類群的標(biāo)本、西藏植物專項(xiàng)采集的標(biāo)本、新編《江蘇植物志》連續(xù)多年普查的標(biāo)本、鄔文祥先生家人捐贈(zèng)的標(biāo)本、薔薇科和菊科新鑒定的標(biāo)本,以及近年新采集的標(biāo)本。在此期間共完成12.5萬份標(biāo)本的數(shù)字化。此時(shí)標(biāo)本圖像的拍攝設(shè)備有了很大改善(圖6),圖片的像素和質(zhì)量都有了進(jìn)一步的提升。

        1.4 第四階段:植物標(biāo)本數(shù)字化信息的維護(hù)與優(yōu)化

        時(shí)至今日,本館已數(shù)字化的標(biāo)本共約50萬份,其中包括蕨類植物39科2.06萬份、裸子植物10科6 951份、被子植物230科47.24萬份,其中模式標(biāo)本4 000余份。但是,本館的標(biāo)本數(shù)字化工作遠(yuǎn)沒有結(jié)束,其中重要的工作之一就是對(duì)已經(jīng)數(shù)字化的標(biāo)本信息進(jìn)行維護(hù)和優(yōu)化,尤其對(duì)于早期數(shù)字化的標(biāo)本,或作信息補(bǔ)充、糾正,或進(jìn)行圖像更新等。這是本館植物標(biāo)本數(shù)字化建設(shè)的最重要階段,也是今后相當(dāng)長一段時(shí)間內(nèi)的重點(diǎn)工作。

        1.4.1 館藏植物模式標(biāo)本高精度數(shù)字化 20世紀(jì)80年代,本館的植物標(biāo)本數(shù)字化工作始于模式標(biāo)本的數(shù)字化。但彼時(shí)植物標(biāo)本數(shù)字化工作屬于起步階段,有許多不完善:一是僅記錄了標(biāo)本采集和鑒定的文字信息;二是尚無標(biāo)本圖像信息;三是僅對(duì)少量標(biāo)本進(jìn)行了數(shù)字化信息采集。

        隨著本館標(biāo)本數(shù)字化的不斷深入和硬件設(shè)備的改進(jìn),在開展“植物標(biāo)本標(biāo)準(zhǔn)化整理、整合及共享平臺(tái)建設(shè)”項(xiàng)目的同時(shí),另行專項(xiàng)重新對(duì)館藏植物模式標(biāo)本進(jìn)行了數(shù)字化——標(biāo)本圖像高精度數(shù)字化。此次數(shù)字化工作,采用了共享平臺(tái)提供的、量身定做的標(biāo)本掃描儀采集圖像信息(圖7),像素可達(dá)到6 000萬。在該項(xiàng)目的支持下,共完成了4 000份模式標(biāo)本的高精度數(shù)字化。此次模式標(biāo)本圖像數(shù)字化是在第一次模式標(biāo)本數(shù)字化基礎(chǔ)上的升級(jí)版,無論在模式標(biāo)本的數(shù)量上還是在圖像質(zhì)量上都有了全面的提升,極大提高了模式標(biāo)本的利用效率和價(jià)值。

        與第一次模式標(biāo)本數(shù)字化工作相比,有2個(gè)重要進(jìn)展:一是所有的標(biāo)本都進(jìn)行了高像素的掃描;二是所有標(biāo)本都按種類附上新種發(fā)表原始文獻(xiàn)的掃描版(圖8)。同時(shí)還有兩個(gè)特點(diǎn):一是采用了掃描儀獲取圖像信息,像素精度有了極大提高;二是每份標(biāo)本既有高像素的標(biāo)本圖片,也有新種發(fā)表原始文獻(xiàn)的圖片,完全不同于普通標(biāo)本的數(shù)字化。

        1.4.2 館藏標(biāo)本早期數(shù)字化信息與圖像的更新優(yōu)化 本館標(biāo)本數(shù)字化起步比較早,開展圖像數(shù)字化的時(shí)間跨度也比較長,館內(nèi)保存的不同時(shí)期的數(shù)字化標(biāo)本圖像在質(zhì)量上存在很大差異。相比之下,早期拍攝的圖片質(zhì)量普遍不佳,像素較小、分辨率低,主要是當(dāng)時(shí)的數(shù)碼相機(jī)分辨率不高,同時(shí)與標(biāo)本拍攝經(jīng)驗(yàn)和拍攝條件有關(guān),但這部分照片的數(shù)量有限。就數(shù)碼相機(jī)而言,從當(dāng)初的富士、柯達(dá),到現(xiàn)在使用的Canon 5DSr,其中經(jīng)歷了多代更新,像素分辨率從原來的100萬到目前的5 000萬,相差50倍。此外,早期數(shù)碼相機(jī)拍攝的標(biāo)本照片,雖然原圖清晰,但放大后部分細(xì)微結(jié)構(gòu)的清晰度已遠(yuǎn)不如當(dāng)今高清晰的數(shù)碼相機(jī)。由于現(xiàn)在拍攝條件有了很大的改善,對(duì)于早期拍攝的少量標(biāo)本進(jìn)行必要的復(fù)拍。

        與上相似,本館的標(biāo)本數(shù)字化經(jīng)歷了不同發(fā)展時(shí)期、采用不同數(shù)據(jù)庫及其標(biāo)準(zhǔn),一些條目和規(guī)定有一定的差異,加之本館保存的許多早期采集的標(biāo)本的信息甄別和錄入比較困難,諸如手寫文字不易辨認(rèn)(主要源于手寫字體不規(guī)整、不規(guī)范或潦草,還因標(biāo)本年代久遠(yuǎn)而字痕變淡),非英文的外文采集信息難以辨識(shí)和錄入,紀(jì)年隨時(shí)代和個(gè)人習(xí)慣變更而不同,地名隨時(shí)代變更而變得難以考證等等,導(dǎo)致有些標(biāo)本信息需要考證或糾正。這些數(shù)據(jù)錯(cuò)誤中,除少量采集人、鑒定人名錯(cuò)誤能夠通過批量處理來修改以外,其他均需人工校對(duì),投入更多時(shí)間,提高早期數(shù)據(jù)的質(zhì)量。

        1.4.3 開展全國江蘇標(biāo)本信息的專家核查 中國國家標(biāo)本網(wǎng)絡(luò)平臺(tái)的標(biāo)本數(shù)據(jù)來自國內(nèi)各個(gè)研究單位和教學(xué)單位的標(biāo)本館/室,參與人員廣泛,標(biāo)本來源復(fù)雜,標(biāo)本信息質(zhì)量難免參差不齊,需要提高準(zhǔn)確率。作為我國國家標(biāo)本網(wǎng)絡(luò)平臺(tái)標(biāo)本信息數(shù)據(jù)的主要參建單位之一,理應(yīng)在這方面有所貢獻(xiàn);身為華東及江蘇的標(biāo)本館,更應(yīng)該加強(qiáng)江蘇標(biāo)本的核查。近年來,本館除了繼續(xù)推進(jìn)庫存標(biāo)本數(shù)字化工作,還開始對(duì)包括本館早期錄入在內(nèi)的、網(wǎng)絡(luò)平臺(tái)上已有(含國內(nèi)其他標(biāo)本館錄入)的江蘇標(biāo)本信息進(jìn)行清理與核查,例如,2021年起我館開展了NSII平臺(tái)中江蘇地區(qū)全部標(biāo)本數(shù)據(jù)的專家核查工作(不含花果、樹皮等非主要檢索性狀),對(duì)其進(jìn)行清理校對(duì)。一方面用以支持區(qū)域植物學(xué)、生物多樣性等方面的研究工作,另一方面可指導(dǎo)本館后續(xù)的標(biāo)本采集與數(shù)字化的方向。

        2 本館標(biāo)本數(shù)字化的深化與利用

        截止到2018年,本館標(biāo)本數(shù)字化工作僅局限于將標(biāo)本圖片數(shù)字化,以及采集和鑒定的文本信息數(shù)字化。但對(duì)于植物研究者來說,這些工作及其信息有一定的局限性;對(duì)于標(biāo)本館的數(shù)字化管理而言,這些工作和信息有待完善和提高。有鑒于此,根據(jù)館內(nèi)標(biāo)本收藏特點(diǎn)和數(shù)字化現(xiàn)狀,本館從2018年開始,在對(duì)余下的標(biāo)本繼續(xù)進(jìn)行常規(guī)標(biāo)準(zhǔn)的圖文數(shù)字化的同時(shí),加強(qiáng)了標(biāo)本數(shù)字化的信息深化工作,重點(diǎn)對(duì)已有數(shù)字化的標(biāo)本信息進(jìn)行發(fā)掘與利用。

        2.1 開展江蘇省標(biāo)本數(shù)字化網(wǎng)絡(luò)平臺(tái)建設(shè)——省級(jí)數(shù)字標(biāo)本館

        2018至2019年,本館參加了NSII平臺(tái)的省級(jí)數(shù)字植物標(biāo)本館聯(lián)盟,籍于此創(chuàng)建了省級(jí)數(shù)字植物標(biāo)本館Web平臺(tái)(簡稱PVH)(圖9),為開展本省植物研究的研究者提供植物名錄的編輯與維護(hù),以及名錄參考的標(biāo)本庫、圖像庫、文獻(xiàn)庫的在線維護(hù)與管理等服務(wù),形成開放式的區(qū)域植物學(xué)研究平臺(tái)。其要點(diǎn):一是根據(jù)新版《江蘇植物志》(2013—2015)與文獻(xiàn),整理并上傳江蘇植物基礎(chǔ)名錄(每種均有出處),包括蕨類植物、裸子植物和被子植物共計(jì)235科1 240屬3 494種;二是對(duì)所有植物種類的憑證標(biāo)本進(jìn)行了審核,共計(jì)14.9萬份,其中對(duì)2 037種指定了2 804份憑證標(biāo)本;三是開展了江蘇植物的原色圖像庫建設(shè),并上傳了1 318種的彩色圖片共計(jì)4 182張。

        2.2 開發(fā)江蘇植物時(shí)空分布可視化軟件

        為了利用標(biāo)本館數(shù)字化建設(shè)的優(yōu)勢(shì),為植物研究者提供更加豐富的地方性植物分布信息,為地方建設(shè)發(fā)揮應(yīng)有的作用,在上述工作的基礎(chǔ)上,本館開展了江蘇地區(qū)植物時(shí)空分布規(guī)律與變化的分析,同時(shí)與軟件公司合作,開發(fā)了標(biāo)本時(shí)空分布的可視化軟件——維管植物標(biāo)本時(shí)空分布可視化系統(tǒng)(圖10)。目前,該軟件的制作已經(jīng)完成。將校準(zhǔn)、“清洗”過的標(biāo)本數(shù)據(jù)導(dǎo)入軟件后,可以實(shí)現(xiàn):(1)在指定時(shí)間段內(nèi),基于標(biāo)本采集數(shù)量和物種數(shù),估算出實(shí)際物種數(shù)量,并投射在本省的網(wǎng)格化地圖上;(2)可對(duì)比指定的兩個(gè)時(shí)間段內(nèi)各網(wǎng)格化區(qū)域中物種數(shù)量的增減;(3)可展示各時(shí)間段中各科的占比。

        3 開展標(biāo)本采集—入庫全過程數(shù)字化

        為了加強(qiáng)館內(nèi)工作暨標(biāo)本的信息化管理,從2019年開始,本館開始采用時(shí)任中國科學(xué)院昆明植物研究所標(biāo)本館館員的徐洲鋒工程師開發(fā)的“Biotracks”手機(jī)App、“標(biāo)本館助手”和“Kingdonia”系列軟件,實(shí)現(xiàn)野外標(biāo)本采集至入庫全過程的標(biāo)本信息化管理(圖11)。

        本館的做法大體如下:(1)在野外采集標(biāo)本的同時(shí),應(yīng)用“Biotracks”手機(jī)App同步記錄采集信息,包括采集的時(shí)間、地點(diǎn)和地理坐標(biāo),以及采集人、采集號(hào)和植物性狀信息,還有采集軌跡和同步拍攝的植物數(shù)碼照片(每份標(biāo)本的實(shí)物及其生境);壓制標(biāo)本時(shí),可補(bǔ)充野外記錄以及相關(guān)標(biāo)注(如留存DNA樣本)。這些信息可同步到服務(wù)器,同時(shí)整理所有數(shù)碼照片至按標(biāo)本采集號(hào)命名的文件夾。(2)標(biāo)本鑒定后,自“Biotracks”下載當(dāng)次野外采集全部記錄,生成Excel文本,錄入相應(yīng)鑒定信息,并使用“標(biāo)本館助手”程序,將其統(tǒng)一為DarwinCore格式的表格,并轉(zhuǎn)換為打印格式,打印一份留作采集記錄存檔,另外根據(jù)采集份數(shù)打印帶條碼格式的采集-鑒定合并記錄簽。(3)標(biāo)本經(jīng)裝訂和再次冷凍殺蟲后,即可入中轉(zhuǎn)庫,進(jìn)行數(shù)碼照片的拍攝。標(biāo)本采集信息通過“標(biāo)本館助手”轉(zhuǎn)化,生成Kingdonia可讀取格式后,上傳至Kingdonia標(biāo)本管理平臺(tái)的緩沖區(qū),即可與上傳至Kingdonia的標(biāo)本照片自動(dòng)識(shí)別及匹配。標(biāo)本數(shù)據(jù)經(jīng)人工審核與校錯(cuò)后,便可以釋放至公共數(shù)據(jù)庫,也可以其他格式導(dǎo)出保存,提交或共享至其他平臺(tái)。目前,由于本館原采集數(shù)據(jù)關(guān)鍵檢索詞的分割方式與Kingdonia平臺(tái)不同,且舊數(shù)碼相片的像素?zé)o法滿足平臺(tái)自動(dòng)識(shí)別與關(guān)聯(lián)的要求,需要大量人工處理的工作,目前這部分工作尚在進(jìn)行中。

        Kingdonia平臺(tái)除了能讓標(biāo)本采集至入庫的流程更系統(tǒng)化以外,也可添加標(biāo)本對(duì)應(yīng)的野外照片,并自動(dòng)關(guān)聯(lián)“Biotracks”中野外記錄標(biāo)本信息時(shí)拍攝的照片。這就為標(biāo)本查閱者提供了該植物更翔實(shí)豐富的外部形態(tài)信息,也可作為文本信息中“生境”信息的補(bǔ)充。同時(shí),Kingdonia與“標(biāo)本館助手”的配套使用也為標(biāo)本提供了庫區(qū)內(nèi)定位的功能,能夠通過在庫內(nèi)掃描網(wǎng)格二維碼及標(biāo)本條形碼,來標(biāo)注標(biāo)本在庫區(qū)內(nèi)的位置及出入庫情況,避免了過去清理和借還標(biāo)本時(shí)因疏漏而導(dǎo)致標(biāo)本無法查找乃至遺失的問題。這項(xiàng)工作的開展,極大提高了標(biāo)本管理的效率。由于本館標(biāo)本數(shù)量較大,因此目前該工作正在起步階段。

        4 結(jié)論

        本館是我國開展植物標(biāo)本數(shù)字化最早的標(biāo)本館,也是我國最有代表性的植物標(biāo)本館, 標(biāo)本數(shù)字化工作前后經(jīng)歷了四個(gè)發(fā)展階段,包括20世紀(jì)80年代末嘗試標(biāo)本文字信息數(shù)字化的起步階段,20世紀(jì)90年代末的標(biāo)本圖像數(shù)字化和文字信息數(shù)字化規(guī)范階段,2004年后的標(biāo)本批量信息化以及信息網(wǎng)絡(luò)共享的快速發(fā)展階段,以及2018年后的已有標(biāo)本數(shù)字化信息維護(hù)與優(yōu)化階段,其中第一個(gè)階段對(duì)我館的數(shù)字化建設(shè)有著重要的意義,是國內(nèi)其他標(biāo)本館未經(jīng)歷過的。作為我國植物標(biāo)本數(shù)字化網(wǎng)絡(luò)平臺(tái)(CVH和NSII)建設(shè)的重要單位之一,本館進(jìn)行的數(shù)字化標(biāo)本信息已經(jīng)共享于平臺(tái),而且也開始數(shù)字化標(biāo)本信息的深化工作。但是,截至目前,數(shù)字化工作主要局限于將標(biāo)本圖片和文本信息的數(shù)字化,國內(nèi)其他標(biāo)本館也幾乎類似。從標(biāo)本館的數(shù)字化管理和開展的研究看,仍存在一些不足和問題,例如:(1)標(biāo)本文本信息化過程中標(biāo)準(zhǔn)化程度不高,導(dǎo)致關(guān)鍵詞檢索匹配度較低,甚至出現(xiàn)錯(cuò)誤;(2)標(biāo)本采集制作過程中,更多有價(jià)值的信息未錄入數(shù)據(jù)庫,包括采集時(shí)拍攝的大量生境、伴生植物和植物分類特征細(xì)節(jié)等的數(shù)碼照片,無法展現(xiàn)給查閱者;(3)目前的數(shù)字化工作并未備注其在實(shí)體館中的位置,無法實(shí)現(xiàn)館內(nèi)庫區(qū)的信息化管理;(4)可提供數(shù)據(jù)統(tǒng)計(jì)分析的平臺(tái)尚未完善,不足以支撐更多的應(yīng)用需求。由此可見,時(shí)至今日,雖然本館的館藏標(biāo)本數(shù)字化工作從館藏量上看已近完成,但是標(biāo)本數(shù)字化的工作仍任重道遠(yuǎn),不僅尚有部分標(biāo)本(與之前已數(shù)字化的標(biāo)本相比在信息完善上往往要花費(fèi)更多的時(shí)間和精力)未及時(shí)進(jìn)行數(shù)字化,而且標(biāo)本數(shù)字化信息的維護(hù)、優(yōu)化、發(fā)掘、利用則剛剛開始。

        致謝 本館植物標(biāo)本數(shù)字化工作得到標(biāo)本館和信息中心許多同仁的參與和幫助,如劉心恬高級(jí)實(shí)驗(yàn)師作為早中期階段的主要成員負(fù)責(zé)了數(shù)據(jù)的整理與核查;鄧懋彬研究員為該項(xiàng)工作鑒定了大量的標(biāo)本,解決了許多信息錄入過程中的書寫疑問;姚淦工程師和徐增萊研究員在后期階段的標(biāo)本信息錄入過程中,在疑難標(biāo)本的鑒定以及文字識(shí)別方面給予了很多幫助;陳岳高級(jí)工程師隨時(shí)解決軟硬件出現(xiàn)的問題;熊豫寧和馬振秀參與標(biāo)本的整理,做了大量工作。正因?yàn)樯鲜龈魑坏拇罅f(xié)助,使得本館的標(biāo)本數(shù)字化得以順利開展,在此一并表示誠摯的感謝。

        參考文獻(xiàn):

        LI MG, 2000. Plant specimen information system 4.4: system management [J]. Acta Sci Nat Univ Sunyatseni, 2: 29.? [李鳴光, 2000. 植物標(biāo)本信息系統(tǒng)4.4: 系統(tǒng)管理 [J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版), 2: 29.]

        LI MG,MIAO RH, XU ZR, et al., 2000. Plant specimen database and biodiversity research [M]// Biodiversity Community, Chinese Academy of Sciences. Biodiversity conservation in China facing the 21st century. Beijing: China Forestry Press: 450-454.? [李鳴光, 繆汝槐,? Zhaoran XU, 2000. 植物標(biāo)本數(shù)據(jù)庫與生物多樣性研究 [M]//中國科學(xué)院生物多樣性委員會(huì). 面向21世紀(jì)的中國生物多樣性保護(hù). 北京: 中國林業(yè)出版社: 450-454.]

        LI MG, XU ZR, GUAN DF, et al., 1995. Conceptual issues in the development of English-Chinese bilingual botanical databases [J]. Acta Sci Nat Univ Sunyatseni, 34(4): 76-81.? [李鳴光, Zhaoran XU, 關(guān)朵霏, 等, 1995. 植物標(biāo)本漢英雙語數(shù)據(jù)庫管理系統(tǒng)的概念與實(shí)踐 [J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版), 34(4): 76-81.]

        LING PP, TANG JS, 1988. The microcomputer management system of specimens in Jiangsu Institute of Botany [M]//Bulletin of Nanjing Botanical Garden Mem. Sun Yat-Sen 1987. Nanjing: Jiangsu Technology and Science Press: 39-42.? [凌萍萍, 湯儆杉, 1988. 江蘇省植物研究所微型計(jì)算機(jī)植物標(biāo)本管理系統(tǒng) [M]//南京中山植物園研究論文集1987. 南京: 江蘇科學(xué)技術(shù)出版社: 39-42.]

        MA B, LI ML, LIU JK, et al., 2001. The construction of Sichuan University botanical specimen database [J]. J Sichuan Univ (Nat Sci Ed), 38(6): 839-843.? [馬波, 李夢(mèng)龍, 劉冀昆, 等, 2001. 四川大學(xué)植物標(biāo)本館館藏標(biāo)本網(wǎng)絡(luò)數(shù)據(jù)庫的構(gòu)建 [J]. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版), 38(6): 839-843.]

        PANKHURST R, 1993. Taxonomic databases: the PANDORA System [M]//FORTUNER R. Advances in computer methods for systematic biology. Baltimore: The Johns Hopkins University Press: 229-590.

        SHETLER SG, 1973. An introduction to the botanical type specimen register [M]. Washington: Smithsonian Institution Press: 1-25.

        SOBEEON J, 1999. Linking biodiversity information sources [J]. Trends Ecol Evol, 14: 291.

        WANG LS, CHEN B, JI LQ, et al., 2010. Progress in biodiversity informatics [J]. Biodivers Sci,18(5): 429-443.? [王利松, 陳彬, 紀(jì)力強(qiáng), 等, 2010. 生物多樣性信息學(xué)研究進(jìn)展 [J]. 生物多樣性, 18(5): 429-443.]

        XU PG, 1992. The first biological research institute in China [J]. Chin Mater Sci Technol, 13(2): 47-57.? [薛攀皋, 1992. 中國科學(xué)社生物研究所——中國最早的生物學(xué)研究機(jī)構(gòu) [J]. 中國科技史料, 13(2): 47-57.]

        (責(zé)任編輯 蔣巧媛 鄧斯麗)

        猜你喜歡
        江蘇省數(shù)據(jù)庫數(shù)字化
        家紡業(yè)亟待數(shù)字化賦能
        江蘇省交通圖
        江蘇年鑒(2021年0期)2021-03-09 05:19:44
        高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
        高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
        江蘇省政區(qū)圖
        江蘇年鑒(2018年0期)2019-01-10 05:32:22
        數(shù)據(jù)庫
        數(shù)字化制勝
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        国产第19页精品| 精品亚洲一区二区三洲| 亚洲国产成人久久精品一区| 色与欲影视天天看综合网| 亚洲人精品亚洲人成在线| 国产精品卡一卡二卡三| 无码高潮久久一级一级喷水| 中文字幕精品亚洲一区二区三区| av在线不卡一区二区| 人妻中文字幕在线网站| 成人网站免费看黄a站视频| 国产96在线 | 亚洲| 无码av永久免费大全| av国产免费在线播放| 亚洲av日韩av卡二| 少妇厨房愉情理伦bd在线观看| 成人国产精品免费视频| 黄 色 成 年 人 网 站免费| 一道本加勒比在线观看| 日本精品女优一区二区三区| 亚洲人成网站色www| 狠狠人妻久久久久久综合| 中文字幕色视频在线播放| av在线不卡免费中文网| 国产成人无码av一区二区在线观看| 中国丰满熟妇xxxx性| 国产AV无码专区亚洲AV桃花庵| 日韩成精品视频在线观看 | 成人做爰69片免费看网站| 手机AV片在线| 亚洲国产成人va在线观看天堂| 亚洲精品无码不卡| 少妇无码吹潮| 亚洲—本道中文字幕久久66| 国产视频一区二区三区在线看| 丁香婷婷在线成人播放视频| 国产精品久久久久乳精品爆| 狠狠爱无码一区二区三区| 亚洲国产精一区二区三区性色| 亚洲精品久久视频网站| 97日日碰人人模人人澡|