孔 琪,夏霞宇,秦 川
(中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所,北京協(xié)和醫(yī)學(xué)院比較醫(yī)學(xué)中心;衛(wèi)生部人類疾病比較醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室;國家中醫(yī)藥管理局人類疾病動(dòng)物模型三級實(shí)驗(yàn)室;北京 100021)
實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫的建立
孔 琪,夏霞宇,秦 川
(中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所,北京協(xié)和醫(yī)學(xué)院比較醫(yī)學(xué)中心;衛(wèi)生部人類疾病比較醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室;國家中醫(yī)藥管理局人類疾病動(dòng)物模型三級實(shí)驗(yàn)室;北京 100021)
目的基于國內(nèi)外部分實(shí)驗(yàn)動(dòng)物數(shù)據(jù)庫和文獻(xiàn),收集整理世界上現(xiàn)有的200多種共計(jì)26 000多個(gè)品系的實(shí)驗(yàn)動(dòng)物數(shù)據(jù),建立關(guān)系型檢索數(shù)據(jù)庫,使其成為世界上最大最全的實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫。方法 構(gòu)建基于My SQL數(shù)據(jù)庫軟件的中小型數(shù)據(jù)庫,建立檢索界面、錄入界面和數(shù)據(jù)庫接口。結(jié)果 本文建立了實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫,已經(jīng)收錄小鼠品系數(shù)據(jù)21 596條;大鼠品系數(shù)據(jù)2062條;猴品系數(shù)據(jù)13條;地鼠品系數(shù)據(jù)2條;犬品系數(shù)據(jù)5條;兔品系數(shù)據(jù)5條。以后會(huì)逐步完善數(shù)據(jù),實(shí)現(xiàn)實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫的定期更新。討論 該數(shù)據(jù)庫的建立方便我國科研人員查閱和使用國內(nèi)外實(shí)驗(yàn)動(dòng)物品系資源,為引進(jìn)歐美日等發(fā)達(dá)國家的實(shí)驗(yàn)動(dòng)物品系資源提供鏈接。
實(shí)驗(yàn)動(dòng)物;品系;數(shù)據(jù)庫;小鼠;資源
實(shí)驗(yàn)動(dòng)物是“活的試劑”,是生命科學(xué)、醫(yī)學(xué)和 藥學(xué)等諸多領(lǐng)域的科技支撐條件。實(shí)驗(yàn)動(dòng)物科學(xué)為生命科學(xué)和現(xiàn)代生物學(xué)的發(fā)展提供技術(shù)平臺(tái),生命科學(xué)和現(xiàn)代生物學(xué)把實(shí)驗(yàn)動(dòng)物科學(xué)帶進(jìn)分子水平時(shí)代并將它推到現(xiàn)代科學(xué)技術(shù)的前沿。推動(dòng)實(shí)驗(yàn)動(dòng)物資源自主研發(fā)和品系數(shù)據(jù)庫建設(shè)對有效支撐生物醫(yī)學(xué)科學(xué)研究和生物醫(yī)藥產(chǎn)業(yè)發(fā)展意義重大[1]。
實(shí)驗(yàn)動(dòng)物按照動(dòng)物物種來分,可以分為小鼠、大鼠、倉鼠、地鼠、沙鼠、豚鼠、土撥鼠、兔、犬、貓、豬、猴、猩猩、牛、羊、馬、樹鼩、雞、鴨、鵝、魚、蟾蜍、雪貂等。世界上用于實(shí)驗(yàn)動(dòng)物研究的動(dòng)物物種已經(jīng)達(dá)到200多種,26000多個(gè)品系。這個(gè)數(shù)據(jù)每年還在不斷增長。我國實(shí)驗(yàn)動(dòng)物國家標(biāo)準(zhǔn)中涉及的七種實(shí)驗(yàn)動(dòng)物包括小鼠、大鼠、地鼠、豚鼠、兔、犬、猴,也是最常用的實(shí)驗(yàn)動(dòng)物[2,3]。實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫建設(shè)的目標(biāo)是收集整理國內(nèi)外所有的實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù),建立世界上最全最大的實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫,供國內(nèi)的實(shí)驗(yàn)動(dòng)物科學(xué)、生物學(xué)、醫(yī)學(xué)、農(nóng)業(yè)等相關(guān)領(lǐng)域科研人員使用。數(shù)據(jù)來源主要是國內(nèi)外實(shí)驗(yàn)動(dòng)物數(shù)據(jù)庫、期刊論文和相關(guān)機(jī)構(gòu)網(wǎng)站。
1.1 數(shù)據(jù)來源
1.1.1 問卷調(diào)查:設(shè)計(jì)實(shí)驗(yàn)動(dòng)物品系資源調(diào)查問卷,面向國內(nèi)2000多家實(shí)驗(yàn)動(dòng)物生產(chǎn)使用單位發(fā)放調(diào)查問卷。
1.1.2 網(wǎng)站檢索:使用百度檢索中文網(wǎng)站信息;訪問各機(jī)構(gòu)網(wǎng)站:實(shí)驗(yàn)動(dòng)物生產(chǎn)機(jī)構(gòu)、使用機(jī)構(gòu)、管理機(jī)構(gòu)、社團(tuán)組織。
1.1.3 數(shù)據(jù)庫檢索:檢索美國、歐洲、日本等國實(shí)驗(yàn)動(dòng)物品系相關(guān)數(shù)據(jù)庫,獲取實(shí)驗(yàn)動(dòng)物品系名稱及相關(guān)信息,整理后錄入數(shù)據(jù)庫。
1.1.4 文獻(xiàn)檢索:檢索中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫,檢索文獻(xiàn)發(fā)表中提及的實(shí)驗(yàn)動(dòng)物品系及來源。
1.1.5 單位積累:作者單位長期從事實(shí)驗(yàn)動(dòng)物研究工作,最早引進(jìn)實(shí)驗(yàn)動(dòng)物品系近百種,建立了700多種基因工程品系,具有全國最多的實(shí)驗(yàn)動(dòng)物品系資源。
1.1.6 同行提供:數(shù)據(jù)庫為開放式數(shù)據(jù)庫,對國內(nèi)外同行提供數(shù)據(jù)錄入窗口,可以在線填報(bào)或以郵件的形式提供數(shù)據(jù),經(jīng)過專家審核后錄入數(shù)據(jù)庫。
1.2 建立數(shù)據(jù)庫
依托專業(yè)公司,構(gòu)建基于MySQL數(shù)據(jù)庫軟件的中小型數(shù)據(jù)庫,建立檢索界面、錄入界面和數(shù)據(jù)庫接口;并預(yù)備與今后建立的數(shù)據(jù)庫接口,逐漸形成數(shù)據(jù)庫集群。
1.3 數(shù)據(jù)庫檢索
實(shí)現(xiàn)廢棄物最大利用的前提便是垃圾分類,在北京、杭州等地,垃圾分類試點(diǎn)已經(jīng)推行了幾年,卻未見明顯成效,“垃圾圍城”問題亟待解決。2016年6月,國家發(fā)改委、住建部聯(lián)合發(fā)布了《垃圾強(qiáng)制分類制度方案》,提出到2020年,重點(diǎn)城市生活垃圾得到有效分類,實(shí)施生活垃圾強(qiáng)制分類的重點(diǎn)城市,生活垃圾分類收集覆蓋率達(dá)到90%以上,回收利用率達(dá)35%以上。
分為簡單檢索、專業(yè)檢索和數(shù)據(jù)瀏覽三種方式。
1.3.1 簡單檢索:關(guān)鍵詞檢索(keyword search)。
1.3.2 專業(yè)檢索:品系編號(accession number)、品系名稱(strain name)、其他名稱(common name)、品系來源(origin)、傳代方法(generation)、遺傳特征(genetics status)、應(yīng)用領(lǐng)域(research area)、保存單位(institution)。
1.3.3 數(shù)據(jù)瀏覽:以實(shí)驗(yàn)動(dòng)物品系編號為序,按照種屬分類,瀏覽實(shí)驗(yàn)動(dòng)物品系。
1.4 聯(lián)網(wǎng)運(yùn)行
接入中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所網(wǎng)站和中國實(shí)驗(yàn)動(dòng)物學(xué)會(huì)網(wǎng)站,提供免費(fèi)的檢索服務(wù);
1.5 數(shù)據(jù)更新
數(shù)據(jù)庫實(shí)行外源運(yùn)行,使用者可以上傳數(shù)據(jù)庫未收錄的實(shí)驗(yàn)動(dòng)物品種品系,經(jīng)過審核和查實(shí)后,可以作為正式數(shù)據(jù)發(fā)布,可以不斷擴(kuò)展數(shù)據(jù)規(guī)模,實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)更新。
2.1 制定元數(shù)據(jù)表
根據(jù)調(diào)查結(jié)果制定了元數(shù)據(jù)表(表1),包括數(shù)據(jù)格式,內(nèi)容等。
2.2 確定實(shí)驗(yàn)動(dòng)物品系編碼規(guī)則
本數(shù)據(jù)庫實(shí)驗(yàn)動(dòng)物品系編號為:31-11-001-0-000001。其中31代表實(shí)驗(yàn)材料大類;11代表實(shí)驗(yàn)動(dòng)物小類;001:實(shí)驗(yàn)動(dòng)物品種編號;0,A-Z:實(shí)驗(yàn)動(dòng)物品系名稱編號(0為品種號,A為首字母為A的品系);000001:數(shù)據(jù)條編碼(表2)[4-26]。國家自然科技資源平臺(tái)實(shí)驗(yàn)動(dòng)物資源庫對根據(jù)實(shí)驗(yàn)材料對實(shí)驗(yàn)動(dòng)物品系編碼做了描述[27],本數(shù)據(jù)庫的編碼方式跟其做了銜接,方便共享。
2.3 數(shù)據(jù)庫建立
2.3.1 數(shù)據(jù)庫名稱:實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫。
2.3.2 數(shù)據(jù)庫網(wǎng)址:http://www.cnilas.org/plus/list.php?tid=158。
2.3.3 數(shù)據(jù)量:現(xiàn)在已經(jīng)收錄小鼠品系數(shù)據(jù)21 596條;大鼠品系數(shù)據(jù)2 062條;猴品系數(shù)據(jù)13條;地鼠品系數(shù)據(jù)2條;犬品系數(shù)據(jù)5條;兔品系數(shù)據(jù)5條(圖1)。
表1 實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫元數(shù)據(jù)表
2.4 數(shù)據(jù)庫檢索
按照國際通用的數(shù)據(jù)庫檢索模式,分為模糊查詢和精確查詢兩種界面。模糊查詢,也叫快速查詢,是指使用關(guān)鍵詞(key word)查詢,數(shù)據(jù)中有相關(guān)內(nèi)容就會(huì)出現(xiàn)在查詢結(jié)果中,每頁20條,點(diǎn)擊顯示詳細(xì)數(shù)據(jù)。精確查詢會(huì)按照邏輯檢索式,設(shè)置3~5個(gè)查詢條件,包括查詢號、品系名稱、英文名稱、研究應(yīng)用和保種單位,顯示界面每頁20條數(shù)據(jù),點(diǎn)擊可顯示詳細(xì)數(shù)據(jù)。
實(shí)驗(yàn)動(dòng)物資源也成為生命科學(xué)研究“大軍”的必備“糧草”,然而在我國,這部分科研“糧草”的供應(yīng)形勢卻不容樂觀。所以,構(gòu)建一個(gè)實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫,調(diào)查分析整理以我國實(shí)驗(yàn)動(dòng)物品系資源為主,引進(jìn)歐美日等發(fā)達(dá)國家實(shí)驗(yàn)動(dòng)物品系資源數(shù)據(jù),供生物醫(yī)藥相關(guān)科技人員檢索使用,對于推動(dòng)我國第六次科技革命,以及國務(wù)院頒發(fā)的生物產(chǎn)業(yè)發(fā)展規(guī)劃意義重大。
國內(nèi)外已經(jīng)建立了一些的實(shí)驗(yàn)動(dòng)物信息數(shù)據(jù)庫以及信息資源平臺(tái),實(shí)現(xiàn)了信息資源共享。例如美國Jackson研究所的“小鼠品系數(shù)據(jù)庫”“小鼠基因組”、“基因表達(dá)數(shù)據(jù)庫”、“小鼠基因組百科全書”、“小鼠位點(diǎn)及遺傳標(biāo)記目錄”、“小鼠突變資源庫”等[5]。美國NIH的心肺血液研究所建立了大鼠基因組數(shù)據(jù)庫(RGD)[6]。英國有“嚙齒類基因組數(shù)據(jù)庫”、“小鼠細(xì)胞遺傳圖譜”、“畸形人鼠同源性數(shù)據(jù)庫”等[11]。以小鼠品系為主,已經(jīng)形成了幾個(gè)主要以信息共享為主的非營利性的實(shí)驗(yàn)動(dòng)物資源聯(lián)盟,包括國際小鼠種質(zhì)資源庫(IMSR)、國際小鼠資源聯(lián)盟(FIMRe)、國際基因敲除小鼠資源聯(lián)盟(IKMC)等。這些數(shù)據(jù)庫收錄品系較全,但僅限于小鼠或大鼠品系。
我國實(shí)驗(yàn)動(dòng)物相關(guān)數(shù)據(jù)庫建設(shè)嚴(yán)重滯后。作者單位曾經(jīng)在2001-2003年構(gòu)建過模式動(dòng)物數(shù)據(jù)庫,收錄數(shù)據(jù)近100條。2008年國家自然科技資源平臺(tái)中設(shè)立了實(shí)驗(yàn)動(dòng)物資源庫,收錄8個(gè)物種188個(gè)品系的生物學(xué)特性數(shù)據(jù)。南京大學(xué)模式動(dòng)物研究所等單位聯(lián)合成立中國遺傳工程小鼠資源共享聯(lián)盟,收錄基因工程小鼠品系717條。其他還有個(gè)別單位建立的小規(guī)模數(shù)據(jù)庫。這些數(shù)據(jù)庫特點(diǎn)是小而散,缺乏數(shù)據(jù)更新。
世界上而尚無一個(gè)數(shù)據(jù)庫,能夠包括所有的實(shí)驗(yàn)動(dòng)物品系資源。建立世界范圍現(xiàn)有的實(shí)驗(yàn)動(dòng)物品系庫,對于國內(nèi)科研人員充分利用現(xiàn)有實(shí)驗(yàn)動(dòng)物資源有積極意義。實(shí)驗(yàn)動(dòng)物資源的共享與合作是全球性的發(fā)展趨勢,主要目標(biāo)在打破國與國之間的貿(mào)易壁壘,增進(jìn)實(shí)驗(yàn)動(dòng)物資源的分享、利用和保存,避免資源的重復(fù)生產(chǎn)與浪費(fèi)。本文數(shù)據(jù)庫的建立,將為用戶免費(fèi)提供實(shí)驗(yàn)動(dòng)物品系資源的“一站式”查詢和交流共享,有利于國內(nèi)外實(shí)驗(yàn)動(dòng)物資源的共享和利用。
本文建立的實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫已經(jīng)開通并提供查詢服務(wù),數(shù)據(jù)量規(guī)模也達(dá)到2.4萬條,但是距離完善還有很大的差距。許多條目還需要補(bǔ)充完善,內(nèi)容上還存在一些瑕疵。檢索方式、動(dòng)物圖片和配套數(shù)據(jù)庫還有待增加。引用數(shù)據(jù)與相關(guān)數(shù)據(jù)庫建立鏈接,用戶可以通過鏈接查閱更詳細(xì)的信息及資源擁有單位的聯(lián)系方式。數(shù)據(jù)更新是一個(gè)數(shù)據(jù)庫的生命線,本數(shù)據(jù)庫建立后將有作者單位信息中心維護(hù),定期收集整理公開發(fā)表的品系數(shù)據(jù)以更新,同時(shí)也接受國內(nèi)外同行提交的品系數(shù)據(jù)。希望能在各位實(shí)驗(yàn)動(dòng)物同行和前輩的指導(dǎo)和支持下,該數(shù)據(jù)庫茁壯成長,健康發(fā)展,為實(shí)驗(yàn)動(dòng)物信息化建設(shè)添磚加瓦。
表2 實(shí)驗(yàn)動(dòng)物品種編號
致謝:小鼠的品系名稱主要參考國際小鼠種質(zhì) 資源庫(IMSR),大鼠的品系名稱主要參考 Rat Genome Database(RGD),其他品系數(shù)據(jù)參考國內(nèi)外發(fā)表的文獻(xiàn),在此一并致謝。
圖1 實(shí)驗(yàn)動(dòng)物品系數(shù)據(jù)庫查詢結(jié)果截圖
[1]秦川,主編,醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物學(xué) [M].人民衛(wèi)生出版社.2008:11.
[2]秦川,主編,實(shí)驗(yàn)動(dòng)物學(xué)學(xué)科發(fā)展報(bào)告[M].中國科學(xué)技術(shù)出版社.2009:4.
[3]秦川,主編,實(shí)驗(yàn)動(dòng)物學(xué)[M].人民衛(wèi)生出版社.2010:8.
[4]International Mouse Strain Resources(IMSR)[OL].2014[2014-11-26]http://www.informatics.jax.org/imsr/
[5]The Jackson Laboratory(TJL)[OL].2014[2014-11-26]http://jaxmice.jax.org/query/
[6]Rat Genome Database(RGD)[OL].2014[2014-11-26]http://rgd.mcw.edu/
[7]突變小鼠資源聯(lián)盟 Mutant Mouse Regional Resource Center(MMRRC)[OL].2014[2014-11-26]http://www.mmrrc.org/catalog/StrainCatalogSearchForm.jsp
[8]人類癌癥模式小鼠聯(lián)盟 Mouse Models of Human Cancer Consortium,F(xiàn)rederick,MD(MMHCC)[OL].2014[2014-11-26]http://mouse.ncifcrf.gov/
[9]加拿大小鼠聯(lián)盟Canadian Mouse Consortium(CMC)[OL].2014[2014-11-26] http://www.mousecanada.ca/ps/catalogue.htm
[10]加拿大突變小鼠數(shù)據(jù)庫Canadian Mouse Mutant Repository,Toronto,Ontario(CMMR)[OL].2014[2014-11-26]http://www.phenogenomics.ca/databases/mutants _ samples.html
[11]European Mouse Mutant Archive(EMMA)[OL].2014[2014 -11-26]http://www.emmanet.org/mutant_types.php
[12] 日本實(shí)驗(yàn)動(dòng)物中央研究所 RIKEN BioResource Center(RBRC)Laboratory Animals Division[OL].2014[2014-11 -26]http://www2.brc.riken.jp/lab/animal/search.php
[13]日本熊本大學(xué)動(dòng)物資源發(fā)展中心Center for Animal Resources and Development(CARD)[OL].2014[2014-11-26]http://cardb.cc.kumamoto-u.ac.jp/transgenic/strains.jsp
[14]Charles River Laboratories,Inc[OL].2014[2014-11-26] http://www.criver.com/
[15]Taconic,Inc[OL].2014[2014-11-26]http://www.taconic.com/wmspage.cfm?parm1=16
[16]Harlan,Inc[OL].2014[2014-11-26]http://www.harlan.com/
[17]Mouse Genome Database[OL].2014[2014-11-26]http://www.informatics.jax.org
[18]ILAR[OL].2014[2014-11-26]http://www2.nas.edu/ilarhome
[19]Kong Q,Qin C.Analysis of current laboratory animal science policies and administration in China[J].ILAR J.2009;51(1):e1-e11.
[20]Kong Q,Qin C.Laboratory animal science in China:current status and potential for the adoption of alternatives[J].Altern Lab Anim.2010,38(1):53-69.
[21]NRC(National Research Council),Institute of Laboratory Animal Resources,Committee on Rat Nomenclature.1992.Definition,nomenclature,and conservation of rat strains[J].ILAR News 34(4):S1-S26
[22]NRC(National Research Council),Institute of Laboratory Animal Resources,Committee on Transgenic Nomenclature.1992.Standardized nomenclature for transgenic animals[J].ILAR News 34(4):45-52.
[23]Davisson MT.Rules and guidelines for nomenclature of mouse genes.International Committee on Standardized Genetic Nomenclature for Mice[J].Gene.1994,147(2):157-160.
[24]Maltais LJ,Blake JA,Eppig JT,et al.Rules and guidelines for mouse gene nomenclature:a condensed version.International Committee on Standardized Genetic Nomenclature for Mice[J].Genomics.1997,45(2):471-476.
[25]Davisson MT.Rules and guidelines for genetic nomenclature in mice:excerpted version.Committee on Standardized Genetic Nomenclature for Mice[J].Transgenic Res.1997,6(5):309 -319.
[26]Montoliu L,Whitelaw CB.Using standard nomenclature to adequately name transgenes,knockout gene alleles and any mutation associated to a genetically modified mouse strain[J].Transgenic Res.2011,20(2):435-440.Epub 2010 Jul 15.
[27]國家自然科技資源平臺(tái)實(shí)驗(yàn)動(dòng)物資源庫[OL].2014[2014 -12-30]http://www.lasdr.cn/UploadFile/local/2008/12/22/30775493626026614161229941196718.pdf.
Establishment of the laboratory animal strain database
KONG Qi,XIA Xia-yu,QIN Chuan
(Institute of Laboratory Animal Science,Chinese Academy of Medical Sciences&Comparative Medical Center,Peking Union Medical College,Key Laboratory of Human Disease Comparative Medicine,Ministry of Health;Key Laboratory of Human Diseases Animal Model,State Administration of Traditional Chinese Medicine,Beijing 100021,China)
Objective To collect more than 200 kinds of species totaling more than 26,000 existing laboratory animals data worldwide to establish a largest and most comprehensive database of laboratory animal strains,based on the existing laboratory animal strain databases and related publications or references.Methods Based on MySQL database software to set up medium sized databases,and build search interface,input interface and database interface.Results In this work,a laboratory animal strain database was established,including data of 21596 mouse strains,2062 rat strains,13 monkey strains,2 hamster strains,5 dog strains,and 5 rabbit strains.We will gradually further improve the data to achieve regularly updated database of animal strains in the future.Discussions The establishment of this database will facilitate scientific researchers in our country to access and use domestic and foreign resources of laboratory animal strains,and provide links to introduce laboratory animal strain resources from European,American and other developed countries.
Laboratory animals;Strains;Database;Laboratory animal resource
R33
A
1671-7856(2015)04-0078-06
10.3969.j.issn.1671.7856.2015.004.016
中央科研院所基本業(yè)務(wù)費(fèi)(DWS200502,DWS200709,DWS201208)和傳染病科技重大專項(xiàng)資助(編號2009ZX10004-503)。
孔琪(1978-),助理研究員,博士,研究方向?yàn)閷?shí)驗(yàn)動(dòng)物學(xué)。E-mail:infor@cnilas.org。
秦川,研究員,博士生導(dǎo)師,研究方向?yàn)閷?shí)驗(yàn)病理學(xué)。E-mail:qinchuan@pumc.edu.cn。
2015-01-21
繼續(xù)教育