周桂蓮,許育彬,席美麗,華千勇
(西北農(nóng)林科技大學(xué)《麥類作物學(xué)報(bào)》編輯部 陜西楊凌712100)
大多數(shù)生物學(xué)、農(nóng)學(xué)和醫(yī)學(xué)期刊都會(huì)刊登分子生物學(xué)論文。這類論文中常常涉及到基因、基因在染色體上的位點(diǎn)以及引物、分子標(biāo)記等內(nèi)容。盡管這些內(nèi)容早已不是什么新鮮事物,但在許多期刊發(fā)表的這類論文中,基因、位點(diǎn)、引物、分子標(biāo)記、引物序列等符號(hào)的編排格式至今仍然五花八門;而且因?yàn)闊o(wú)據(jù)可依,致使許多編輯人員無(wú)所適從。雖然已經(jīng)有人撰文探討過基因、蛋白質(zhì)、內(nèi)切酶、病毒和質(zhì)粒的正斜體編排問題[1-5],但論述都比較簡(jiǎn)短,且都未涉及基因位點(diǎn)、引物、分子標(biāo)記等符號(hào)以及基因芯片型號(hào)、引物的核苷酸序列、基因符號(hào)中阿拉伯?dāng)?shù)字的規(guī)范編排問題,有些文章還給出了一些含糊甚至錯(cuò)誤的信息,比如有文章稱:“按照《TIG 遺傳命名指南》[6],人類基因的符號(hào)由斜體大寫的拉丁字母與正體的阿拉伯?dāng)?shù)字組成?!边@其中“正體的阿拉伯?dāng)?shù)字”就是個(gè)錯(cuò)誤信息,《TIG遺傳命名指南》中并沒有這樣的信息。因此,本文統(tǒng)計(jì)分析了國(guó)內(nèi)外 130種生物學(xué)期刊關(guān)于這些符號(hào)的編排格式,提出了這些符號(hào)的規(guī)范使用建議。
在中國(guó)知網(wǎng)《期刊全文數(shù)據(jù)庫(kù)》中選取80種近幾年刊登分子生物學(xué)論文較多的學(xué)術(shù)性中文科技期刊,其中,生物學(xué)期刊20種,農(nóng)學(xué)期刊30種,醫(yī)學(xué)期刊30種;在美國(guó)《科學(xué)引文數(shù)據(jù)庫(kù)》中選取50種近幾年刊登分子生物學(xué)論文較多的英文科技期刊,其中,生物學(xué)期刊10種,農(nóng)學(xué)期刊20種,醫(yī)學(xué)期刊20種。于2017年6月下旬,分別用“分子標(biāo)記”“基因”“位點(diǎn)”“引物序列”“基因芯片”(或其相應(yīng)的英文)為關(guān)鍵詞逐刊檢索其2016年以來(lái)發(fā)表的論文,每刊取不同期號(hào)發(fā)表的2~4篇文章,統(tǒng)計(jì)其中基因、基因位點(diǎn)、引物、分子標(biāo)記符號(hào)以及SNP基因芯片型號(hào)的編排格式,同時(shí)統(tǒng)計(jì)了引物序列轉(zhuǎn)行時(shí)是否加有連字符的情況。
簡(jiǎn)單地說(shuō),基因是含特定遺傳信息的核苷酸序列,是遺傳信息的最小功能單位[7]。具體一點(diǎn)說(shuō),基因是基因組序列中與調(diào)控、轉(zhuǎn)錄和/或其他功能序列相關(guān)聯(lián)的有確定位置的區(qū)段,對(duì)應(yīng)于一個(gè)遺傳單位[8]?;虻拿诓煌锓N間還沒有統(tǒng)一的規(guī)則,但各物種內(nèi)的基因命名已趨于遵循統(tǒng)一的規(guī)則,具體可參見有關(guān)文獻(xiàn)[6-12]。比如細(xì)菌的基因符號(hào)由3個(gè)小寫斜體字母組成,具有相同表型的不同基因座(locus,如今一般被翻譯為基因位點(diǎn))突變用斜體大寫字母后綴相區(qū)別,等位基因用緊隨基因座名稱后的一系列特定的數(shù)字來(lái)表示[6],如araA2表示ara基因座A的2位突變。因?yàn)槊恳粋€(gè)物種都有一個(gè)國(guó)際性的基因命名委員會(huì),已經(jīng)注冊(cè)的基因都已被命名,并且經(jīng)過了有關(guān)委員會(huì)的審批[6-10],作者在撰寫論文時(shí),一般都會(huì)自覺采用已有的名稱;在命名新發(fā)現(xiàn)的基因時(shí),一般也都會(huì)遵循本物種的基因命名規(guī)則。因此,絕大多數(shù)學(xué)術(shù)期刊中出現(xiàn)的問題都不是基因名稱是否正確,而是基因符號(hào)的編排格式不規(guī)范。最普遍的問題是基因符號(hào)的正斜體格式不規(guī)范。在《TIG遺傳命名指南》[6]中,所有基因符號(hào)中的字母都被要求為斜體,包括表示復(fù)等位基因的上角標(biāo)字母(如豌豆crtys)在內(nèi);數(shù)字的正斜體雖然沒有明確要求,但所有舉例中,無(wú)論是阿拉伯?dāng)?shù)字還是羅馬數(shù)字,也不管它們?cè)诨蚍?hào)的末尾、中間,還是上標(biāo)位置,一律都是斜體(例如細(xì)菌基因lacA1,lac-23;枯草芽孢桿菌突變體基因spo0A,spoⅡB;斑馬魚基因cyctf219),未見一處例外。而從表1可知,在筆者調(diào)查的80種國(guó)內(nèi)學(xué)術(shù)期刊中,基因符號(hào)有多種編排格式,其中,所有字母和數(shù)字均為斜體的期刊只占36.25%,字母為斜體、數(shù)字為正體的期刊占31.25%,還有少量期刊是部分字母為斜體、部分字母(比如代表基因座的大寫字母)和數(shù)字為正體(比如將大腸桿菌aroG 基因?qū)懗蒩roG);最不應(yīng)該發(fā)生的情況是,在不同文章,尤其是不同期號(hào)的不同文章中,格式不統(tǒng)一,在這一篇文章中是字母和數(shù)字均為斜體,在另一篇文章中是字母斜體、數(shù)字正體,這樣的期刊還不少,占到了總數(shù)的13.75%。這正是沒有統(tǒng)一標(biāo)準(zhǔn)造成的不良后果。
國(guó)外 SCI收錄期刊的格式統(tǒng)一度要高得多。在所調(diào)查的 50種期刊中,基因名稱和基因符號(hào)的字母和數(shù)字均為斜體的期刊占 90.00%;字母為斜體、數(shù)字為正體的期刊占 10.00%,多為亞非拉國(guó)家主辦的期刊;沒有字母和數(shù)字均為正體的期刊。
基因在染色體上占有的特定位置叫基因位點(diǎn),又稱為遺傳基因座[13]。一個(gè)基因位點(diǎn)上往往存在兩個(gè)或兩個(gè)以上的基因,這些基因被稱為等位基因或復(fù)等位基因[14]?;蛭稽c(diǎn)符號(hào)一般也都由字母和阿拉伯?dāng)?shù)字組成,有時(shí)也會(huì)有連字符。在《TIG遺傳命名指南》[6]中,基因位點(diǎn)(locus)被翻譯為基因座,一般是在基因符號(hào)后加上適當(dāng)?shù)暮缶Y來(lái)表示;基因位點(diǎn)符號(hào)中的字母和數(shù)字也都為斜體,如 1B染色體上控制小麥株高的位點(diǎn)符號(hào)為 Rht-B1。國(guó)內(nèi)學(xué)術(shù)期刊在基因位點(diǎn)符號(hào)的編排格式上更為混亂(見表 1),在筆者調(diào)查的 80種期刊中,字母和數(shù)字均為正體的期刊比例最大(32.50%);字母和數(shù)字均為斜體的期刊次之(27.50%);字母為斜體、數(shù)字為正體的期刊也占有不小的比例(21.25%);在不同文章中格式不統(tǒng)一的期刊占 18.75%,其中個(gè)別期刊在同一篇文章中前后的格式都不一致,有的是字母和數(shù)字均為正體,有的是字母斜體、數(shù)字正體。
國(guó)外 SCI收錄期刊的格式也不夠統(tǒng)一,但與基因符號(hào)的情況相似,仍然以字母和數(shù)字均為斜體者占絕大多數(shù)(82.00%);字母為斜體、數(shù)字為正體的期刊只占 10.00%;不同文章中格式不統(tǒng)一的期刊占8.00%。后兩類多為亞非拉國(guó)家主辦的期刊。
引物(primer)是人工合成的、作為 DNA 復(fù)制起始點(diǎn)的兩段寡核苷酸序列[15]。分子標(biāo)記(molecular markers)有廣義和狹義之分。廣義的分子標(biāo)記是指可遺傳并可檢測(cè)的 DNA序列或蛋白質(zhì),狹義的分子標(biāo)記是指 DNA標(biāo)記,也就是能反映生物個(gè)體或種群間基因組中某種差異的特異性DNA片段[16]。
引物和分子標(biāo)記的符號(hào)一般也都由字母和數(shù)字組成,應(yīng)該用正體還是斜體,也沒有統(tǒng)一規(guī)定,國(guó)內(nèi)學(xué)術(shù)期刊在其編排格式上也不夠統(tǒng)一(見表 1)。在筆者調(diào)查的 80種中文期刊中,引物符號(hào)中的字母和數(shù)字均為正體的期刊占 70.00%,字母和數(shù)字均為斜體的期刊占 8.75%,在不同文章中正斜體格式不統(tǒng)一的期刊占 21.25%;分子標(biāo)記符號(hào)中的字母和數(shù)字均為正體的期刊占48.75%,字母和數(shù)字均為斜體的期刊占16.25%,字母為斜體、數(shù)字為正體的期刊占 7.50%,在不同文章中或者同一篇文章的正文與圖表中正斜體格式不統(tǒng)一的期刊占27.50%。
SCI收錄的國(guó)外期刊中,引物符號(hào)的格式比較統(tǒng)一,字母和數(shù)字均為正體的期刊占86.00%,均為斜體的期刊占12.00%;不同文章中格式不統(tǒng)一的期刊只占2.00%;分子標(biāo)記符號(hào)的格式也比較統(tǒng)一,字母和數(shù)字均為正體的期刊占 82.00%,均為斜體的期刊占12.00%;不同文章中格式不統(tǒng)一的期刊占6.00%。
表1 國(guó)內(nèi)外科技期刊所發(fā)表的分子生物學(xué)論文中幾種常見名詞符號(hào)的編排格式Tab.1 Formatting of normal nouns and symbols for molecular biology papers published in domestic or overseas sci-tech journals
需要特別說(shuō)明的是,有一類 SSR(Simple sequence repeats)標(biāo)記,比如檢測(cè)小麥抗病基因的 SSR標(biāo)記 Xcfd81、Xwmc154、Xgwm429等等,其符號(hào)開頭的 X代表基因位點(diǎn),所以這類標(biāo)記符號(hào)一般都被排為斜體,這是應(yīng)該的。同一種期刊的不同論文或同一篇論文中,這類標(biāo)記被排為斜體,其他標(biāo)記(如SCAR標(biāo)記 SCAR203)被排為正體,筆者在調(diào)查統(tǒng)計(jì)時(shí),未將其視為“格式不統(tǒng)一”。
引物序列(Primer sequences)即引物的核苷酸序列,也就是 DNA或 RNA中堿基的排列順序,如 5'-GTGATGAAGTCGGAGTGGCA-3',其中的 A、T、G、C代表4種堿基。有些引物比較長(zhǎng),含有四五十個(gè)堿基,排版時(shí)往往需要轉(zhuǎn)行,轉(zhuǎn)行時(shí),不宜在堿基之間加連字符,因?yàn)橐粋€(gè)連字符代表一個(gè)省略的堿基,轉(zhuǎn)行時(shí)所加的連字符容易被誤認(rèn)為省略了一個(gè)堿基。
國(guó)內(nèi)中文期刊中,引物序列符號(hào)轉(zhuǎn)行時(shí)不加連字符的期刊占 57.50%,轉(zhuǎn)行時(shí)加連字符的期刊占42.50%。SCI收錄的國(guó)外期刊中,引物序列符號(hào)轉(zhuǎn)行時(shí)不加連字符的占 92.00%,轉(zhuǎn)行時(shí)加連字符的占8.00%,后者基本為亞洲和非洲期刊。
基因芯片又稱DNA 芯片(DNA chip)、DNA 微陣列(DNA microarray)、DNA 微陣列芯片(DNA microarray chip),是以預(yù)先設(shè)計(jì)的方式將大量的生物訊息密碼(寡核苷酸、cDNA、基因組DNA 等)固定在玻片、硅片、聚丙烯膜、尼龍膜等固相載體上組成的密集分子陣列[17]。其中的SNP(Single Nucleotide Polymorphisms,單核苷酸多態(tài)性)基因芯片有90K、60K等不同型號(hào)。SCI收錄的國(guó)外期刊中,這種K為大寫者占96.00%,為小寫者僅占4.00%,并且與數(shù)字之間均無(wú)空格。但國(guó)內(nèi)中文期刊中,這種K有大寫、小寫、與數(shù)字之間留空格和不留空格4種格式,如90K、90,K、90k、90,k,有時(shí)同一篇論文中出現(xiàn)4種或3種格式:K為大寫、與數(shù)字之間無(wú)空格的期刊占38.75%;K為小寫、與數(shù)字之間有空格或無(wú)空格的期刊占17.50%;在不同文章或同一篇文章中格式不統(tǒng)一的期刊占31.25%。
沒有統(tǒng)一的國(guó)家標(biāo)準(zhǔn),可能是造成我國(guó)眾多科技期刊分子生物學(xué)名詞符號(hào)編排不規(guī)范的主要原因。因此,中國(guó)科技期刊編輯學(xué)會(huì)應(yīng)該盡快牽頭制定與上述分子生物學(xué)符號(hào)編排格式有關(guān)的國(guó)家標(biāo)準(zhǔn),讓相關(guān)期刊有據(jù)可依。在標(biāo)準(zhǔn)制定中,應(yīng)以《TIG遺傳命名指南》為基準(zhǔn),以方便期刊排版操作為原則,以多數(shù)國(guó)際性期刊的習(xí)慣格式為標(biāo)樣。筆者在此提出幾點(diǎn)建議,供標(biāo)準(zhǔn)制定者和有關(guān)期刊參考:①根據(jù)《TIG遺傳命名指南》及90%國(guó)外期刊的慣例,建議基因和位點(diǎn)符號(hào)中的字母和數(shù)字都用斜體。②根據(jù) 80%以上國(guó)外期刊的慣例,建議引物和標(biāo)記符號(hào)中的字母和數(shù)字都用正體。③將引物序列盡量排在同一行,必須轉(zhuǎn)行時(shí),一定不要加連字符。④根據(jù) 95%以上國(guó)外期刊的慣例,建議SNP基因芯片型號(hào)中的字母大寫,字母與數(shù)字之間不留空格。■
[1]張翠英. 基因及蛋白質(zhì)符號(hào)的規(guī)范編排[J]. 編輯學(xué)報(bào),2004,16(4):262-263.
[2]郭建順,沈曉峰,張學(xué)東. 分子生物學(xué)書刊中限制性內(nèi)切酶的規(guī)范表達(dá)[J]. 編輯學(xué)報(bào),2005,17(3):195-196.
[3]張冰. 科技期刊中基因及蛋白質(zhì)的規(guī)范表達(dá)[J]. 學(xué)報(bào)編輯論叢,2007:81-83.
[4]夏元玲,高玨,周麗萍,等. 分子生物學(xué)類論文中幾類常見名詞的正斜體編排[J]. 編輯學(xué)報(bào),2009,21(2):127-128.
[5]王連芬,張立方,孫勇. Taq 酶正斜體編排問題的探討[J]. 中國(guó)科技期刊研究,2011,22(2):291-292.
[6]分子生物學(xué)進(jìn)展編輯部. TIG遺傳命名指南[M]. 王金發(fā),陳中健,楊琳,等譯. 北京:科學(xué)出版社,2002.
[7]Helen P. What is a Gene?[J]. Nature,2006(441):398-401.
[8]張輝,丁蘭,梁前進(jìn),等. 基因組學(xué)中幾個(gè)分子生物學(xué)問題的探討[J]. 生物學(xué)通報(bào),2009,44(3):17-19.
[9]Wain H M,Bruford E A,Lovering R C,et al. Guidelines for human gene nomenclature[J]. Genomics,2002,79(4):464-470.
[10]Wright M W,Bruford E A. Human and orthologous gene nomenclature[J]. Gene,2006(369):1-6.
[11]方福德,向若蘭,楊燕麗,等. 如何命名和書寫基因:最新國(guó)際人類基因命名和書寫規(guī)則[J]. 中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào),2005,27(129):128-134.
[12]Price C A,Reardon E M. Mendel,a database of nomenclature for sequenced plant genes[J]. Nucleic Acids Reserch,2001,29(1):118-119.
[13]Robert H. 世界最新英漢雙解細(xì)胞與分子生物學(xué)詞典[M]. 3版. 西安:世界圖書出版公司,2008:319.
[14]趙壽元,喬守怡. 現(xiàn)代分子生物學(xué)[M]. 2版. 北京:高等教育出版社,2008:35.
[15]劉春宇,張春玲,夏家輝. 隨機(jī)引物在分子生物學(xué)研究中的應(yīng)用[J]. 生物化學(xué)與生物物理進(jìn)展,1996,23(6):517-520.
[16]黎裕,賈繼增,王天宇. 分子標(biāo)記的種類及其發(fā)展[J]. 生物技術(shù)通報(bào),1999(4):19-22.
[17]孫兵,閆彩霞,張廷婷,等. 基因芯片技術(shù)在植物基因克隆中的應(yīng)用研究進(jìn)展[J]. 基因組學(xué)與應(yīng)用生物學(xué),2009,28(1):153-158.