最近幾年參加了全國科學技術(shù)名詞審定委員會組織的《生物化學與分子生物學名詞》(第二版)審定和《英漢生物學大詞典》的編撰,同時筆者編寫了《蛋白質(zhì)導論》一書。在這過程中,深感蛋白質(zhì)定名是一個非常復雜、令人煩惱和困惑的事。
早年蛋白質(zhì)的命名相對比較簡單,因為蛋白質(zhì)的研究是從分離、純化和理化性質(zhì)鑒定開始,而后進行功能研究。蛋白質(zhì)的命名就是根據(jù)來源、分離的過程、理化性質(zhì)和功能等特征來確定[1]。譯名確定也比較簡單,基本是直譯。但是,由于早年技術(shù)條件的限制,對一些活性物質(zhì)的結(jié)構(gòu)特征還不了解,因此,在譯名時,廣泛地使用了“素”。除了抗菌素和維生素,很多物質(zhì)也被稱為“素”,某些蛋白質(zhì)也不例外,胰島素就是一個典型的例子。
隨著越來越多的物種的基因組完成了全序列的測定,一個基因?qū)?yīng)了一個蛋白質(zhì),為此,蛋白質(zhì)的數(shù)量幾乎在以指數(shù)曲線的形式增加。這就使蛋白質(zhì)命名的問題更加突出。
基因的主要職責是負責遺傳信息的傳代和蛋白質(zhì)的編碼,對它們的命名和定名似乎沒有遇到什么困難。與表型明確相關(guān)的,就用一個名詞,如玭otch、wingless、sex lethal等。還經(jīng)常給予基因一個縮寫和編號,例如參與細胞分裂調(diào)節(jié)(cell division control)的基因為玞dc,因有關(guān)的基因很多,就在其后加上數(shù)字編號,玞dc4、玞dc25等;一時還無法了解其生物學意義的基因也可以用一個符號。
然而,蛋白質(zhì)與基因卻有明顯的不同,因為提起蛋白質(zhì),一定會聯(lián)想到它們的性質(zhì)和功能。在功能仍不清楚的情況下,對蛋白質(zhì)的命名當然也可以用符號。根據(jù)分子質(zhì)量就命名了很多蛋白質(zhì),例如p53、p21等。這樣的命名也有不全面之處,因為分子質(zhì)量相同的蛋白質(zhì)在自然界中是不勝枚舉的。在同一個復雜的體系中得到的諸多蛋白質(zhì)也使用了編號,例如核糖體中的蛋白質(zhì),定位小亞基上的冠以S,定位在大亞基上的以L開頭,然后是數(shù)字編號;構(gòu)成核孔的許多蛋白質(zhì)就用NuP加數(shù)字表示。這些符號為蛋白質(zhì)的命名減少了很多麻煩。至于對有明確生物學含義的基因所表達得到的蛋白質(zhì),通常是將斜體扶正,也即認為是對蛋白質(zhì)的定名,例如玭otch基因的表達產(chǎn)物,即定名為notch蛋白(質(zhì))。筆者認為不應(yīng)簡單地以外文定名,而應(yīng)該以其生物學意義對蛋白質(zhì)命名或定名,玭otch基因的表達蛋白質(zhì)應(yīng)定名為刻缺蛋白。
蛋白質(zhì)定名,更多的是蛋白質(zhì)英文譯名的確定,看似簡單,但仍遇到很多問題。
首先是,很多學者,尤其是醫(yī)學工作者,仍然喜歡使用“素”,例如integrin被稱為“整合素”。早年在不了解某種活性物質(zhì)的屬性時,使用“素”字無可非議,如今已明確知道integrin是一類蛋白質(zhì),若譯名能反映其屬性,則更確切。即“整合蛋白”(或“整聯(lián)蛋白”)比“整合素”合適;“泛蛋白”比“泛素”更好。目前一些生物學出版物中,往往還是將兩者并用[2]。對此筆者建議定一個原則,如果一個活性物質(zhì)其屬性已確定為蛋白質(zhì)或肽,則其譯名應(yīng)盡量使用“某某蛋白”或“某某肽”,如defensin,可定名為“防衛(wèi)肽”而非“防衛(wèi)素”。
其次,在確定譯名時,應(yīng)盡可能地考慮到外文名的由來,不必根據(jù)外文詞直譯。例如selectin曾被譯為“選擇素”,其實其詞根是lectin,含凝集素的意義,將其譯為“選擇凝(集)素”或許更合理,簡化為“選凝素”則更簡潔。同理collectin的直譯則是“收集素”,根據(jù)外文的構(gòu)詞,其詞根也是lectin,前綴col來源于collagen,全面考慮,則其譯名以“膠原凝(集)素”為佳。另外,外國人很喜歡顯示他們的特有文化。例如,Janus kinase(一種激酶)多被直譯為詹納斯激酶(Jak)[2],其實Jak兼有轉(zhuǎn)錄因子的功能,同時英文中Janus是羅馬神話中的一位具有兩副面孔的門神,既看前面,又看后面,January(一月)便是既看過去的一年又看即將來臨的一年之意,因此考慮到Jak既看信號的傳送,又看到蛋白質(zhì)的轉(zhuǎn)錄,譯為兩面激酶也是一個不錯的選擇。再如,一種促進胚胎頭部發(fā)育的蛋白質(zhì),英文名為cerberus,當然可以音譯為“塞貝魯斯”,但因原文為希臘和羅馬神話中守衛(wèi)冥府入口的三頭狗,故建議定名為“促頭蛋白”。另有一些名稱是根據(jù)原國文字的特點用英文命名。例如ryudocan,此詞源于日文的ryudousei,意為流動狀態(tài),因此根據(jù)英文是無法給予確切的譯名的。對這樣的定名,最好是追溯該詞的由來,即查閱原始文獻,根據(jù)作者的命名依據(jù),進行譯名的確定。為此,筆者建議將ryudocan定名為“流態(tài)蛋白聚糖”。
這樣來定名一個術(shù)語是很費力耗時的,但這能使定名更確切,能夠望文生義。
理想的譯名應(yīng)兼顧音譯和意譯兩方面。gene譯為基因是典型佳作,因它是遺傳時的“基(本)因(素)”。motif是一個法文詞,有多種含義,但是均離不開“基本構(gòu)件”的意思,曾譯為“基序”(基本的序列),后來在蛋白質(zhì)的立體結(jié)構(gòu)中也使用此詞,顯然“基序”不足以涵蓋全部含義,筆者建議定名為“模體”,意為“規(guī)范的實體”,且與外文諧音。目前使用“模體”的人在增多。SUMO是一個使用日益頻繁的縮寫,其全名是Small Ubiquitin-related Modifier。如果使用全名“小的泛素相關(guān)修飾劑”,似乎太長,失卻了使用縮寫的意義,為此,筆者建議定名為“修模蛋白”,既是音譯,也考慮其在修飾時,被整體地作為模塊使用。
在外文中,經(jīng)常將一個詞組中各個詞的詞頭組合在一起,構(gòu)成新詞,并以此命名蛋白質(zhì)。serpin的全名是serine protease inhibitor,筆者曾提議定名為“抑絲酶”,但遭到從事酶學研究的同人反對,認為這樣的定名會誤導為這是一種酶,而非抑制劑。他們的顧慮不無道理。但是,筆者認為既然是一個縮寫,就應(yīng)盡可能地以縮寫來定名,以全名的譯名作為縮寫的譯名,似乎總有些別扭??s寫PTEN的全名是phosphatase and tensin homology deleted on chromosome ten,其譯名為“在10號染色體有缺失的磷酸酶及張力蛋白同源蛋白”,若將4個英文字母的縮寫譯為一長串中文則使人啞然。建議此縮寫譯為“10號蛋白”或“十號蛋白”。
對這類詞頭組合詞命名時使用音譯是下策,
但有時又是無奈之舉,如ADAM為英文詞組a disintegrin and a metalloproteinase的詞頭組合詞,全稱為“解整聯(lián)蛋白及金屬蛋白酶”。創(chuàng)造ADAM縮寫的這位學者肯定是聯(lián)想到人的祖先,那不妨將其定名為“亞當?shù)鞍住?。與serpin類似的還有eppin,其全名為epididymal protease inhibitor(附睪分泌的蛋白酶抑制劑),在全面考慮后,很難給出確切譯名時,建議主張音譯為“艾匹”;serpin也不妨音譯為“絲匹”。
在一種材料中,分離得到多種不同功能的蛋白質(zhì)是很自然的。然而,往往將一種較先發(fā)現(xiàn)的、功能特定的蛋白質(zhì)命名為此材料中蛋白質(zhì)的總稱。例如在由栝樓根制備得到的天花粉中提取的核糖體失活蛋白質(zhì)曾被定名為天花粉蛋白,英文為trichosanthin[2]。其實,在天花粉中至少還存在著另一種凝集素,因此,trichosanthin定名為天花粉毒蛋白更確切。
大量的事實表明,一個蛋白質(zhì),即使分子量不是很大,也可以呈現(xiàn)幾種不同的功能,因此,對這類蛋白質(zhì)的命名如果僅反映了其形狀和功能的一個方面,似乎總有缺陷??墒?這是無法避免的。因為隨著研究在不斷地深入,開始的命名肯定無法涵蓋以后研究的成果。然而,往往幾個實驗室同時研究一個蛋白質(zhì),各自又根據(jù)自身的研究結(jié)果對此蛋白質(zhì)進行了不同的命名,例如L-選凝素,
這些名稱的統(tǒng)一是很有必要的[3]。這一蛋白質(zhì),在得到cDNA時,因其相當于MEl-14抗原而被命名為MEl-14。但是在得到其cDNA以前,各家實驗室對其已有不同的稱謂:LEC-CAM、Ly-22、Leu8、TQ1、DREG-56和LAM-1等。后經(jīng)多方協(xié)商,最后定名為L-selectin,譯名為L-選凝素。
總之,蛋白質(zhì)的命名是一個非常復雜的問題,上面僅是筆者碰到和所能想到的一些難處。如果能有一個為絕大多數(shù)人認可的蛋白質(zhì)命名原則或規(guī)則,那么,任何人在遇到新的蛋白質(zhì)外文名詞時,就能根據(jù)這個規(guī)則提出建議的譯名,而后經(jīng)多方確認后,就可給予正式的定名。這樣,可以使蛋白質(zhì)的命名“群眾化”,每一位從事蛋白質(zhì)科研、教學的人員都能為蛋白質(zhì)命名貢獻力量。在群策群力的基礎(chǔ)上,使得中國的學術(shù)刊物更多地使用規(guī)范的中文學術(shù)名詞。
參 考 文 獻
[1]王克夷.蛋白質(zhì)導論.北京:科學出版社,2007:2-4.
[2]金冬雁,黎孟楓.英漢分子生物學與生物工程詞匯.北京:科學出版社,2003.
[3]http://cn.expasy.org/uniprot/P14151.
王克夷:中國科學院上海生命科學院生物
化學與細胞生物學研究所,200031