基因
先談一下和人類演化歷史有關(guān)的簡單基因常識。
人類基因資料歸檔于細(xì)胞內(nèi)(圖1—6)。細(xì)胞主要由細(xì)胞核、細(xì)胞質(zhì)和飄浮在細(xì)胞質(zhì)中的核糖體和線粒體(Mitochondrion)等組成。人類的基因訊息庫存于兩個(gè)地方,第一重地當(dāng)然是細(xì)胞核內(nèi)的染色體,其次是細(xì)胞核外的線粒體。
人類細(xì)胞核內(nèi)有23條染色體,每條染色體由兩股交纏在一起,呈雙螺旋結(jié)構(gòu)的DNA(稱脫氧核糖核酸)核酸分子和蛋白質(zhì)組成。每股核酸分子則由一連串功能各異的核苷酸序列組成。構(gòu)成DNA的核苷酸分子只有四種,其核心是以A、T、C和G四個(gè)字母代表的堿基。堿基的特性是A只能和T連手,C只能和G連手,一邊一股形成DNA分子,A扣T、C扣G,結(jié)合成DNA雙螺旋的堅(jiān)固結(jié)構(gòu)。
和遺傳有關(guān)的DNA一般被稱為“基因”,其中含一些“內(nèi)含子”片段?!皟?nèi)含子”在合成體內(nèi)所需的蛋白質(zhì)之前,皆被剪除,表面上看似無用,但其實(shí)際功能難測。
人類23條染色體中總共含約30億個(gè)獨(dú)立堿基對(Base Pair,BP)。我們由父母親處各繼承了一套完整內(nèi)含DNA雙螺旋結(jié)構(gòu)的染色體,所以人體內(nèi)共有30億x2x2=120億個(gè)堿基。人類雖然有這么龐大數(shù)字的堿基,但有用的基因不及3萬個(gè),比稻米的4萬多個(gè)還不如。
人類最長的染色體是一號染色體,有2.5億個(gè)獨(dú)立堿基;最短的染色體是男性的性染色體,簡稱Y染色體,只有5,000萬個(gè)獨(dú)立堿基。Y染色體紀(jì)錄了現(xiàn)代智人演化歷史,下文還會提到。
基因的主要用途在于制造人體需要的各類蛋白質(zhì),講起來又是一篇文章,有興趣的讀者可參閱《生命的起始點(diǎn)》一書,24-30頁,中國科學(xué)普及出版社2008年發(fā)行。
人體由父母處共繼承了120億個(gè)A、T、C和G堿基,其中每2億個(gè)就有一個(gè)可能發(fā)生突變,比如T變成了C、或A或C。120億個(gè)中就約有60個(gè)堿基和由父母親遺傳下來的基因原版不同了。這些突變的堿基可能在任何基因或內(nèi)含子中出現(xiàn),對人類族群的演化功用玄機(jī)深奧,福禍難測。但一般看來,突變發(fā)生在有用的基因中,大半有害,不是好事,甚或會將宿主處死。發(fā)生在內(nèi)含子中則不關(guān)痛癢,千秋萬世傳下去,宿主也能健康生活。追尋人類基因突變的歷史,通常都要上溯萬代,可利用內(nèi)含子中無關(guān)痛癢的堿基變異,追溯演化歷史。
細(xì)胞內(nèi)另一個(gè)儲存基因數(shù)據(jù)的地方就是細(xì)胞核外的線粒體。線粒體飄浮在細(xì)胞質(zhì)內(nèi),呈豌豆莢形狀,是供應(yīng)細(xì)胞能量的“發(fā)電廠”,其中有許多攜帶相同基因的DNA分子,每個(gè)DNA分子內(nèi)含16,568個(gè)獨(dú)立的A、T、C和G堿基,組成37個(gè)有用基因,展開后呈首尾相接的圓環(huán)形雙螺旋結(jié)構(gòu),和細(xì)胞核內(nèi)染色體的30億個(gè)獨(dú)立堿基和近3萬個(gè)有用基因相比,數(shù)目是小巫見大巫。
線粒體內(nèi)的基因和細(xì)胞核內(nèi)染色體內(nèi)的基因,有個(gè)基本不同的性質(zhì)。線粒體內(nèi)的基因只來自母親,而細(xì)胞核內(nèi)的基因,分別來自雙親,父母各半,原因是精子的頭部,攜帶著父親完整的23個(gè)染色體訊息,在受精的一剎那間,以最后一哆嗦的高速,全部鉆入卵子體內(nèi),傳與后代雙親細(xì)胞核內(nèi)完整的基因,完成繁衍使命。
精子躊躇滿志之余,回頭一望,糟,怎么把尾巴撂在外面了?
線粒體主要功能是供應(yīng)精子逆流而上的能量,基因資料完全庫存于精子尾部(圖1—7)。在近億個(gè)精子雄獅軍團(tuán)搶著和單一的卵子相會時(shí),只有一個(gè)能拔頭籌成狀元,剩下的全是竹籃打水,瞎忙乎。于是每個(gè)精子的線粒體就卯足了勁拼命供應(yīng)能量,幸運(yùn)的那顆精子一頭扎進(jìn)卵子體內(nèi)時(shí),全數(shù)交出在頭部的染色體基因數(shù)據(jù),而尾巴內(nèi)的物資早已傾囊而出,變成了進(jìn)攻上甘嶺的沖鋒火力,如今只剩下一條枯萎的尾巴空殼,留在卵子體外。
但以逸待勞的卵子內(nèi)由母親方面來的線粒體基因資料可是一點(diǎn)沒少,全數(shù)傳給了下一代。兒子體內(nèi)也有母親完整的線粒體基因,但不傳下代,每代精子的尾巴都留在卵子外面,枯萎后蒂落,劃上了英雄的線粒體基因遺傳休止符。而女兒結(jié)婚生子時(shí),這個(gè)基因數(shù)據(jù)就完整無缺地傳給外孫女,沿母親-女兒系統(tǒng),代代相傳,永不停息。
細(xì)胞核內(nèi)染色體基因的突變,父母雙親可能都有貢獻(xiàn),比起單由母親線粒體而來的基因突變,顯然較復(fù)雜且難以處理許多。另細(xì)胞核內(nèi)的基因突變速率比線粒體基因突變速率緩慢很多,對人類演化歷史的追尋用途不大。但自從“人類基因圖譜”完成后,只來自父親的Y染色體內(nèi)的某些基因,也被用來尋找人類的第一個(gè)父親“亞當(dāng)”。
母親或父親單方面?zhèn)鹘o后代的基因,專家以“單倍體基因類”(Haplotype)稱之。在人體內(nèi)只有母親的線粒體和父親的Y染色體基因符合這個(gè)要求。追尋人類演化歷史,一定得使用這類基因。兩相比較,母系基因比父系基因可靠,下文會談到。
所以,對人類演化歷史最有用的基因,非線粒體基因莫屬。這類基因的突變速率比細(xì)胞核內(nèi)的基因要高出20余倍,每一萬年可能有一個(gè)堿基突變,突變后也穩(wěn)定,是母親-女兒遺傳系統(tǒng)最佳的演化標(biāo)竿,尋找人類第一個(gè)母親“夏娃”的利器。
線粒體中的夏娃
從人類線粒體基因變化中尋找人類演化歷史,思維的基礎(chǔ)不難了解。
想象久遠(yuǎn)以前,真的有那么一位母親“夏娃”,她生出幾個(gè)女兒,每個(gè)女兒都繼承了她線粒體中所有的16,568個(gè)堿基。
她的女兒們又生了外孫女,外孫女又生了曾外孫女,就這樣沿著母親一女兒這條線繁衍下去。
以20年算一代,傳到2,000代時(shí),也就是4萬年后,我們用現(xiàn)代基因鑒定技術(shù),發(fā)現(xiàn)她的后代女兒,已有4個(gè)堿基,和她原來的不一樣了,也就是發(fā)生了突變。而女兒甲后代堿基突變位置和女兒乙后代堿基突變位置不盡雷同,“夏娃”母親于是就分出來哪些女孩是女兒甲的后代,哪些是女兒乙的后代。
時(shí)間又流逝了4萬年,她又多出好些外孫孫女,再通過基因鑒定,她發(fā)現(xiàn)又多出4個(gè)堿基突變。她以4萬年前的基因數(shù)據(jù)為參考,就能決定出哪些女孩是4萬年前哪個(gè)女兒的后代。轉(zhuǎn)眼又過了4萬年,距她的親生女兒們已有12萬年了。她的每代外孫女有的遠(yuǎn)嫁,在不同的自然環(huán)境下生活,發(fā)生更多的堿基突變。這位“夏娃”祖母,通過基因鑒定,還是能歸納出這群女孩們是4萬年前某個(gè)外孫女的后代,另外一群女孩又全是4萬年前另一個(gè)外孫女的后代,她們又全都是8萬年前某一個(gè)外孫女的后代。母系家譜通過基因鑒定,脈絡(luò)清晰可尋。
這個(gè)思維雖然不難,但問題是:處于當(dāng)今21世紀(jì),我們并沒有原版“夏娃”母親哪套完整的16,568個(gè)堿基序列數(shù)據(jù),又怎能找出以后發(fā)生突變的哪些個(gè)堿基呢?還有,我們也沒有中間代外孫女們的基因數(shù)據(jù),又怎能確定在她們體內(nèi)線粒體基因發(fā)生了什么變化呢?
其實(shí)這兩個(gè)問題不難解決。第一,我們并不需要原始“夏娃”母親任何基因資料,我們需要的是一套現(xiàn)代活人完整的線粒體基因圖譜,誰的都行,包括你和我的都管用。
沒有中間代女兒們的突變堿基數(shù)據(jù),也有補(bǔ)救之道。我們可以用現(xiàn)代生存的不同“單倍體基因類群”(Haplog roup)來取代“夏娃”女兒群后代。通過和這套“參考”圖譜對比,找出和這“參考”圖譜不同的堿基和位置就成?!皢伪扼w基因類群”是專家用語,有些拗口,在本文就粗略稱為“基因族群”。相同基因族群成員間堿基變化較小。比較由近到遠(yuǎn)的基因族群堿基的疏親,就可理清各族群間母系家譜關(guān)系。
所以,要在當(dāng)今活人體的線粒體基因中尋找人類第一位母親“夏娃”,首先就是要把線粒體基因“參考”圖譜列出來。
線粒體的“劍橋參考基因圖譜”(Cambridge Reference Sequence,CRS)早在1981年就已出籠,基因取樣于一位屬于基因族群編號為H2a2的歐洲人。第一版共有11處錯誤,1999年修訂后,仍沿用原版編號系統(tǒng),001-16,569,包括1981版在3,107位置有個(gè)多余的空號也沒被刪除,共實(shí)得16,568堿基對。
舉個(gè)例子,“劍橋參考基因圖譜”中16,561—16,569的9個(gè)堿基為ATCACGATG,01—10的10個(gè)堿基為GATCACAGGT,301-310的10個(gè)堿基為AACCCCCCCT”等。
在追尋“夏娃”出身時(shí),其實(shí)用不上全部的堿基。在實(shí)際使用中,只用到線粒體16,569堿基編號中被稱為“控制區(qū)”的16,001—16,569和001—574兩個(gè)片段,尤其是001—574段,因其突變速度快(約每一萬年就有個(gè)堿基突變),突變后的堿基很穩(wěn)定,被使用得最頻繁(圖1—8)。
從概念上來說,追尋人類母系演化歷史,我們現(xiàn)在只要在世界各基因族群中,以“劍橋參考基因圖譜”為標(biāo)準(zhǔn),尋找在001—574這段574個(gè)堿基的變化,然后比較他們之間的異同。兩個(gè)基因族群問堿基的變化相差小的,共同的祖母年代近;找到第一個(gè)共同祖母后,和另一個(gè)基因族群的堿基變化比較,再找出更久遠(yuǎn)的祖母;如此周而復(fù)始地比較下去……,一直找到最古老和惟一的“夏娃”母親為止。
從活著的現(xiàn)代基因族群往回推算,用圖8舉例會更清楚。比較生活在21世紀(jì)的基因族群M和N,在線粒體控區(qū)001—574個(gè)堿基中,只有4個(gè)互不相同,剩余的570個(gè)完全雷同,表示她們共同的、單一的祖母生存于4萬年前(第一層)。M+N和L3比較,只有8個(gè)不同,得共同8萬年前祖母(第二層);M+N+L3和L2比較,有12個(gè)不同,得共同12萬年前祖母(第三層)…,依此類推,最后和一個(gè)在世界上堿基突變數(shù)目最多的基因族群L0(在此以20為例)比較,得人類線粒體“夏娃”生活在20萬年前。
中國的基因族群一般皆取樣于南方的少數(shù)民族,因?yàn)檫@些族群和外界通婚少,較少外來基因混入,基因演化過程“純度”高,可靠性大。世界上和中國南方少數(shù)民族最接近的基因族群是太平洋島嶼原住民,包括臺灣的高山族和所有的波利尼西亞人;次接近的有澳洲和新幾內(nèi)亞土著;再來就是美國印地安人和高加索人……;最遠(yuǎn)的是非洲原住民。
以基因突變對比,不論使用多少基因族群,目前的非洲人種總是最后一步的比較對象。換句話說,現(xiàn)在活著的非洲人體內(nèi)的線粒體基因堿基突變的數(shù)目,比世界上任何基因族群都來得多。不可避免的自然的結(jié)論,就是現(xiàn)代智人共同的“夏娃”母親生存于15萬20萬年前,是非洲人。
用基因突變速率來計(jì)算人類第一個(gè)“夏娃”或“亞當(dāng)”生存的年代,每個(gè)實(shí)驗(yàn)室測量出來的數(shù)字也常有很大的差距,這個(gè)極為不定的因素,也影響到非洲人向外移民的確切年代。但不管早晚,人類的祖先來自非洲的結(jié)論不變(圖1-10)。
以人類線粒體堿基數(shù)據(jù)為線索,原始“夏娃”在13萬-17萬年前的直系基因族群L1,L2和L3現(xiàn)仍是非洲住民。L3基因族群是非洲向外擴(kuò)散主力。其中N支在4萬-5萬年前抵南歐,M和N支在6萬-7萬年前抵印度甚或澳洲大陸;然后M支繼續(xù)向亞洲、北、南美洲擴(kuò)散。
男性的Y染色體幾個(gè)獨(dú)特的堿基突變也被用來尋找人類的第一個(gè)父親“亞當(dāng)”。結(jié)論是現(xiàn)代智人共同的“亞當(dāng)”父親,約生存于6萬年前,也是非洲人。
細(xì)胞核內(nèi)Y染色體堿基突變速率和細(xì)胞核外線粒體堿基突變速率不同,再加上男性的繁殖模式和女性不同,就造成“亞當(dāng)”和“夏娃”的生存年代不同。從理論上來理解,一名男性一生可以使成千上萬個(gè)卵子受精,而女性只能一個(gè)一個(gè)地生小孩,線粒體基因遠(yuǎn)不如男性Y染色體基因散播速度快。一個(gè)男性,比如酋長或皇帝,一下子可能有很多子嗣,可一旦被革了命,就可能斷子絕孫?!皝啴?dāng)”的后代樓起樓塌,相同基因的族群快速大起大落,造成他的生存年代比“夏娃”年輕很多,是可以理解的。另一個(gè)從Y染色體堿基突變數(shù)據(jù)得到的結(jié)論是從非洲出走的男性比女性多。結(jié)語
“多區(qū)域起源說”以出土的化石為證據(jù),認(rèn)為現(xiàn)代智人由各區(qū)域的直立猿人直接演化而來;“非洲智人快速取代說”以現(xiàn)代人的基因?yàn)橐罁?jù),認(rèn)為世界上所有的現(xiàn)代智人皆起源于非洲。
目前在中國出土的化石,有從200萬年前的直立猿人“巫山人”、“元謀人”、“藍(lán)田人”和“北京猿人”,經(jīng)早期智人“金牛山人”,到現(xiàn)代智人“柳江人”、“許昌人”、“河套人”和“山頂洞人”等,形成一個(gè)相當(dāng)完整的證據(jù)鏈。
化石雖是死的,但她們是直接證據(jù),并且會說話:從28萬年前的早期智人“金牛山人”開始,化石骨骼呈現(xiàn)代黃種人結(jié)構(gòu),會制造和使用大量石器,也會使用火和保存火種。
說黃土地上的中國人是從直立猿人連續(xù)演化出來的龍的傳人,和這系列的化石證據(jù)沒有沖突。
基因堿基突變數(shù)據(jù)是人類演化歷史活的記錄,它是間接證據(jù),并且是從基因理論推演出來的學(xué)說。理論要先正確,結(jié)論才接近真理。這個(gè)理論是正確的嗎?
目前全世界每個(gè)“單倍體基因類群”細(xì)胞內(nèi)的確都含有最原始的非洲智人基因。這個(gè)基因何時(shí)開始走出非洲,向外傳播,因基因堿基突變速率和其它文化因素,目前還有相當(dāng)大的不定性。有的基因?qū)W者干脆就說應(yīng)從非洲200萬年前出走的直立猿人起算,一步到位,非洲是人類起源的搖籃,智人是很久以后的事,別爭了!
現(xiàn)代民事法庭是以“對多于錯”(Preponderance evidence)為證據(jù)標(biāo)準(zhǔn),龍的傳人化石證據(jù)以一條龍架勢出現(xiàn),在民事法庭應(yīng)該打得贏這場官司。
以刑事法庭“可疑的陰影”(Shadow of doubt)較嚴(yán)格的證據(jù)為標(biāo)準(zhǔn),只要證據(jù)中有無法澄清的疑問存在,就不能定案。非洲人的基因已在世界各人種包括黃種人的細(xì)胞內(nèi)出現(xiàn),純種龍的傳人立場擺脫不掉可疑的陰影,很難站得住腳。
但科學(xué)真理只有一個(gè),法庭是鐵路警察,管不著這段。