亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        群體遺傳學下動物馴化研究進展

        2021-03-20 01:02:52文子龍趙毅強
        遺傳 2021年3期
        關(guān)鍵詞:等位基因基因組群體

        文子龍,趙毅強

        綜 述

        群體遺傳學下動物馴化研究進展

        文子龍,趙毅強

        中國農(nóng)業(yè)大學生物學院,北京 100193

        動物馴化是將野生動物改變?yōu)槟軌蜷L期穩(wěn)定飼養(yǎng)的家養(yǎng)動物的過程。作為新石器時代農(nóng)業(yè)革命的內(nèi)容,馴化是人類社會文明進步的重要標志之一。由于和人類的密切關(guān)系,馴化不僅改變了動物的野生狀態(tài),也改變了人類的生活習性和文明進程。動物馴化研究的關(guān)鍵問題包含馴化祖先是誰、馴化所產(chǎn)生的改變及馴化時間地點等。隨著高通量基因組技術(shù)和對應分析方法的發(fā)展,目前研究動物馴化一般基于群體水平,在群體遺傳學的框架下研究動物馴化過程中的重要事件。本文總結(jié)了群體遺傳學下動物馴化研究的相關(guān)內(nèi)容,包括群體動態(tài)歷史、選擇信號、基因交流等,著重介紹了基因選擇初始時間和基因交流時間兩個新的拓展內(nèi)容及分析方法,概述了家豬()、家雞()、綿羊()和山羊()等幾種主要農(nóng)業(yè)動物近期馴化研究的進展,以期為動物馴化研究提供了新的方向和視角。

        馴化;家養(yǎng)動物;群體遺傳學;選擇初始時間;基因交流時間

        動物馴化是人類根據(jù)自身的需求將動物從野生狀態(tài)改變?yōu)榛筐B(yǎng)狀態(tài)并為人類提供所需的過程。在馴化過程中,野生動物由兇猛變?yōu)闇仨?,從低產(chǎn)變?yōu)楦弋a(chǎn)等[1]。這一過程會持續(xù)多個世代[2]。距今約12,000多年前,人類逐漸拋棄了通過采集和狩獵獲取食物,而慢慢轉(zhuǎn)向以農(nóng)耕和馴養(yǎng)動物為主的生產(chǎn)方式[3]。馴化是新石器時代農(nóng)業(yè)革命的重要內(nèi)容,是人類社會文明進步的標志之一。研究表明馴化事件主要發(fā)生在世界上的9個地區(qū):中東、中國、美國東部、中美洲、安第斯/亞馬遜、西非熱帶、薩赫勒、埃塞俄比亞和新幾內(nèi)亞[4]。動物馴化是人類進行的最廣泛的遺傳實驗,馴化導致動物的某些性狀,如性情、生長和繁殖等方面與野生祖先相比產(chǎn)生了顯著的改變[5,6]。通過開展動物馴化的研究,不僅有助于人們了解野生動物的遷移、演化規(guī)律和遺傳多樣性,還能幫助人們更全面的了解現(xiàn)代人類文明社會的發(fā)展歷史和傳染病歷史[7]。

        對于動物馴化研究,最基本的問題在于馴化物種的野生祖先有哪些?由馴化引起哪些基因組和表型的變化?以及馴化所發(fā)生的時間和地點等[5,6,8]??脊艑W是研究動物馴化歷史的一個重要方法。經(jīng)過考古發(fā)現(xiàn),對獲得的各種動物遺骸進行骨骼形態(tài)學、同位素斷代法等分析,從而達到追蹤其馴化軌跡,了解其馴化起源和馴化歷史的目的。考古學相關(guān)研究給研究者提供了人類馴養(yǎng)動物的直接證據(jù)。例如,在近東和歐洲東南地區(qū)的墳墓中發(fā)現(xiàn)的陶罐證明人類在7000年之前就已經(jīng)飲用牛奶[7,9]。此外,在哈薩克斯坦地區(qū)的Eneolithic Botai遺址中發(fā)現(xiàn)了可以追溯到5500年前的一具馬骨架上有系過韁繩的印跡[10]。雖然考古學常用的C14法能夠精確的判斷時間范圍,但其只能對已經(jīng)發(fā)掘出來的馴化動物標本進行推斷,加上馴化之初的家養(yǎng)動物與野生祖先在形體狀態(tài)上差異較小,如狼與早期家犬就具有相似外形,使得其推斷的起源時間并不是馴化動物的真實起始時間,且該時間會比真實的馴化起始時間要晚[7]。

        群體遺傳學興起于20世紀初,是遺傳學的分支領(lǐng)域,也是研究生物進化的主要手段[11]。群體遺傳學主要關(guān)注種群內(nèi)部和種群之間的遺傳差異研究,其中包括自然選擇(natural selection)、人工選擇(artificial selection)、漂變(gene drift)、突變(mutation)、基因流(gene flow)及群體歷史動態(tài)(demography)等過程的研究。群體遺傳學現(xiàn)在正處于一個前所未有的革命性階段,隨著DNA測序技術(shù)的高速發(fā)展,遺傳數(shù)據(jù)被快速、準確、大量地產(chǎn)生。目前動物馴化研究主要在群體基因組水平,使用遺傳多態(tài)標記來研究家養(yǎng)動物與其野生祖先之間的關(guān)系以及可能的馴化事件,其相關(guān)的研究方法也就此產(chǎn)生且快速發(fā)展[12]。用于動物馴化研究的遺傳多態(tài)性標記包括微衛(wèi)星標記、線粒體變異及以SNP為主的基因組變異[13]。2016年,Wang等[14]對總共58只犬科動物的全基因組進行大規(guī)模重測序,其中包括12只灰狼()、27只來自亞洲和非洲的土狗()以及分布世界各地的19種不同犬種。分析得出:家犬()起源于3.3萬年前的東亞南部,且在15,000年前一部分祖先群體開始遷移到中東、非洲和歐洲,在大約10,000年前到達歐洲??脊艑W與分子生物學的結(jié)合,成為目前研究動物馴化新的方向。Peters等[15]通過對家雞()基因組數(shù)據(jù)進行分子鐘分析,發(fā)現(xiàn)家雞由野生原雞()分化而來的時間約在9500±3000年之前,這一時間范圍要比考古所得時間早很多。同樣,基于全基因組數(shù)據(jù)所得到的家犬起源時間比考古記錄中最早發(fā)現(xiàn)的犬化石的時間早了約15,000年[14,16]。

        1 群體遺傳學下動物馴化研究的經(jīng)典內(nèi)容

        1.1 群體動態(tài)歷史估計

        群體動態(tài)歷史是長期和短期變化的綜合結(jié)果,了解群體動態(tài)歷史可以幫助我們更好地理解種群在時間維度上的變化,再結(jié)合考古或是歷史記載則可以估計出精確的動物馴化時間。為了研究物種極其復雜的演化和馴化過程,研究者使用概率論和數(shù)理統(tǒng)計設計出了多種基于基因組遺傳變異特征的方法重建群體歷史[17],包括基于單倍型的方法、基于位點頻譜(site frequency spectrum, SFS)、連鎖不平衡(linkage disequilibrium, LD)及群體參數(shù)模擬等多種方法。

        1.1.1 基于單倍型信息

        種群的動態(tài)事件影響種群的遺傳結(jié)構(gòu),典型的種群動態(tài)事件包括種群擴張(expansion)、瓶頸效應(bottleneck)、奠基者效應(founder effect)、群體分化(population subdivision)以及群體間的基因交流等。在溯祖理論的基礎(chǔ)上,Li和Durbin[18]首次發(fā)表了用于種群動態(tài)歷史估計的PSMC (pairwise sequentially Markovian coalescent)方法。PSMC是一種隱馬爾可夫模型(hidden Markov model, HMM)框架來估計作為隱狀態(tài)參數(shù)的最近共同祖先(time to the most recent common ancestor, TMRCA)的時間,然后使用公式=/4(為群體遺傳參數(shù),為突變頻率)來計算歷史上每個時間點對應的有效群體大小()。該方法認為在二倍體基因組中存在著成千上萬個由于重組產(chǎn)生的獨立的基因座,每個基因座內(nèi)的雜合度水平都對應一個TMRCA。有些基因座等位基因間雜合度低,因此共同祖先時間較近,有些基因座等位基因間雜合度高,則其對應的TMRCA較早。根據(jù)不同基因座的時間分布,可用來估計種群大小隨時間變化的波動。在PSMC基礎(chǔ)上,Schiffels等[19]于2014年又擴展了可以同時計算多個個體的多序列馬氏鏈溯祖模型(multiple sequentially Markovian coalescent, MSMC),以及后續(xù)開發(fā)的版本MSMC2。在估算近期種群動態(tài)歷史時,MSMC2需要更精準的單倍型分型數(shù)據(jù),所以其對單倍型分型錯誤(phasing error)異常敏感[20]。2016年Terhorst等[20]針對PSMC方法因單個樣本且分辨率低、MSMC2方法對單倍型分型錯誤十分敏感,以及計算負荷重等問題,開發(fā)了SMC++ (sequential Markov coalescent + plenty of unlabeled samples)軟件。該軟件與PSMC都是基于HMM算法與溯祖模型,其還充分利用了SFS及LD信息,SMC++拓展了PSMC使得該方法能夠在沒有單倍型分型(unphased)的情況下高速處理大量基因組數(shù)據(jù),并能夠根據(jù)位點之間的連鎖信息來估算群體之間的分化時間,并推測有效群體大小的變化趨勢[20]。為了提高估計的魯棒性(robustness),PSMC、MSMC2和SMC++均利用自舉法(bootstrap)多次進行重復計算來保證估計質(zhì)量[13]。

        1.1.2 基于位點頻譜信息

        群體變異頻率信息也被用于推算群體歷史變化。例如,若發(fā)現(xiàn)SFS上存在較多低頻位點,則可知該群體在某個時間產(chǎn)生了群體擴張事件;而在SFS上低頻位點少于預期且整體雜合度偏高時,則推測該群體發(fā)生過群體收縮事件。相比于PSMC和MSMC2等方法,基于等位基因變異頻率的SFS方法(也叫做mutation frequency spectrum, MFS)[21~23]可以估算更為近期的群體歷史,而且可以方便地使用較大的群體信息進行推斷。SFS方法需基于先驗模型來進行計算,隨后未知群體歷史參數(shù)的后驗分布需要從先驗分布中采取重復抽樣估計所得[24,25]。另外,SFS方法還可以重建十分復雜的多群體歷史變化,并推測群體間的遷徙事件。基于SFS方法重塑群體歷史的軟件包括?a?i[24]和Fastsimcoal2[25]。其中,?a?i軟件使用擴散近似法(diffusion approximation)對一個群體或多個群體的SFS來估算3個群體以內(nèi)的有效群體大小變化、群體分化及遷移率等;Fastsimcoal2軟件則使用復合似然法(composite likelihood)來推算群體的進化過程[13]。

        1.1.3 基于連鎖不平衡信息

        為了克服不完全系譜的限制,越來越多的研究者意識到可以通過基因組數(shù)據(jù)中的LD信息來估計歷史有效群體大小[26]。LD用來描述不同基因座中等位基因的非隨機關(guān)聯(lián)關(guān)系,其可能由群體歷史中的交流事件或基因漂變所產(chǎn)生,或者是源于背景選擇(background selection)[27]。因為LD的方差和相關(guān)聯(lián),所以根據(jù)LD可推測[28]。SNeP[26]工具使用SNP數(shù)據(jù),并根據(jù)LD、和重組率之間的關(guān)系估算有效群體大小的趨勢,即歷史有效群體大小。其公式如下[29]:

        式中N()是代之前的有效群體大??;(c)是用來估計代之前重組率c的映射函數(shù);2代表群體LD的大小,用于調(diào)整群體的樣本量(2=2– (β)–1,是樣本數(shù)量;樣本為分相數(shù)據(jù)時:β = 2,樣本數(shù)據(jù)未分相時:β = 1);a是用于修正突變值的常數(shù)。

        1.1.4 基于群體參數(shù)模擬

        近似貝葉斯(approximate Bayesian computation, ABC)算法通過數(shù)據(jù)模擬的方式,逼近似然函數(shù)的效果,適用于復雜模型中似然函數(shù)推斷困難或無法計算的情況[30]。該方法先根據(jù)觀測數(shù)據(jù)相關(guān)遺傳參數(shù)(雜合度、遺傳距離等)確定先驗分布,再對先驗分布經(jīng)過抽樣得到待選參數(shù)并帶入模型進行模擬,隨后比較觀測數(shù)據(jù)與模擬數(shù)據(jù)的差異,如果小于設定的閾值,則接受該待選參數(shù)作為后驗分布的采樣。經(jīng)過多次采樣、仿真和比較以后,即可得到參數(shù)的后驗分布。根據(jù)貝葉斯法則,在觀測數(shù)據(jù)集中,未知參數(shù)的后驗概率表達式為:

        表示在數(shù)據(jù)集中的后驗概率分布,表示關(guān)于的似然函數(shù),表示的先驗概率分布。表示邊緣概率分布,通常忽略不計,故上式可以寫為:

        ABCtoolbox[31]是基于ABC方法軟件,其能夠執(zhí)行完整ABC分析的所有步驟,從先驗分布的遺傳參數(shù)采樣、數(shù)據(jù)模擬,到匯總計算后驗分布及概率,再到結(jié)果可視化。該軟件常結(jié)合Fastsimcoal2[25]的數(shù)據(jù)模擬功能進行優(yōu)化。為了更加精準地估計群體的演化歷史,Sanchez等[32]基于深度學習中的人工神經(jīng)網(wǎng)絡(artificial neural networks, ANN)方法設計了MLP (multi-layer perceptron)、Custom CNN (convolu-tional neural network)和SPIDNA (sequence position informed deep neural architecture)等架構(gòu),利用群體中樣本個體的SNP數(shù)據(jù)來推斷有效歷史群體大小,其中SPIDNA的估計效果最佳;并且該研究還發(fā)現(xiàn)將深度學習與ABC方法結(jié)合起來能夠?qū)Y(jié)果進一步優(yōu)化。

        1.2 選擇信號研究及檢測方法

        自然及人工選擇是馴化過程中關(guān)鍵的影響因素,經(jīng)過長期定向的高強度選擇,讓滿足人類需求的特定性狀固定下來。選擇導致目標基因座,以及相鄰基因座中等位基因的頻率發(fā)生變化[33],并在基因組中留下相應的印記。未被選擇的等位基因及其連鎖基因的頻率降低的現(xiàn)象被稱為“選擇性清掃”(selective sweep)[34]。而目標基因座臨近區(qū)域中等位基因頻率的變化模式與中性理論預期的不同,被稱為“搭便車效應”(hitchhiking)[35]。兩者是選擇信號的不同表述方式,而所體現(xiàn)的群體遺傳事件的背景相同。選擇信號在基因組上所產(chǎn)生印跡的主要特征為:(1)被選擇位點極端高的等位基因頻率;(2)被選擇區(qū)域長范圍增加的單倍型純合度;(3)群體分化。依據(jù)所選擇的等位基因或單倍型的起始頻率和終端頻率,選擇信號依次被劃分為兩種:硬選擇(hard sweep)和溫和選擇(soft sweep)[34,36,37]。根據(jù)被選擇等位基因或單倍型頻率方向的變化不同,選擇又可分為正向選擇(positive selection)、負向選擇(negative selection)和平衡選擇(balancing selection)[12,34,38,39]。

        1.2.1 基于經(jīng)典群體遺傳學特征檢測

        選擇信號的驗證統(tǒng)計量大多都針對正向選擇和負向選擇展開設計[34,40]。隨著基因組測序技術(shù)的廣泛應用,選擇信號被更加準確地識別。目前這方面的綜述相對較多,本文不做贅述。檢測選擇信號最常用的方法可以分為五大類[41]:基于序列水平的替換率(substitution rates),如MKT和dN/dS檢驗;基于LD,主要有LRH (long-range haplotype)、EHH (extended haplotype homozygosity)和iHS (integrated haplotype score)檢驗;基于等位基因頻譜(allele fre-quency spectrum),包括Tajima’s、Fay以及Wu’s H檢驗;以及基于群體分化(differences between popu-lations),包括ST、XP-CLR (cross population com-posite likelihood ratio)、LSBL (locus-specific branch lengths)、XP-EHH (cross population-extended haplo-type homozygosity)和hapFLK檢驗等[42~44];還有一些復合策略方法綜合考慮以上特征,主要包括CMS (composite of signals)、Meta-SS、CSS (composite sele-ction signals)和DCMS (de-correlated composite of signals)方法[45~48]。

        圖1 受到正向選擇的等位基因信號與經(jīng)典統(tǒng)計量檢測方法的關(guān)系

        典型的正向選擇過程(圖左):1~2:受到環(huán)境等外在選擇壓力后, 基因組中的某中性區(qū)域出現(xiàn)了一個新生有益突變(顯示為一個黑色等位基因);3:隨后攜帶該突變的個體在種群中的占比迅速攀升,并且位于其周圍與其相連鎖的中性突變頻率也隨之增加(“搭便車效應”),形成了一個受選擇區(qū)間;4:通過個體間的重組進一步增加了該有益突變的頻率,最終該有利突變在種群中固定下來,形成了受選擇區(qū)域。根據(jù)文獻[49]修改繪制。

        1.2.2 基于機器學習檢測

        隨著基因組數(shù)據(jù)的爆炸式增長,如何在龐大的數(shù)據(jù)中提取有利信息并得到真實可信的結(jié)論成為現(xiàn)今研究者的一大挑戰(zhàn)。Schrider等[50]研究認為,經(jīng)典統(tǒng)計學方法難以滿足群體遺傳學目前的發(fā)展,功能更強大的機器學習方法才是大數(shù)據(jù)時代的有利工具。機器學習目前可分為3大類別:無監(jiān)督學習、有監(jiān)督學習和半監(jiān)督學習[12]。研究表明,有監(jiān)督學習更適合檢測自然選擇信號,且相比于傳統(tǒng)統(tǒng)計量方法有著更優(yōu)的表現(xiàn)。有監(jiān)督學習[51]算法包括支持向量機(support vector machine, SVM)、決策樹(decision tree)、隨機森林(random forest)、神經(jīng)網(wǎng)絡(neural network)等[12]。Lin等[52]通過組合學習將H、π、W、Tajima’s、iHH和Fay & Wu’s H等幾個傳統(tǒng)統(tǒng)計量綜合起來訓練,其優(yōu)勢在于能夠準確的將自然選擇信號和群體歷史事件辨別開來。群體大小變化、自然和人工選擇等事件可能同時發(fā)生,并在基因組中留下類似的印記。如果忽略之間的相互影響,或者不進行細致的剖分,估計出來的遺傳參數(shù)可能存在偏差,導致做出錯誤推斷。這一方法運用到了兩個分類器(classifier):第一個分類器判斷用于檢測的數(shù)據(jù)是否存在可能的選擇信號,而第二個分類器則是判斷上一個分類器檢測的信號是源于自然選擇還是瓶頸效應。該方法依據(jù)Boosting得到的權(quán)重高低,判斷不同情況下各種統(tǒng)計量在檢測信號時的適用范疇[12]。結(jié)果表明,iHH在檢測近期產(chǎn)生的自然選擇時結(jié)果更佳;而在檢測時間較早期的自然選擇時,π更加有效果;對于區(qū)分自然選擇和瓶頸效應信號時,則W更為擅長[12]。

        2 基因選擇初始時間估計

        除了對馴化過程中選擇信號的定性和定量研究,對選擇發(fā)生時間的研究也逐漸成為研究者感興趣的問題。雖然用于檢測選擇信號的方法較多,但是估計選擇初始時間的方法仍然有限。現(xiàn)有的估計方法分為兩種,其一是針對時間序列數(shù)據(jù)的選擇初始時間估計,該數(shù)據(jù)要求較多歷史時間節(jié)點的采集樣本,通過綜合各時間節(jié)點的數(shù)據(jù)估計某個有利突變的選擇初始時間[53]。其中最為典型的方法是 Malaspinas等[54]發(fā)表的基于馬氏鏈模型對選擇初始時間進行的最大似然估計。第二種方法則是針對非時間序列數(shù)據(jù)的有利突變選擇初始時間估計,目前以近似貝葉斯(ABC)算法最為知名。

        2003年,Przeworski等[55]首次運用ABC算法推測有利突變的選擇初始時間。作者使用溯祖模擬產(chǎn)生相關(guān)模擬數(shù)據(jù),再分別利用分離位點數(shù)(the number of segregating sites,)、Tajima’s、SFS和單倍型種類數(shù)(the number of distinct haplotypes in the sample,)等統(tǒng)計量對這些模擬數(shù)據(jù)進行分析。作者發(fā)現(xiàn)隨著統(tǒng)計量數(shù)目的增加,選擇初始時間估計值的后驗概率分布曲線斜率逐漸增大,即估計時間結(jié)果更為準確[53]。為了了解生活在美國白沙國家公園的兩種蜥蜴(和)由于環(huán)境變化而產(chǎn)生適應的遺傳機制,Laurent等[56]使用ABC算法結(jié)合21種統(tǒng)計量對與膚色相關(guān)的基因進行了選擇初始時間估計,結(jié)果發(fā)現(xiàn)群體中的估計時間較早(約1200年前),而在群體中的估計時間則稍晚(約900年前)。雖然兩者的估計時間不一致,但其膚色都是在白沙形成之后(約7000年前)改變的。

        3 基因交流檢測及時間估計

        隨著對基因交流事件研究的日益深入,其越來越被認為是進化中的一個核心過程。遺傳上有別的種群彼此相遇并發(fā)生雜交,這一過程廣泛影響著馴化動物以及人類的演化進程[57]。

        之前的系統(tǒng)發(fā)育分析方法大多假定生物類群的分化方式是樹狀結(jié)構(gòu),即系統(tǒng)樹是個二岐(bifurca-ting)分支樹。然而,隨著研究的不斷深入,研究人員發(fā)現(xiàn)樹狀結(jié)構(gòu)不能準確的展現(xiàn)真實進化過程。近年來,有研究者提出了更能體現(xiàn)實際進化過程的系統(tǒng)發(fā)育網(wǎng)絡模式(phylogenetic network),以表現(xiàn)多個系統(tǒng)樹之間的網(wǎng)狀進化結(jié)構(gòu)[58]。網(wǎng)絡狀進化模式同樣適用于馴化事件。馴化被認為是一個長期的、動態(tài)的過程[59],涉及野生和家養(yǎng)種群之間的基因交流(馴化過程中以及馴化后)[60]。當來自兩個或多個不同種群的個體開始交換遺傳物質(zhì)后,遺傳重組將親本基因組打斷成不同大小的片段,來自不同祖先亞群的染色體片段在子代染色體上鑲嵌混合[61]。基因交流可以是單次事件,也可能連續(xù)發(fā)生。隨著世代數(shù)增加重組事件也增多,LD片段逐漸變短。每個祖先親本種群的單倍型片段的期望長度是自初始交流事件產(chǎn)生以來的世代數(shù)的函數(shù)。通過比較祖先個體或群體的基因組,可以推斷遺傳自某一祖先群體的基因組片段的構(gòu)成和比例,即局部和全局祖源分析?;蚪涣骰蚧驖B入(introgression)是普遍的生物學過程,近年來受到廣泛的關(guān)注。一個群體可以通過基因交流快速獲得新的優(yōu)勢等位基因,增加群體的適應性。通過基因交流獲得的基因可能幫助受體獲得某些新的功能或者適應環(huán)境的變化,這種滲入稱為適應性基因滲入(adaptive introgression)[62]。2015年,艾華水等[63]研究發(fā)現(xiàn)中國南北(低高緯度)豬種()X染色體上存在兩種長達14 Mb的低重組單倍型[64],該研究應用分子鐘模型估算該14 Mb差異單倍型在約8.5百萬年前分化,遠早于本地豬的分化時間;推測可能由于一種已經(jīng)滅絕的對中國北方豬X染色體上滲入的基因幫助中國北方豬適應了寒冷的環(huán)境。

        檢測是否發(fā)生基因交流也是馴化研究的主要內(nèi)容之一,目前主流的方法主要有f4和f3統(tǒng)計量[65,66]、統(tǒng)計量[67]和基于統(tǒng)計量衍生出來的DFOIL方法[68]等。一些分析方法如主成分分析(principal com-ponents analysis, PCA)、Admixture、Structure等工具可用來提示基因滲入的發(fā)生。Reich等[66]提出的f4統(tǒng)計量,通過衡量4個群體的系統(tǒng)發(fā)生關(guān)系與群體間等位基因頻率差異之間的關(guān)系來判斷可能的基因滲入。對于群體A、B、C和D,以及假定的總體拓撲(A,B)(C,D),f4統(tǒng)計量為A和B之間以及C和D之間等位基因頻率差的乘積,即:(a-b)(c-d)。如果群體間沒有混雜,f4統(tǒng)計量的期望值為0。如果f4統(tǒng)計量的觀測值顯著偏離0,則提示至少有一個群體存在混雜。f4統(tǒng)計量還有一個簡單版本f3統(tǒng)計量,用于檢測群體A是否由群體B和群體C混雜而來,即:(a-b)(a-c)。當f3統(tǒng)計量為負時,提示群體A由群體B和群體C混雜而來。

        統(tǒng)計量也是檢測基因交流的主流方法之一[69]。統(tǒng)計量中定義了H1與H2兩個姐妹群體,H3為滲入源群體,H4為外群,并將外群等位基因認定為祖先等位基因。統(tǒng)計量只能用于雙等位基因位點,其中定義a為祖先等位基因,b為衍生等位基因。統(tǒng)計量的公式為(修改自文獻[69]):

        如果沒有基因交流發(fā)生,統(tǒng)計量的期望值則為0。而當統(tǒng)計量為正值時,結(jié)果表明H2群體與H3群體共享更多位點,則推斷H3對H2有基因滲入。相反的,當統(tǒng)計量為負值,則表明H1群體與H3群體共享更多位點,即推斷H3對H1群體有基因滲入。統(tǒng)計量的設計原理需要滲入源和被滲入群體在等位基因狀態(tài)上差異較大,否則統(tǒng)計量將不會檢測到基因滲入信號[69]。統(tǒng)計量最早用于檢測尼安德特人()對現(xiàn)代人祖先的基因滲入,后廣泛應用于動物馴化分析。Frantz等[70]使用統(tǒng)計量對東南亞野豬()與家豬之間的基因流事件進行了研究,證明了東南亞桑德蘭群島上的物種之間存在交流事件,且共享著大量的等位基因。

        對基因交流時間進行估計是基因交流鑒定分析的擴展,可以幫助更好的理解復雜的群體演化歷程。子代個體的基因組包含了從不同祖先而來的片段,由于重組事件打斷了染色體片段[71~73],利用位點間LD和單倍型片段在后代個體基因組中的分布這兩個原理可推斷交流事件發(fā)生的日期[74]。

        近年來,已經(jīng)開發(fā)了多個估計交流事件時間的工具[75]。(表1,表2) Patterson等[65]于2012年發(fā)布了包含ROLLOFF在內(nèi)等多個基因交流分析方法的軟件包Admixtools,其中ROLLOFF是最早基于兩個位點之間的連鎖不平衡信息來研究基因交流時間的方法[76]。該方法認為通過基因交流產(chǎn)生的LD隨著重組的發(fā)生呈指數(shù)衰減(e–nd,為自交流以來的世代數(shù),為SNP之間的遺傳距離)。ROLLOFF計算成對標記之間的LD統(tǒng)計量與反映祖先群體中等位基因頻率差異權(quán)重之間的相關(guān)系數(shù),分析標記間遺傳距離的增加對相關(guān)系數(shù)的影響,并利用最小二乘模型對相關(guān)系數(shù)的衰減進行了指數(shù)擬合,最后得到交流事件發(fā)生時間的估計值[76]。

        表1 基于LD估計交流時間工具匯總

        根據(jù)文獻[75]修改總結(jié)。

        表2 基于單倍型/祖先區(qū)塊大小分布估計交流時間工具匯總

        根據(jù)文獻[75]修改總結(jié)。

        根據(jù)模擬及真實數(shù)據(jù)的測試,ROLLOFF可以對過去500代內(nèi)發(fā)生的交流事件的時間進行準確的估計。但是,對于小樣本量、交流比例低和交流時間較早群體的估計中會產(chǎn)生輕微的向上偏差。同時該方法還會受瓶頸事件和基因漂變等影響,但是幾乎不受未校正祖先群體的影響[76]。ALDER[77]拓展了ROLLOFF的方法,利用由混合片段引起的連鎖不平衡的指數(shù)衰減作為遺傳距離函數(shù)。ALDER提出了一個新的加權(quán)LD統(tǒng)計量,該統(tǒng)計量可用于推斷群體的混合比例和交流時間,相比之前方法其對于參考群體的約束更少。MALDER[77]則是ALDER的一個拓展版本,其可以運用于多個交流事件同時發(fā)生的情形,能夠反應更真實的歷史事件[75]。

        Chimusa等[75]通過利用模擬數(shù)據(jù)與真實數(shù)據(jù)的對比發(fā)現(xiàn)MALDER和GLOBETROTTER兩種工具的精度最佳。其中GLOBETROTTER[81]考慮到群體遷徙、交流事件可能多次發(fā)生和涉及多個群體的情況。該方法將樣本中的每個個體視為接收者,其染色體是其他個體貢獻的DNA片段重建而來。首先使用工具CHROMOPAINTER[84]將混合個體的染色體分解為各個區(qū)塊,并將各區(qū)塊與最可能的祖先個體相關(guān)聯(lián),然后確定交流種群的完整單倍型區(qū)段并將其與不同的祖先種群配對。該方法對于每組擬合一條指數(shù)衰減分布曲線并估計最佳擬合率,然后估計其發(fā)生的時間。Galaverni等[85]對意大利狼(L)群體使用PCADMIX工具結(jié)合ALDER計算群體的混合時間,其結(jié)果表明基因交流大多數(shù)在采樣前的3到4代發(fā)生,而最早的事件可追溯到采樣之前的19代。

        4 群體遺傳學用于動物馴化的研究

        隨著高通量測序及SNP芯片成本逐漸降低,在群體水平研究動物馴化的報道日益增加。目前對于豬、雞、綿羊()和山羊()等家養(yǎng)動物的研究進展較多。

        4.1 家豬

        約在10,000年前,豬在近東和中國被馴化。馴化過程中,豬受到自然選擇和人工選擇的共同作用,在外形、繁殖力、生長發(fā)育和環(huán)境適應性等方面表現(xiàn)出顯著改變[63]。目前在中國家豬中已發(fā)現(xiàn)多個與馴化性狀相關(guān)的基因受到選擇。例如, 與神經(jīng)系統(tǒng)相關(guān)的基因與免疫應答相關(guān)的基因以及與生長相關(guān)的基因等[86]。但是,目前仍缺乏被選擇基因選擇初始時間的研究報道。梁作翔[53]使用ABC算法估計了部分中國家豬中與馴化性狀相關(guān)基因的選擇壓力和選擇初始時間,并比較了不同基因的選擇初始時間差異。結(jié)果表明,與神經(jīng)系統(tǒng)相關(guān)的基因(約8,473.32年前)和與生長相關(guān)的基因(約1,587.75年前)之間的選擇初始時間相差甚遠。經(jīng)過估計多個基因選擇初始時間后, 其認為中國家豬的馴化是一個不斷復雜變化的過程, 與同一馴化性狀相關(guān)的基因既包括早期選擇又包括近期選擇,持續(xù)不同的馴化過程影響著這些性狀的改變。最近的研究中,Chen等[87]利用266只歐亞野豬和家豬的全基因組測序數(shù)據(jù),得到了法系長白豬(French Large White, FLW)與中國豬之間的滲入比例,并通過ALDER軟件計算得到法系長白豬在約200~300年前與華南豬(Southern Chinese pigs, SCN)和華東豬(Eastern Chinese pigs, ECN)發(fā)生過基因交流事件。

        4.2 家雞

        家雞馴化于8000~10,000年前,是最早馴化的鳥類之一。在地理隔離和人工選擇等因素作用下,家雞成為表型和用途最為豐富的馴化動物之一,包括給人類提供食物的蛋雞和肉雞、用來娛樂打斗的斗雞(gamecock)及用于觀賞消遣的觀賞雞等。Rubin等[88]首次對9個雞群體進行了全基因組測序(whole genome sequencing, WGS),其中包括紅色原雞(Red Junglefowl)、肉雞及蛋雞。根據(jù)標準化雜合度(Z- transformations of the pooled heterozygosity, ZP)方法發(fā)現(xiàn)基因在馴化中受到了強烈選擇。進一步研究發(fā)現(xiàn)基因有一個非同義突變發(fā)生在外顯子區(qū)域,可能與雞季節(jié)性發(fā)情相關(guān)。李明洲課題組利用統(tǒng)計量檢測了紅色原雞和10種家雞之間的基因滲入,發(fā)現(xiàn)紅色原雞與藏雞之間存在更多的滲入?yún)^(qū)域,可能跟野生紅色原雞與山區(qū)散養(yǎng)的藏雞經(jīng)常混在一起生活所導致。該研究還發(fā)現(xiàn)藏雞長期生活在高海拔地區(qū)的過程中,獲得了適應高海拔環(huán)境的能力,例如其紅細胞數(shù)量、血氧親和力和血紅蛋白濃度都有所增加,而通過π、ZST(Z-transforma-tions ofST)和Tajima’s檢驗等方法進行選擇信號分析得到,和基因在參與藏雞適應高海拔輸送氧的方面可能起作用。該研究也發(fā)現(xiàn)藏雞中GTP酶(GTPase)的調(diào)控活性顯著增加,這表明能量代謝對于維持藏雞體溫的重要性[89]。然而,基因滲入除了發(fā)生在野生雞種和地方雞種外,商業(yè)品種也會有基因滲入到家雞當中。張春媛等[90]通過比較群體單倍型相似性發(fā)現(xiàn)在我國商業(yè)雞種的基因滲入到了地方雞種基因組中,而由于我國遺傳育種保護工作起步較晚,很多方面缺少有效監(jiān)管,導致基因滲入事件的發(fā)生,可能對我國家雞遺傳資源造成了基因污染。

        4.3 綿羊和山羊

        綿羊和山羊是最早被馴化的反芻動物,源于扎格羅斯山脈附近,已有10,000年的馴化歷史[91,92]。作為世界農(nóng)業(yè)經(jīng)濟的重要組成部分,為人們提供了包括肉、毛、奶、皮革等產(chǎn)品[93]。李孟華課題組利用來自129個家羊群體和包括亞洲摩弗倫(Asiatic mouflon)、歐洲摩弗倫(European mouflon)、盤羊(argali)、烏利阿爾羊(urial),大角羊(bighorn)、瘦角羊(thinhorn)和雪羊(snow sheep)等7種野生羊種的3938個樣本數(shù)據(jù),結(jié)合40年間117個氣候變化的數(shù)據(jù),通過統(tǒng)計量及XP-CLR等方法解析了野生綿羊物種中與抗菌及先天性免疫有關(guān)的基因滲入到家養(yǎng)綿羊中,并對抵御肺炎和快速適應氣候做出了貢獻[94]。姜雨課題組研究了山羊馴化基因的起源,利用來自世界各地的164只家養(yǎng)山羊、24只野山羊、56個山羊化石及6個其他野羊物種的基因組數(shù)據(jù)進行分析。運用f3統(tǒng)計量和統(tǒng)計量分析了山羊中的基因交流事件,并使用ST和XP-EHH方法進行選擇信號分析,推斷提高羊群胃腸道抗寄生蟲能力的基因使得山羊能夠更加適應人類環(huán)境,并在山羊馴化過程中起著重要的作用[95]?;谌后w基因組學下的遺傳變異研究加深了人們對綿羊和山羊遺傳及適應機制的認知。

        5 結(jié)語與展望

        群體遺傳學用于動物馴化研究,極大地擴展了研究的內(nèi)容,并推動了學科的發(fā)展。一些經(jīng)典的研究內(nèi)容,如基因組選擇信號和基因交流信號的檢測已經(jīng)相對比較成熟,而對群體歷史及時間估計等方面的方法研究可做的工作還有很多。對于群體歷史推斷,不同的方法各具優(yōu)點,例如在缺失先驗模型的情況下推斷種群有效群體大小歷史變化和種群間分化時間時,可以利用PSMC、MSMC2及SMC++等方法,不過這類方法沒有過多考慮群體之間的基因流事件,其歷史真實性會受到影響[96];SFS方法對重構(gòu)復雜的多群體歷史變化和推測群體之間的遷徙事件具有很好的效果;推測近期歷史事件則可以利用基于LD或者IBD (identical by descent)的方法來得到較為準確的時間。為了更準確的估算結(jié)果則需要充分考慮可能發(fā)生的歷史事件,構(gòu)建更全面的模型進行推斷。基于恰當模型量化特定群體歷史的方式逐漸成為一種主流,然而模型的適合度固然重要,但是其穩(wěn)定可行性卻更為重要。一個模型若要在任何參數(shù)上都與真實的群體歷史相匹配的概率極其微小,我們需要帶著實際科學問題去設計不同的模型來研究我們最感興趣的問題,通過利用赤池信息量(Akaike information criterion, AIC)或貝葉斯信息量(Bayesian information criterion, BIC)等標準來篩選與實際數(shù)據(jù)最吻合的模型。

        在過去的幾十年中,關(guān)于馴化的考古學研究和遺傳學研究持續(xù)開展。研究馴化的時間節(jié)點不僅有助于了解馴化對象自身的群體歷史,而且有助于了解人類的遷移擴散和文明發(fā)展史[7]。對于基因選擇初始時間的估計,種群動態(tài)歷史也是重要的影響因素之一。Ormond等[97]在估計鹿鼠(deer mouse)中某一個與皮膚顏色變化有關(guān)的有利突變的選擇初始時間時,發(fā)現(xiàn)如果在模擬數(shù)據(jù)中不加以種群動態(tài)歷史模型推斷,則根據(jù)真實數(shù)據(jù)估計所產(chǎn)生的后驗概率分布顯著離散,即準確度偏低。而在添加了種群動態(tài)歷史模型之后,估計真實數(shù)據(jù)的后驗概率分布就變得非常集中,即準確率顯著提高。對于交流時間估計來說,近年來由于基因分型和測序技術(shù)的進步,以及統(tǒng)計和計算工具的發(fā)展使得以上方法能夠更精確的估計基因交流事件發(fā)生的日期。基因交流的研究可以用來揭示很多極為有趣的生物學問題,例如,F(xiàn)rantz等[98]通過對多種模型進行比較展示了十分復雜的豬的馴化進程。野豬和家豬群體之間的基因交流在馴化過程中或馴化后均普遍存在。另外,人工選擇又抵消掉野生和家養(yǎng)群體基因交流產(chǎn)生的均一化影響,使得兩者之間的形態(tài)及行為差異化。但是,對復雜多混合種群基因組的祖先片段分布或精確定位祖先片段并進行建模仍是一個尚未解決的問題,以至于對較早期或多群體混合的復雜交流事件的時間估計還是不夠精準[75]。

        為了更好的研究動物馴化的歷史,應綜合運用跨學科的知識,包括群體遺傳學、地理地質(zhì)學、考古學和歷史學等進行更全面的研究。在材料方面,優(yōu)化和改進古代DNA (ancient DNA, aDNA)分離和擴增技術(shù),為古代尤其是史前的數(shù)據(jù)提供證據(jù)支持。另外,基于大量的基因組數(shù)據(jù)可以發(fā)掘出更多群體遺傳學特征,用于發(fā)現(xiàn)馴化過程中基因組的改變,以便進行更全面的分析。在分析方法上,引入更多的多元統(tǒng)計學和機器學習方法,可以更好的進行分類和定量研究。最后,面對大量測序數(shù)據(jù)的積累,需加強對于處理超大規(guī)模群體數(shù)據(jù)的算法改進和包括GPU[99]和FPGA[100]在內(nèi)的硬件加速來滿足科學研究的需求。

        [1] Pan ZY, He XY, Wang XY, Guo XF, Cao XH, Hu WP, Di R, Liu QY, Chu MX. Selection signature in domesticated animals., 2016, 38(12): 1069–1080.潘章源, 賀小云, 王翔宇, 郭曉飛, 曹曉涵, 胡文萍, 狄冉, 劉秋月, 儲明星. 家養(yǎng)動物選擇信號研究進展. 遺傳, 2016, 38(12): 1069–1080.

        [2] Zeder MA. Core questions in domestication research., 2015, 112(11): 3191–3198.

        [3] Gamble C, Davies W, Pettitt P, Richards M. Climate change and evolving human diversity in Europe during the Last Glacial., 2004, 359(1442): 243–254.

        [4] Fabrice T. Animal domestication: A brief overview. London: IntechOpen. 2019.

        [5] Zeder MA. The domestication of animals., 1982, 9(4): 321–327.

        [6] Larson G, Piperno DR, Allaby RG, Purugganan MD, Andersson L, Arroyo-Kalin M, Barton L, Climer Vigueira C, Denham T, Dobney K, Doust AN, Gepts P, Gilbert MTP, Gremillion KJ, Lucas L, Lukens L, Marshall FB, Olsen KM, Pires JC, Richerson PJ, de Casas RR, Sanjur OI, Thomas MG, Fuller DQ. Current perspectives and the future of domestication studies., 2014, 111(17): 6139–6146.

        [7] Li J, Zhang YP. Advances in research of the origin and domestication of domestic animals., 2009, 17(4): 1–11.李晶, 張亞平. 家養(yǎng)動物的起源與馴化研究進展. 生物多樣性, 2009, 17(4): 1–11.

        [8] Diamond J. Evolution, consequences and future of plant and animal domestication., 2002, 418(6898): 700–707.

        [9] Evershed RP, Payne S, Sherratt AG, Copley MS, Coolidge J, Urem-Kotsu D, Kotsakis K, Ozdo?an M, Ozdo?an AE, Nieuwenhuyse O, Akkermans PMMG, Bailey D, Andeescu RR, Campbell S, Farid S, Hodder I, Yalman N, Ozba?aran M, Bi?akci E, Garfinkel Y, Levy T, Burton MM. Earliest date for milk use in the Near East and southeastern Europe linked to cattle herding., 2008, 455(7212): 528–531.

        [10] Outram AK, Stear NA, Bendrey R, Olsen S, Kasparov A, Zaibert V, Thorpe N, Evershed RP. The earliest horse harnessing and milking., 2009, 323(5919): 1332–1335.

        [11] Daniel LH, Andrew GC. Principles of population genetics. 4th ed. Sinauer Associates,Sunderland, MA, 2006.

        [12] Shi Y, Li HP. Population genomics: from classical statistics to supervised learning., 2019, 49(4): 445–455.施懌, 李海鵬. 群體基因組學方法:從經(jīng)典統(tǒng)計學到有監(jiān)督學習. 中國科學: 生命科學, 2019, 49(4): 445– 455.

        [13] Zheng ZQ. Population structure and genetic introgres-sion from wild relatives in worldwide goat populations [Dissertation]. Northwest A&F University, 2019.鄭竹清. 世界山羊群體遺傳結(jié)構(gòu)及其野生近緣種基因滲入研究[學位論文]. 西北農(nóng)林科技大學, 2019.

        [14] Wang GD, Zhai WW, Yang HC, Wang L, Zhong L, Liu YH, Fan RX, Yin TT, Zhu CL, Poyarkov AD, Irwin DM, Hyt?nen MK, Lohi H, Wu CI, Savolainen P, Zhang YP. Out of southern East Asia: the natural history of domestic dogs across the world., 2016, 26(1): 21–33.

        [15] Peters J, Lebrasseur O, Deng H, Larson G. Holocene cultural history of Red jungle fowl () and its domestic descendant in East Asia., 2016, 142: 102–119.

        [16] Wang MS, Thakur M, Peng MS, Jiang Y, Frantz LAF, Li M, Zhang JJ, Wang S, Peters J, Otecko NO, Suwannapoom C, Guo X, Zheng ZQ, Esmailizadeh A, Hirimuthugoda NY, Ashari H, Suladari S, Zein MSA, Kusza S, Sohrabi S, Kharrati-Koopaee H, Shen QK, Zeng L, Yang MM, Wu YJ, Yang XY, Lu XM, Jia XZ, Nie QH, Lamont SJ, Lasagna E, Ceccobelli S, Gunwardana HGTN, Senasige TM, Feng SH, Si JF, Zhang H, Jin JQ, Li ML, Liu YH, Chen HM, Ma C, Dai SS, Bhuiyan AKFH, Khan MS, Silva GLLP, Le TT, Mwai OA, Ibrahim MNM, Supple M, Shapiro B, Hanotte O, Zhang GJ, Larson G, Han JL, Wu DD, Zhang YP. 863 genomes reveal the origin and domes-tication of chicken., 2020, 30(8): 693–701.

        [17] Gao F, Li HP. Application of computer simulators in population genetics., 2016, 38(8): 707–717.高峰, 李海鵬. 群體遺傳學模擬軟件應用現(xiàn)狀. 遺傳, 2016, 38(8): 707–717.

        [18] Li H, Durbin R. Inference of human population history from individual whole-genome sequences., 2011, 475(7357): 493–496.

        [19] Schiffels S, Durbin R. Inferring human population size and separation history from multiple genome sequences., 2014, 46(8): 919–925.

        [20] Terhorst J, Kamm JA, Song YS. Robust and scalable inference of population history from hundreds of unphased whole genomes., 2017, 49(2): 303– 309.

        [21] Qanbari S, Strom TM, Haberer G, Weigend S, Gheyas AA, Turner F, Burt DW, Preisinger R, Gianola D, Simianer H. A high resolution genome-wide scan for significant selective sweeps: an application to pooled sequence data in laying chickens., 2012, 7(11): e49525.

        [22] Li HP, Stephan W. Inferring the demographic history and rate of adaptive substitution in., 2006, 2(10): e166.

        [23] Wakeley J, Hey J. Estimating ancestral population parameters., 1997, 145(3): 847–855.

        [24] Gutenkunst RN, Hernandez RD, Williamson SH, Bustamante CD. Inferring the joint demographic history of multiple populations from multidimensional SNP frequency data., 2009, 5(10): e1000695.

        [25] Excoffier L, Dupanloup I, Huerta-Sánchez E, Sousa VC, Foll M. Robust demographic inference from genomic and SNP data., 2013, 9(10): e1003905.

        [26] Barbato M, Orozco-terWengel P, Tapio M, Bruford MW. Snep: a tool to estimate trends in recent effective population size trajectories using genome-wide SNP data., 2015, 6: 109.

        [27] Wang JL. Estimation of effective population sizes from data on genetic markers., 2005, 360(1459): 1395–1409.

        [28] Hill WG. Estimation of effective population size from data on linkage disequilibrium., 1981, 38(3): 209–216.

        [29] Corbin LJ, Liu AYH, Bishop SC, Woolliams JA. Estimation of historical effective population size using linkage disequilibria with marker data., 2012, 129(4): 257–270.

        [30] Sunn?ker M, Busetto AG, Numminen E, Corander J, Foll M, Dessimoz C. Approximate Bayesian computa-tion., 2013, 9(1): e1002803.

        [31] Wegmann D, Leuenberger C, Neuenschwander S, Exco-ffier L. Abctoolbox: A versatile toolkit for approximate Bayesian computations., 2010, 11(116).

        [32] Sanchez T, Cury J, Charpiat G, Jay F. Deep learning for population size history inference: design, comparison and combination with approximate Bayesian computa-tion., 2020.

        [33] Tiago Do Prado Paim, Patrícia I, Samuel RP, Alexandre RC, Concepta Margaret Mcmanus Pimentel. Detection and evaluation of selection signatures in sheep., 2018, 53(5): 527–539.

        [34] Xue ZYY, Song XW, Wu LH, Wang LZ, Cui JA, Sun ZJ, Zhang Z, Ma YL. The identification methods of selec-tion signatures in livestock and its statistical problems., 2018, 49(6): 1099–1107.薛周艤源, 宋顯威, 吳林慧, 王露珍, 崔家安, 孫章健, 張政, 馬云龍. 畜禽選擇信號檢測方法及其統(tǒng)計學問題. 畜牧獸醫(yī)學報, 2018, 49(6): 1099–1107.

        [35] Eisenhaber F. Discovering biomolecular mechanisms with computational biology. Springer, Boston, MA, 2006.

        [36] Pennings PS, Hermisson J. Soft sweeps II—molecular population genetics of adaptation from recurrent mutation or migration., 2006, 23(5): 1076–1084.

        [37] Hermisson J, Pennings PS. Soft sweeps: molecular population genetics of adaptation from standing genetic variation., 2005, 169(4): 2335–2352.

        [38] Suzuki Y. Statistical methods for detecting natural selection from genomic data., 2010, 85(6): 359–376.

        [39] Nielsen R. Molecular signatures of natural selection., 2005, 39: 197–218.

        [40] Lohmueller KE, Bustamante CD, Clark AG. Detecting directional selection in the presence of recent admixture in African-Americans., 2011, 187(3): 823–835.

        [41] Wang YZ, Zhao YQ. Research progress of genomic signature of selection and its detection methods., 2019, 40(5): 1–6.王宇占, 趙毅強. 基因組水平的選擇信號及其檢測方法研究進展. 家畜生態(tài)學報, 2019, 40(5): 1–6.

        [42] de Simoni Gouveia JJ, da Silva MVGB, Paiva SR, de Oliveira SMP. Identification of selection signatures in livestock species., 2014, 37(2): 330– 342.

        [43] Chen H, Patterson N, Reich D. Population differentia-tion as a test for selective sweeps., 2010, 20(3): 393–402.

        [44] Oleksyk TK, Smith MW, O'Brien SJ. Genome-wide scans for footprints of natural selection., 2010, 365(1537): 185–205.

        [45] Grossman SR, Shlyakhter I, Karlsson EK, Byrne EH, Morales S, Frieden G, Hostetter E, Angelino E, Garber M, Zuk O, Lander ES, Schaffner SF, Sabeti PC. A composite of multiple signals distinguishes causal variants in regions of positive selection., 2010, 327(5967): 883–886.

        [46] Utsunomiya YT, Pérez O'Brien AM, Sonstegard TS, Van Tassell CP, do Carmo AS, Mészáros G, S?lkner J, Garcia JF. Detecting loci under recent positive selection in dairy and beef cattle by combining different genome- wide scan methods., 2013, 8(5): e64280.

        [47] Randhawa IAS, Khatkar MS, Thomson PC, Raadsma HW. Composite selection signals can localize the trait specific genomic regions in multi-breed populations of cattle and sheep., 2014, 15: 34.

        [48] Ma Y, Ding X, Qanbari S, Weigend S, Zhang Q, Simianer H. Properties of different selection signature statistics and a new strategy for combining them., 2015, 115(5): 426–436.

        [49] Biswas S, Akey JM. Genomic insights into positive selection., 2006, 22(8): 437–446.

        [50] Schrider DR, Kern AD. Supervised machine learning for population genetics: a new paradigm., 2018, 34(4): 301–312.

        [51] Kotsiantis SB. Supervised machine learning: a review of classification techniques., 2007, 31: 3–24.

        [52] Lin K, Li HP, Schl?tterer C, Futschik A. Distinguishing positive selection from neutral evolution: boosting the performance of summary statistics., 2011, 187(1): 229–244.

        [53] Liang ZX. Analysis of pig domestication and ancestry using genomewide SNP information[Dissertation]. China Agricultural University, 2019.梁作翔. 利用全基因組SNP信息研究家豬的馴化及祖先來源[學位論文]. 中國農(nóng)業(yè)大學, 2019.

        [54] Malaspinas AS, Malaspinas O, Evans SN, Slatkin M. Estimating allele age and selection coefficient from time-serial data., 2012, 192(2): 599–607.

        [55] Przeworski M. Estimating the time since the fixation of a beneficial allele., 2003, 164(4): 1667–1676.

        [56] Laurent S, Pfeifer SP, Settles ML, Hunter SS, Hardwick KM, Ormond L, Sousa VC, Jensen JD, Rosenblum EB. The population genomics of rapid adaptation: disen-tangling signatures of selection and demography in white sands lizards., 2016, 25(1): 306–323.

        [57] Medina P, Thornlow B, Nielsen R, Corbett-Detig R. Estimating the timing of multiple admixture pulses during local ancestry inference., 2018, 210(3): 1089–1107.

        [58] Cheng CH, Huang Y. Construction and application of phylogenetic network., 2008, 30(3): 215–221.程春花, 黃原. 系統(tǒng)發(fā)育網(wǎng)絡的構(gòu)建與應用. 昆蟲分類學報, 2008, 30(3): 215–221.

        [59] Dobney K, Larson G. Genetics and animal domestica-tion: New windows on an elusive process., 2006, 269(2): 261–271.

        [60] Marshall FB, Dobney K, Denham T, Capriles JM. Evaluating the roles of directed breeding and gene flow in animal domestication., 2014, 111(17): 6153–6158.

        [61] Winkler CA, Nelson GW, Smith MW. Smith. Admixture mapping comes of age., 2010, 11: 65–89.

        [62] Racimo F, Sankararaman S, Nielsen R, Huerta-Sánchez E. Evidence for archaic adaptive introgression in humans., 2015, 16(6): 359–371.

        [63] Ai HS, Fang XD, Yang B, Huang ZY, Chen H, Mao LK, Zhang F, Zhang L, Cui LL, He WM, Yang J, Yao XM, Zhou LS, Han LJ, Li J, Sun SL, Xie XH, Lai BX, Su Y, Lu Y, Yang H, Huang T, Deng WJ, Nielsen R, Ren J, Huang LS. Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing., 2015, 47(3): 217–225.

        [64] Liang SY, Zhou ZK, Hou SS. The research progress of farm animal genomics based on sequencing techno-logies., 2017, 39(4): 276–292.梁素蕓, 周正奎, 侯水生. 基于測序技術(shù)的畜禽基因組學研究進展. 遺傳, 2017, 39(4): 276–292.

        [65] Patterson N, Moorjani P, Luo Y, Mallick S, Rohland N, Zhan YP, Genschoreck T, Webster T, Reich D. Ancient admixture in human history., 2012, 192(3): 1065–1093.

        [66] Reich D, Thangaraj K, Patterson N, Price AL, Singh L. Reconstructing Indian population history., 2009, 461(7263): 489–494.

        [67] Green RE, Krause J, Briggs AW, Maricic T, Stenzel U, Kircher M, Patterson N, Li H, Zhai WW, Fritz MHY, Hansen NF, Durand EY, Malaspinas AS, Jensen JD, Marques-Bonet T, Alkan C, Prüfer K, Meyer M, Burbano HA, Good JM, Schultz R, Aximu-Petri A, Butthof A, H?ber B, H?ffner B, Siegemund M, Weihmann A, Nusbaum C, Lander ES, Russ C, Novod N, Affourtit J, Egholm M, Verna C, Rudan P, Brajkovic D, Kucan ?, Gu?ic I, Doronichev VB, Golovanova LV, Lalueza-Fox C, de la Rasilla M, Fortea J, Rosas A, Schmitz RW, Johnson PLF, Eichler EE, Falush D, Birney E, Mullikin JC, Slatkin M, Nielsen R, Kelso J, Lachmann M, Reich D, P??bo S. A draft sequence of the Neandertal genome., 2010, 328(5979): 710– 722.

        [68] Pease JB, Hahn MW. Detection and polarization of introgression in a five-taxon phylogeny., 2015, 64(4): 651–662.

        [69] Zheng YC, Janke A. Gene flow analysis method, the-statistic, is robust in a wide parameter space., 2018, 19(1): 10.

        [70] Frantz LAF, Schraiber JG, Madsen O, Megens HJ, Bosse M, Paudel Y, Semiadi G, Meijaard E, Li N, Crooijmans RPMA, Archibald AL, Slatkin M, Schook LB, Larson G, Groenen MAM. Genome sequencing reveals fine scale diversification and reticulation history during speciation in., 2013, 14(9): R107.

        [71] Sanderson J, Sudoyo H, Karafet TM, Hammer MF, Cox MP. Reconstructing past admixture processes from local genomic ancestry using wavelet transformation., 2015, 200(2): 469–481.

        [72] Pugach I, Matveyev R, Wollstein A, Kayser M, Stoneking M. Dating the age of admixturewavelet transform analysis of genome-wide data., 2011, 12(2): R19.

        [73] Xu SH, Huang W, Qian J, Jin L. Analysis of genomic admixture in Uyghur and its implication in mapping strategy., 2008, 82(4): 883–894.

        [74] Price AL, Tandon A, Patterson N, Barnes KC, Rafaels N, Ruczinski I, Beaty TH, Mathias R, Reich D, Myers S. Sensitive detection of chromosomal segments of distinct ancestry in admixed populations., 2009, 5(6): e1000519.

        [75] Chimusa ER, Defo J, Thami PK, Awany D, Mulisa DD, Allali I, Ghazal H, Moussa A, Mazandu GK. Dating admixture events is unsolved problem in multi-way admixed populations., 2020, 21(2): 144–155.

        [76] Moorjani P, Patterson N, Hirschhorn JN, Keinan A, Hao L, Atzmon G, Burns E, Ostrer H, Price AL, Reich D. The history of African gene flow into Southern Europeans, Levantines, and Jews., 2011, 7(4): e1001373.

        [77] Loh PR, Lipson M, Patterson N, Moorjani P, Pickrell JK, Reich D, Berger B. Inferring admixture histories of human populations using linkage disequilibrium., 2013, 193(4): 1233–1254.

        [78] Zhou Y, Qiu HX, Xu SH. Modeling continuous admixture using admixture-induced linkage disequili-brium., 2017, 7: 43054.

        [79] Zhou Y, Yuan K, Yu Y, Ni X, Xie P, Xing EP, Xu S. Inference of multiple-wave population admixture by modeling decay of linkage disequilibrium with poly-nomial functions., 2017, 118(5): 503–510.

        [80] Ni XM, Yuan K, Yang X, Feng QD, Guo W, Ma ZM, Xu SH. Inference of multiple-wave admixtures by length distribution of ancestral tracks., 2018, 121(1): 52–63.

        [81] Hellenthal G, Busby GBJ, Band G, Wilson JF, Capelli C, Falush D, Myers S. A genetic atlas of human admixture history., 2014, 343(6172): 747–751.

        [82] Ni XM, Yang X, Guo W, Yuan K, Zhou Y, Ma ZM, Xu SH. Length distribution of ancestral tracks under a general admixture model and its applications in population history inference., 2016, 6: 20048.

        [83] Corbett-Detig R, Nielsen R. A hidden Markov model approach for simultaneously estimating local ancestry and admixture time using next generation sequence data in samples of arbitrary ploidy., 2017, 13(1): e1006529.

        [84] Lawson DJ, Hellenthal G, Myers S, Falush D. Inference of population structure using dense haplotype data., 2012, 8(1): e1002453.

        [85] Galaverni M, Caniglia R, Pagani L, Fabbri E, Boattini A, Randi E. Disentangling timing of admixture, patterns of introgression, and phenotypic indicators in a hybridizing wolf population., 2017, 34(9): 2324– 2339.

        [86] Zhu YL, Li WB, Yang B, Zhang ZY, Ai HS, Ren J, Huang LS. Signatures of selection and interspecies introgression in the genome of Chinese domestic pigs., 2017, 9(10): 2592–2603.

        [87] Chen H, Huang M, Yang B, Wu ZP, Deng Z, Hou Y, Ren J, Huang LS. Introgression of Eastern Chinese and Southern Chinese haplotypes contributes to the improvement of fertility and immunity in European modern pigs., 2020, 9(3): giaa014.

        [88] Rubin CJ, Zody MC, Eriksson J, Meadows JRS, Sherwood E, Webster MT, Jiang L, Ingman M, Sharpe T, Ka S, Hallb??k F, Besnier F, Carlborg O, Bed'hom B, Tixier-Boichard M, Jensen P, Siegel P, Lindblad-Toh K, Andersson L. Whole-genome resequencing reveals loci under selection during chicken domestication., 2010, 464(7288): 587–591.

        [89] Li DY, Li Y, Li M, Che TD, Tian SL, Chen BL, Zhou XM, Zhang GL, Gaur U, Luo MJ, Tian K, He MN, He S, Xu ZX, Jin L, Tang QZ, Dai YF, Xu HL, Hu YD, Zhao XL, Yin HD, Wang Y, Zhou RJ, Yang CW, Du HR, Jiang XS, Zhu Q, Li MZ. Population genomics identifies patterns of genetic diversity and selection in chicken., 2019, 20(1): 263.

        [90] Zhang CY, Lin D, Wang YZ, Peng DZ, Li HF, Fei J, Chen KW, Yang N, Hu XX, Zhao YQ, Li N. Widespread introgression in Chinese indigenous chicken breeds from commercial broiler., 2019, 12(3): 610– 621.

        [91] Zeder MA, Hesse B. The initial domestication of goats () in the Zagros Mountains 10, 000 years ago., 2000, 287(5461): 2254–2257.

        [92] Wang FH, Zhang L, Li XK, Fan YX, Qiao X, Gong G, Yan XC, Zhang LT, Wang ZY, Wang RJ, Liu ZH, Wang ZX, He LB, Zhang YJ, Li JQ, Zhao YH, Su R. Progress in goat genome studies., 2019, 41(10): 928–938.王鳳紅, 張磊, 李曉凱, 范一星, 喬賢, 龔高, 嚴曉春, 張令天, 王志英, 王瑞軍, 劉志紅, 王志新, 何利兵, 張燕軍, 李金泉, 趙艷紅, 蘇蕊. 山羊基因組研究進展. 遺傳, 2019, 41(10): 928–938.

        [93] Li XK, Wang G, Qiao X, Fan Y, Zhang L, Ma YH, Nie RX, Wang RJ, He LB, Su R. Research progress on whole-genome sequencing on important domesticated animals., 2018, 34(6): 11–21.李曉凱, 王貴, 喬賢, 范一星, 張磊, 馬宇浩, 聶瑞雪, 王瑞軍, 何利兵, 蘇蕊. 全基因組測序在重要家畜上的研究進展. 生物技術(shù)通報, 2018, 34(6): 11–21.

        [94] Cao YH, Xu SS, Shen M, Chen ZH, Gao L, Lv FH, Xie XL, Wang XH, Yang H, Liu CB, Zhou P, Wan PC, Zhang YS, Yang JQ, Pi WH, Eer H, Berry DP, Barbato M, Esmailizadeh A, Nosrati M, Salehian-Dehkordi H, Dehghani-Qanatqestani M, Dotsev AV, Deniskova TE, Zinovieva NA, Brem G, ?těpánek O, Ciani E, Weimann C, Erhardt G, Mwacharo JM, Ahbara A, Han JL, Hanotte O, Miller JM, Sim Z, Coltman D, Kantanen J, Bruford MW, Lenstra JA, Kijas J, Li MH. Historical introgression from wild relatives enhanced climatic adaptation and resistance to pneumonia in sheep., 2020, 17: msaa236.

        [95] Zheng ZQ, Wang XH, Li M, Li YJ, Yang ZR, Wang XL, Pan XY, Gong M, Zhang Y, Guo YW, Wang Y, Liu J, Cai YD, Chen QM, Okpeku M, Colli L, Cai DW, Wang K, Huang SS, Sonstegard TS, Esmailizadeh A, Zhang WG, Zhang TT, Xu YB, Xu NY, Yang Y, Han JL, Chen L, Lesur J, Daly KG, Bradley DG, Heller R, Zhang GJ, Wang W, Chen YL, Jiang Y. The origin of domestication genes in goats., 2020, 6(21): eaaz5216.

        [96] Terhorst J, Kamm JA, Song YS. Robust and scalable inference of population history from hundreds of unphased whole genomes., 2017, 49(2): 303–309.

        [97] Ormond L, Foll M, Ewing GB, Pfeifer SP, Jensen JD. Inferring the age of a fixed beneficial allele., 2016, 25(1): 157–169.

        [98] Frantz LA, Schraiber JG, Madsen O, Megens HJ, Cagan A, Bosse M, Paudel Y, Crooijmans RPMA, Larson G, Groenen MAM. Evidence of long-term gene flow and selection during domestication from analyses of Eurasian wild and domestic pig genomes., 2015, 47(10): 1141–1148.

        [99] Freudenthal JA, Ankenbrand MJ, Grimm DG, Korte A. GWAS-Flow: A GPU accelerated framework for efficient permutation based genome-wide association studies., 2019, 1: 783100.

        [100] Bu LN, Wang Q, Gu WJ, Yang RF, Zhu D, Song Z, Liu XJ, Zhao YQ. Improving read alignment through the generation of alternative referenceiterative strategy., 2020, 10(1): 18712.

        Progress on animal domestication under population genetics

        Zilong Wen, Yiqiang Zhao

        Animal domestication is the process of changing wild animals into domesticated animals that can be kept stably for a long period of time. As the content of the Neolithic agricultural revolution, domestication is one of the important milestones of the progress of human civilization. Due to the close relationship between humans and animals, domestication has not only changed the wild state of animals, but also changed the habits and historical processes of human beings. The key question on animal domestication research include who is the ancestors of the domesticated animals were, the changes produced by domestication, and the time and place of domestication. Due to the advances in high-throughput genomic technologies and correspondence analysis methods, animal domestication is generally studied at the population level. Here we discuss the research content of animal domestication under population genetics, including population history, selection signals, as well as gene introgression, and we highlight two new expand contents, namely, dating the initial time of gene selection and the time of gene introgression. Finally, we summarize the recent research progress of major domesticated including pig, chicken, sheep and goat. These advances provide a new insights and perspective for the research on the animal domestication.

        domestication; domesticated animals; population genetics; initial time of gene selection; time of gene introgression

        2020-08-26;

        2020-12-07

        轉(zhuǎn)基因重大專項(編號:2018ZX08007001)資助[Supported by National Special Foundation for Transgenic Species of China (No. 2018ZX08007001)]

        文子龍,在讀碩士研究生,專業(yè)方向:生物信息學。E-mail: zilongwen@cau.edu.cn

        趙毅強,博士,副教授,博士生導師,研究方向:生物信息學。E-mail: yiqiangz@cau.edu.cn

        10.16288/j.yczz.20-268

        2021/2/3 10:41:51

        URI: https://kns.cnki.net/kcms/detail/11.1913.r.20210202.1002.002.html

        (責任編委: 李海鵬)

        猜你喜歡
        等位基因基因組群體
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        親子鑒定中男性個體Amelogenin基因座異常1例
        智慧健康(2021年17期)2021-07-30 14:38:32
        通過自然感染獲得群體免疫有多可怕
        科學大眾(2020年10期)2020-07-24 09:14:12
        “群體失語”需要警惕——“為官不言”也是腐敗
        當代陜西(2019年6期)2019-04-17 05:04:02
        WHOHLA命名委員會命名的新等位基因HLA-A*24∶327序列分析及確認
        DXS101基因座稀有等位基因的確認1例
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        有趣的植物基因組
        世界科學(2014年8期)2014-02-28 14:58:31
        等位基因座D21S11稀有等位基因32.3的確認
        基因組生物學60年
        世界科學(2013年6期)2013-03-11 18:09:33
        成人免费a级毛片无码片2022| 久久久精品人妻一区二区三区四| 日本伊人精品一区二区三区| 玖玖色玖玖草玖玖爱在线精品视频| 亚洲一区二区三区新视频| 日本少妇熟女一区二区| 亚洲精品无码久久久久y| 欧美成人精品午夜免费影视| 一卡二卡三卡视频| 欧美片欧美日韩国产综合片| 91久久精品一区二区三区大全| 91丝袜美腿亚洲一区二区| 国产国产裸模裸模私拍视频| 男女肉粗暴进来120秒动态图| 91精品欧美综合在线观看| 蜜桃码一区二区三区在线观看| 蜜桃传媒一区二区亚洲av婷婷| 国产99在线 | 亚洲| 女同久久精品国产99国产精品| 欧美成人网视频| 五月婷婷开心五月播五月| 人妻丰满熟妇av无码区app| 中国内射xxxx6981少妇| 精品亚洲女同一区二区| 手机免费在线观看日韩av| 精品人妻va一区二区三区| 99久久免费国产精品| 欧美国产亚洲精品成人a v| 国产三级国产精品国产专区 | 国产av无码专区亚洲版综合| 在线综合亚洲欧洲综合网站 | 日本边添边摸边做边爱| 亚洲毛片αv无线播放一区| 日韩丝袜亚洲国产欧美一区| 伊人狼人影院在线视频| 国产av自拍视频在线观看| 亚洲精品乱码久久久久久金桔影视 | 日本视频在线观看一区二区| 国产精品久久成人网站| 日产无人区一线二线三线新版| 果冻蜜桃传媒在线观看|