張宏禮,張鴻雁
(1.嶺南師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湛江 524048;2.嶺南師范學(xué)院生命科學(xué)與技術(shù)學(xué)院)
群體遺傳學(xué)即是研究生物系統(tǒng)進(jìn)化和自然選擇的生物學(xué)家的基本理論[1-2],又是遺傳多樣性判定[3-4]、動(dòng)植物性狀選擇[5-6]、人類遺傳學(xué)分析[7-8]等諸多研究的必要基礎(chǔ)工具。
哈迪—溫伯格平衡定律是隨機(jī)交配下的遺傳平衡定律,達(dá)到哈迪—溫伯格平衡群體的遺傳結(jié)構(gòu)世代不變。許多數(shù)據(jù)在進(jìn)一步分析之前要檢驗(yàn)是否符合哈迪—溫伯格平衡定律,比如在基因關(guān)聯(lián)性疾病的研究中,首先應(yīng)對(duì)所研究的基因進(jìn)行哈迪—溫伯格平衡檢驗(yàn),用以推斷目標(biāo)基因在群體中是否為穩(wěn)定存在的基因,進(jìn)而才能繼續(xù)研究該基因與疾病的關(guān)聯(lián)性,若該基因不符合哈迪—溫伯格平衡定律,則不能進(jìn)行下一步的關(guān)聯(lián)性研究[9-11],哈迪—溫伯格平衡群體為研究群體遺傳結(jié)構(gòu)提供了一個(gè)參照系。除隨機(jī)交配外,近親交配是最重要的一種交配方式,其中完全自交是最強(qiáng)的近親交配方式。一般的近親交配可以看成群體一部分隨機(jī)交配、一部分完全自交構(gòu)成,研究完全自交對(duì)于研究近親交配有重要的實(shí)際價(jià)值。在一位點(diǎn)上關(guān)于完全自交的理論分析有較多的文獻(xiàn),而從兩位點(diǎn)整體角度如何刻畫完全自交下的世代變化中群體遺傳結(jié)構(gòu)的變化及度量的成果較少見。
基于申農(nóng)信息理論,能夠應(yīng)用申農(nóng)熵指標(biāo)度量群體的遺傳結(jié)構(gòu),刻畫在世代傳遞中群體遺傳結(jié)構(gòu)的變化[12-17]。利用申農(nóng)熵原理可以為不同的目標(biāo)人群篩選合適的Y-STR基因座組合,為Y-STR檢驗(yàn)在法醫(yī)學(xué)中的應(yīng)用提供科學(xué)依據(jù)和有效辦法[18]。關(guān)于兩對(duì)等位基因群體熵變規(guī)律的研究主要針隨機(jī)交配機(jī)制[19-20],近親交配及完全自交情況國(guó)內(nèi)未見報(bào)道。
從處于哈迪-溫伯格平衡的兩對(duì)等位基因群體開始,研究在完全自交下的世代變化中群體遺傳結(jié)構(gòu)的變化規(guī)律及刻畫這種變化的信息學(xué)描述。
考慮一個(gè)大Mendel二倍體生物群體的兩位點(diǎn)A和B,各等位基因頻率為
為研究方便將正反交分開表示,滿足公式(1)的群體會(huì)有16種基因型,基因型頻率會(huì)有無(wú)窮多種,假設(shè)初始世代群體為哈迪-溫伯格平衡群體,基因型頻率分布為
矩陣表示為
以后各世代的基因型頻率為
矩陣表示為
其中
隨世代數(shù)增加,ε1(t)和ε2(t)是在區(qū)間[0,p1p2)和[0,q1q2)上取值的單調(diào)增加的函數(shù)。
從一位點(diǎn)看,各世代的純合體基因型頻率逐代增加、雜合體基因型頻率逐代減少,但是從兩位點(diǎn)整體看,完全的純合體基因型頻率逐代增加、完全的雜合體基因型頻率逐代減少,而半純合半雜合的基因型頻率可能增加也可能減少,群體的遺傳多樣性程度如何變化值得研究。
性質(zhì)2說(shuō)明,盡管從兩位點(diǎn)整體看,半純合半雜合的基因型頻率可能增加也可能減少,但是群體的遺傳多樣性程度整體上還是嚴(yán)格單調(diào)減少的,而不會(huì)出現(xiàn)波動(dòng),這和一位點(diǎn)的情形一致。
根據(jù)申農(nóng)信息理論,位點(diǎn)A和B各自初始世代的基因型申農(nóng)熵為
所以在完全自交下,兩位點(diǎn)的配子頻率分布世代不變,與初始平衡群體的基因頻率一致。兩位點(diǎn)A和B各自的位點(diǎn)申農(nóng)熵為H(A)=-p1lnp1-p2lnp2;H(B)=-q1lnq1-q2lnq2。假定群體雌雄兩性配子同分布,用X、Y分別表示雄、雌配子,則配子申農(nóng)熵為
配子間互信息反映配子間的遺傳信息關(guān)聯(lián)程度。性質(zhì)4說(shuō)明,在完全自交下,隨世代交替,配子間的信息交流逐代增加,直到極限狀態(tài)最大,此時(shí)群體完全純合。
進(jìn)一步定義兩位點(diǎn)配子間近交關(guān)聯(lián)信息系數(shù)為
根據(jù)性質(zhì)4可得近交關(guān)聯(lián)信息系數(shù)如下性質(zhì)。
性質(zhì)5配子間近交關(guān)聯(lián)信息系數(shù)隨著近交系數(shù)F的增大而增大,且0≤IFX,Y(t)≤1。
近交關(guān)聯(lián)信息系數(shù)與近交系數(shù)反映的問題一致的,且取值范圍相同。近交系數(shù)是數(shù)理統(tǒng)計(jì)意義下配子間的相關(guān)系數(shù),而配子間的近交關(guān)聯(lián)信息系數(shù)從信息學(xué)角度反映配子間的相對(duì)關(guān)聯(lián)程度。
為檢驗(yàn)上述結(jié)果的正確些,選擇如下的兩位點(diǎn)哈迪—溫伯格平衡群體作為初始群個(gè)體。
應(yīng)用MATLAB軟件推演在完全自交下各世代基因型頻率如表1。
表1 各世代基因型頻率Table1 Genotype frequency distribution in the initial population from generation to generation
各世代基因型聯(lián)合申農(nóng)熵、配子間互信息、近交關(guān)聯(lián)信息系數(shù)如表2。
由表1可見,完全純合體基因型頻率逐代增加、完全的雜合體基因型頻率逐代減少,而半純合半雜合的基因型頻率中Aabb,aAbb,aaBb,aabB四種基因型頻率先增后降,其他半純合半雜合基因型頻率一直下降。但是,由表2可見,基因型聯(lián)合申農(nóng)熵逐代減少,配子間互信息逐代增加,近交關(guān)聯(lián)信息系數(shù)越來(lái)越大,與理論分析一致。
表2 各世代基因型聯(lián)合申農(nóng)熵、配子間互信息、近交關(guān)聯(lián)信息系數(shù)Table2 Shannon entropy,information and the coefficient of inbred correlation information from generation to generation
從處于哈迪—溫伯格平衡的兩對(duì)等位基因群體開始完全自交,盡管從兩位點(diǎn)整體看,半純合半雜合的基因型頻率可能增加也可能減少,但是群體的基因型聯(lián)合申農(nóng)熵還是嚴(yán)格單調(diào)減少的,亦即群體遺傳多樣性程度整體上是嚴(yán)格單調(diào)減少的,而不會(huì)出現(xiàn)波動(dòng),從理論分析的角度證實(shí)了與一位點(diǎn)的情形具有一致性?;蛐吐?lián)合申農(nóng)熵可以很好地從兩對(duì)等位基因情形推廣到多位點(diǎn)、多等位基因情形,結(jié)論類似,這種整體性描述是從各基因型頻率的變化不容易體現(xiàn)出來(lái)的。
兩位點(diǎn)配子間互信息反映配子間的遺傳信息關(guān)聯(lián)程度,在完全自交下隨世代交替配子間的信息交流逐代增加,配子間的遺傳信息關(guān)聯(lián)程度越來(lái)越大,直到極限狀態(tài)最大,此時(shí)群體完全純合。同基因型聯(lián)合申農(nóng)熵一樣,可以將配子間互信息從兩對(duì)等位基因情形推廣到多位點(diǎn)、多等位基因情形,這時(shí)配子間互信息最大值為各位點(diǎn)申農(nóng)熵之和,從而多位點(diǎn)、多等位基因的近交關(guān)聯(lián)信息系數(shù)的分母即為各位點(diǎn)申農(nóng)熵之和,這種加法計(jì)算起來(lái)簡(jiǎn)單、方便、易用,而且具有信息學(xué)意義。
兩對(duì)等位基因情形下,如果群體中一部分自交、一部分隨機(jī)交配,可以依據(jù)概率論中的全概率公式推導(dǎo)世代變化中基因型聯(lián)合分布的演化規(guī)律、基因型聯(lián)合申農(nóng)熵的變化規(guī)律、配子間互信息的變化規(guī)律,相關(guān)結(jié)果應(yīng)該介于隨機(jī)交配平衡群體和完全自交群體之間,這樣的結(jié)果可以用來(lái)描述一般的近期繁殖群體的變化規(guī)律。上述研究還可以進(jìn)一步考慮遷移、突變、選擇、連鎖等因素的作用,豐富應(yīng)用信息論方法研究群體遺傳學(xué)理論的內(nèi)容。
從處于哈迪—溫伯格平衡的兩對(duì)等位基因群體開始完全自交,完全的純合體基因型頻率逐代增加、完全的雜合體基因型頻率逐代減少,而半純合半雜合的基因型頻率可能增加也可能減少。在這個(gè)演化過(guò)程中群體的遺傳多樣性程度是否單調(diào)變化值得關(guān)注,研究表明:從兩位點(diǎn)整體來(lái)看,群體的基因型聯(lián)合申農(nóng)熵逐代嚴(yán)格單調(diào)減少,亦即群體遺傳多樣性程度整體上嚴(yán)格單調(diào)減少;配子間的互信息逐代增加,近交關(guān)聯(lián)信息系數(shù)越來(lái)越大,兩性配子的信息關(guān)聯(lián)程度越來(lái)越緊密地趨于一致。研究從理論上證實(shí)了兩位點(diǎn)情形與一位點(diǎn)情形具有一致性,所得結(jié)論可以很好地推廣到多位點(diǎn)、多等位基因情形。
黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào)2022年1期