李宏 韋曉蘭
表型組學是近年來發(fā)展起來的一門新學科,主要研究生物的物理和化學等表型性狀(phenome,表型組)隨突變和環(huán)境影響而變化的規(guī)律,即對基因型在不同環(huán)境下的全部細胞表型進行系統(tǒng)研究[1]。它在功能基因組學、藥物研究和代謝工程領域有潛在的應用價值。表型組學是一門新出現(xiàn)的交叉學科,其目的是在基因組尺度的基因型分析,臨床和認知神經(jīng)科學快速發(fā)展的知識以及信息和計算機科學的發(fā)展方面有所突破,對非常復雜的生物醫(yī)學問題研究有所推動。表型組學(Phenomics)最早由Steven A.Garan博士于1996年提出,隨后在神經(jīng)科學研究中被研究者使用。2002年,Niculescu和 Kelsoe[2]將表型組學用于精神病表型的實驗研究中。2006年,Niculescu[3]及其同事提出了一種用于表型組學分析的實驗定量方法——PhenoChipping,并將其與基因組學結合起來,這對于表型組學的發(fā)展具有里程碑意義。同時,一些公司和研究機構為了搶占先機和盡快走向商業(yè)化應用,投入大量資金和人力用于研究與開發(fā)表型組學平臺,如比利時CropDesign公司的轉基因和植物性狀評價的高通量技術平臺,英國國家植物表型組學中心,歐洲植物表型組平臺(PhenoFab),澳洲植物表型組學設施(Australian Plant Phenomics Facility),南澳大利亞大學的表型組學與生物信息學研究中心(The Phenomics and Bioinformatics Research Centre)以及澳大利亞昆士蘭大學的斑馬魚表型組學中心等[4]。
表型組學能夠有效地追蹤基因型、環(huán)境因素和表型之間的聯(lián)系。在分離群體中,個體的基因組和表型研究可以通過稱為孟德爾隨機化方法的途徑來進行。的確,將基因組數(shù)據(jù)與表型數(shù)量變化數(shù)據(jù)相結合的表型組計劃最近在許多物種中開始實施,其目的是了解G-P圖譜(即基因型-表型圖譜)。表型組數(shù)據(jù)對于了解G-P圖譜中的遺傳變異的多效性很重要[5]。目前所了解的表型組學研究計劃主要有:國際植物表型組學網(wǎng)絡(澳大利亞植物表型組中心和德國Jülich植物表型分析中心),擬南芥研究組織合作計劃(美國國家自然基金和NIH基金),果蠅基因組資源平臺(Baylor醫(yī)學院人類基因組測序中心),小鼠表型組數(shù)據(jù)庫(NIH基金),歐洲表型組計劃(歐盟),國家生物資源計劃(日本),犬類表型組計劃(NIH基金),神經(jīng)心理表性組學協(xié)作計劃(NIH基金),UK生物庫(MRC、衛(wèi)生部和Wellcome Trust基金會),個人基因組計劃(私人贊助)。
現(xiàn)在數(shù)字DNA數(shù)據(jù)很豐富,急切需求將每個基因型對應的表型進行量化。處理這些問題后我們能夠對重要的經(jīng)濟動植物的一些復雜性狀如產量,脅迫抗性等有更深入的認識。這可以拓展到系統(tǒng)水平的認識,最終可以預測像生態(tài)和進化研究中的適應性和生存力,或產量、脅迫耐性和其它有經(jīng)濟價值的性狀。
代謝綜合癥是一種常見的復雜性狀疾病,包括腹部肥胖、高血壓、高血脂和高血糖等[6]?;蚪M學研究的前提是積累一系列影響表型的遺傳變異進行研究,而不是仔細研究表型。表型組學是在基因組尺度對表型作系統(tǒng)研究,期望解釋基因組的未知功能。例如,無意中將5-lipoxygenase-(5-LOX)缺陷型老鼠和低風險阿爾茨海默?。ˋlzheimer's disease,AD)患者血液中調節(jié)食欲的分子——adipokine leptin的水平增加這兩個無關的表型聯(lián)系起來,研究者推斷出leptin對AD患者ALOX5(a gene encoding 5-LOX)基因缺陷能產生有利的影響。當然可以盡量避免依賴于無意識發(fā)現(xiàn)能力,盡可能開發(fā)數(shù)據(jù)挖掘工具以便能夠在表型組學數(shù)據(jù)庫中提取有用的知識支持新的假說[7]。
圖1 表型組學解析基因型-表型關系
耐鹽性植物的選擇是一個很棘手的難題,高的鹽分影響了全世界1/5的土地和澳洲2/3的谷物。利用三維照相機,Tester實驗室的研究人員對移植到鹽堿地并生產滲透休克的小麥記錄了其生長反應的每分鐘的變化。通過對幾百種植物進行篩選后,Tester的博士生Karthika Rajendran[8]發(fā)現(xiàn)了幫助植物抵抗?jié)B透休克的一個基因。
2005年,CropDesign公司的Christophe Reuzeau等在分子植物育種(Molecular Plant Breeding)上發(fā)表具有里程碑意義的論文,詳細闡述了稱之為“性狀工廠”(TraitMill)的可大規(guī)模自動化分析全生育期植物表型的技術設施。2008年,澳大利亞科學家利用澳洲植物表型組學設施,借助可見光、近紅外、遠紅外和熒光成像提供高通量表型圖像,為植物的生長和性狀表現(xiàn)提供全面、持續(xù)的分析。2009年4月第一屆國際植物表型組大會已在澳大利亞堪培拉成功舉辦。為了進一步加強該領域的交流(如表型分析工具的協(xié)調)和制定相應的國際質量標準,建立了國際植物表型組網(wǎng)絡,相關的信息可進一步從該網(wǎng)絡的Website中獲取。
過去的十幾年,“基因組學革命”根本上改變了植物生物學。模式植物Arabidopsis的基因組測序是植物基因組學的里程碑,隨后許多重要經(jīng)濟作物包括水稻和玉米的基因組被測序和注釋。模式系統(tǒng)和非作物品種的植物基因組序列也經(jīng)常出現(xiàn)在國際數(shù)據(jù)庫中[9]。Arabidopsis基因組相當比例被注釋為“未知功能基因”或僅僅根據(jù)序列同源性線索進行注釋。干擾基因功能的反向遺傳途徑通常無法得到“可見的表型”。該領域新的瓶頸已變成高通量生理學和表型分析。該瓶頸在植物生物學、作物育種的輸出終端也表現(xiàn)得十分明顯。適應惡劣環(huán)境的高產量作物基因型的分子標記輔助選擇受到慢且主觀的手工表型分析的困擾,常常需要在不同田間環(huán)境和季節(jié)花費勞力收獲作物。目前的育種體系尚缺乏對照環(huán)境與田間作物高通量評價方法。以很高的精度和速度將基因功能、植物表現(xiàn)和環(huán)境應答聯(lián)系起來,這種需求比任何時候都更加迫切[10]。篩選高產量和對生物和非生物脅迫有耐受性的遺傳變異,需要將基因功能的有關知識和重組DNA技術相結合應用到新品種分子標記輔助選擇上,也需要植物表型組學工具的快速發(fā)展。目前植物表型組學研究的資源主要有:GARNet[11]、加拿大的 Biotron[12]、Aberystwyth 大學的 IBERS[13]、國際植物表型組學網(wǎng)絡(IPPN)[14]、the Juelich植物表型組學中心(JPPC)[15]、蒙特利爾的 Lepse[16]和澳洲表型組學設施[17]。
隨著水稻基因組測序計劃的完成[18],后基因組時代的挑戰(zhàn)是系統(tǒng)分析基因組中所有基因的功能?;谟嬎愫统C正的基因組功能注釋的啟動,用于預測基因位置,包括外顯子、內含子和其假定功能[19,20]。對水稻基因結構和功能,已經(jīng)開展了一系列研究,如cDNA全長序列分析[21],全基因組微陣列研究[22],基因表達陣列研究[22,23],基因表達序列分析(SAGE)[24,25],大規(guī)模平行標簽序列分析(MPSS)[26],蛋白質組學研究[27],和大規(guī)?;瘜W和輻射誘導突變子等[28]。在這些技術中,定義一個新基因功能的重要和直接的途徑是通過插入突變消除或激活基因的功能。利用T-DNA或轉座因子產生插入突變,可以將功能與DNA序列聯(lián)系起來,分離引起特定表型的靶基因。自20世紀90年代晚期,為獲得水稻轉座子標簽突變群體,中國臺灣、中國大陸、韓國和法國的研究者們采用T-DNA為載體[6,29-32];日本研究者采用水稻內源性逆轉座子Tos17[33,34],澳大利亞、歐洲和美國研究者則使用玉米的Ac/Ds和 En/Spm 轉座子[35-37]。
這些研究積累了突變系、插入位點區(qū)域的序列特征以及公共數(shù)據(jù)庫[38-41]。利用Tos17和Ac/Ds僅僅產生了基因敲出。用T-DNA作為載體,某些產生了兩種功能,包括增強子捕獲和敲出,僅2組有3種功能,即基因捕獲、基因敲出和活性標簽。
表型微陣列(phenotypemicroArrayTM,PM)技術是可應用于細菌、真菌或動物細胞的生物工藝開發(fā)計劃的平臺??茖W家利用該技術可以快速輕易地在成百上千種不同條件下培養(yǎng)細胞,同時檢測像途徑活性和細胞產量等主要參數(shù)。一種配套設備,OmniLog?能同時監(jiān)控5000個培養(yǎng)分析并提供詳細的動力學數(shù)據(jù)并可以用opm軟件進行分析[42]。PM技術是一個細胞檢測整合系統(tǒng),可以同時高通量篩選大量的細胞表型[43]。它由預先構造的微孔陣列組成,每個陣列檢測不同的細胞表型,而一種自動化裝置持續(xù)監(jiān)控和記錄所有陣列微孔中細胞的反應。例如,僅需將細胞懸液注入7個微孔板陣列就可檢測大腸桿菌近700種表型。PMs可以用于直接檢測細胞遺傳變化特別是基因敲除的影響[44]。
表型組學領域的迅速發(fā)展——通過表型數(shù)量分析進行基因組尺度的基因不確定性研究——急迫需求新的數(shù)據(jù)分析和可視化工具。Zorych等[45]提出了統(tǒng)計學方法用于比較由Biolog表型微陣列平臺(Biolog Phenotype Microarray)產生的表型組學數(shù)據(jù),以便進行高通量的表型分析。該統(tǒng)計方法有兩種分析途徑,一是對兩個處理組的均值曲線的距離進行定量分析,然后進行好適度檢驗,同時也可對均值曲線以下的區(qū)域進行好適度檢驗;二是應用函數(shù)主分量分析。Fernandez-Ricaud等[46]開發(fā)出一種新的公共資源——PROPHECY數(shù)據(jù)庫,用于挖掘、過濾和可視化表型數(shù)據(jù)。PROPHECY可以從IP地址http://prophecy.lundberg.gu.se獲取。
作為研究基因突變與表型關系的科學,表型組學研究首先必須獲得大量的基因突變,因此,轉基因技術、轉座子插入突變,基因敲出,化學物理誘變方法以及RNA干涉等都可以作為獲得突變的方法在表型組學研究中應用。例如,RNA干涉技術用于線蟲,可以產生大量的隨機突變,并同時產生各種各樣的表型變化。通過對各種表型的分析產生的大量數(shù)據(jù)可儲存于表型組學數(shù)據(jù)庫——PhenomicDB。代謝流可以用氣相色譜、核磁共振和具陣列輔助激光解析/解離(MALDI)的質譜進行直接分析。
除了基因突變以外,一些表觀遺傳修飾也與生物的表型變化有關,如DNA甲基化修飾,因此,分析DNA甲基化的一些方法也可以應用于表型組學研究,特別是一些高通量的分析方法,適合于表型組學大量的數(shù)據(jù)分析,如高效液相色譜柱(HPLC),甲基化CpG島層析柱法,DNA微陣列法等。
圖2 細菌表型組學研究流程示意圖
表型組學研究中面臨的主要問題是將表型數(shù)和樣本大小的增加。但表型數(shù)的增加常大于樣本數(shù)的增加,導致“大p,小N”數(shù)據(jù)組(lPSn)。此情況下,許多模型都能適合或過度適合這些數(shù)據(jù),結果是當模型應用到新的數(shù)據(jù)時,效果較差。一個普遍但合適的處理lPSn數(shù)據(jù)的方法是降低維數(shù),即在分析之前減少預測變量的數(shù)目,但在表型組學中,我們無法對降維作出基于生物學知識的選擇,因為重要的特征預先不知曉。一些統(tǒng)計學技術,包括邊沿和LASSO回歸[47],不需要降維就能在lPSn情況下很好適應模型。這些方法通常對復雜模型進行罰分,通過交叉確認進行協(xié)調。一系列證據(jù)表明表型變異的真實維數(shù)很高,維數(shù)降低將會丟失信息。比lPSn更可怕的是我們不得不處理“高維數(shù),小樣本”(HdSn)數(shù)據(jù)。這些高維數(shù)據(jù)可以用許多模型進行處理,因此選擇哪些模型至關重要。明智的選擇就是利用先前的知識[48,49],例如通過確定某些變量(如SnPs)和其它變量(RnA豐度)[50]或結構方程模型探索假設的因果模型[51]。在先前的信息不足以確定模型時,應該利用各種合理模型的信息[52,53]。當結果預測是分析的首要目的時,有很多不斷發(fā)展技術可以適合于HdSn,如偏最小二乘回歸[54],隨機森林[55]和支持向量機[56]。
表型組研究涉及的性狀很多,需要用多重檢驗(multiple testing)來進行統(tǒng)計分析?,F(xiàn)有的統(tǒng)計學方法主要通過控制假性發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)來達到所需的置信度。盡管選擇最好的候選者進行追朔(follow-up)研究時,也會產生偏離真實情況的結果。例如,在基因組尺度分析(GWA)研究中,將FDR最小化可以達到非常嚴謹?shù)慕y(tǒng)計檢驗效果,但往往造成了遺傳力的缺失(missingheritability)[57]。這些基因組尺度分析無法檢測到的對象包括基因-基因相互作用,表觀遺傳變化以及稀有變異等。不過最近的有關多重檢驗的一些進展,如 Han等和 Sandve等[58,59]提出的 SLIDE 和 SLIP方法及Monte Carlo-FDR方法可能改善多重檢驗的效率。在人類遺傳研究中,對基因組和表型組多樣性進行分析,往往需要足夠大的群體樣本才能達到要求的效力,這對于多數(shù)研究者來講仍然富有挑戰(zhàn)性?,F(xiàn)有的實驗室表型分析方法通量有限,基于Web網(wǎng)的確認和表型分析策略也許是最為合理的,但要將現(xiàn)有的技術進行應用和推廣還有很多工作要做[60]。
表型組學研究也面臨一些困難,如何獲取不同環(huán)境下大樣本的基因組信息,廣泛而深入的跨時空尺度的表型分析,降低表型組研究的成本等。表型組計劃類似于20世紀80年代后期的人類基因組計劃,有諸多的問題須待解決。比如基因組計劃最初由于缺乏基本圖譜和成本高而受到很多人反對。但當DNA自動測序技術發(fā)展起來后,成本得到降低,很快就得到研究者們的支持。當然,表型組學研究一開始也不可能進行大規(guī)模的表型分析,而是建立表型組計劃的基本框架。要達到此目的有3個途徑:技術發(fā)展、統(tǒng)計分析能力和人力及資源的整合。
基因組計劃的完成為生命科學研究奠定了基礎,盡管在醫(yī)學上的應用還遠沒有達到要求?;蚪M數(shù)據(jù)的廣泛特征直接催生了以基因組序列為研究起點的新科學。可以相信,表型組學研究能夠加快僅間接受益于基因組學的生物學和醫(yī)學的相關領域進步。表型組學對跨多個生物學尺度的多個表型進行系統(tǒng)研究是非常重要的。一旦進入“后基因組尺度分析時代”,由于成本降低和新方法可以對遺傳序列作更精細的作圖,檢測稀有突變(raremutation)和拷貝數(shù)變異(copy number variation),這些是現(xiàn)有的技術平臺無法揭示的。截至目前,仍然不清楚表觀遺傳因子解釋基因組數(shù)據(jù)表型變化的程度,其理論重要性很大[61],而一些主要的啟動計劃其目的在于更完全地發(fā)展表觀基因組學(http://nihroadmap.nih.gov/epigenomics/initiatives.asp),可能使表觀基因組尺度分析成為生物學特征分析的主要手段。表型組學是對表型進行基因組尺度的系統(tǒng)研究,對后基因組時代生物醫(yī)學研究的進步是至關重要的動力[6]。
[1] Gowen CM, Fong S.Phenome analysis ofmicroorganisms[M]//Edwards D, Stajich and D.Bioinformatics Tools and Applications, J Hansen, New York:editors.Springer, 2009.
[2] Kelsoe JR, Niculescu AB 3rd.Finding genes for bipolar disorder in the functional genomics era:from convergent functional genomics to phenomics and back[J].CNS Spectr, 2002, 7(3):215-216,223-226.
[3] Niculescu AB, Lulow LL, Ogden CA, et al.PhenoChipping of psychotic disorders: A novel approach for deconstructing and quantitating psychiatric phenotypes[J].American Journal of Medical Genetics Part B:Neuropsychiatric Genetics, 2006, 141B(6):653-662.
[4] http://www.unisa.edu.au/maths/phenomics/about.asp
[5] Bilder RM, Sabb FW, Cannon TD, et al.Phenomics:the systematic study of phenotypes on a genome-wide scale[J].Neuroscience,2009, 164:30-42.
[6] Joy T, Hegele RA.Genetics ofmetabolic syndrome:Is there a role for phenomics?[J]Curr Atheroscler Rep, 2008, 10(3):201-208.
[7] Manev H, Manev R.Benefits of neuropsychiatric phenomics:example of the 5-lipoxygenase-leptin-alzheimer connection[J].Cardiovasc Psychiatry Neurol, 2010(2010), Article ID 838164,doi:10.1155/2010/838164.
[8] Finkel E.With ‘Phenomics’, plant scientistshope to shift breeding into overdrive[J].Science, 2009, 325:380-381.
[9] Furbank RT.Plant phenomics:from gene to form and function[J].Functional Plant Biology, 2009, 36:v-vi.
[10] Furbank RT, von Caemmerer S, Sheehy J, et al.C4rice:a challenge for plant phenomics[J].Functional Plant Biology,2009, 36:845-856.
[11] http://www.garnetcommunity.org.uk/resources/phenomics
[12] http://www.thebiotron.ca/
[13]http://www.aber.ac.uk/en/ibers/news-events/new_builds_at_ibers/
[14] http://www.plantphenomics.com/
[15] http://www.fz-juelich.de/icg/icg-3/jppc
[16] http://www1.montpellier.inra.fr/ibip/lepse/english/
[17] http://www.plantphenomics.org.au/
[18] IRGSP.Themap-based sequence of the rice genome[J].Nature,2005, 436:793-800.
[19] Itoh T, Tanaka T, Barrero RA, et al.Curated genome annotation of Oryza sativa ssp.japonica and comparative genome analysis with Arabidopsis thaliana[J].Genome Res, 2007, 17:175-183
[20] Ouyang S, Zhu W, Hamilton J, et al.The TIGR Rice Genome Annotation Resource:improvements and new features[J].Nucleic Acids Res, 2007, 35:D883-887.
[21] Kikuchi S, Satoh K, Nagata T, et al.Collection,mapping, and annotation of over 28,000 cDNA clones from japonica rice[J].Science, 2003, 301:376-379.
[22] Li L, Wang X, Stolc V, et al.Genome-wide transcription analyses in rice using tilingmicroarrays[J].Nat Genet, 2006, 38:124-129.
[23] Wasaki J, Shinano T, Onishi K, et al.Transcriptomic analysis indicates putativemetabolic changes caused bymanipulation of phosphorus availability in rice leaves[J].J Exp Bot, 2006, 57:2049-2059.
[24] Gibbings JG, Cook BP, Dufault MR, et al.Global transcript analysis of rice leaf and seed using SAGE technology[J].Plant Biotechnol J, 2003, 1:271-285.
[25] Su CL, Chung CI, Lin YC, et al.Statistical analysis of rice SAGE data[J].J Genet Mol Biol, 2005, 16:248-260.
[26] Nakano M, Nobuta K, Vemaraju K, et al.Plant MPSS databases:signature-based transcriptional resources for analyses ofmRNA and small RNA[J].Nucleic Acids Res, 2006, 34:D731-735.
[27] Komatsu S, Tanaka N.Rice proteome analysis:a step toward functional analysis of the rice genome[J].Proteomics, 2005, 5:938 -949.
[28] Wu JL, Wu C, Lei C, et al.Chemical- and irradiation-inducedmutants of indica rice IR64 for forward and reverse genetics[J].Plant Mol Biol, 2005, 59:85-97.
[29] Hsing YI, Chern CG, Fan MJ, et al.A rice gene activation/knockoutmutant resource forhigh throughput functional genomics[J].Plant Mol Biol, 2007, 63:351-364.
[30] Jeong DH, An S, Kang HG, et al.T-DNA insertionalmutagenesis for activation tagging in rice[J].Plant Physiol, 2002, 130:1636-1644.
[31] Chen S, Jin W, Wang M, et al.Distribution and characterization of over 1000 T-DNA tags in rice genome[J].Plant J, 2003, 36:105-113.
[32] Wu C, Li X, Yuan W, et al.Development of enhancer trap lines for functional analysis of the rice genome[J].Plant J, 2003, 35:418-427.
[33] Hirochika H.Contribution of the Tos17 retrotransposon to rice functional genomics[J].Curr Opin Plant Biol, 2001, 4:118-122.
[34] Miyao A, Tanaka K, Murata K, et al.Target site specificity of the Tos17 retrotransposon shows a preference for insertion within genes and against insertion in retrotransposon -rich regions of the genome[J].Plant Cell, 2003, 15:1771-1780.
[35] Upadhyaya NM, Zhu QH, Zhou XR, et al.Dissociation(Ds)constructs,mapped Ds launch pads and a transiently-expressed transposase system suitable for localized insertionalmutagenesis in rice[J].Theor Appl Genet, 2006, 112:1326-1341.
[36] van Enckevort LJ, Droc G, Piffanelli P, et al.EU-OSTID :a collection of transposon insertionalmutants for functional genomics in rice[J].Plant Mol Biol, 2005, 59:99-110.
[37] Kolesnik T, Szeverenyi I, Bachmann D, et al.Establishing an efficient Ac/Ds tagging system in rice:large-scale analysis of Ds flanking sequences[J].Plant J, 2004, 37:301-314.
[38] Hirochika H, Guiderdoni E, An G, et al.Ricemutant resources for gene discovery[J].Plant Mol Biol, 2004, 54:325-334.
[39] An G, Lee S, Kim SH, et al.Molecular genetics using T-DNA in rice[J].Plant Cell Physiol, 2005, 46:14-22.
[40] Guiderdoni E, An G, Yu SM, et al.T-DNA insertionmutants as a resource for rice functional genomics[M]//Upadhyaya NM(ed)Rice functional genomics-challenges, progress and prospects.New York:Springer, 2007:181-221.
[41] Hsing YI, Chern CG, Fan MJ, et al.A rice gene activation/knockoutmutant resource forhigh throughput functional genomics[J].Plant Mol Biol, 2007, 63:351-364.
[42] Vaas LAI, Sikorski J, Hofner B, et al.opm:an R package for analysing OmniLog? phenotypemicroarray data[J].Bioinformatics 2013, First published online:June 5, 2013.
[43] Zhang J, Biswas I.A phenotypicmicroarray analysis of a Streptococcusmutans liaSmutant[J].Microbiology, 2009, 155:61-68.
[44] Bochner BR.PhenotypemicroArray technology:A “phenomics”tool for studying cells and optimizing bioprocesses[C].Recent Advances in Fermentation Technology.San Diego, CA:Marriott Mission Valley, 2009.
[45] Zorych I, Sturino J, Bliznyuk N, et al.Statisticalmethods for comparative phenomics usinghigh-throughput phenotypemicroarrays[J].Int J Biostat, 2010, 6(1):Article 29.doi:10.2202/1557-4679.1227.
[46] Fernandez-Ricaud L, Warringer J, Ericson E, et al.PROPHECY—a database forhigh-resolution phenomics[J].Nucleic Acids Research, 2005, 33:D369-D373.
[47] Tibshirani R.Regression shrinkage and selection via the Lasso[J].J Royal Stat Soc Ser B, 1996, 58(1):267-288.
[48] Rockman MV.Reverse engineering the genotype- phenotypemap with natural genetic variation[J].Nature, 2008, 456:738-744.
[49] Ochs MF.Knowledge-based data analysis comes of age[J].Brief Bioinformatics, 2010, 11:30-39.
[50] Zhu J, Lum PY, Lamb J, et al.An integrative genomics approach to the reconstruction of gene networks in segregating populations.cytogenet[J].Genome Res, 2004, 105:363-374.
[51] Li RH, Tsaih SW, Shockley K, et al.Structuralmodel analysis ofmultiple quantitative traits[J].PLoS Genet, 2006, 2:1046-1057.
[52] Burnham KP, Anderson DR.Model selection andmulti-model inference:A practical information-theoretic approach[M].New York:Springer, 2002.
[53] Claeskens G, Hjort NL.The focused information criterion.J Am Stat Assoc, 2003, 98:900-916.
[54] Wold S, Martens H, Wold H.Themultivariate calibration-problem in chemistry solved by the PLSmethod[J].Lect Notes Math,1983, 973:286-293.
[55] Bureau A, Dupuis J, Falls K, et al.Identifying SNPs predictive of phenotype using random forests[J].Genet Epidemiol, 2005, 28:171-182.
[56] Breiman L.Statisticalmodeling:the two cultures[J].Stat Sci,2001, 16(3):199-215.
[57] Yang J, Benyamin B, McEvoy BP, et al.Common SNPs explain a large proportion of theheritability forhumanheight[J].Nature Genet, 2010, 42:565-569.
[58] Han B, Kang HM, Eskin E.Rapid and accuratemultiple testing correction and power estimation formillions of correlatedmarkers[J].PLoS Genet, 2009, 5(4):e1000456.
[59] Sandve GK, Gundersen S, Rydbeck H, et al.The Genomic Hyper-Browser:inferential genomics at the sequence level[J].Genome Biology, 2010, 11:R121
[60] Bilder RM, Sabb FW, Cannon TD, et al.Phenomics:the systemtic study of phenotypes on a genome-wide scale[J].Neuroscience,2009, 164:30-42.
[61] Mehler MF.Epigenetic principles andmechanisms underlying nervous system functions inhealth and disease[J].Prog Neurobiol,2008, 86(4):305-341.