陳志雄 王少奎 李亞娟
摘要 生物信息學是一門生命科學與計算機科學、統(tǒng)計學等學科相互滲透而形成的綜合性學科,廣泛應用于生命領域科學研究。針對農學類專業(yè)課程設置、學生知識背景及農業(yè)科學研究熱點需要,提出生物信息學課程教學過程在必要理論基礎知識學習的基礎上,針對農學專業(yè)的研究目的,設置功能模塊化教學內容,將分布各章節(jié)的知識點融匯貫通,提高農學類專業(yè)學生分析問題和解決問題的能力,適應后基因組時代農業(yè)科學研究,滿足現(xiàn)代社會對農業(yè)創(chuàng)新型人才的需求。
關鍵詞 科研導向;生物信息學;教學內容;農學
中圖分類號 S-01 文獻標識碼 A 文章編號 0517-6611(2018)32-0234-03
Teaching Contents Reform of Bioinformatics in Agricultural Science Specialty from Scientific Research Orientation
CHEN Zhixiong1, WANG Shaokui1, LI Yajuan2
(1.College of Agriculture, South China Agricultural University, Guangzhou, Guangdong 510642;2.Center of Experimental Teaching for Commom Basic Courses, South China Agricultureal University, Guangzhou, Guangdong 510642)
Abstract Bioinformatics is a comprehensive discipline formed by life sciences, computer science and statistics, which is widely used in scientific research in the life field. This paper summarized the curriculum of agronomy majors, the background of students knowledge and the hotspots of agricultural science research. The setting of functional modular teaching content was proposed on the basis of the necessary theoretical basic knowledge during the teaching process of bioinformatics course. The knowledge points of each chapter would be redistributed, reorganized and integrated in different functional modular teaching content. The setting of functional modular teaching content aimed to improve the ability of agronomy students to analyze and solve problems, adapt to the agricultural science research in the postgenome era, and meet the needs of modern society for innovative agricultural talents.
Key words Research orientation;Bioinformatics;Teaching content;Agronomy
基金項目 國家自然科學基金項目(31271688);廣東省自然科學基金項目(2018A030313090);廣東省省級教改課題(201619);2016年華南農業(yè)大學校級教改課題。
作者簡介 陳志雄(1975—),男,福建莆田人,副研究員,博士,從事作物遺傳育種和生物信息學研究。*通訊作者,高級實驗師,博士,從事作物遺傳育種研究和遺傳學實驗教學與研究。
收稿日期 2018-09-11
生物信息學是隨著人類基因組計劃的實施而興起的一門新學科,綜合運用了信息學、數(shù)學、計算機和生物學的的方法和技術,管理和利用DNA、RNA和蛋白質等生物分子數(shù)據(jù),揭示數(shù)據(jù)所蘊含的生物學意義。生物信息學已融合到生命科學各個領域,成為生命科學不可分割的重要組成部分[1]。近年來,隨著第二代測序技術和PacBio RS單分子實時測序系統(tǒng)的推出,測序成本大幅下降,大大促進了作物基因組測序工作的開展。2017年啟動的“萬種植物基因組計劃,將在5年內對10 000種植物的基因組進行測序。面對已經產生或即將產生的海量基因組數(shù)據(jù),亟需強有力的工具挖掘有用的信息、發(fā)現(xiàn)農作物的重要基因、加快基因克隆等,以推進生物多樣性、生態(tài)保護及各種重要基礎科研和農業(yè)應用轉化問題的研究。生物信息學已成為農業(yè)科學家開展科研工作的重要工具,同時也是農學相關專業(yè)本科生必須掌握的基本知識和技能。因此,各農業(yè)院校應大力開展生物信息學課程教學,培養(yǎng)大量了解農業(yè)知識的生物信息學人才。筆者結合農業(yè)院校的專業(yè)特點和生物信息學教學過程中遇到的實際問題,制定科研導向的農學類專業(yè)生物信息學教學內容,以激發(fā)作物學專業(yè)本科生對生物信息學的學習興趣,提高農業(yè)院校生物信息學課程的教學效果。
1 農學類專業(yè)生物信息學教學面臨的主要難題
1.1 學生專業(yè)基礎較差
農學類專業(yè)學生在知識面及綜合技能上相對較窄,對信息學知識接觸得不多,對信息學的認識僅限于使用電腦編輯文本和上網等基礎應用,未深入學習計算機語言、編程等。大多數(shù)農業(yè)院校學生的英語基礎不好,難以適應生物信息學數(shù)據(jù)庫、分析軟件、文獻資料的英文環(huán)境,在學習生物信息學時感覺難度較大,學習的積極性受到打擊,從而導致學生學習生物信息學的興趣下降。同時,本科生深入接觸科學研究的機會較少,其學習的目的主要是通過考試和拿到學分,很難意識到生物信息學知識對將來學習和工作的重要性。
1.2 課程安排學時不充裕
農業(yè)院校以培養(yǎng)農業(yè)人材為目的,開設的課程主要是農業(yè)生產相關的課程,而對計算機語言、編程等課程未深入學習,未意識到生物信息學對未來農業(yè)科研和發(fā)展的重要性,一般將生物信息學視為一門普通的選修課。近年來,隨著各種新技術和新理論的發(fā)展,人類獲得生物數(shù)據(jù)的能力越來越強,大量數(shù)據(jù)的積累進一步推動了生物信息分析技術的開發(fā),而生物信息學涉及的學科越來越多,教學內容涉及生物化學、分子生物學、遺傳學、基因工程、計算機語言及數(shù)據(jù)庫等相關知識等相關知識以及不斷更新的數(shù)據(jù)庫和軟件,需要學生花費更多時間去理解與運用。豐富多樣的課程內容與較少學時之間的沖突,為完整系統(tǒng)授課帶來一定難度。
1.3 缺乏適合教材
生物信息學涉及到的學科越來越多,各種生物信息學專著及教材種類不斷涌現(xiàn)。以“生物信息學”為題名檢索本校圖書館館藏書目,有62種與生物信息學相關的教材或專著。各種專著側重點不同,內容繁雜,涉及人類醫(yī)學、疾病研究、藥物設計等領域的教材較多,而涉及農學的內容幾乎沒有。部分教材專業(yè)性過強,難度較大,不適于農學專業(yè)學生使用。各教材內容豐富,但缺少連貫性,在解決農業(yè)院校學生所遇到的專業(yè)問題時實用性差。因此,很難選到合適的教材是農學專業(yè)生物信息學教學的一大難題。
2 針對農學專業(yè)特點,設置模塊化的生物信息學教學內容
針對農學類專業(yè)生物信息學教學學時少、缺乏合適教材、學生知識基礎與結構差異大等問題,借鑒各兄弟院校的經驗[2-5],在突出生物信息學的應用性和系統(tǒng)性的基礎上[6],從農業(yè)院校人才培養(yǎng)的目的和專業(yè)特色出發(fā)[7],選擇和設置實用、易學、有一定深度的教學內容,圍繞生物學知識、農業(yè)研究熱點展開生物信息學課程教學,使學生愿意接受生物信息學課程,從而輕松學習、掌握與運用生物信息學知識。
農學以谷類、豆類等農作物的生理生化、栽培育種等為研究對象,圍繞農作物的優(yōu)質、高產、抗逆等性狀進行表型、遺傳等方面研究。農學類專業(yè)課程設置特點使學生對基因的復制、轉錄和翻譯、基因功能較熟悉。農學類專業(yè)生物信息學課程主要圍繞基因功能、基因表達和系統(tǒng)進化三方面內容(表1),在必要的理論基礎學習的基礎上,以功能模塊為中心的理論與實踐融合的教學模式,在有限的學時內,寓教于科研實踐,教學內容簡單實用,提高了生物信息學的教學強度和教學效果,為學生將來從事科研實踐奠定堅實的基礎。
2.1 必要的基礎知識學習
2.1.1 基礎理論知識。生物信息學的學科基礎分為生物學基礎知識、數(shù)學基礎知識和計算機及網絡基礎知識。農學類本科生學習完生物化學、植物學和遺傳學等專業(yè)基礎課程,對染色體、基因、中心法則有較深的理解,對生物學知識較為熟悉,已積累了必需的生物學基礎知識。因此,緒論部分簡要介紹數(shù)學、計算機及網絡基礎知識,著重介紹生物信息學的狹義定義以及數(shù)據(jù)庫、序列分析和基因表達等生物信息在科研實踐中的應用,讓學生意識到生物信息學在農業(yè)科研中的重要性,并且強調生物信息學的實踐應用特點。
2.1.2 基礎數(shù)據(jù)庫。生物信息學相關數(shù)據(jù)庫有一級數(shù)據(jù)庫、二級數(shù)據(jù)庫,貯存了生物大分子(DNA、蛋白質)序列、結構、表達、相關文獻等海量信息。NCBI是當今世界上最大的分子生物學研究的綜合性數(shù)據(jù)庫,為生物醫(yī)學及生命科學研究提供了大量的數(shù)據(jù)和眾多的分析工具與平臺,因此NCBI成為生物信息學數(shù)據(jù)庫的教學重點之一??蒲兄谐S玫臄?shù)據(jù)庫有核苷酸數(shù)據(jù)庫(GenBank、EMBL和DDBJ)、蛋白質序列、結構數(shù)據(jù)庫(UniProt、PIR、PDB、PFAM、SMART、Prosite等)、基因表達數(shù)據(jù)庫(GEO)、代謝通路數(shù)據(jù)庫(KEGG)、基因本體數(shù)據(jù)庫(GO)等生命科學相關數(shù)據(jù)庫,在農業(yè)科學研究中發(fā)揮著重要的作用。作為農學類專業(yè)的生物信息學課程,應著重介紹2種模式植物擬南芥基因組數(shù)據(jù)庫(TAIR)和水稻基因組數(shù)據(jù)庫(RAP-DB、RGAP),了解并熟悉作物和模式植物比較基因組數(shù)據(jù)庫(Gramene)、植物基因組資源(Phytozome)、基于基因芯片的植物表達數(shù)據(jù)庫(PLEXdb)、水稻表達數(shù)據(jù)庫(RiceXPro)等,它們是農業(yè)分子生物學研究最基礎的批量數(shù)據(jù)來源,為農學類學生需要了解甚至可運用到科研活動中的資源。
2.1.3 序列聯(lián)配工具。生物信息學計算的核心是序列聯(lián)配,BLAST是最常用的核酸和蛋白質同源性比較工具。教學內容包括序列比較算法(Needle-man-Wunsch、Smith-Waterman、Karlin-Altchul)、得分矩陣(PAM、BLOSUM、DNA替換矩陣)、BLAST種類及使用、在線BLAST使用方法和參數(shù)設置及結果解讀。這些基礎知識的學習有助于學生了解生物信息所涉及的問題、掌握解決問題的基本方法,并將知識融會貫通。
2.2 基于基因功能研究方向的生物信息學教學內容設置
隨著越來越多物種的基因組測序工作完成,生命科學研究已邁入功能基因組時代。基因功能驗證技術包括過表達、RNA干擾和反義RNA技術、基因敲除等技術[8],這些技術核心環(huán)節(jié)是載體設計與構建。因此,該部分內容重點講解和分析基因的結構(外顯子和內含子)、啟動子序列、編碼區(qū),掌握蛋白質預測表達部位、跨膜結構和信號肽等理論知識。實踐課內容設置選用作物基因家族為研究對象,從數(shù)據(jù)庫搜索并下載序列,利用生物信息學常用的EditSeq、引物設計軟件、限制性內切酶識別軟件等,設計過表達、RNA干擾和載體構建,指導分子生物學試驗,達到研究基因功能的目的。根據(jù)基因表達水平和部位的概念和原理,介紹多種載體構建所涉及的基礎理論知識、實驗過程采用的軟件及注意事項,減輕學生對基因序列的陌生感,增加學生的興趣和解決問題的能力。
2.3 基于基因表達譜研究方向的生物信息學教學內容設置
基因表達是基因功能研究的重要內容之一。單個基因表達的常用試驗方法有半定量RT-PCR、定量RT-PCR和Northern雜交等。基因芯片技術可以高通量分析生物全基因組的表達模式,篩選特定組織、特定階段或特定生理過程中表達的功能基因。這部分內容簡要介紹基因芯片的種類、制備和信號檢測過程,重點講解芯片數(shù)據(jù)處理與分析以及數(shù)據(jù)反映出的生物學意義。然后,選擇一種作物的基因家族,利用PLEXdb檢索基因家族的表達模式,通過PLEXdb提供的Blast工具找到對應的探針號,利用探針號查找不同生育時期、不同器官、不同生物脅迫或非生物脅迫下的基因表達值,通過MEV、Clustal和Treevies軟件圖形化顯示各個基因的表達量,從復雜的數(shù)據(jù)凝煉出生物學意義。在學時保證的情況下,可安排或參考《DNA和蛋白質數(shù)據(jù)分析工具》(第3版)中的“基因芯片數(shù)據(jù)處理和分析”從全基因組水平進行基因表達聚類分析和差異表達基因篩選。