馬文濤
摘要:生物信息學(xué)的產(chǎn)生標(biāo)志著生物學(xué)研究模式的變革,其本科課程的建設(shè)倍受關(guān)注。目前,生物信息學(xué)課程建設(shè)的主流思想是注重實(shí)踐,引入諸如案例式教學(xué)、問題式教學(xué)或任務(wù)驅(qū)動(dòng)式教學(xué)等新型教學(xué)模式。然而,生物信息學(xué)作為一個(gè)學(xué)科本身,具有強(qiáng)烈的理論內(nèi)涵和普遍規(guī)律。本文強(qiáng)調(diào)了傳統(tǒng)課堂在傳授這些知識(shí)方面的不可替代作用,并舉例說(shuō)明了其中應(yīng)講授的基本思想和基礎(chǔ)概念。最后,這里提出,注重理論和簡(jiǎn)單實(shí)踐的導(dǎo)論性課程和注重實(shí)踐的新型課程應(yīng)分開建設(shè),并同樣重視。
關(guān)鍵詞:傳統(tǒng)授課方式;理論聯(lián)系實(shí)踐;大學(xué)教學(xué);跨學(xué)科課程
中圖分類號(hào):G642.3 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2018)40-0122-03
一、生物信息學(xué):從科學(xué)到教學(xué)
生物信息學(xué)是一個(gè)生物學(xué)和數(shù)學(xué)以及計(jì)算機(jī)科學(xué)交叉而形成的新興學(xué)科。現(xiàn)在人們一般認(rèn)為其英文說(shuō)法“bioinformatics”是由時(shí)任弗羅里達(dá)州立大學(xué)超算中心基因與生物物理組主任的林華安(H.A.Lim)博士在1987年首創(chuàng),從此標(biāo)志該學(xué)科的誕生;不過(guò),也有人指出,早在1968年,已經(jīng)有教材采用相關(guān)概念[1]。無(wú)論如何,生物信息學(xué)仍是一個(gè)比較新的學(xué)科,它隨人類及其他生物基因組計(jì)劃的進(jìn)行而蓬勃發(fā)展,研究范圍逐漸擴(kuò)展到整個(gè)生命科學(xué)領(lǐng)域?,F(xiàn)在,生物信息學(xué)是生物學(xué)研究模式革命的標(biāo)志,正如諾貝爾獎(jiǎng)獲得者吉爾伯特(W.Gilbert)所言:“基于全部基因都將知曉并以電子技術(shù)可操作的方式駐留在數(shù)據(jù)庫(kù)中,新的生物學(xué)研究模式的出發(fā)點(diǎn)應(yīng)該是理論的。科學(xué)家將從理論推測(cè)出發(fā),再返回到實(shí)驗(yàn)中去,追蹤或驗(yàn)證這些理論假設(shè)。……生物學(xué)家不僅必須成為計(jì)算機(jī)學(xué)者,而且也要改變他們研究生命現(xiàn)象的途徑”[2]。順應(yīng)科學(xué)發(fā)展的趨勢(shì),生物信息學(xué)的大學(xué)教育也迅速開展。在美國(guó),最早于1990s中期即開始培養(yǎng)相關(guān)的博士和碩士。目前幾乎每所美國(guó)和歐洲綜合性大學(xué)均開設(shè)生物信息學(xué)課程?,F(xiàn)在,我國(guó)各高等院校也逐漸和國(guó)際接軌——一般來(lái)說(shuō),有著生物學(xué)或生物技術(shù)專業(yè)的學(xué)校都在努力建設(shè)生物信息學(xué)課程。然而,生物信息學(xué)非常特殊,其課程建設(shè)并不容易。首先,它是一門跨專業(yè)學(xué)科,僅有生物學(xué)背景遠(yuǎn)遠(yuǎn)不夠,還需要數(shù)學(xué)和計(jì)算機(jī)方面的背景;但傳統(tǒng)上,生物專業(yè)的學(xué)生在這方面的基礎(chǔ)課程力度不夠。其次,由于涉及到生命科學(xué)領(lǐng)域的方方面面,它的內(nèi)容跨度很大,比如,從“序列比對(duì)分析”到“分子進(jìn)化分析”,再到“分子結(jié)構(gòu)分析”,其中涉及到的生物學(xué)知識(shí)和算法知識(shí)都很不相同;其結(jié)果是,計(jì)劃的課時(shí)往往難以覆蓋。然后,它的理論和實(shí)踐內(nèi)容都很重要,但側(cè)重點(diǎn)上卻有很大的不同,難以緊密結(jié)合。
目前,解決這些矛盾的一個(gè)普遍采用的辦法就是“放棄”理論,專注于實(shí)踐。的確,不少關(guān)于生物信息學(xué)的教學(xué)改革的思路就是如此,即所謂“案例式教學(xué)(Case-based Learning)”、“問題式教學(xué)(Problem-based Learning)”和“任務(wù)驅(qū)動(dòng)式教學(xué)(Task-based learning)”等等[3-5]。如此,理論和實(shí)踐相結(jié)合的問題當(dāng)然沒有了;計(jì)劃的課時(shí)也因?yàn)閷?duì)理論方面的放棄而足夠了;甚至,計(jì)算機(jī)和數(shù)學(xué)方面的基礎(chǔ)似乎也不那么重要了——只要會(huì)查數(shù)據(jù)庫(kù)以及會(huì)用軟件來(lái)“解決”實(shí)際問題就行了,最多用數(shù)據(jù)處理能力較強(qiáng)的腳本語(yǔ)言(如Perl或Python等)寫寫小程序就已經(jīng)是“小專家”了。然而,這樣培養(yǎng)出來(lái)的“人才”能配得上生物信息學(xué)這個(gè)改變生物學(xué)面貌的革命性學(xué)科嗎?顯然不是,這個(gè)問題需要引起足夠重視。我們?cè)诟叩冉逃恼n程建設(shè)上仍然需要注重學(xué)科的基本理論思想和基礎(chǔ)概念的傳授,才不至于流于“實(shí)用主義”,才能為我國(guó)培養(yǎng)具有“學(xué)科高度”的相關(guān)人才。下面,筆者結(jié)合本校生物信息學(xué)本科教學(xué)實(shí)踐的經(jīng)驗(yàn)來(lái)談生物信息學(xué)理論教學(xué)需要注重的三個(gè)方面的內(nèi)容,而這些方面顯然是傳統(tǒng)課堂形式中的傳授內(nèi)容,將使生物信息學(xué)的魅力展現(xiàn)無(wú)疑。
二、生物信息學(xué)的內(nèi)容特色:生命的信息內(nèi)涵
正因?yàn)槭切屡d學(xué)科,生物信息學(xué)并沒有一個(gè)統(tǒng)一的定義,幾乎每一本相關(guān)教材中都有自己的定義。根據(jù)一個(gè)較權(quán)威的來(lái)源——人類基因組計(jì)劃第一個(gè)五年總結(jié)報(bào)告(1995,美國(guó))中的提法:生物信息學(xué)是利用信息技術(shù)對(duì)生物信息進(jìn)行獲取、儲(chǔ)存、分發(fā)(查詢)和分析,以解釋這些信息數(shù)據(jù)所蘊(yùn)涵的生物學(xué)意義的學(xué)科。從這個(gè)定義中,我們可以看出兩個(gè)和信息有關(guān)的關(guān)鍵詞:“信息技術(shù)”和“生物信息”。其中,第一個(gè)代表本學(xué)科用到的方法,在一般的教材和課堂教學(xué)中都會(huì)充分強(qiáng)調(diào)。然而,對(duì)于第二個(gè),“生物信息”,也即本學(xué)科研究的內(nèi)容(對(duì)象),我們往往在講解中不夠重視——似乎大家都清楚:想想那些基因序列和蛋白質(zhì)序列就知道了。不過(guò),大家真的清楚嗎?這些信息是怎么來(lái)的?為什么信息對(duì)于生命這么重要?為什么“生物信息學(xué)”現(xiàn)在這么熱門,卻沒有相應(yīng)的“物理信息學(xué)”和“化學(xué)信息學(xué)”等等?這些正是涉及到“生物信息學(xué)”作為一個(gè)學(xué)科的基本問題。大家都知道,化學(xué)對(duì)于生物學(xué)十分重要,生物專業(yè)的學(xué)生要學(xué)習(xí)很多化學(xué)方面的課程。如果有人說(shuō):“化學(xué)對(duì)于生物學(xué)不僅僅是一種方法,生命現(xiàn)象植根于化學(xué)的規(guī)律之上”,我們都不會(huì)有太多異議。然而,如果說(shuō):“信息學(xué)對(duì)于生物學(xué)不僅僅是一種方法,生命現(xiàn)象植根于信息學(xué)的規(guī)律之上”,很多人就會(huì)疑惑了。但這個(gè)卻是事實(shí),生命世界里的各種現(xiàn)象和信息緊密相關(guān)。比如,遺傳是信息的代代相傳,而進(jìn)化是信息的演化。信息論的鼻祖申農(nóng)(C.E.Shannon)指出,信息的產(chǎn)生來(lái)源于選擇(“不確定性的消除”);而顯然,進(jìn)化中產(chǎn)生的基因組信息就源于“自然選擇”[6]。一個(gè)更加顯見的例子是,分子生物學(xué)中的中心法則就是一個(gè)信息傳遞和轉(zhuǎn)化的流程,昭示著“生命的核心機(jī)制就建立在信息的流轉(zhuǎn)之上”。那么,如果說(shuō)化學(xué)代表著生物學(xué)的一面,則信息學(xué)就代表著它的另一面。所以,我們?cè)谡n堂上講清楚“生命的信息內(nèi)涵”十分重要,將使學(xué)生理解到生物信息學(xué)的根本意義。
三、生物信息學(xué)的研究方式:算法思想的意義
算法,通俗來(lái)說(shuō)就是計(jì)算的方法。計(jì)算機(jī)的基本工作原理就是基于計(jì)算的,因此,如何進(jìn)行計(jì)算對(duì)于計(jì)算機(jī)來(lái)說(shuō)就至關(guān)重要,關(guān)系到它能否完成我們希望它完成的任務(wù)。對(duì)于生物信息學(xué)來(lái)說(shuō),算法其實(shí)就是其分析問題的方式和解決問題的途徑。顯然,這又是一個(gè)生物信息學(xué)理論課堂必須強(qiáng)調(diào)的內(nèi)容。在課堂上,首先,我們要講解算法相關(guān)的基本概念,強(qiáng)調(diào)其嚴(yán)格的“步驟性”和面向“任務(wù)”的特性。其次,需要講解算法的最重要特性:正確性、時(shí)間復(fù)雜度、空間復(fù)雜度、并行可能性及其可實(shí)現(xiàn)性(變成代碼的難度)等等。然后,可以介紹一些經(jīng)典的算法思想,如貪婪算法、窮舉算法等等。當(dāng)然,這些基本知識(shí)的傳授對(duì)學(xué)生理解生物信息學(xué)的工作方式是很有意義的。比如,經(jīng)典序列比對(duì)搜索工具Blast,對(duì)時(shí)效要求非常高,一方面是因?yàn)槠渌阉鞯臄?shù)據(jù)庫(kù)的規(guī)模巨大,另一方面是因?yàn)閬?lái)自全世界的網(wǎng)上訪問。所以,在講Blast算法的時(shí)候,我們要讓學(xué)生理解它是如何實(shí)現(xiàn)它的高效率的,其中就涉及到其對(duì)時(shí)間復(fù)雜度的降低以及貪婪算法思想的應(yīng)用等。再如,在講分子進(jìn)化分析時(shí),如果介紹“最大似然法”的算法,我們就可以向?qū)W生講解其窮舉算法的思想。生物信息學(xué)課講算法,決不僅僅是傳授不同問題的具體解決方法,更重要地是讓學(xué)生體會(huì)生物信息學(xué)的工作方式。生物專業(yè)的學(xué)生通過(guò)這些內(nèi)容可以知道:“原來(lái),生物學(xué)研究還可以這樣進(jìn)行”;而數(shù)學(xué)或計(jì)算機(jī)專業(yè)的學(xué)生會(huì)很興奮地發(fā)現(xiàn),原來(lái)他們所學(xué)到的知識(shí)和技能可以如此地應(yīng)用于解決生物學(xué)問題。這些內(nèi)容極可能觸發(fā)這些學(xué)生的興趣,讓他們進(jìn)入生物信息學(xué)的殿堂,成為具有“學(xué)科”高度和眼界的相關(guān)人才。這樣才能使我國(guó)在生物信息學(xué)領(lǐng)域也可能有思想和理論的原創(chuàng)性,而不只是世界先進(jìn)思想的跟隨者或?qū)嵺`者。
四、生物信息學(xué)應(yīng)用軟件的利用:研究結(jié)果的評(píng)估
當(dāng)然,很多生物背景的學(xué)生并不會(huì)真正進(jìn)入生物信息學(xué)領(lǐng)域。他們關(guān)心的只是怎么樣利用生物數(shù)據(jù)庫(kù),以及怎樣運(yùn)用別人開發(fā)好的軟件工具進(jìn)行自己的研究。那么,傳統(tǒng)課堂的理論講授能不能在這方面也起到作用呢?
答案是肯定的。也許數(shù)據(jù)庫(kù)查詢方面的結(jié)果差異并不會(huì)很多,然而,用不同的軟件,即使針對(duì)同樣的問題并利用同樣的數(shù)據(jù),也往往得到不同的結(jié)果。有的時(shí)候,這些結(jié)果的區(qū)別還很大。那么,如何評(píng)估這些結(jié)果對(duì)于我們得出有效結(jié)論就至關(guān)重要。比如,在構(gòu)建進(jìn)化樹的時(shí)候,各種構(gòu)樹方法可能得到不同的結(jié)果,我們要說(shuō)明:各種方法的假設(shè),它們對(duì)其假設(shè)的敏感性(即如違背假設(shè),結(jié)果會(huì)不會(huì)錯(cuò)得離譜),它們的統(tǒng)計(jì)特性(如估計(jì)一致性:樣本數(shù)據(jù)增加時(shí),是否能傾向正確的樹),以及實(shí)踐過(guò)程中它們的一般表現(xiàn)如何(即符合實(shí)際情況程度的評(píng)價(jià))等等??偟膩?lái)說(shuō),我們的策略應(yīng)該是,各種方法都用——如果結(jié)果很相似,則此結(jié)果的可信度很高;如果結(jié)果明顯不同,就需要考慮上述有關(guān)假設(shè)、統(tǒng)計(jì)學(xué)以及符合程度等方面的評(píng)價(jià)。再如,在講解蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的內(nèi)容,我們可以介紹兩年一屆的世界范圍內(nèi)的預(yù)測(cè)競(jìng)賽:“CASP(Critical Assessment of Structure Prediction)”。各個(gè)參賽軟件的結(jié)果都不同,甚至可能相差甚遠(yuǎn);從而讓學(xué)生深刻地體會(huì)到,不同工具分析得到的結(jié)果不同是生物信息學(xué)研究領(lǐng)域的常態(tài)。的確,站在科學(xué)的高度,從研究方法上去評(píng)價(jià)生物信息學(xué)分析的結(jié)果,并基于生物學(xué)的背景知識(shí)去探討這些結(jié)果的意義十分重要——絕對(duì)不是會(huì)用某個(gè)或某些個(gè)軟件,就是生物信息學(xué)的專家了。
五、完備的生物信息學(xué)課程體系:兼得理論和實(shí)踐之妙
生物信息學(xué)的發(fā)展日新月異,方法和內(nèi)容上的更新都非常迅速。我們的理論課堂上需要傳授的內(nèi)容一定要站在相當(dāng)?shù)母叨龋枰焉镄畔W(xué)中不變的東西提煉出來(lái),讓學(xué)生去體會(huì)。上述三個(gè)方面,從生命的信息內(nèi)涵,到生物信息學(xué)的研究方式,再到生物信息學(xué)軟件工具的利用方式,無(wú)一不是經(jīng)得起時(shí)間考驗(yàn)的。當(dāng)然,這里強(qiáng)調(diào)生物信息學(xué)基本理論思想和基礎(chǔ)概念的重要性,并不是否定實(shí)踐對(duì)這門學(xué)科的重要性。相反,我們要告訴學(xué)生,生物信息學(xué)是一個(gè)實(shí)踐性很強(qiáng)的學(xué)科,緊密聯(lián)系實(shí)踐,才能更深刻地體會(huì)和掌握它,才能在嶄新模式下的生物學(xué)研究中游刃有余。因此,一個(gè)好的方式是將生物信息學(xué)開成兩個(gè)課堂:傳統(tǒng)的講授課堂和新興的注重實(shí)踐的課堂。在傳統(tǒng)的講授課堂中,應(yīng)強(qiáng)調(diào)上述的基本理論思想和基礎(chǔ)概念,講解基本的數(shù)據(jù)庫(kù)和通用的應(yīng)用軟件工具的運(yùn)用;而在注重實(shí)踐的新型課堂下,我們可以采用案例式教學(xué)、問題式教學(xué)、任務(wù)驅(qū)動(dòng)式教學(xué)等方式。鑒于信息對(duì)生命科學(xué)的核心意義,建議前者開成必修課(可稱“生物信息學(xué)導(dǎo)論”,考慮到知識(shí)背景,應(yīng)開于分子生物學(xué)之后)。而實(shí)踐課應(yīng)該延后一學(xué)期,開成專業(yè)選修課(可稱為“生物信息學(xué)實(shí)踐”)。另外,由于一般來(lái)說(shuō),高校的研究生生源有很大差異,而生物信息學(xué)對(duì)現(xiàn)代生物學(xué)研究至關(guān)重要,所以這兩門本科課應(yīng)該通開于研究生,記選修學(xué)分。總的來(lái)說(shuō),這樣就“兼得理論和實(shí)踐之妙”——我們可以期待,采取這種模式的生物信息學(xué)大學(xué)教育將為我國(guó)培養(yǎng)既有科學(xué)眼界、又有實(shí)踐能力的生物信息學(xué)人才。
參考文獻(xiàn):
[1]Hodgman TC,F(xiàn)rench A,Westhend DR.Instant Notes in Bioinformatics,2nd edition[Z].Taylor & Francis Group,2010.
[2]Gilbert W.Towards a paradigm shift in biology[Z].Nature,1991,(349):99.
[3]劉念.案例教學(xué)法在《生物信息學(xué)》本科教學(xué)的應(yīng)用[J].考試周刊,2016,(78):152,191.
[4]朱柳村,李嘉睿.生物信息學(xué)創(chuàng)新教學(xué)模式的探究[J].安徽農(nóng)學(xué)通報(bào),2017,23(6):179-181.
[5]鄒先瓊,林軍,廖錦鋒.任務(wù)驅(qū)動(dòng)教學(xué)法在生物信息學(xué)教學(xué)中的實(shí)踐與思考[J].教育教學(xué)論壇,2017,(28):209-210.
[6]Ma WT.The essence of life[Z].Biological Direct,2016,(11):49.