鐘茂生,黃曉輝,張紅斌
(1.江西師范大學(xué) 計算機信息工程學(xué)院,江西 南昌 330022;2.華東交通大學(xué) 信息工程學(xué)院,江西 南昌 330013)
自然語言處理是一門新興交叉學(xué)科,也是人工智能領(lǐng)域的一個研究分支,它涵蓋了語言學(xué)、計算機科學(xué)、概率統(tǒng)計、機器學(xué)習(xí)、數(shù)據(jù)挖掘等學(xué)科知識內(nèi)容。自然語言處理人才的培養(yǎng),是自然語言處理課程教學(xué)的主要目標和任務(wù)。在國外,本科階段就有自然語言處理的獨立專業(yè),基礎(chǔ)課程主要有數(shù)學(xué)、語言學(xué)、計算機三大塊,核心課程有自然語言處理的統(tǒng)計學(xué)方法、語言計算的算法運用、語義分析、信息抽取、語音合成、人工智能等,前沿課程包括機器翻譯、自然語言處理在生物醫(yī)藥中的應(yīng)用、語音信號合成等。在國內(nèi),本科階段沒有高校開設(shè)單獨的自然語言處理專業(yè),僅有清華、北大、復(fù)旦、哈工大、上海交大等少數(shù)重點大學(xué)開設(shè)了自然語言處理的本科生選修課程,很多高校和中科院研究所開設(shè)了自然語言處理的研究生課程。
自然語言處理引入國內(nèi)的時間也相對較短,因此在課程教學(xué)中還存在一些影響課程教學(xué)質(zhì)量的重要問題,主要體現(xiàn)在:①由于課程內(nèi)容的交叉性和前后內(nèi)容的相關(guān)性,以及內(nèi)容本身具有一定的理論深度,增加了來自不同知識背景學(xué)生的學(xué)習(xí)難度,很多同學(xué)不知道如何將不同學(xué)科的知識融合運用,也不知道在哪里使用;②缺乏統(tǒng)一的開發(fā)語言或軟件平臺來輔助該課程的實踐教學(xué),難于直接對課程中講授的算法理論進行實現(xiàn)和實驗,如中文的分詞算法問題,如果沒有詞典資源,就無法進行分詞的實驗,而詞典資源的建設(shè)本身就是一個工程問題。
問題引導(dǎo)教學(xué)法,即基于問題的教學(xué)方法(Problem-Based Learning,PBL)[1-3]。這種方法不像傳統(tǒng)教學(xué)那樣先學(xué)習(xí)理論知識再解決問題,而是以學(xué)生為主體、以專業(yè)領(lǐng)域內(nèi)的各種問題為學(xué)習(xí)起點,以問題為核心規(guī)劃學(xué)習(xí)內(nèi)容,讓學(xué)生圍繞問題尋求解決方案的一種學(xué)習(xí)方法。教師在此過程中的角色是問題的提出者、課程的設(shè)計者以及結(jié)果的評估者。問題引導(dǎo)教學(xué)法能夠激發(fā)學(xué)生學(xué)習(xí)的主動性,提高學(xué)生在教學(xué)過程中的參與程度,容易激起學(xué)生的求知欲,活躍其思維。
自然語言處理課程內(nèi)容繁雜,對來自不同專業(yè)背景的研究生來說,學(xué)習(xí)起來相當(dāng)有難度,要很好地掌握課程知識,并靈活應(yīng)用于相關(guān)領(lǐng)域,就必須改革傳統(tǒng)的教學(xué)模式,提高教學(xué)質(zhì)量。在課程講授過程中,采用問題引導(dǎo)教學(xué)方法,學(xué)生能夠更快速有效地掌握課程的核心知識。
第一個例子是關(guān)于“自動分詞”概念的講解。教師在課程講授過程中提出“人是如何閱讀一句話的?是逐字、逐詞還是其他方式進行閱讀?”。學(xué)生針對該問題進行思考和討論,大部分同學(xué)認為:人在閱讀一句話的時候,首先是將句子分解成不同的詞,然后在詞的基礎(chǔ)上進行詞語語義的耦合和疊加,從而得到整個句子的意思,這就很自然地引出了自然語言處理的第一個任務(wù):自動分詞,即機器要處理或理解自然語言,首先是要進行分詞,這就是“自動分詞”的概念。接下來再提出問題“如何進行自動分詞?”,學(xué)生自然能想到需要有一個詞典庫,然后采用匹配方法進行查找匹配。通過這種問題引導(dǎo)教學(xué)方式,讓學(xué)生很快知道什么是自動分詞?如何進行自動分詞?需要什么資源支持?采用什么算法進行分詞?分詞算法設(shè)計過程中要注意的關(guān)鍵問題是什么?
第二個例子是關(guān)于“信息檢索”概念的講解。教師在講授過程中,首先提出“同學(xué)們幾乎每天都在使用百度、谷歌查找自己想要的信息,請問百度、谷歌是如何查找信息的?”。針對該問題,很多同學(xué)自然想到如何在數(shù)據(jù)庫系統(tǒng)中查找相關(guān)的記錄信息。事實上,查找數(shù)據(jù)庫系統(tǒng)中記錄信息針對的是結(jié)構(gòu)化數(shù)據(jù),如何在非結(jié)構(gòu)化數(shù)據(jù)中查找信息,這就是信息檢索的概念。通過問題引導(dǎo)教學(xué)方法,既可以把信息檢索的概念厘清楚,又可以將信息檢索和數(shù)據(jù)庫查找檢索兩個概念區(qū)分出來,更重要的是讓學(xué)生知道:信息檢索技術(shù)已經(jīng)在百度、谷歌中得到成熟應(yīng)用。
為了講清楚“文本分類”的概念和算法,課程在講解前提出問題“幼兒園小朋友是如何識別卡片中的老虎、獅子、大象等各種動物?”“假設(shè)圖書館的圖書資料不加以分類,結(jié)果如何? 圖書館的圖書資料是如何進行分類?”,針對類似問題,學(xué)生很快就能理清要進行分類或者識別,首先要找出能夠區(qū)分兩類對象的特征,然后利用識別到的特征進行對象分類。通過這種問題引導(dǎo)教學(xué),能夠把文本自動分類的概念厘清,并且知道在文本自動分類任務(wù)中,重要的任務(wù)是進行特征提取和特征選擇,由此構(gòu)建文本分類模型,并在此基礎(chǔ)上,進一步學(xué)習(xí)分類任務(wù)中的“二類分類”“多類分類”和“層次分類”等概念。
在課程的其他知識點上,很多地方也采用這種基于問題引導(dǎo)的教學(xué)方法,如通過問題“信息爆炸時代如何快速地了解自己關(guān)心和感興趣的信息?”來引出“個性化信息檢索”和“自動摘要”等概念,通過問題“如何讓計算機進行語義分析和理解語義?”來解釋“語義表示和語義分析”知識點,通過問題“人類語言交流中如何識別對方的話語是否符合語法?”來引出“句法分析”概念。通過在上述課程教學(xué)中采用問題引導(dǎo)式教學(xué)法,可以提高學(xué)生課程學(xué)習(xí)的主動性、教學(xué)過程的參與度以及求知欲,能幫助學(xué)生快速有效地掌握課程核心知識,提高課程的教學(xué)質(zhì)量。
項目驅(qū)動教學(xué)是建立在建構(gòu)主義理論基礎(chǔ)上的,在教師的指導(dǎo)下,以學(xué)生為中心、以項目為驅(qū)動的教學(xué)方式,是探究式教學(xué)模式的一種[4]。其特點是:①教學(xué)目標以項目開發(fā)能力為本位;②教學(xué)內(nèi)容以典型項目為載體,通過教學(xué)項目承載理論知識,體現(xiàn)專業(yè)技術(shù)能力的要求,有機融合專業(yè)理論知識與專業(yè)實踐技能;③教學(xué)組織以學(xué)生為中心,項目教學(xué)以工作任務(wù)為引領(lǐng),學(xué)生全過程主動參與教學(xué),創(chuàng)設(shè)有利于學(xué)生充分發(fā)揮潛能的寬松環(huán)境和真實的職業(yè)情景,使學(xué)生置身于真實或模擬的環(huán)境中,鼓勵其積極主動地探索和嘗試。運用項目驅(qū)動進行實踐教學(xué)轉(zhuǎn)變學(xué)生的學(xué)習(xí)方式,可以充分發(fā)揮學(xué)生的主動性、能動性和創(chuàng)造性,使學(xué)習(xí)過程更多地成為發(fā)現(xiàn)問題、分析問題和解決問題的過程[5-7],在解決問題的過程中強化學(xué)生的自主、探究和合作學(xué)習(xí)的能力。學(xué)生通過同化和順應(yīng)[8]兩種途徑來獲得知識,培養(yǎng)學(xué)生的自我學(xué)習(xí)能力、實踐能力和創(chuàng)新能力。
鑒于項目驅(qū)動教學(xué)方法的優(yōu)勢,本課程采用項目驅(qū)動方法來進行實踐教學(xué),基本過程如下:首先,課程開始講授之前,按照當(dāng)前自然語言處理研究的熱點,擬定了8個小項目(見表1);然后,由選修該課程的研究生選好項目,在教學(xué)過程中,每位同學(xué)根據(jù)每次所學(xué)內(nèi)容,結(jié)合自己所選項目,通過項目驅(qū)動,獨立思考、查閱資料,提出項目解決方案,進行課內(nèi)討論,并由學(xué)生獨立編程實現(xiàn)和實驗。對于項目解決的比較好的方案,將其擴展實現(xiàn)到現(xiàn)有應(yīng)用系統(tǒng)中,部分實驗好的成果以論文的形式進行發(fā)表。
表1 課程教學(xué)項目列表
項目驅(qū)動教學(xué)的具體實施方法:①“未登錄詞獲取”知識點的學(xué)習(xí),在教學(xué)中先從概念上解釋“人名、地名、組織機構(gòu)名”等未登錄詞,然后分析每種未登錄詞的特點及未登錄詞識別用到的主要特征,搞清楚每種未登錄詞采用的主要算法和相關(guān)評價指標,而對于選擇了表1中1、2、3三個項目的同學(xué),必須根據(jù)所學(xué)的知識,用程序設(shè)計語言實現(xiàn)相關(guān)算法,下載收集已有的人名、地名、組織機構(gòu)名數(shù)據(jù)庫,并有針對性地從網(wǎng)上下載新聞?wù)Z料或者相關(guān)文本,進行實驗和性能評價;②關(guān)于“隱馬爾可夫模型(HMM)”和“詞性標注”知識點的學(xué)習(xí),在教學(xué)中先從概念上解釋“馬爾科夫模型和隱馬爾可夫模型”,然后用馬爾可夫模型對詞性標注問題進行建模,而選擇了表1中項目4的同學(xué),必須根據(jù)所講的知識,用程序設(shè)計語言實現(xiàn)基于隱馬爾可夫模型的詞性標注算法,然后選用標準的標注語料庫進行模型參數(shù)訓(xùn)練、詞性標注測試和算法性能的評價;③關(guān)于“文本分類”問題的學(xué)習(xí),在教學(xué)中會介紹很多文本分類的方法和算法,而選擇了表1中項目5、6、7、8的同學(xué),必須在學(xué)習(xí)課堂知識的基礎(chǔ)上,用程序設(shè)計語言實現(xiàn)相應(yīng)的分類算法,并用給定的標準文本分類語料庫進行文本分類實驗和分類算法的性能評價。
經(jīng)過兩屆研究生自然語言處理課程的教學(xué)改革探索和實踐,筆者提出的“問題引導(dǎo)+項目驅(qū)動”并舉的教學(xué)方法可以使課程的教學(xué)質(zhì)量得到明顯提升,收到了很好的教學(xué)效果,學(xué)生對課程的認識也比以往學(xué)生更深入,學(xué)生反響非常好,主要體現(xiàn)在:①學(xué)生能夠在研一期間利用自然語言處理理論知識完成項目任務(wù),并以項目為背景,撰寫學(xué)術(shù)論文。在7位選修該課程的學(xué)生中,已有3位同學(xué)有學(xué)術(shù)論文投稿,其中1位同學(xué)投稿的論文“面向自動寫作的中文排比句抽取方法”已被《計算機應(yīng)用研究》錄用;②學(xué)生在完成項目任務(wù)后,以項目為背景,申請軟件著作權(quán)2項;③學(xué)生完成的項目“科技術(shù)語自動抽取”“文本內(nèi)容相似性檢測”成果已經(jīng)部分應(yīng)用于江西省科技獎勵評審系統(tǒng)的“科技項目申報評審內(nèi)容分析與挖掘”任務(wù)中,取得了一定的效果。
“問題引導(dǎo)+項目驅(qū)動”并舉的課程教學(xué)和學(xué)習(xí)方法,符合唯物主義認識論“認識-實踐-認識”多次反復(fù)的思想。在課程教學(xué)過程中,首先,采用問題引導(dǎo)的方法來讓學(xué)生更有效的學(xué)習(xí)理論知識,加深對自然語言處理課程理論知識的理解;同時,采用項目驅(qū)動的方法,將學(xué)習(xí)到的理論知識用于實際應(yīng)用項目中,提高動手能力,解決學(xué)生“學(xué)不知所用”的問題。通過本課程兩輪的教學(xué)改革探索,課程教學(xué)質(zhì)量有明顯提升,學(xué)生也能夠就自然語言處理領(lǐng)域中的某一問題進行深入研究,給出自己的想法,實現(xiàn)主動和自主學(xué)習(xí),通過由點到面漸進擴展模式,學(xué)習(xí)掌握自然語言處理的其他基本知識,并在應(yīng)用理論知識解決實際問題的過程中,提高學(xué)生解決實際問題的能力和研究水平,對于培養(yǎng)研究生的理論研究能力和運用開發(fā)能力,具有重要的作用和意義,對其他新興交叉和內(nèi)容繁雜課程的教學(xué)改革也具有示范作用。
[1]儲冬生. 問題驅(qū)動式教學(xué)的思考與實踐[J]. 河北教育(教學(xué)版), 2016 (1): 15-17.
[2]嚴瑞芳. 問題驅(qū)動導(dǎo)學(xué)模式探析:“宏微觀經(jīng)濟學(xué)”教學(xué)模式改革的實踐與思考[J]. 湖南廣播電視大學(xué)學(xué)報, 2005(2): 8-9.
[3]徐秀珍, 徐洊學(xué). 淺談問題驅(qū)動式教學(xué)方式在“計算機應(yīng)用基礎(chǔ)”課程中的應(yīng)用[J]. 內(nèi)蒙古民族大學(xué)學(xué)報(自然漢文版), 2008,23(4): 462-464.
[4]陽紅珍. 建構(gòu)主義學(xué)習(xí)理論與我國課程改革: 一種反思性研究[D]. 長沙: 湖南師范大學(xué), 2006.
[5]李海生. 基于項目驅(qū)動的實踐教學(xué)改革: 以Java程序設(shè)計課為例[J]. 廣西民族師范學(xué)院學(xué)報, 2017, 34(3): 110-113.
[6]余建國, 劉雙紅. 基于任務(wù)驅(qū)動的協(xié)同教學(xué)模式在程序設(shè)計類課程中的研究與實踐[J]. 科技信息, 2009(27): 104.
[7]范會聯(lián), 仲元昌. 基于項目驅(qū)動的軟件工程課程教學(xué)改革探索[J]. 教育與職業(yè), 2013(5): 147-148.
[8]張建偉, 孫燕青. 學(xué)習(xí)科學(xué)的整合性探索[M]. 上海: 上海教育出版社, 2005: 125.