亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)字詞典學(xué)視閾下“有意學(xué)習(xí)”與“附帶學(xué)習(xí)”新探*

        2022-11-19 03:18:28SvenTarp耿云冬
        辭書(shū)研究 2022年6期
        關(guān)鍵詞:附帶詞典語(yǔ)境

        Sven Tarp 撰 陳 汝 耿云冬 譯

        一、 引 言

        本次講座的主題聚焦“有意學(xué)習(xí)”(intentional learning)和“附帶學(xué)習(xí)”(incidental learning),有關(guān)這對(duì)概念的討論已長(zhǎng)達(dá)至少十年之久。今天,我將嘗試從一個(gè)新的技術(shù)角度來(lái)探討這個(gè)問(wèn)題,其靈感來(lái)自于愛(ài)因斯坦談?wù)撡だ詴r(shí)所說(shuō)的一段話,[1]其中提到,應(yīng)該“從新的角度審視一些固有的問(wèn)題”(to regard old problems from a new angle)。此次講座內(nèi)容與之前我在中國(guó)的另一場(chǎng)會(huì)議[2]上所講的內(nèi)容相似。但此次我有更加充足的準(zhǔn)備時(shí)間,因此,思考也更加深入。

        二、 概念辨析:“有意學(xué)習(xí)”與“附帶學(xué)習(xí)”

        二語(yǔ)習(xí)得既可以是“有意學(xué)習(xí)”,也可以是“附帶學(xué)習(xí)”。現(xiàn)有學(xué)術(shù)文獻(xiàn)對(duì)這兩大概念的定義非常多。例如,在肖恩·洛文(Shawn Loewen)和佐藤正俊(Masatoshi Sato)編著的《勞特利奇課堂二語(yǔ)習(xí)得手冊(cè)》(The Routledge Handbook of Instructed Second Language Acquisition,2017)中,就可以找到很多相關(guān)定義,該手冊(cè)在部分專欄還列出了一些重要概念的簡(jiǎn)短釋義:“附帶學(xué)習(xí)”指學(xué)習(xí)者不帶有特定學(xué)習(xí)意圖的學(xué)習(xí),而“有意學(xué)習(xí)”的概念則相反,它與意圖(intent)或意向(intention)相關(guān)聯(lián)。事實(shí)上,區(qū)分這兩個(gè)概念并非易事,在“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”之間還存在一個(gè)“灰色地帶”(grey zone),而形成這一“灰色地帶”的因素有很多。以我個(gè)人的教學(xué)體會(huì)為例:我在西班牙語(yǔ)課堂上給學(xué)生做了口語(yǔ)測(cè)試,有部分學(xué)生表現(xiàn)非常好,另外一部分卻存在一些問(wèn)題。近一年半以來(lái),我們一直是線上教學(xué),我建議學(xué)生們利用休息時(shí)間多讀一些用西班牙語(yǔ)寫作的書(shū)籍,選擇感興趣的主題,以循序漸進(jìn)的方式習(xí)得語(yǔ)言。學(xué)生主動(dòng)閱讀的過(guò)程其實(shí)就是在開(kāi)展“有意學(xué)習(xí)”,因?yàn)樗麄兡軌蚯宄匾庾R(shí)到自己是在自主學(xué)習(xí)。就我自己而言,我已經(jīng)用西班牙語(yǔ)教了三十多年的書(shū)。雖然我和學(xué)生同樣都是閱讀西班牙語(yǔ)作品,但于我而言,西班牙語(yǔ)的學(xué)習(xí)主要是“附帶學(xué)習(xí)”。即便如此,我也能夠意識(shí)到我有時(shí)也在主動(dòng)學(xué)習(xí),并非完全是“附帶學(xué)習(xí)”。由此,我深感要厘清這兩個(gè)概念之間的差異并不容易。在二語(yǔ)習(xí)得環(huán)境下,我們會(huì)發(fā)現(xiàn)“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”都可與閱讀活動(dòng)相關(guān)聯(lián)。然而,我認(rèn)為,“附帶學(xué)習(xí)”與文本產(chǎn)出(尤其是寫作)的聯(lián)系也非常緊密,而且通常情況下,基于書(shū)面語(yǔ)文本所發(fā)生的交流情境大致如下:作者和讀者不處在同一時(shí)間域,當(dāng)作家在寫作時(shí)遇到問(wèn)題,他們會(huì)查閱詞典;而讀者在閱讀時(shí)遇到問(wèn)題,他們同樣是查閱詞典。在這種情況下,詞典似乎成為了他們交流的中介,如果閱讀者只是完成“附帶學(xué)習(xí)”,那么他就要盡可能縮短查閱過(guò)程,也就是說(shuō)花最少的時(shí)間查閱不熟悉的單詞。在本次講座中,立足于書(shū)面語(yǔ)文本(包括文本閱讀和文本寫作),我將重點(diǎn)從詞典學(xué)視角來(lái)探討“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”之間存在的“灰色地帶”。

        在詞典學(xué)視閾下,我把“附帶學(xué)習(xí)”界定為“學(xué)習(xí)者在持續(xù)閱讀或?qū)懽鬟^(guò)程中通過(guò)查閱詞典來(lái)獲得所需要的信息,整個(gè)學(xué)習(xí)過(guò)程完全不受到干擾,通過(guò)查閱詞典,學(xué)習(xí)者習(xí)得新詞(包括詞語(yǔ)、義項(xiàng)、語(yǔ)法結(jié)構(gòu)等)”。相反,當(dāng)學(xué)習(xí)者暫停閱讀或?qū)懽鳎瑳Q定對(duì)其中一些問(wèn)題進(jìn)行深入探究,“有意學(xué)習(xí)”就開(kāi)始了:以詞典使用為例,學(xué)習(xí)者可能出于興趣或其他原因中斷閱讀或?qū)懽?,轉(zhuǎn)而去翻閱一本詞典,獲得一些關(guān)于詞語(yǔ)的信息(如語(yǔ)法、義項(xiàng)或句法結(jié)構(gòu)等),那么,這就意味著他已經(jīng)開(kāi)始有意學(xué)習(xí)了。假設(shè)閱讀者查閱的是傳統(tǒng)意義上的詞典,情況會(huì)怎樣呢?需要特別指出,我這里所提及的傳統(tǒng)意義上的詞典囊括了紙質(zhì)詞典、詞典應(yīng)用程序、在線詞典等。無(wú)論哪一種,閱讀者都得放下正在閱讀的文本,在外部的詞典資源中查閱信息。在可能獲取的信息中,大部分與當(dāng)前具體語(yǔ)境沒(méi)有關(guān)聯(lián),而查閱這些信息,不僅花費(fèi)大量時(shí)間,還會(huì)影響閱讀進(jìn)程。因此,需要將詞典研發(fā)與數(shù)字化技術(shù)相結(jié)合。在進(jìn)一步探討這一話題前,有必要先簡(jiǎn)短回顧一下詞典學(xué)發(fā)展的歷程。

        三、 詞典發(fā)展簡(jiǎn)史:從詞匯對(duì)照表邁向智能詞典

        我想從追溯詞典在歐洲的演變史來(lái)展開(kāi)論述。早在公元前8世紀(jì)末,古希臘最重要的兩部史詩(shī)《伊利亞特》和《奧德賽》誕生。當(dāng)時(shí)的作品全部是手寫,300年后人們開(kāi)始謄抄這些作品,在這個(gè)過(guò)程中,抄寫員創(chuàng)造了一些新詞,并且使用其他詞匯對(duì)新詞進(jìn)行闡釋,只不過(guò)這些詞在今天已經(jīng)很少或不再使用了。據(jù)我的理解,這個(gè)闡釋的過(guò)程類似中國(guó)古代的訓(xùn)詁學(xué)。再往后200年,學(xué)者們把這些詞語(yǔ)匯編入詞典,這便是歐洲詞典的起源,但這并不是人類編纂詞典的開(kāi)端,因?yàn)槲覀冎涝缭?000年以前,詞典就以某種形式存在了。彼時(shí),人們制作詞匯對(duì)照表,并在形式上做了兩個(gè)重要?jiǎng)?chuàng)新:一是增設(shè)條目或中心詞,通過(guò)豐富詞匯信息(包括詞頭、音標(biāo)、詞性、釋義、例證等),逐步構(gòu)建詞典的微觀結(jié)構(gòu);二是收集單詞,并單獨(dú)設(shè)立條目,我們稱之為詞典的宏觀結(jié)構(gòu)。這些創(chuàng)新無(wú)疑是一種進(jìn)步。早期制作詞匯表,首先需要確立詞語(yǔ)的標(biāo)準(zhǔn)形式。文本中出現(xiàn)的詞語(yǔ)有可能是基于標(biāo)準(zhǔn)形式的語(yǔ)法變體,這就需要編者能夠加以辨別,以標(biāo)準(zhǔn)形式作為詞語(yǔ)條目,這是詞典發(fā)展的一個(gè)重要體現(xiàn)。正如我們所見(jiàn),按照歐洲的傳統(tǒng),詞典條目是完全按字母順序來(lái)編排的。但不得不說(shuō),正因?yàn)橛辛嗽~典,我們可以在任何情況下進(jìn)行查閱,這的確是件好事。但我們也要充分認(rèn)識(shí)到,查閱過(guò)程其實(shí)是一個(gè)復(fù)雜的認(rèn)知過(guò)程。從詞典使用者的角度看,他們需要明辨詞語(yǔ)的標(biāo)準(zhǔn)形式,且具備按照字母排序來(lái)查詢?cè)~典的能力。在微觀結(jié)構(gòu)方面,尤其是印刷技術(shù)得以發(fā)明之后,詞語(yǔ)信息越來(lái)越豐富,這也就意味著編者需要思考如何在有限的印刷空間內(nèi)更好地呈現(xiàn)詞語(yǔ)的信息。由于印刷媒介的篇幅限制,詞典中出現(xiàn)了許多縮寫形式??傊?,學(xué)習(xí)者查閱的過(guò)程是比較復(fù)雜的,需要一些訓(xùn)練和具備一定的查閱能力。事實(shí)上,關(guān)于英語(yǔ)學(xué)習(xí)者詞典使用的爭(zhēng)議長(zhǎng)期存在,山田茂(Shigeru Yamada)曾說(shuō):“詞典查檢不成功的因素有兩個(gè):要么是詞典的原因,要么是用戶自身的原因。”(轉(zhuǎn)引自Rundell 2015)26-27《麥克米倫高階英語(yǔ)詞典》主編邁克爾·倫德?tīng)枺≧undell 2015)則認(rèn)為問(wèn)題應(yīng)歸于詞典,因?yàn)樵~典本該科學(xué)設(shè)計(jì),直觀呈現(xiàn)信息。換言之,如果在學(xué)習(xí)者查閱能力和詞典直觀呈現(xiàn)之間選擇一個(gè)影響因素,倫德?tīng)杻A向于把問(wèn)題歸結(jié)于后者。當(dāng)然,如果是詞典質(zhì)量低劣或詞典印刷問(wèn)題,則應(yīng)另當(dāng)別論。基于數(shù)字技術(shù)的不斷發(fā)展,可以開(kāi)發(fā)出信息呈現(xiàn)更為直觀的詞典,這樣學(xué)習(xí)者可以輕松查閱,并實(shí)現(xiàn)“附帶學(xué)習(xí)”,這是本文討論的另一重要議題。

        值得一提的是,編纂詞典是一種技能?!霸~典學(xué)”這個(gè)詞源自希臘語(yǔ),意為“關(guān)于詞與描述”。進(jìn)入數(shù)據(jù)時(shí)代,語(yǔ)言數(shù)據(jù)不僅用于編纂詞典,還可以整合嵌入各類電子工具、寫作助手等。與傳統(tǒng)詞典編纂關(guān)注詞典文本本身有所不同,大數(shù)據(jù)時(shí)代的詞典編纂應(yīng)更加重視如何提高快捷有效地滿足用戶需求,這應(yīng)當(dāng)成為數(shù)字詞典研究的重點(diǎn)。今天,電子閱讀器、學(xué)習(xí)類應(yīng)用程序、寫作助手和其他學(xué)習(xí)工具基本都包含詞典。但由于編纂理念過(guò)于保守和傳統(tǒng),我個(gè)人認(rèn)為這種整合目前并不是很成功。下面以我的一次電子閱讀經(jīng)歷為例。2021年11月,我讀了一則故事,閱讀過(guò)程并不順暢,其間,我碰到mark一詞,并對(duì)其在上下文中的含義不甚理解。于是,我試圖借助電子閱讀器中的嵌入式詞典(integrated dictionary)來(lái)解決我的疑惑。我選中該單詞并點(diǎn)擊,頁(yè)面便出現(xiàn)了與mark相關(guān)的語(yǔ)言知識(shí)。瀏覽之后,發(fā)現(xiàn)所展示的信息并不能解決我的問(wèn)題,我想查閱的是mark做動(dòng)詞時(shí)的語(yǔ)義知識(shí),嵌入式詞典卻給了我它作為名詞的語(yǔ)義(詳見(jiàn)圖1)。繼續(xù)點(diǎn)擊more,彈出一個(gè)很長(zhǎng)的信息界面,我不斷滑動(dòng)鼠標(biāo),嘗試查看全部?jī)?nèi)容。顯而易見(jiàn),在大量信息中找到切合當(dāng)下閱讀語(yǔ)境的詞義需要耗費(fèi)一些時(shí)間,我想找mark作為動(dòng)詞的信息,卻“被動(dòng)”瀏覽了嵌入式詞典給出的6個(gè)義項(xiàng),甚至還有一些額外的數(shù)據(jù)或信息。實(shí)際上,如果我只是想了解mark在某一具體語(yǔ)境中的詞義,上面這種情況就可算是信息或數(shù)據(jù)過(guò)載(information or data overload)了,因?yàn)橛性S多信息是無(wú)關(guān)緊要的,“附帶學(xué)習(xí)”也就很難實(shí)現(xiàn)。查閱單詞的過(guò)程擾亂了我的專注力,一度中斷了閱讀進(jìn)程。

        圖1 電子閱讀器嵌入式詞典查閱過(guò)程展示

        如上所示,在查閱了很多不相關(guān)的數(shù)據(jù)之后,我才找到真正所需的信息,其間花費(fèi)了大量的時(shí)間。我的注意力從正在閱讀的文本轉(zhuǎn)移到了詞匯查閱上,閱讀中斷,這使得我之前所定義的“附帶學(xué)習(xí)”變得無(wú)法實(shí)現(xiàn)。某種程度而言,它只解決了我的部分問(wèn)題——標(biāo)記詞類:我點(diǎn)擊mark的名詞用法,發(fā)現(xiàn)在這些被標(biāo)記的詞中,有些既不是名詞,也不是代詞或動(dòng)詞。這表明,該標(biāo)記工具還需完善。標(biāo)記可以解決部分問(wèn)題,但并不完全可靠。那么,怎樣才算是理想的解決方案呢?答案應(yīng)該是有這樣一個(gè)程序,它能夠檢測(cè)出文本中單詞的具體語(yǔ)義。遺憾的是,目前還沒(méi)有研發(fā)出這樣的程序,但我們正通過(guò)人工智能與詞典學(xué)相結(jié)合的方式尋找解決的方案。據(jù)我所知,已有歐洲的詞典公司在朝著這一方向努力,只是該項(xiàng)技術(shù)十分昂貴,它基于機(jī)器學(xué)習(xí)、語(yǔ)料庫(kù)、詞典數(shù)據(jù)庫(kù)等,顯示英語(yǔ)單詞在特定語(yǔ)境下的意義,識(shí)別率高達(dá)90%。當(dāng)然,該技術(shù)的應(yīng)用不僅取決于信息工程師,還取決于詞典編纂者。只有詞典編纂者提供高質(zhì)量的數(shù)據(jù)庫(kù),這項(xiàng)技術(shù)才能快速發(fā)展。例如,目前如谷歌公司擁有巨大數(shù)據(jù)處理能力,為實(shí)現(xiàn)這一目標(biāo),其16個(gè)處理器能夠連續(xù)長(zhǎng)時(shí)間同時(shí)工作,時(shí)間可以長(zhǎng)達(dá)數(shù)周。而與我合作開(kāi)展研究的一家詞典公司目前還負(fù)擔(dān)不起這一技術(shù)。眾所周知,新技術(shù)在誕生初期總是很昂貴、難以負(fù)擔(dān),但若干年后,技術(shù)會(huì)普及,我們就可以拿來(lái)使用,這意味著我們作為詞典編纂者必須未雨綢繆,要為未來(lái)的發(fā)展趨勢(shì)做好準(zhǔn)備。假設(shè)我們已經(jīng)擁有這項(xiàng)技術(shù),那么,在查詢中就會(huì)快速獲取所需的詞義,即mark作為“通過(guò)某一具體行動(dòng)來(lái)慶?;蚣o(jì)念”解的義項(xiàng),這一查詢結(jié)果對(duì)“附帶學(xué)習(xí)”來(lái)說(shuō)就足夠了。如果我想從“附帶學(xué)習(xí)”轉(zhuǎn)為“有意學(xué)習(xí)”,就可以點(diǎn)擊more獲得更多信息。如果將來(lái)能夠根據(jù)概率(probability)統(tǒng)計(jì)來(lái)對(duì)不同義項(xiàng)進(jìn)行排列就更加有趣了。雖然目前沒(méi)有這項(xiàng)技術(shù),但至少在未來(lái)有實(shí)現(xiàn)這一技術(shù)的可能。

        我們學(xué)習(xí)語(yǔ)言還面臨另外一個(gè)挑戰(zhàn)——如何處理“多詞語(yǔ)義單位”(multi-word units of meaning)。例如,隨著語(yǔ)料庫(kù)相關(guān)研究的不斷深入,與辛克萊(Sinclair)合作的詞典學(xué)家愈發(fā)地意識(shí)到,很多單詞在與其他詞的搭配組合時(shí)會(huì)產(chǎn)生新的語(yǔ)義,它們被稱作“擴(kuò)展的語(yǔ)義單位”(extended units of meaning)或“多詞語(yǔ)義單位”。對(duì)詞典學(xué)家而言,這一語(yǔ)言現(xiàn)象非常有趣。辛克萊建議將這些詞作為“中心詞”(headwords)使用,這在大多數(shù)詞典中仍然存在。以單詞part為例。假設(shè)你想知道文本中part的詞義,鼠標(biāo)選中并點(diǎn)擊part,嵌入式詞典會(huì)“打包”顯示take part這個(gè)詞組,同時(shí)彈出對(duì)等釋義詞participate。這種學(xué)習(xí)模式很有趣。你以為你的問(wèn)題是要知道part的詞義,實(shí)際上,你的問(wèn)題是take part的詞組意義。但是最開(kāi)始查詢時(shí)并沒(méi)有意識(shí)到這一點(diǎn),你點(diǎn)擊了part,得到的答案已然是take part。目前,這一技術(shù)已經(jīng)存在,但需要推廣。(詳見(jiàn)圖2)

        圖2 電子閱讀器嵌入式詞典多詞語(yǔ)義單位查閱展示(1)

        再舉一例。我曾與廣東外語(yǔ)外貿(mào)大學(xué)的黃芳老師合作開(kāi)展過(guò)一項(xiàng)研究(Huang,Tarp 2021),涉及一款中國(guó)學(xué)習(xí)者常用的英語(yǔ)學(xué)習(xí)軟件“開(kāi)言英語(yǔ)”(Kaiyan Open Language)。以set的查詢?yōu)槔?,點(diǎn)擊set,該學(xué)習(xí)軟件會(huì)彈出很長(zhǎng)的詞條信息,屏幕上顯示出該詞有兩種不同的詞性,分別是動(dòng)詞和名詞。繼續(xù)點(diǎn)擊屏幕上的“查看完整釋義”,會(huì)出現(xiàn)set作為形容詞的用法,可見(jiàn)set是一個(gè)復(fù)雜的英語(yǔ)單詞。然而,讀者希望看到的只是set在此語(yǔ)境下的釋義,滿屏的詞條信息不僅會(huì)影響讀者的閱讀體驗(yàn),還妨礙閱讀者的“附帶學(xué)習(xí)”。(如圖3所示)

        圖3 電子閱讀器嵌入式詞典多詞語(yǔ)義單位查閱展示(2)

        事實(shí)上,在set詞條的釋義內(nèi)容中,它作為名詞的含義“(物品的)一套,一組”,才是我需要的情境語(yǔ)義,其他信息均不相關(guān)。如何不顯示冗余的、不相關(guān)聯(lián)的信息是未來(lái)的研究方向。遇到以上情況,我認(rèn)為理想的詞典應(yīng)該是這樣的:點(diǎn)擊set,只出現(xiàn)“(物品的)一套,一組”這個(gè)釋義,自動(dòng)屏蔽不相關(guān)聯(lián)的信息(如圖4所示)。大家可以看到,在釋義內(nèi)容左側(cè)還有一個(gè)“小喇叭”的圖標(biāo),如果讀者需要獲取該詞的讀音,點(diǎn)擊圖標(biāo)即可;在釋義內(nèi)容右側(cè)有一個(gè)“向右箭頭”(>)的圖標(biāo),點(diǎn)擊查詢更多詞條信息,這樣“附帶學(xué)習(xí)”就轉(zhuǎn)化成了“有意學(xué)習(xí)”。

        圖4 電子閱讀器嵌入式詞典多詞語(yǔ)義單位的新設(shè)計(jì)理念

        就這個(gè)例子而言,“附帶學(xué)習(xí)”的內(nèi)容包括set的發(fā)音和情境釋義,但不包括詞語(yǔ)條目、詞性、語(yǔ)法變體、非情景釋義等其他信息。這種釋義模式其實(shí)是受到漢語(yǔ)訓(xùn)詁學(xué)的釋義方法、荷馬史詩(shī)抄寫員所采取的釋義方法的啟發(fā),它們之間有相似之處。在閱讀過(guò)程中,讀者碰到生僻詞語(yǔ),只希望在最短時(shí)間內(nèi)得到解釋。

        一旦讀者想要獲得除釋義之外的其他信息(比如詞頭、詞性等),就意味著“附帶學(xué)習(xí)”開(kāi)始向“有意學(xué)習(xí)”發(fā)生轉(zhuǎn)變。那么,問(wèn)題在于如何才能讓計(jì)算機(jī)在最短時(shí)間內(nèi)給讀者提供當(dāng)下所需的釋義?首要的方法是數(shù)據(jù)過(guò)濾,主要分兩步:第一步,用戶界面加載從數(shù)據(jù)庫(kù)中提取出來(lái)的詞典數(shù)據(jù);第二步,以定量計(jì)量的方式呈現(xiàn)數(shù)據(jù),以滿足讀者“附帶學(xué)習(xí)”和“有意學(xué)習(xí)”過(guò)程中的特定需求。這里還涉及另一個(gè)重要的概念,即“人工輔助智能”(human-assisted intelligence,以下簡(jiǎn)稱“人助智能”),這個(gè)概念既有趣又重要。眾所周知,利用人工智能(artificial intelligence)可以做很多事情,例如,它能夠判斷文本模式,這是人類僅靠雙眼觀察無(wú)法做到的。如果是要給出單詞在具體語(yǔ)境下的特定含義,人工智能就行不通了,但人類可以做到。此時(shí),為了解決這一問(wèn)題,可以引入“人助智能”,具體做法如下:語(yǔ)言專家點(diǎn)擊電子文本中想要查詢的詞匯單位,可以是單詞,也可以是詞組,然后彈出一個(gè)釋義框,緊接著,專家就能夠在其中標(biāo)記出正確的、符合語(yǔ)境的釋義,這整個(gè)操作流程被一個(gè)特定編寫的程序自動(dòng)記錄下來(lái)。第二次有讀者需要查詢這個(gè)單詞或詞組時(shí),用戶界面彈出的釋義框就只會(huì)顯示專家標(biāo)記之后的內(nèi)容,幫助讀者在具體語(yǔ)境中快速準(zhǔn)確地理解詞匯單位。整個(gè)操作過(guò)程只需要用手指觸碰屏幕即可,所需信息會(huì)自動(dòng)呈現(xiàn)。通過(guò)這種方式,詞典釋義和語(yǔ)境的關(guān)系更加緊密,用戶界面出現(xiàn)的信息必須有助于上下文的理解,這也是普通電子詞典邁向智能詞典的第一步。這一方法十分高效,我們希望在未來(lái),一個(gè)訓(xùn)練有素的“專家”每分鐘可以標(biāo)記2—3個(gè)詞匯單位。此外,這一特定程序的編寫很容易實(shí)現(xiàn)。從長(zhǎng)期維護(hù)來(lái)看,還需要添加用戶反饋,這樣才能不斷提升學(xué)習(xí)類應(yīng)用軟件的質(zhì)量。

        上述例子是我們目前在閱讀/學(xué)習(xí)類應(yīng)用軟件、互聯(lián)網(wǎng)以及數(shù)字技術(shù)方面的一些思考,希望未來(lái)能夠繼續(xù)發(fā)展。

        四、 數(shù)字詞典新進(jìn)展:寫作助手(Writing assistants)

        帕特里克·漢克斯(Patrick Hanks 2013)399曾言,“原則上,可能的(語(yǔ)言)組合(possible combinations)從數(shù)量上來(lái)說(shuō)可以是無(wú)限的,可行的(語(yǔ)言)組合(probable combinations)卻相對(duì)有限”。[3]邁克爾·倫德?tīng)枺∕ichael Rundell 2018)6也曾說(shuō)過(guò),“盡管語(yǔ)料庫(kù)分析能讓我們觀察大多數(shù)語(yǔ)言產(chǎn)出的內(nèi)在可預(yù)測(cè)性(inbuilt predictability),但學(xué)習(xí)者遠(yuǎn)不能夠?qū)Υ俗龀鲱A(yù)測(cè)”。[4]母語(yǔ)者可能較容易掌握本族語(yǔ)的語(yǔ)言組合,但是這對(duì)于非母語(yǔ)學(xué)習(xí)者而言就非常困難。針對(duì)這一問(wèn)題,我們來(lái)看看寫作助手的相關(guān)情況。應(yīng)用軟件不同,技術(shù)和功能也會(huì)不同。有些寫作助手能夠在作者寫出第一個(gè)詞之后馬上提示可能出現(xiàn)的下一個(gè)單詞,甚至是整個(gè)句子。當(dāng)作者不知道應(yīng)該使用第二語(yǔ)言中的哪一個(gè)單詞時(shí),寫作助手就會(huì)提供最有可能的對(duì)應(yīng)詞。這些技術(shù)的核心主要是依靠語(yǔ)境給出判斷。通過(guò)此類應(yīng)用,二語(yǔ)學(xué)習(xí)者在習(xí)得過(guò)程中也能實(shí)現(xiàn)“附帶學(xué)習(xí)”和“有意學(xué)習(xí)”。

        一般而言,寫作助手是基于語(yǔ)言模型的,同時(shí)還會(huì)使用數(shù)據(jù)庫(kù)和詞典數(shù)據(jù)作為數(shù)據(jù)資源。無(wú)論是通過(guò)統(tǒng)計(jì)編程還是機(jī)器學(xué)習(xí)來(lái)處理自然語(yǔ)言,其結(jié)果都是基于語(yǔ)言模型。結(jié)合具體語(yǔ)境,語(yǔ)言模型為寫作者提供建議。這一項(xiàng)技術(shù)已然存在,當(dāng)然,它還有改進(jìn)完善的空間。下面以丹麥一家詞典公司研發(fā)的寫作系統(tǒng)(WriteAssitant)為例(檢索過(guò)程如圖5所示):假設(shè)我現(xiàn)在是一名西班牙人,正在用英語(yǔ)寫作,一時(shí)想不起某個(gè)英語(yǔ)單詞,只好用自己的母語(yǔ)西班牙語(yǔ)單詞cerrado來(lái)替代,輸入之后馬上出現(xiàn)了一組英語(yǔ)對(duì)等詞,而且是按照它們?cè)诰唧w語(yǔ)境中出現(xiàn)的概率來(lái)排序。這里我不討論概率是如何計(jì)算出來(lái)的,因?yàn)樘^(guò)于復(fù)雜。在這一組對(duì)等詞中,只要我認(rèn)識(shí)其中一個(gè),比如sealed,我就可以選擇使用。如果我仍然不確定選擇的單詞是否正確,我可以點(diǎn)擊sealed右側(cè)的“向右箭頭”(>)繼續(xù)查詢,出現(xiàn)了一些非常簡(jiǎn)短的定義,而其中一個(gè)定義看起來(lái)非常有趣,繼續(xù)點(diǎn)擊,就可以看到完整定義。在這個(gè)過(guò)程中,我從“附帶學(xué)習(xí)”轉(zhuǎn)為“有意學(xué)習(xí)”。這項(xiàng)技術(shù)雖已經(jīng)研發(fā)出來(lái),但也面臨著后臺(tái)的詞典數(shù)據(jù)庫(kù)不夠好這一問(wèn)題,這也說(shuō)明相關(guān)技術(shù)仍然沒(méi)有為迎接真正的數(shù)字辭書(shū)時(shí)代做好準(zhǔn)備。

        圖5 WriteAssistant檢索界面

        再舉一例,仍然是關(guān)于寫作的問(wèn)題。比如,因?yàn)槿鄙倜鞔_的辨析規(guī)則,而且詞典中也沒(méi)有明確的界定,學(xué)習(xí)者常常難以區(qū)分-ic和-ical為詞綴結(jié)尾的形容詞之間的差異。翻開(kāi)《牛津派生形態(tài)學(xué)手冊(cè)》(Oxford Handbook of Derivational Morphology),你會(huì)發(fā)現(xiàn)幾乎有1.2萬(wàn)個(gè)英語(yǔ)詞干可以同時(shí)添加這兩個(gè)后綴。根據(jù)《朗文交際3000詞》(Longman Communication 3000),英語(yǔ)中以這些后綴結(jié)尾的形容詞占1%左右。大家可以參見(jiàn)我與廣東外語(yǔ)外貿(mào)大學(xué)詞典學(xué)研究中心馬立東老師共同撰寫的一篇文章(Ma,Tarp 2020)。我們發(fā)現(xiàn),以-ic和-ical為詞綴結(jié)尾的形容詞對(duì)(adjective pairs)總會(huì)給二語(yǔ)學(xué)習(xí)者帶來(lái)困擾,造成使用錯(cuò)誤的情況。在有些情況下,兩個(gè)變體含義不同,詞頻不同。另外,在某些固定搭配或術(shù)語(yǔ)表達(dá)中,其中一個(gè)變體更為常見(jiàn),另外一個(gè)變體則使用頻率低、甚至不被使用。以academic和academical為例。往前追溯200年,academical比academic更常見(jiàn),但今天,人們幾乎不再使用academical。

        從圖6可知,8年前有一門俄語(yǔ)課程《學(xué)術(shù)寫作》,英語(yǔ)譯成Academical Writing。2018年發(fā)表在《歐洲跨學(xué)科研究期刊》(European Journal of Multidisciplinary Studies)上的一篇文章,其標(biāo)題里面也用了Academical Writing。這就意味著,即使是學(xué)術(shù)界人士,如果他們的母語(yǔ)不是英語(yǔ),也可能會(huì)錯(cuò)誤使用這些形容詞對(duì)。這是一個(gè)非常棘手的難題。我們應(yīng)思考:如何處理這一問(wèn)題?寫作助手又該如何應(yīng)對(duì)這個(gè)問(wèn)題?

        圖6 academic與academical使用情況歷時(shí)分析

        事實(shí)上,有些以-ic和-ical為詞綴結(jié)尾的形容詞對(duì),其含義并不相同。受一些詞典設(shè)計(jì)的啟發(fā),我們提出三種可能的解決辦法:一是增加用法比較說(shuō)明,二是簡(jiǎn)要解釋兩個(gè)形容詞的含義,三是增加固定搭配用法。如果是數(shù)據(jù)庫(kù),可以在兩種形式后面附加單詞使用說(shuō)明,包括此類形容詞對(duì)的使用特征。如果是彈出的查閱窗口,那么應(yīng)該默認(rèn)顯示詞匯辨析,如果辨析詳細(xì)具體,需要多頁(yè)顯示,則應(yīng)予以標(biāo)記,方便用戶查閱。整個(gè)查閱過(guò)程同樣包含了從“附帶學(xué)習(xí)”到“有意學(xué)習(xí)”的轉(zhuǎn)變。

        對(duì)于所有以-ic或-ical詞綴結(jié)尾的形容詞對(duì),我們都需要設(shè)置“X或Y”文本段:其一是為了提示讀者,兩個(gè)形容詞不是互換關(guān)系,只能二選一;其二是引起讀者關(guān)注,這兩個(gè)形容詞存在差異。比如,我先寫一段英文,在寫作過(guò)程中彈出了economic和economical這兩個(gè)單詞,我對(duì)它們的用法有一定的困惑,舉棋不定。為了進(jìn)一步了解二者的區(qū)別,我點(diǎn)擊單詞彈出框,出現(xiàn)了兩個(gè)簡(jiǎn)短的定義(詳見(jiàn)圖7):當(dāng)然,如果想獲得更多信息,可以繼續(xù)點(diǎn)擊查看。以上操作需要一個(gè)前提條件,那就是提前準(zhǔn)備好單詞辨析的相關(guān)內(nèi)容,否則就無(wú)法通過(guò)寫作助手來(lái)幫助作者選擇正確的單詞。

        圖7 economic和economical辨析程序設(shè)計(jì)示意圖

        還有另外一種情況:詞義相同,單詞使用頻率卻明顯不同。針對(duì)這種情況,寫作助手可以提供三種用法說(shuō)明,分別是“不用X,用Y”“很少使用X,用Y”和“已經(jīng)棄用X,用Y”。以上三種用法說(shuō)明只在作者選擇使用X的情況下出現(xiàn),如果作者一開(kāi)始就選擇使用Y,那么就不會(huì)彈出提示窗口。也就是說(shuō),該窗口只會(huì)在用戶輸入不推薦的形式之后才會(huì)被激活。接下來(lái),我們看看具體的操作(詳見(jiàn)圖8)。比如,我現(xiàn)在輸入單詞specifical,單詞上方馬上彈出信息,表明specifical已經(jīng)過(guò)時(shí)了,可以用specific代替。如果我想了解更多關(guān)于specific的知識(shí),點(diǎn)擊該單詞即可。

        圖8 specific和specifical用法辨析設(shè)計(jì)示意圖

        你可能并不知道specifical這個(gè)單詞的存在,但有些詞典,比如《柯林斯詞典》同時(shí)收錄了這兩個(gè)單詞,詞條信息中卻找不到類似“不用specifical,用specific”的提示信息。也有詞典,比如《韋氏詞典》,只收錄了其中一個(gè)單詞。綜上所述,對(duì)于二語(yǔ)學(xué)習(xí)者來(lái)說(shuō),詞匯辨析與選擇的確是一個(gè)復(fù)雜的問(wèn)題,上文提及的解決方法有三大優(yōu)勢(shì):直接推薦用法;推薦的原因直截了當(dāng);標(biāo)準(zhǔn)化的信息標(biāo)注方法也易被詞典編纂者所掌握。

        在“附帶學(xué)習(xí)”場(chǎng)景下,寫作助手推薦的用詞必須穩(wěn)妥、合乎語(yǔ)境且簡(jiǎn)單直接,避免冗余信息帶來(lái)的干擾。然而,“有意學(xué)習(xí)”強(qiáng)調(diào)輕松便捷地獲取附加信息,當(dāng)然,在這個(gè)過(guò)程中用戶也會(huì)受到不相關(guān)信息的干擾。目前,我們已經(jīng)擁有人工智能、人工輔助智能、高級(jí)編程等技術(shù),下一步是思考如何將它們充分應(yīng)用到詞典數(shù)據(jù)庫(kù)構(gòu)建和寫作助手的軟件開(kāi)發(fā)中。

        五、 對(duì)未來(lái)的展望

        如果我們充分利用前沿科技,就能幫助用戶自動(dòng)檢測(cè)擴(kuò)展語(yǔ)義單位,就能通過(guò)概率計(jì)算確定詞匯的語(yǔ)境意義,就能根據(jù)具體語(yǔ)境將所有對(duì)等詞優(yōu)化排序。除此之外,我們還能借鑒中國(guó)古代的訓(xùn)詁學(xué)思想,突破具體語(yǔ)境的限制,盡可能呈現(xiàn)出豐富的釋義內(nèi)容。新時(shí)代背景下,詞典學(xué)領(lǐng)域面臨著重大的技術(shù)突破,比如,“語(yǔ)境敏感型詞典”(contextaware dictionary),伴隨著它的出現(xiàn),詞典內(nèi)部逐漸會(huì)形成一個(gè)語(yǔ)境適應(yīng)選擇系統(tǒng)。然而,正如我所指出的,“語(yǔ)境敏感型詞典”的研發(fā)不僅需要信息工程師、程序員等提供先進(jìn)的技術(shù),還需要詞典編纂者不斷完善詞典數(shù)據(jù)庫(kù)設(shè)計(jì)和優(yōu)化用戶界面,方便目標(biāo)用戶快速獲取所需數(shù)據(jù)。這意味著公司股東、詞典編纂者、語(yǔ)言專家、教師、設(shè)計(jì)師、信息程序員等必須開(kāi)展密切的跨學(xué)科合作。我認(rèn)為,這是未來(lái)詞典學(xué)發(fā)展的必然要求,因?yàn)榇蠖鄶?shù)人都有查閱詞典的需求,通常情況下,他們都希望能夠通過(guò)詞典簡(jiǎn)單快速地找到解決問(wèn)題的答案,而詞典設(shè)計(jì)與研發(fā)也應(yīng)朝著這個(gè)目標(biāo)不斷努力。在數(shù)字詞典使用場(chǎng)景下,詞典的首要功能應(yīng)是滿足用戶“附帶學(xué)習(xí)”的需求。如果詞典用戶想獲取更多信息,“附帶學(xué)習(xí)”又可轉(zhuǎn)變成“有意學(xué)習(xí)”。這正好呼應(yīng)了達(dá)芬奇那句反復(fù)被引用的句子——“至繁歸于至簡(jiǎn)”(Simplicity is the ultimate sophistication)。

        附 注

        [1]愛(ài)因斯坦的原話如下:“To raise new questions,new possibilities,to regard old problems from a new angle,requires creative imagination and marks real advance in science.”(轉(zhuǎn)引自 Tarp 2009)30

        [2]第七屆學(xué)習(xí)詞典與二語(yǔ)教學(xué)國(guó)際研討會(huì)(福建泉州)。

        [3]原文:“Although the number of possible combinations may in principle be limitless…the number of probable combinations…is rather limited.”(Hanks 2013:399)

        [4]原文:“Although corpus analysis enables us to observe the inbuilt predictability of most language output,much of this is far from predictable to a learner or non-fluent user of a language.”(Rundell 2015)6

        猜你喜歡
        附帶詞典語(yǔ)境
        米沃什詞典
        文苑(2019年24期)2020-01-06 12:06:50
        評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
        詞典例證翻譯標(biāo)準(zhǔn)探索
        附帶民事訴訟原告人權(quán)利保護(hù)研究
        語(yǔ)言學(xué)習(xí)中語(yǔ)境化的輸入與輸出
        跟蹤導(dǎo)練(三)2
        第二語(yǔ)言詞匯附帶習(xí)得研究30年述評(píng)
        論幽默語(yǔ)境中的預(yù)設(shè)觸發(fā)語(yǔ)
        《胡言詞典》(合集版)刊行
        話“徑”說(shuō)“園”——來(lái)自現(xiàn)象學(xué)語(yǔ)境中的解讀
        久热综合在线亚洲精品| 日韩人妻ol丝袜av一二区| 私人vps一夜爽毛片免费| 一本色道久久88精品综合| 成 人 免费 黄 色 视频| 成人区人妻精品一区二区不卡网站| 曰本人做爰又黄又粗视频| 国产成a人亚洲精v品无码性色| 国产男女猛烈无遮挡免费视频| 精品视频专区| 亚洲黄色官网在线观看| 女主播国产专区在线观看| 久久久精品亚洲人与狗| 国产成人av无码精品| 熟妇人妻久久中文字幕| 内射精品无码中文字幕| 91亚洲国产成人aⅴ毛片大全| 国产精品白浆免费观看| 人妻少妇中文字幕专区| 一区二区三区字幕中文| 日本艳妓bbw高潮一19| 又色又污又爽又黄的网站| 高清国产亚洲va精品| 国内精品女同一区二区三区| 国产精品亚洲三级一区二区三区| 一二区成人影院电影网| 中国丰满熟妇xxxx| 在线丝袜欧美日韩制服| 亚洲一区二区三区天堂av| 亚洲综合日韩一二三区| 亚洲av无码专区在线观看成人| 久久人人玩人妻潮喷内射人人 | 日韩制服国产精品一区| 最新国产一区二区精品久久| 亚洲欧洲美洲无码精品va| 伊人影院成人在线观看| 无遮挡很爽很污很黄的女同| 亚洲成在人线在线播放无码| 香蕉视频一级| 精品午夜一区二区三区| 亚洲av熟女中文字幕|