亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究綜述*

        2018-02-27 00:01:00王連柱
        現(xiàn)代教育技術(shù) 2018年9期
        關(guān)鍵詞:人工智能人類智能

        王連柱

        ?

        機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究綜述*

        王連柱1,2

        (1.北京外國語大學(xué) 中國外語與教育研究中心,北京 100089;2.新鄉(xiāng)醫(yī)學(xué)院 外語學(xué)院,河南新鄉(xiāng) 453003)

        文章首先對(duì)機(jī)器學(xué)習(xí)和語言智能進(jìn)行了概念界定,隨后將機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究分為萌芽時(shí)期、發(fā)展時(shí)期、繁榮時(shí)期等三個(gè)階段,并綜述了各歷史階段中機(jī)器學(xué)習(xí)在語言智能中的應(yīng)用情況。為了探討語言智能機(jī)器人背后的技術(shù)原理,文章以微軟“小冰”為例,論述了機(jī)器學(xué)習(xí)理論和算法在情感聊天、智能作詩、智能新聞寫作中的作用。最后,文章從機(jī)器學(xué)習(xí)方式、算法、語言智能水平和產(chǎn)業(yè)規(guī)模等四個(gè)方面,就機(jī)器學(xué)習(xí)應(yīng)用于語言智能的未來趨勢(shì)進(jìn)行了展望,以期為未來的機(jī)器學(xué)習(xí)研究和語言智能產(chǎn)業(yè)發(fā)展提供參考。

        機(jī)器學(xué)習(xí);語言智能;人工智能;機(jī)器翻譯

        自1946年世界上第一臺(tái)計(jì)算機(jī)誕生至今的70余年間,人們不斷地思索如何利用計(jì)算機(jī)服務(wù)于人類各項(xiàng)事業(yè)。時(shí)至今日,計(jì)算機(jī)已被廣泛地應(yīng)用于科學(xué)計(jì)算、數(shù)據(jù)處理、過程控制、生產(chǎn)自動(dòng)化、人工智能等領(lǐng)域。隨著計(jì)算機(jī)軟硬件設(shè)備的迭代升級(jí),以及數(shù)理統(tǒng)計(jì)等基礎(chǔ)科學(xué)的跨越式發(fā)展,人們已不再滿足于僅讓計(jì)算機(jī)從事程序執(zhí)行、數(shù)據(jù)運(yùn)算之類的簡單工作,而是設(shè)法讓計(jì)算機(jī)自行推理、自主學(xué)習(xí)。計(jì)算機(jī)的自主學(xué)習(xí)即機(jī)器學(xué)習(xí)(Machine Learning),已在若干學(xué)科前沿發(fā)揮革命性的作用。如天文學(xué)方面,美國國家航空航天局于2017年12月15日發(fā)布聲明,谷歌人工智能工程師Shallue等利用機(jī)器學(xué)習(xí),從開普勒望遠(yuǎn)鏡項(xiàng)目對(duì)外公布的海量數(shù)據(jù)中成功發(fā)現(xiàn)第8顆行星——開普勒-90i(Kepler-90i)。當(dāng)然,機(jī)器學(xué)習(xí)的“主陣地”——自然語言處理,也并沒有被遺忘。隨著機(jī)器學(xué)習(xí)理論、算法的發(fā)展和語料庫、知識(shí)庫的健全,自然語言處理這個(gè)“主業(yè)”日臻完善,正不斷朝著規(guī)模化和智能化的方向發(fā)展。而語言智能機(jī)器人,如美國的“索菲亞”(Sophia)、中國的“佳佳”、日本的“安蘇娜”(Asuna)等,已經(jīng)具備一定的智能語音交互功能,語言智能的新時(shí)代正在快步走來[1]。

        一 概念界定

        1 機(jī)器學(xué)習(xí)

        機(jī)器學(xué)習(xí)的核心問題是學(xué)習(xí)。Simon認(rèn)為:“學(xué)習(xí)是系統(tǒng)中的任何改進(jìn),這種改進(jìn)使得系統(tǒng)在重復(fù)同樣的工作或進(jìn)行類似的工作時(shí),能完成得更好?!盵2]機(jī)器學(xué)習(xí)不同于人類學(xué)習(xí),具體表現(xiàn)為:①學(xué)習(xí)依靠的資源不同。人類學(xué)習(xí)依靠的是人類對(duì)整個(gè)世界的經(jīng)驗(yàn),即人類的所聽、所見、所讀、所想等;而機(jī)器學(xué)習(xí)依靠的是各種可獲得的標(biāo)記(Labeled)或者非標(biāo)記(Unlabeled)的歷史數(shù)據(jù)。②做出預(yù)測(cè)的依據(jù)不同。人類做出預(yù)測(cè)或者進(jìn)行演繹推理,依據(jù)的是歸納出來的各種原理和規(guī)律;而機(jī)器做出預(yù)測(cè)或判斷,依據(jù)的是各種算法模型。③學(xué)習(xí)效率不同。人類學(xué)習(xí)過程緩慢,抗干擾性差,且效率較低;而機(jī)器學(xué)習(xí)可以更加迅速、高效地獲取知識(shí)和技能??梢哉f,機(jī)器學(xué)習(xí)是包括語言智能在內(nèi)的人工智能的核心[3]。

        針對(duì)機(jī)器學(xué)習(xí)的重點(diǎn),學(xué)者們提出了各自不同的觀點(diǎn),如Samuel[4]強(qiáng)調(diào)機(jī)器學(xué)習(xí)過程中的去程序化,Mitchell[5]和Mooney[6]強(qiáng)調(diào)學(xué)習(xí)經(jīng)驗(yàn)使計(jì)算機(jī)程序自身的性能得以改善,而Carbonell等[7]強(qiáng)調(diào)機(jī)器學(xué)習(xí)的策略以及知識(shí)或技能表征的方式。綜合上述觀點(diǎn),本研究認(rèn)為機(jī)器學(xué)習(xí)是指計(jì)算機(jī)模擬人類的學(xué)習(xí)行為,通過識(shí)別現(xiàn)有知識(shí),以獲取新知識(shí)或新技能,或者重組已有的知識(shí)結(jié)構(gòu),不斷改善性能和實(shí)現(xiàn)自身完善的過程、原理和方法[8][9],其主要目標(biāo)是建立學(xué)習(xí)模型、發(fā)展學(xué)習(xí)理論、設(shè)計(jì)數(shù)理算法和建立應(yīng)用系統(tǒng)[10]。其中,建立應(yīng)用系統(tǒng)是指把機(jī)器學(xué)習(xí)的成果應(yīng)用于包括語言智能在內(nèi)的各種人工智能,以更好地服務(wù)于人類社會(huì)。

        2 語言智能

        研究機(jī)器學(xué)習(xí)貴在應(yīng)用,即把研究成果應(yīng)用于學(xué)科領(lǐng)域。機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域十分廣泛,Carbonell等[11]總結(jié)出19個(gè)應(yīng)用領(lǐng)域——其中,與語言智能有關(guān)的有3個(gè):語音識(shí)別/合成、自然語言處理和計(jì)算機(jī)編程。這三個(gè)領(lǐng)域涉及的問題各不相同,以自然語言處理領(lǐng)域?yàn)槔?,機(jī)器學(xué)習(xí)側(cè)重于解決該領(lǐng)域中的詞性標(biāo)注、句法標(biāo)注、語義標(biāo)注、詞義消歧、指代消解、信息抽取等問題[12],以達(dá)到提升信息處理效率和效度的目標(biāo)。

        機(jī)器學(xué)習(xí)技術(shù)的大量應(yīng)用,使機(jī)器更善于聽懂人類的語言,并使用人類的語言與人類交流。機(jī)器與人類的實(shí)時(shí)語言交互體現(xiàn)了語言智能的內(nèi)涵,即利用機(jī)器學(xué)習(xí)算法、知識(shí)庫和語音識(shí)別/合成技術(shù),智能化地理解、生成語言,實(shí)現(xiàn)人機(jī)交互。如今,人機(jī)智能交互已進(jìn)入生產(chǎn)、生活領(lǐng)域,誕生了許多種類的語言智能機(jī)器人,如自動(dòng)翻譯機(jī)器人、新聞寫作機(jī)器人、作詩機(jī)器人、情感陪護(hù)機(jī)器人、社交機(jī)器人、客服機(jī)器人等。

        二 機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究歷程

        為解答“機(jī)器能否思考”(Can Machines Think?)的疑問,英國數(shù)學(xué)家Turing[13]例舉了一個(gè)由三方參與的“模擬游戲”,采用“問答”形式來檢測(cè)學(xué)習(xí)機(jī)器的智商,這就是后來的“圖靈測(cè)試”——當(dāng)時(shí),Turing使用的名稱還是“學(xué)習(xí)機(jī)器”。

        “機(jī)器學(xué)習(xí)”這一術(shù)語由西洋跳棋程序的研制者Samuel于1956年首次提出,他將這一新術(shù)語定義為“不顯式編程地賦予計(jì)算機(jī)能力的研究領(lǐng)域”[14]。機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究大致可分為萌芽時(shí)期、發(fā)展時(shí)期和繁榮時(shí)期等三個(gè)階段,這三個(gè)階段見證了語言智能從單純語言翻譯向復(fù)雜人機(jī)對(duì)話、智能寫作等多領(lǐng)域應(yīng)用的轉(zhuǎn)變。

        1 萌芽時(shí)期(1980年以前)

        上個(gè)世紀(jì)80年代以前,語言智能的研究尚處于低級(jí)階段,研究的主要內(nèi)容是機(jī)器翻譯、自然語言理解和相關(guān)的算法。

        (1)機(jī)器學(xué)習(xí)與機(jī)器翻譯

        1954年,美國喬治敦大學(xué)利用國際商業(yè)機(jī)器(International Business Machines,IBM)公司生產(chǎn)的IBM-701型計(jì)算機(jī),在世界首次進(jìn)行了俄英機(jī)器翻譯實(shí)驗(yàn),獲得巨大成功。蘇聯(lián)、意大利、英國、德國、日本、中國等不甘示弱,也紛紛進(jìn)行機(jī)器翻譯實(shí)驗(yàn)。1959年,我國在104型電子計(jì)算機(jī)上首次進(jìn)行了俄漢機(jī)器翻譯實(shí)驗(yàn)[15]。但是語言遠(yuǎn)比人們想象的要復(fù)雜,早期翻譯主要采用查字典的方法,沒有考慮句法分析等,譯文可讀性差,難以產(chǎn)生效益。1966年,美國自動(dòng)語言處理咨詢委員會(huì)發(fā)布《語言與機(jī)器》()報(bào)告,否定了機(jī)器翻譯[16],因?yàn)闄C(jī)器翻譯難以攻克“語義障礙”。隨后,機(jī)器翻譯研究陷入低潮。

        60年代末開始,機(jī)器翻譯研究開始重視句法和語義,同時(shí)把句法和算法分開。這一時(shí)期誕生的較為典型的機(jī)器翻譯系統(tǒng)是美國喬治敦大學(xué)的俄英機(jī)器翻譯系統(tǒng)SYSTRAN[17]和法國格勒諾布爾醫(yī)科大學(xué)的俄法機(jī)器翻譯系統(tǒng)ARIANE-78[18]。此外,加拿大的實(shí)用翻譯系統(tǒng)TAUM-METEO也具有里程碑意義[19],它可以每天翻譯1500~2000篇天氣預(yù)報(bào)。由于此時(shí)期的機(jī)器翻譯采用了基于邏輯表示的“連接主義”學(xué)習(xí)系統(tǒng)、基于決策理論的學(xué)習(xí)技術(shù)和基于統(tǒng)計(jì)學(xué)的學(xué)習(xí)算法(如Earley算法、Beyesian算法),外加應(yīng)用了詞典和語料庫,故使句法成功率得到顯著提升,詞義消歧、多義詞選擇也得到明顯改善。

        (2)機(jī)器學(xué)習(xí)與自然語言理解

        70年代,自然語言理解研究取得突破,出現(xiàn)了多個(gè)利用程序推演進(jìn)行語義、語用和語境分析的系統(tǒng),如PAM系統(tǒng)和SHRDLU系統(tǒng)[20]。其中,SHRDLU系統(tǒng)是1972年由美國麻省理工學(xué)院的Winograd[21]設(shè)計(jì)的,該系統(tǒng)較好地把句法、語義分析與邏輯推理結(jié)合起來,可以實(shí)現(xiàn)用自然語言指揮機(jī)器人擺弄積木[22]。

        2 發(fā)展時(shí)期(1980~2000年)

        80年代初至20世紀(jì)末是機(jī)器學(xué)習(xí)和語言智能快速發(fā)展的時(shí)期,學(xué)習(xí)理論、算法、語料庫、知識(shí)庫等新概念、新事物在這一時(shí)期不斷興起。其中,影響較大的機(jī)器學(xué)習(xí)理論和算法有:80年代的歸納學(xué)習(xí)(Inductive Learning)和決策樹(Decision Tree)算法、歸納邏輯程序設(shè)計(jì)(Inductive Logic Programming,ILP)算法、神經(jīng)網(wǎng)絡(luò)反向傳播(Back Propagation,BP)算法[23]等;90年代的統(tǒng)計(jì)學(xué)習(xí)(Statistical Learning)和支持向量機(jī)(Support Vector Machine,SVM)算法[24]、集成學(xué)習(xí)(Ensemble Learning)和Boosting、Bagging算法等。機(jī)器學(xué)習(xí)理論和算法的快速發(fā)展,推動(dòng)了自然語言處理、機(jī)器翻譯和人機(jī)對(duì)話等研究逐步走向成熟。

        (1)機(jī)器學(xué)習(xí)與自然語言處理

        在自然語言處理方面,億詞級(jí)的英國國家語料庫(British National Corpus,BNC)實(shí)現(xiàn)了自動(dòng)詞性標(biāo)注,為詞典編制、自然語言理解、機(jī)器翻譯奠定了基礎(chǔ)。BNC的自動(dòng)詞性標(biāo)注是基于概率統(tǒng)計(jì)進(jìn)行的標(biāo)注,準(zhǔn)確率能達(dá)到96%~97%。此外,世界上許多大學(xué)和研究機(jī)構(gòu)在90年代建立了不同語種的樹庫,其中建設(shè)最早、影響力最大的當(dāng)屬賓州樹庫(The Penn Treebank)。目前,樹庫實(shí)現(xiàn)了在線檢索和共享,谷歌和斯坦福大學(xué)等更是發(fā)起并建設(shè)了通用依存樹庫共享平臺(tái)①。

        (2)機(jī)器學(xué)習(xí)與機(jī)器翻譯

        統(tǒng)計(jì)方法除了可以應(yīng)用于詞性標(biāo)注、句法標(biāo)注,還可以應(yīng)用于機(jī)器翻譯。正如Hutchins所言,自1989年以來,基于規(guī)則、統(tǒng)計(jì)、實(shí)例、語料庫、知識(shí)庫的方法已經(jīng)把機(jī)器翻譯帶入了一個(gè)新紀(jì)元②。90年代初,IBM工程師Brown等[25]在不借助翻譯規(guī)則、術(shù)語庫的情況下,僅僅依靠平行語料庫和統(tǒng)計(jì)算法,短短幾年內(nèi)就構(gòu)建出了一個(gè)與SYSTRAN媲美的翻譯系統(tǒng)。

        (3)機(jī)器學(xué)習(xí)與人機(jī)對(duì)話

        90年代,語言智能方面取得的成功還包括自動(dòng)問答系統(tǒng)和自動(dòng)語音識(shí)別系統(tǒng)。1993年,美國麻省理工學(xué)院的Katz及其同事開發(fā)了世界上首個(gè)基于網(wǎng)頁的問答系統(tǒng)START——目前,該系統(tǒng)可以回答幾百萬個(gè)關(guān)于地點(diǎn)、影片、人物、字典上的定義等英語問題。另外一個(gè)比較成熟的問答系統(tǒng)是AnswerBus,這是一種多語種、多引擎的句級(jí)信息抽取系統(tǒng),支持5種語言和5種搜索引擎。但是,START和AnswerBus這兩個(gè)問答系統(tǒng)需要手工輸入,而自動(dòng)語音識(shí)別技術(shù)的發(fā)展可以有效解決手工輸入的問題。1997年,IBM推出語音識(shí)別軟件ViaVoice,使用者可自行短時(shí)訓(xùn)練該軟件,使其適應(yīng)個(gè)體語音和語調(diào)。

        3 繁榮時(shí)期(2000年至今)

        在機(jī)器學(xué)習(xí)理論、算法等蓬勃發(fā)展的新世紀(jì),語言智能進(jìn)入了前所未有的繁榮時(shí)期。進(jìn)入21世紀(jì),學(xué)習(xí)理論從統(tǒng)計(jì)學(xué)習(xí)向集成學(xué)習(xí)、深度學(xué)習(xí)(Deep Learning)轉(zhuǎn)變,Adaboost、隨機(jī)森林(Random Forests)、卷積神經(jīng)網(wǎng)絡(luò)(Convulsion Neural Networks)、深度信念網(wǎng)絡(luò)(Deep Belief Networks)等算法應(yīng)運(yùn)而生并不斷迭代升級(jí)。2006年,加拿大多倫多大學(xué)的Hinton等[26]在《科學(xué)》()雜志上發(fā)表關(guān)于運(yùn)用神經(jīng)網(wǎng)絡(luò)削減數(shù)據(jù)維度的文章,給出了訓(xùn)練深層網(wǎng)絡(luò)的新思路,從而拉開了深度學(xué)習(xí)的大幕。如今,深度學(xué)習(xí)越來越火熱,常被應(yīng)用于工程實(shí)踐,如機(jī)器翻譯、自然語言理解和智能語音交互等。

        (1)機(jī)器學(xué)習(xí)與機(jī)器翻譯

        2012年11月,微軟在第十四屆“二十一世紀(jì)的計(jì)算”學(xué)術(shù)研討會(huì)上,公開演示了全自動(dòng)同聲傳譯系統(tǒng)——演講者用英文發(fā)言,后臺(tái)的計(jì)算機(jī)即時(shí)自動(dòng)完成語音識(shí)別、英中機(jī)器翻譯和中文語音合成,運(yùn)行非常流暢,其中的關(guān)鍵支撐技術(shù)就是深度學(xué)習(xí)[27]。2016年9月,谷歌公布基于網(wǎng)頁和APP的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Google Neural Machine Translation,GNMT),結(jié)束了始于1989年的IBM基于短語的機(jī)器翻譯(Phrase-Based Machine Translation,PBMT)模式。與谷歌先前基于短語的機(jī)器翻譯相比,基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯將錯(cuò)誤率減少約60%[28]。

        (2)機(jī)器學(xué)習(xí)與自然語言理解

        2018年1月,在斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering Dataset)機(jī)器閱讀理解挑戰(zhàn)賽中,由微軟亞洲研究院和阿里巴巴iDST自然語言處理部提交的智能模型分別實(shí)現(xiàn)了82.650%、82.440%的精準(zhǔn)匹配,首次超越了人類于2016年創(chuàng)造的82.304%的精準(zhǔn)率。

        (3)機(jī)器學(xué)習(xí)與智能語音交互

        語音識(shí)別/合成、自然語音理解、知識(shí)庫檢索等技術(shù)的快速發(fā)展,使機(jī)器人已經(jīng)具備一定的智能語音交互功能。以美國的“索菲亞”為例,她不僅可以“逼真地”做出各種動(dòng)作與表情,還可以“幽默地”與人類交流與溝通,故自2015年4月誕生起就引起了人們的高度關(guān)注。

        三 機(jī)器學(xué)習(xí)應(yīng)用于語言智能的典型案例

        微軟的“小冰”是目前全球最大的交互式人工智能系統(tǒng)之一。該系統(tǒng)不僅實(shí)現(xiàn)了智能情感聊天,而且做到了智能作詩、智能新聞寫作。從2014年5月29日首次亮相,到2017年8月22日第五版發(fā)布,“小冰”已成為流量規(guī)模最大、應(yīng)用范圍最廣的情感社交聊天機(jī)器人。豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)和良好的業(yè)績表現(xiàn),為“小冰”在更多語言場(chǎng)景中的應(yīng)用奠定了基礎(chǔ)。目前,“小冰”已成功登陸微信、微博、Facebook、中國東方航空、東方衛(wèi)視、Window 10等應(yīng)用平臺(tái)。此外,微軟還開發(fā)了“小娜”(Cortana)、日本版的“小冰凜菜”(Rinna)和美國版的“Zo”等聊天機(jī)器人?!靶”钡戎阅軐?shí)現(xiàn)智能情感聊天,離不開專門用途語料庫的建設(shè)、深度學(xué)習(xí)理論的支撐和深度神經(jīng)網(wǎng)絡(luò)技術(shù)的應(yīng)用。

        在智能作詩方面,由“小冰”創(chuàng)作的現(xiàn)代詩集《陽光失了玻璃窗》于2017年5月19日正式出版。該詩集共收錄139首詩,精選自“小冰”創(chuàng)作的70,928首詩。這是人類歷史上第一部100%人工智能詩集,運(yùn)用的正是深度神經(jīng)網(wǎng)絡(luò)等算法。在模擬人類作詩過程的基礎(chǔ)上,經(jīng)過上萬次的訓(xùn)練,“小冰”才具有了詩歌創(chuàng)作的能力。除“小冰”外,由清華大學(xué)語音和語言技術(shù)中心開發(fā)的“薇薇”也具有這種作詩能力。2016年3月20日,該中心宣布,他們的作詩機(jī)器人“薇薇”通過了中國社會(huì)科學(xué)院唐詩專家的評(píng)定和“圖靈測(cè)試”,即“薇薇”創(chuàng)作的古詩詞中,有30%以上(31%)被認(rèn)為是人創(chuàng)作而非機(jī)器創(chuàng)作的。

        而在智能新聞寫作方面,“小冰”自2016年12月起正式入職《錢江晚報(bào)》,成為該報(bào)的一名特約記者。與人類記者相比,機(jī)器記者雖然存在問題思考不夠深刻、情感投入不夠豐富等弱點(diǎn),但在速度和準(zhǔn)度方面卻頗有優(yōu)勢(shì)。正因?yàn)槿绱?,研究者紛紛進(jìn)行了寫作機(jī)器人的研發(fā)。2009年10月11日,美國西北大學(xué)研發(fā)的StatsMonkey系統(tǒng)曾撰寫了一篇關(guān)于棒球比賽的新聞稿。此后,世界上誕生了多款寫作機(jī)器人,如國外《洛杉磯時(shí)報(bào)》的Quakebot、美國聯(lián)合通訊社(簡稱“美聯(lián)社”)的Wordsmith和《紐約時(shí)報(bào)》的Blossombot等,國內(nèi)騰訊的Dreamwriter、新華社的“快筆小新”和人民日?qǐng)?bào)的“小融”等。這些機(jī)器人之所以能夠撰寫稿件,其背后的技術(shù)支撐就是大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法。

        四 機(jī)器學(xué)習(xí)應(yīng)用于語言智能的研究展望

        隨著計(jì)算機(jī)硬件尤其是神經(jīng)網(wǎng)絡(luò)處理單元(Neural-network Processing Unit,NPU)的研發(fā)與改進(jìn),機(jī)器學(xué)習(xí)會(huì)變得更加強(qiáng)大,并觸發(fā)包括語言智能在內(nèi)的人工智能領(lǐng)域的更大變革?;趯?duì)計(jì)算機(jī)硬件、機(jī)器學(xué)習(xí)理論和算法等發(fā)展態(tài)勢(shì)的分析與研判,本研究將機(jī)器學(xué)習(xí)應(yīng)用于語言智能的未來趨勢(shì)總結(jié)如下:

        ①機(jī)器學(xué)習(xí)方式的升級(jí)——監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)將向無監(jiān)督學(xué)習(xí)、預(yù)測(cè)學(xué)習(xí)(Predictive Learning)轉(zhuǎn)變。2017年5月,谷歌發(fā)布自動(dòng)機(jī)器學(xué)習(xí)(Auto Machine Learning,AutoML)系統(tǒng)。該系統(tǒng)的獨(dú)特之處在于,機(jī)器成了獨(dú)立于人類之外的另一架構(gòu)師,它可以自主選擇算法模型、模型參數(shù),并自動(dòng)評(píng)估模型質(zhì)量,以獲得更好的結(jié)果。目前,該系統(tǒng)設(shè)計(jì)的模型與專業(yè)研發(fā)工程師設(shè)計(jì)的模型不分伯仲,可以預(yù)計(jì),該系統(tǒng)將逐步取代部分機(jī)器學(xué)習(xí)研發(fā)工程師。此外,由美國紐約大學(xué)LeCun提出的預(yù)測(cè)學(xué)習(xí)③讓機(jī)器擁有了“共識(shí)”,通過使用機(jī)器,給可以獲得的任意信息建模,來預(yù)測(cè)感知對(duì)象的未來,從而實(shí)現(xiàn)推理和規(guī)劃的結(jié)合。總之,未來的機(jī)器學(xué)習(xí)將開啟以自主學(xué)習(xí)為主、以人工干預(yù)為補(bǔ)充的新局面。

        ②算法的換代——機(jī)器學(xué)習(xí)算法將改變?cè)瓉韱涡?、單任?wù)的做法,逐步朝著并行化、層次化、模塊化的方向發(fā)展。算法系統(tǒng)會(huì)將復(fù)雜的任務(wù)拆分成若干簡單的子任務(wù),交由不同的算法模塊來執(zhí)行,這樣既可發(fā)揮每個(gè)模塊的專長,也可進(jìn)行任務(wù)的并行化運(yùn)算,減少任務(wù)響應(yīng)時(shí)間。此外,根據(jù)神經(jīng)元理論,建立深層神經(jīng)網(wǎng)絡(luò)算法,可以實(shí)現(xiàn)對(duì)成千上萬互聯(lián)互通神經(jīng)元的監(jiān)測(cè)。

        ③語言智能水平的提升——當(dāng)機(jī)器學(xué)習(xí)理論、算法的進(jìn)步映射到語言智能上時(shí),就會(huì)提升語言智能的水平。李宇明[29]列舉了機(jī)器給人類語言生活帶來變革的九大職業(yè),其中包括講解員、引導(dǎo)員、后臺(tái)客服、翻譯、秘書、記者等,而這些職業(yè)中90%的工作在未來十年將被機(jī)器代替。以新聞?dòng)浾叩墓ぷ鳛槔?,未來的機(jī)器不僅能夠組稿、寫稿,還可以幫助處理假新聞。

        ④產(chǎn)業(yè)規(guī)模的擴(kuò)大——語言智能的應(yīng)用場(chǎng)景將不再局限于機(jī)器翻譯、人機(jī)對(duì)話等,而是不斷向智能家具、語音導(dǎo)航、可穿戴設(shè)備、教育等蔓延。《新一代人工智能發(fā)展白皮書(2017)》顯示:2017年,全球人工智能核心產(chǎn)業(yè)規(guī)模已超過370億美元,預(yù)計(jì)2020年將超過1300億美元[30]??梢灶A(yù)見,包括語言智能在內(nèi)的智能產(chǎn)業(yè)將成為未來企業(yè)巨頭競爭的制高點(diǎn),也將引領(lǐng)世界經(jīng)濟(jì)邁向新征程。

        五 結(jié)語

        通過以蒸汽機(jī)、電力和計(jì)算機(jī)為技術(shù)標(biāo)志的三次工業(yè)革命,人類社會(huì)已相繼完成了機(jī)械化、電氣化和信息化。而在創(chuàng)新工場(chǎng)董事長、微軟前全球副總裁李開復(fù)等[31]看來,人工智能極有可能成為下一次工業(yè)革命的核心驅(qū)動(dòng)力。歸根結(jié)底,人工智能就是讓計(jì)算機(jī)模擬人類的智能行為,來完成以往需要人類智力才能完成的工作。目前,人工智能已被應(yīng)用于自動(dòng)駕駛、疾病診斷、藝術(shù)創(chuàng)作、智能金融等領(lǐng)域,Turing[32]更是預(yù)言:機(jī)器最終會(huì)與人在所有智能領(lǐng)域里競爭。

        在語言生活領(lǐng)域,機(jī)器正與語言工作者一起參與人類的生產(chǎn)、生活,并已凸顯其速度快、抗干擾強(qiáng)等優(yōu)勢(shì)。機(jī)器可以成為人類語言生活的助手,并為縮小人類溝通的鴻溝、減少人際間的隔閡作出貢獻(xiàn)。當(dāng)然,機(jī)器能夠輔助人類完成一定的交際任務(wù),離不開數(shù)據(jù)科學(xué)家、工程師、統(tǒng)計(jì)學(xué)家等專家的集體智慧。語言智能技術(shù)的不斷發(fā)展,對(duì)這些專家提出了更高的要求。未來,專家們要做的不僅僅是改進(jìn)和升級(jí)機(jī)器學(xué)習(xí)理論、算法,還要讓未來的語言智能更富靈性、更具感染力。盡管語言智能發(fā)展之路還很漫長,遇到的阻力也不少,但我們有理由相信:語言智能的明天肯定會(huì)更好!

        [1][29]李宇明.迎接與機(jī)器人共處的時(shí)代[N].光明日?qǐng)?bào),2017-8-6(12).

        [2]Simon H A. Why should machines learn?[A]. Michalski R S, Carbonell J G, Mitchell T M. Machine learning: An artificial intelligence approach[C]. Berlin: Springer-Verlag, 1983:28.

        [3][14]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016:18、22.

        [4]Samuel A L. Some studies in machine learning using the game of checkers[J]. IBM Journal on Research and Development, 1959,(3):210-229.

        [5](美)Mitchell T M著.曾華軍,張銀奎,等譯.機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2003:2-3.

        [6][12]Mooney R J. Machine learning[A]. Mitkov R. The Oxford handbook of computational linguistics[C]. Oxford: Oxford University Press, 2003:376、386-392.

        [7][11]Carbonell J G, Michalski R S, Mitchell T M. An overview of machine learning[A]. Michalski R S, Carbonell J G, Mitchell T M. Machine learning: An artificial intelligence approach[C]. Berlin: Springer-Verlag, 1983:7、13.

        [8]陳文偉,陳晟.知識(shí)工程與知識(shí)管理[M].北京:清華大學(xué)出版社,2010:166.

        [9]劉潤清.外語教學(xué)中的科研方法(修訂版)[M].北京:外語教學(xué)與研究出版社,2015:492.

        [10]楊忠祥.機(jī)器學(xué)習(xí)研究的發(fā)展現(xiàn)狀與動(dòng)向[J].信息與控制,1987,(1):34-37.

        [13][32]Turing A M. Computing machinery and intelligence[J]. Mind, 1950,(236):433-460.

        [15]劉涌泉.計(jì)算語言學(xué)在我國的發(fā)展[J].現(xiàn)代語文:高中版,2002,(7):44-45.

        [16]ALPAC. Languages and machines: Computers in translation and linguistics[R]. Washington, D. C.: National Academy of Sciences, 1966:32.

        [17][18]劉穎.計(jì)算語言學(xué)(修訂版)[M].北京:清華大學(xué)出版社,2014:11、12.

        [19]馮志偉.機(jī)器翻譯與語言研究(上)[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2007,(3):39-43.

        [20]馮志偉.計(jì)算語言學(xué)的歷史回顧與現(xiàn)狀分析[J].外國語,2011,(1):9-17.

        [21]Winograd T. Understanding natural language[J]. Cognitive Psychology, 1972,(1):1-191.

        [22](美)Jurafsky D, Martin J H著.馮志偉,孫樂譯.自然語言處理綜論[M].北京:電子工業(yè)出版社,2005:9.

        [23]Rumelhart D E, Hinton G E, Williams R J. Learning internal representations by error propagation[A]. Rumelhart D E, McClelland J L. Parallel distributed processing: Explorations in the microstructure of cognition[C]. Cambridge, MA: The MIT Press, 1986:318-362.

        [24]Cortes C, Vapnik V N. Support-vector networks[J]. Machine Learning, 1995,(3):273-297.

        [25]Brown P F, Pietra V J D, Pietra S A D, et al. The mathematics of statistical machine translation: Parameter estimation[J]. Computational Linguistics, 1993,(2):263-311.

        [26]Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science, 2006,(5786):504-507.

        [27]盧鶇翔.DNN與微軟同聲傳譯系統(tǒng)背后的故事[J].程序員,2013,(6):30-33.

        [28]Wu Y H, Schuster M, Chen Z F, et al. Google’s neural machine translation system: Bridging the gap between human and machine translation[OL].

        [30]李颋,周珉峰,馬良,等.新一代人工智能發(fā)展白皮書(2017)[R].北京:中國電子學(xué)會(huì),2018:30-31.

        [31]李開復(fù),王詠剛.人工智能[M].北京:文化發(fā)展出版社,2017:146.

        ①通用依存樹庫共享平臺(tái)的訪問網(wǎng)址:http://universaldependencies.org/。

        ②此觀點(diǎn)源自1993年7月英國學(xué)者Hutchins在日本神戶召開的第四屆機(jī)器翻譯高層會(huì)議上所作的報(bào)告。

        ③2016年12月,在西班牙巴塞羅那舉辦的神經(jīng)信息處理系統(tǒng)(Neural Information Processing Systems,NIPS)年會(huì)上,LeCun受邀發(fā)表主旨演講,并在演講中提出用“預(yù)測(cè)學(xué)習(xí)”代替“無監(jiān)督學(xué)習(xí)”這一傳統(tǒng)分類。

        A Review on the Application of Machine Learning in Language Intelligence

        WANG Lian-zhu1,2

        Firstly, this paper defined the concept of Machine Learning (ML) and Language Intelligence (LI). Then, this paper divided the research of the application of ML in LI into three periods of budding period, progressive period and flourishing period, and further summarized the application situations of ML in LI at different history stages. In order to discuss the technical principle behind LI robot, this paper took the Microsoft’s “Xiaobing” as an example to analyze the role of ML theory and algorithm in emotional chat, intelligent poetry and intelligent news writing. Finally, the future development of applying ML in LI was presented from four perspectives of ML mode, algorithm, LI level and industry scale, expecting to provide reference for the future ML research and the LI industry development.

        machine learning; language intelligence; artificial intelligence; machine translation

        G40-057

        A

        1009—8097(2018)09—0066—07

        10.3969/j.issn.1009-8097.2018.09.010

        本文為教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目“基于歷時(shí)英漢平行語料庫的醫(yī)學(xué)文獻(xiàn)翻譯研究”(項(xiàng)目編號(hào):14YJC740084)、河南省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目“醫(yī)學(xué)文獻(xiàn)歷時(shí)英漢平行語料庫的創(chuàng)建、加工及應(yīng)用研究”(項(xiàng)目編號(hào):2016BYY011)的階段性研究成果。

        王連柱,北京外國語大學(xué)在讀博士,新鄉(xiāng)醫(yī)學(xué)院講師,研究方向?yàn)檎Z料庫語言學(xué)、計(jì)算語言學(xué)等,郵箱為lianzhuwang@126.com。

        2018年3月31日

        編輯:小米

        猜你喜歡
        人工智能人類智能
        人類能否一覺到未來?
        人類第一殺手
        1100億個(gè)人類的清明
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        成人片黄网站色大片免费观看cn| 亚洲av无码乱码国产麻豆| 白白在线视频免费观看嘛| 久久成人国产精品一区二区| 亚洲人成网线在线播放va蜜芽| 芒果乱码国色天香| 女性女同性aⅴ免费观女性恋| 国产一区二区激情对白在线| 精品人妻系列无码一区二区三区| 亚洲成A人A∨久在线观看| 免费人成网站在线播放| 精品久久人妻av中文字幕| 国产禁区一区二区三区| 欧美综合天天夜夜久久| 小宝极品内射国产在线| 欧性猛交ⅹxxx乱大交| 国产丝袜一区二区三区在线不卡| 精品黄色av一区二区三区| 国产精品国产三级国a| 手机在线看片国产人妻| 亚洲成av人片乱码色午夜| 久久精品国产亚洲av麻豆| 亚洲精品无码高潮喷水在线| 妺妺窝人体色www聚色窝韩国| 日本av在线精品视频| 久久综合五月天啪网亚洲精品| 职场出轨的人妻中文字幕| 久激情内射婷内射蜜桃人妖| 伊人精品无码AV一区二区三区| 中文字幕日韩一区二区不卡| 色久悠悠婷婷综合在线| 人妻少妇乱子伦精品| 久久久久亚洲精品无码网址| 超碰观看| 国产日产高清一区二区三区| 亚洲成人免费av影院| 久久久久久九九99精品| 一本大道久久香蕉成人网| 亚洲AV无码乱码1区久久| 五十路在线中文字幕在线中文字幕 | 老熟妇仑乱一区二区视頻|