湯麗拿
基于“人工智能+”的語(yǔ)言服務(wù)行業(yè)創(chuàng)新技術(shù)研究*
湯麗拿
(浙江長(zhǎng)征職業(yè)技術(shù)學(xué)院,浙江 杭州 310023)
人工智能技術(shù)的興起給語(yǔ)言服務(wù)行業(yè)的發(fā)展帶來(lái)了新挑戰(zhàn)。旨在分析人工智能背景下的語(yǔ)言服務(wù)行業(yè)發(fā)展趨勢(shì),在結(jié)合國(guó)內(nèi)外語(yǔ)言服務(wù)需求的基礎(chǔ)上,對(duì)語(yǔ)言服務(wù)中的創(chuàng)新技術(shù)應(yīng)用和策略進(jìn)行研究,尋找有效的互聯(lián)網(wǎng)翻譯技術(shù)及語(yǔ)言服務(wù)解決方案,推進(jìn)大數(shù)據(jù)、人工智能與語(yǔ)言服務(wù)的協(xié)同創(chuàng)新發(fā)展。
人工智能;語(yǔ)言服務(wù);翻譯技術(shù);語(yǔ)音識(shí)別
隨著社會(huì)語(yǔ)言服務(wù)需求的不斷增長(zhǎng),人們對(duì)語(yǔ)言服務(wù)行業(yè)發(fā)展的研究不僅包含國(guó)家層面上的總體戰(zhàn)略規(guī)劃,并且逐漸開(kāi)始向社會(huì)層面的各專業(yè)和業(yè)務(wù)領(lǐng)域深度發(fā)展研究延伸。語(yǔ)言服務(wù)行業(yè)涉及翻譯服務(wù)、本地化服務(wù)、語(yǔ)言技術(shù)工具開(kāi)發(fā)與應(yīng)用(機(jī)器翻譯MT與計(jì)算機(jī)輔助翻譯CAT)、語(yǔ)言教學(xué)與培訓(xùn)等眾多業(yè)務(wù)領(lǐng)域。
人工智能語(yǔ)言服務(wù)的出現(xiàn),突顯了全球化大數(shù)據(jù)背景下的語(yǔ)言信息特點(diǎn)以及翻譯智能技術(shù)平臺(tái)時(shí)代的來(lái)臨,未來(lái)即將是“一帶一路”的專業(yè)化語(yǔ)言服務(wù)和智能化翻譯需求激增的時(shí)代。目前國(guó)內(nèi)語(yǔ)言服務(wù)行業(yè)的發(fā)展趨勢(shì)和現(xiàn)狀是:語(yǔ)言服務(wù)人才市場(chǎng)供求失衡,語(yǔ)言服務(wù)人才培養(yǎng)體系不完善,翻譯技術(shù)和軟件運(yùn)用不足,語(yǔ)言類服務(wù)企業(yè)和高校的創(chuàng)新協(xié)同合作有待深入,網(wǎng)絡(luò)翻譯平臺(tái)的開(kāi)發(fā)與應(yīng)用研究需要新技術(shù)和新實(shí)踐等。
知識(shí)增長(zhǎng)和技術(shù)發(fā)展往往呈現(xiàn)交替加速發(fā)展的特點(diǎn),當(dāng)今尤其以云計(jì)算、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、5G等為代表的新技術(shù)正逐漸改變著人類生活的各個(gè)領(lǐng)域。人工智能技術(shù)正改變著智能制造、金融貿(mào)易、教育培訓(xùn)、公共事業(yè)、醫(yī)療應(yīng)用等各個(gè)行業(yè),并成為變革社會(huì)的重要推動(dòng)力。世界各國(guó)都高度重視發(fā)展人工智能,加強(qiáng)人工智能領(lǐng)域的技術(shù)研發(fā)和創(chuàng)新。2017年國(guó)務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》將發(fā)展人工智能作為國(guó)家重點(diǎn)發(fā)展戰(zhàn)略之一。2018年教育部印發(fā)的《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》中指出要加快人工智能在教育領(lǐng)域的創(chuàng)新應(yīng)用。
人工智能的應(yīng)用開(kāi)始涉及各行各業(yè)。目前,中國(guó)的人工智能在金融、安防、客服等行業(yè)領(lǐng)域已得到廣泛運(yùn)用。人工智能在語(yǔ)言服務(wù)行業(yè)的應(yīng)用主要是自然語(yǔ)言處理技術(shù)(NLP),它是計(jì)算機(jī)科學(xué)、人工智能、語(yǔ)言學(xué)關(guān)注計(jì)算機(jī)和人類(自然)語(yǔ)言之間的相互作用的領(lǐng)域,主要包括機(jī)器翻譯和語(yǔ)音識(shí)別技術(shù)。機(jī)器學(xué)習(xí)、語(yǔ)音識(shí)別、語(yǔ)義識(shí)別、圖像識(shí)別技術(shù)等不同形態(tài)的語(yǔ)言產(chǎn)品將不同程度地融入新的智能技術(shù)平臺(tái),未來(lái)語(yǔ)言服務(wù)業(yè)的發(fā)展無(wú)疑會(huì)進(jìn)入“語(yǔ)言智能+”的時(shí)代。語(yǔ)言智能的目標(biāo)是實(shí)現(xiàn)自然語(yǔ)言與機(jī)器語(yǔ)言的連續(xù)交互,是人工智能的高級(jí)階段,在未來(lái)人工智能的應(yīng)用上有著非常重要的作用。
人工智能翻譯技術(shù)的應(yīng)用在語(yǔ)言服務(wù)業(yè)中發(fā)揮著越來(lái)越重要的作用。傳統(tǒng)的簡(jiǎn)單機(jī)械的人工翻譯模式已經(jīng)無(wú)法適應(yīng)快速發(fā)展的市場(chǎng)需求,今后會(huì)逐漸被機(jī)器翻譯、語(yǔ)音識(shí)別技術(shù)和同步多語(yǔ)字幕翻譯技術(shù)、神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)所取代。
在新一代技術(shù)的影響下,翻譯產(chǎn)品也發(fā)生著巨大的變化。2018年底由騰訊AILab研制出的人工智能輔助翻譯產(chǎn)品TranSmart在業(yè)內(nèi)引起轟動(dòng)。騰訊交互翻譯TranSmart是一款面向人工翻譯場(chǎng)景的機(jī)器翻譯產(chǎn)品,也是業(yè)內(nèi)首個(gè)落地的交互式機(jī)器翻譯產(chǎn)品。該產(chǎn)品結(jié)合了騰訊AILab自主研發(fā)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、交互式機(jī)器翻譯、翻譯輸入法、翻譯記憶片斷復(fù)用技術(shù),配合億級(jí)雙語(yǔ)數(shù)據(jù),幫助用戶更快、更好地完成翻譯任務(wù)。針對(duì)人工翻譯市場(chǎng)現(xiàn)狀,特別加強(qiáng)了常見(jiàn)專業(yè)領(lǐng)域的翻譯性能,對(duì)于教育、合同、法律和專利等領(lǐng)域的文本效果尤為出色。
另外,針對(duì)2020年初的突發(fā)性全球新冠肺炎疫情,很多語(yǔ)言服務(wù)行業(yè)人士運(yùn)用自己的語(yǔ)言技能,服務(wù)于抗疫戰(zhàn)役,將中國(guó)寶貴的抗疫經(jīng)驗(yàn)通過(guò)多國(guó)文字及時(shí)地傳遞給全世界,讓更多的人能夠積極參與防疫抗疫。
一個(gè)機(jī)器翻譯矩陣Tmxmall為了給更多正在為抗疫出力的翻譯團(tuán)隊(duì)及相關(guān)人士提供技術(shù)便利,及時(shí)上線了聚焦于醫(yī)療的垂直領(lǐng)域機(jī)器翻譯引擎——阿里醫(yī)療機(jī)器翻譯。阿里醫(yī)療引擎是阿里云達(dá)摩院機(jī)器翻譯產(chǎn)品,能為譯者提供更加專業(yè)和準(zhǔn)確的醫(yī)療翻譯結(jié)果。該系統(tǒng)支持中英、英中、中日、日中及多語(yǔ)種互譯,并且支持YICAT企業(yè)版/團(tuán)隊(duì)版、Tmxmall MT Plugin、SDL Trados、memoQ中應(yīng)用。本次疫情期間,阿里也在不間斷地使用優(yōu)質(zhì)的疫情雙語(yǔ)語(yǔ)料來(lái)訓(xùn)練醫(yī)療機(jī)器翻譯引擎,幫助大家更加輕松高效地完成新冠肺炎疫情及醫(yī)療相關(guān)的翻譯工作。未來(lái),翻譯服務(wù)也將從通用領(lǐng)域的機(jī)器翻譯:谷歌翻譯、有道翻譯、云譯、騰訊翻譯君、搜狗翻譯、aws、阿里翻譯、小牛翻譯、DeepL、百度翻譯、Bling、Yandex等,拓展到更精準(zhǔn)更專業(yè)化方向的垂直領(lǐng)域機(jī)器翻譯。未來(lái)幾年,智能化的翻譯技術(shù)必將加速推進(jìn)語(yǔ)言服務(wù)行業(yè)的發(fā)展。人工智能背景下的語(yǔ)言服務(wù)必將是專業(yè)領(lǐng)域和業(yè)務(wù)領(lǐng)域深度融合發(fā)展的語(yǔ)言服務(wù)。
語(yǔ)音識(shí)別作為自然語(yǔ)言處理的關(guān)鍵技術(shù),被逐漸運(yùn)用于移動(dòng)終端,各種語(yǔ)音識(shí)別產(chǎn)品層出不窮。語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,通過(guò)語(yǔ)音信號(hào)處理和模式識(shí)別讓機(jī)器自動(dòng)識(shí)別人類口述的語(yǔ)言。
本次研究以大數(shù)據(jù)采集、抽取樣本的研究方法研究語(yǔ)音識(shí)別技術(shù)的創(chuàng)新應(yīng)用。以杭州好云教育科技有限公司提供的MyET語(yǔ)音識(shí)別軟件在浙江省高?;ヂ?lián)網(wǎng)聽(tīng)說(shuō)比賽系統(tǒng)中的運(yùn)用為實(shí)證研究,以大數(shù)據(jù)評(píng)價(jià)學(xué)生學(xué)習(xí)習(xí)慣的養(yǎng)成和在實(shí)踐過(guò)程中口語(yǔ)能力的變化情況。MyET自動(dòng)語(yǔ)音分析診斷技術(shù)(ASAS?,Automatic Speech Analysis System),擁有中國(guó)、英國(guó)、法國(guó)、德國(guó)、日本等九個(gè)國(guó)家及地區(qū)的發(fā)明專利(中華人民共和國(guó)專利第ZL02160031.7)。系統(tǒng)會(huì)根據(jù)語(yǔ)言學(xué)習(xí)四個(gè)要素——發(fā)音、語(yǔ)調(diào)、流利度、音量去分析學(xué)習(xí)者在口語(yǔ)上的問(wèn)題,并提出有效的口語(yǔ)改善建議。比賽收集的數(shù)據(jù)和報(bào)表包括以下幾種。
詳細(xì)成績(jī)報(bào)表(Score Details)數(shù)據(jù)內(nèi)容:在比賽期間中,系統(tǒng)會(huì)完整詳實(shí)記錄選手歷次進(jìn)行比賽刷分的信息,包含每次比賽刷分成績(jī)、比賽刷分次數(shù)、登錄比賽刷分時(shí)間點(diǎn)及每次完成比賽所花的時(shí)間。數(shù)據(jù)意義為教師可以從詳盡的成績(jī)數(shù)據(jù)中,了解每一位學(xué)生對(duì)大賽的投入程度,并看出學(xué)生在大賽實(shí)踐過(guò)程中口語(yǔ)能力(成績(jī))的變化。
統(tǒng)計(jì)報(bào)表(Statistics 1)比賽總時(shí)長(zhǎng)(Contest Duration)數(shù)據(jù)內(nèi)容:在比賽期間中,系統(tǒng)會(huì)自動(dòng)偵測(cè)每位選手每次進(jìn)入比賽與完成比賽當(dāng)中實(shí)際操作所花的時(shí)間,計(jì)算出選手實(shí)際投入在比賽模塊的總在線時(shí)間。數(shù)據(jù)意義為教師可以了解每位學(xué)生總共花了多少時(shí)間在進(jìn)行比賽,看出通過(guò)大賽是否能有效激發(fā)學(xué)生的學(xué)習(xí)熱情,啟發(fā)學(xué)習(xí)的積極主動(dòng)性。
課程學(xué)習(xí)總時(shí)長(zhǎng)(Accumulated Learning Time)數(shù)據(jù)內(nèi)容:每位參賽選手將獲得一組MyET課程包,選手可在比賽期間進(jìn)行課程練習(xí),系統(tǒng)會(huì)自動(dòng)偵測(cè)并計(jì)算每位選手使用課程內(nèi)各學(xué)習(xí)模塊(包含單句練習(xí)、角色扮演、強(qiáng)化練習(xí)、自我檢定、跟讀、復(fù)誦等)進(jìn)行自主學(xué)習(xí)的總體時(shí)間。數(shù)據(jù)意義為教師可以了解每位學(xué)生在課堂外,花了多少時(shí)間在進(jìn)行口語(yǔ)課程的自主學(xué)習(xí),有效增加了多少口語(yǔ)學(xué)時(shí)。
以學(xué)校為單位的分析報(bào)表(Analysis by school)數(shù)據(jù)內(nèi)容:在比賽期間中,同一場(chǎng)比賽里,報(bào)表會(huì)呈現(xiàn)每所參賽學(xué)校的總參賽人數(shù)、每所學(xué)校參賽選手總刷分次數(shù)、每所學(xué)校參賽選手總刷分時(shí)間。數(shù)據(jù)意義為教師可以了解在比賽中,各學(xué)校對(duì)比賽投入程度及自己學(xué)校的學(xué)生在比賽的總體表現(xiàn)程度。
刷分時(shí)段分析報(bào)表(Analysis by Time Slots)數(shù)據(jù)內(nèi)容:在比賽期間中,報(bào)表會(huì)呈現(xiàn)全體選手刷分時(shí)段的分布統(tǒng)計(jì)。數(shù)據(jù)意義為教師可以了解學(xué)生上線時(shí)間分布,看出學(xué)生習(xí)慣在哪些時(shí)間段內(nèi)學(xué)習(xí),體現(xiàn)通過(guò)大賽是否有效地幫助學(xué)生養(yǎng)成學(xué)習(xí)習(xí)慣及妥善運(yùn)用碎片化時(shí)間學(xué)習(xí)。
在人工智能語(yǔ)言服務(wù)改變?nèi)祟惤?jīng)濟(jì)社會(huì)生活方式的新形勢(shì)下,抓住機(jī)遇,努力進(jìn)行技術(shù)創(chuàng)新變革,逐步建立語(yǔ)言服務(wù)行業(yè)規(guī)范及標(biāo)準(zhǔn),培養(yǎng)新一代創(chuàng)新技術(shù)應(yīng)用人才是當(dāng)前語(yǔ)言服務(wù)行業(yè)發(fā)展的當(dāng)務(wù)之急。
[1]蔡自興.人工智能及其應(yīng)用[M].北京:清華大學(xué)出版社,2016.
[2]羅華珍,潘正芹,易永忠.人工智能翻譯的發(fā)展現(xiàn)狀與前景分析[J].電子世界,2017(21):21-23.
[3]王華樹(shù).語(yǔ)言服務(wù)的協(xié)同創(chuàng)新與規(guī)范發(fā)展——2016中國(guó)語(yǔ)言服務(wù)業(yè)大會(huì)暨中國(guó)譯協(xié)年會(huì)綜述[J].中國(guó)翻譯,2017(1):85-88.
[4]2016中國(guó)語(yǔ)言服務(wù)行業(yè)發(fā)展報(bào)告[R].中國(guó)翻譯協(xié)會(huì),2016.
2095-6835(2020)20-0125-02
H059
A
10.15913/j.cnki.kjycx.2020.20.053
湯麗拿(1979—),女,浙江杭州人,碩士研究生,副教授,研究方向?yàn)檎n程與教學(xué)論。
2018年上海外語(yǔ)教育出版社全國(guó)高校外語(yǔ)教學(xué)科研項(xiàng)目“人工智能背景下語(yǔ)言服務(wù)行業(yè)發(fā)展策略研究”(編號(hào):2018ZJ0038B)課題成果
〔編輯:嚴(yán)麗琴〕