高思暢
正確率為87%的谷歌翻譯,你見過嗎?
“松下問童子”該怎么翻譯成英文?一位網(wǎng)友將這句話輸入了谷歌翻譯,跳出來的回答是“Panasonic asked the boy”。這樣令人哭笑不得的神翻譯,相信你在使用谷歌翻譯、百度翻譯等人工智能翻譯服務(wù)的時候也碰到過吧?
雖然機器翻譯經(jīng)常被吐槽不夠準(zhǔn)確,科學(xué)家們對人工智能技術(shù)的研究可是一點也沒松懈。2016年9月28日,谷歌正式推出神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)(Google Neural Machine Translation,簡稱GNMT),采用最先進(jìn)的神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù),將翻譯準(zhǔn)確率提高到了87%。這樣的科技進(jìn)步,我們還是要好好鼓掌一下的!
除了谷歌、百度、科大訊飛等專門設(shè)有研究語音識別和自然語言處理的機構(gòu),其他領(lǐng)域的機構(gòu)也紛紛開始將語音識別運用到實踐中。匯豐銀行(HSBC)發(fā)起的一項通過語音生物識別(Voice Biometrics)技術(shù)對用戶賬戶進(jìn)行安全保障的研究,研究的基礎(chǔ)正是因為我們每一個人的聲音和我們的指紋一樣都具有特殊性。我們的言語,可以作為我們的身份識別標(biāo)志,因此,未來的生活、工作、儲蓄可能都可以通過聲音特征來啟動。
然而,當(dāng)我們?yōu)槿斯ぶ悄艿挠忠淮瓮黄茪g欣鼓舞,感嘆人類智慧的發(fā)展,期待人工智能大幅度改善人類未來的同時,一些語言學(xué)家開始預(yù)測,互聯(lián)網(wǎng)、計算機、手機等電子化工具的使用不僅會帶來新詞語,也會改變?nèi)祟愓Z言。
就在谷歌推出GNMT后的第二天,英國《每日郵報》的一則新聞引起了不少人的注意。報道稱,隨著科技不斷進(jìn)步,聲音識別將成為我們與機器互動的主要方式之一。但是,正是由于未來人機互動會成為人們生活、工作的主導(dǎo)方式,科技的進(jìn)步將會導(dǎo)致人類語言的改變。社會語言學(xué)家Watt教授預(yù)測,在2066年,各國語言中的部分發(fā)音將會逐漸減少甚至被取代,例如英文中的齒間音“th”將會被“f”“d”或者“v”取代, 也就是說,“mother”會變成 “muvver”, “thick”可能會變成 “fick”,當(dāng)我們想表達(dá)“what do you think of this”時,我們說的是“what do you fink of dis”。
事實上,電子化工具對人類語言的改變早就引起了語言學(xué)家的關(guān)注,“OMG”已經(jīng)出現(xiàn)在了牛津詞典里,去年,“LOL”也正式進(jìn)入了牛津詞典,表情符號的使用在人類溝通中已經(jīng)不可或缺。就在不久前,微信里還流行過一個“24小時不使用表情符號”的活動。然而,在5000多名參與者中,超過30%的人失敗了,23萬字的報告被戲稱為“血淚報告”。大家紛紛表示:“太難了!”“習(xí)慣太難改變了!”“不使用表情使我經(jīng)常在對話中感到尷尬。”
這是科技發(fā)展對我們?nèi)祟悤鴮懥?xí)慣的一次沖擊,但是語言學(xué)家們依然信心滿滿,他們認(rèn)為,只有超過十年時間長度的考驗,才能決定這些表情符號、特殊表達(dá)能否最終進(jìn)入我們的語言系統(tǒng)?!癘MG”在1917年就第一次出現(xiàn)在了報紙上,但是直到最近才出現(xiàn)在牛津詞典里。
第二次沖擊,無疑就是人機互動、語音識別技術(shù)可能帶來的對人類發(fā)音習(xí)慣的改變。聲音識別是我們與機器互動的主要方式之一,然而語音識別技術(shù)的局限性導(dǎo)致機器只能識別某幾類發(fā)音,例如機器無法識別齒間音“th”,但是對“f”和“v”這樣的唇齒音卻有著良好的識別機制,所以,機器語音識別逆向影響了人類的發(fā)音方式。千百年來,語言的發(fā)展、變化、消亡、借用本身就是自然而然的發(fā)展過程,而現(xiàn)在,最新一代的改變,要由機器來觸發(fā)了。
如果真的發(fā)生了這樣的改變,對我們語言系統(tǒng)的影響是積極的還是消極的呢?現(xiàn)階段語音識別中,最困難的不是對個別語音的識別,而是對自然語言中節(jié)奏、韻律的識別,以及當(dāng)一個句子的節(jié)奏和韻律有著微弱的區(qū)別導(dǎo)致意義完全不同時的識別。比如,“我看見她很高興”,停頓在“她”后面和“她”前面,兩句話的意義就完全不同。當(dāng)“你大爺”的“爺”字分別輕讀和重讀時,意義也完全不同。每個人都有著自己說話時的抑揚頓挫、輕重緩急、情緒變化不同表現(xiàn),這些都是機器難以攻克的難題。即便聰慧如Siri,在說話時,依然有著明顯的“機器口音”,不可避免地“一字一頓”,就像是我們坐公交車時聽到的語音報站“下、一、站、北、京、大、學(xué)、東、門”。如果節(jié)奏和韻律是機器難以識別的部分,那人類是不是要改變說話方式,抹去語言中的情緒和抑揚頓挫來適應(yīng)機器的識別機制呢?以后我們說話會不會也變成“你、好、我、叫、王、小、虎”嗎?
所幸,這樣的改變并不會發(fā)生。世界上所有的語言系統(tǒng)都有著自己的穩(wěn)定性,人工智能的發(fā)展可能會帶來語音層面上的部分改變,而這樣的改變可能即便不由人工智能的發(fā)展也會隨著人口大規(guī)模遷移、不同國家人口流動而逐漸發(fā)生改變,單詞發(fā)音結(jié)構(gòu)可能會簡化,“th”可能會被“d”代替,甚至單詞會變得更短,“thanks”變成“danks”。但是,語言中穩(wěn)定的部分,如語音系統(tǒng)、韻律結(jié)構(gòu)、語義結(jié)構(gòu)、句法系統(tǒng)并不會由此而發(fā)生改變。
語言作為人類進(jìn)行溝通和交流的符號,履行著符號需要完成的功能——充分地表達(dá)、傳遞人類思維和感情。符號的簡化(如漢字繁體字向簡體字的轉(zhuǎn)變)可以發(fā)生,但是符號的功能并不會被簡化。科技會改變?nèi)祟惖恼Z言,但是不會改變?nèi)祟惖乃季S和情感。