提 要 中國語言產(chǎn)業(yè)的歷史進程可概括為三次浪潮:第一波約始于1990年,是傳統(tǒng)語言產(chǎn)業(yè)的快速增長期;第二波約始于2000年,是語言信息技術(shù)產(chǎn)業(yè)的興盛期;第三波約始于2010年,是“語言信息技術(shù)平臺(互聯(lián)網(wǎng)、智能手機、語言智能)+語言產(chǎn)業(yè)”的發(fā)展期。三次浪潮前后呼應(yīng)、彼此融合,每一波發(fā)展都以某種方式匯入新的浪潮之中。第一次浪潮主要由社會開放所致,第二、三次浪潮則為語言信息技術(shù)革命所引領(lǐng)。未來語言產(chǎn)業(yè)將是“人工語言智能+語言產(chǎn)業(yè)”的時代。
關(guān)鍵詞 當代中國語言產(chǎn)業(yè);傳統(tǒng)語言產(chǎn)業(yè);語言信息產(chǎn)業(yè);智能語言產(chǎn)業(yè)
Abstract Chinas Language Industry has witnessed three waves of development in the past three decades. The first wave appeared in around 1990, a time when the traditional Language Industry experienced a rapid expansion. The second wave started in around 2000, a time often seen as the rise of Language Information Industry. The third wave arrived in around 2010, a period when “l(fā)anguage information technology platforms” (e.g., internet, cell phones and language intelligence) became a major media for press, education and speech synthesis. The three waves are three continuous developmental phases, showing the upgrading trajectory of the language industry in China. With regard to the driving forces of such developments, this paper contends that the first wave can be attributed to the opening up of the Chinese society, while the second and the third waves are the results of the revolution of Language Information Technology. It is predicted that the next phase in China will be “Artificial Intelligence plus Language Industry” .
Key words contemporary Chinas Language Industry; traditional Language Industry; Language Information Industry; Intelligence Language Industry
一、前言:中國語言產(chǎn)業(yè)的興起
在國內(nèi),大約自2010年起,語言產(chǎn)業(yè)概念開始引起比較廣泛的關(guān)注。我們把語言產(chǎn)業(yè)概念初步界定為生產(chǎn)各種語言產(chǎn)品或提供各種語言服務(wù)的規(guī)模化的產(chǎn)業(yè)形態(tài)。語言產(chǎn)品則是以語言為內(nèi)容、材料,或是以語言為加工、處理對象的產(chǎn)品形態(tài)。目前,較為典型的語言產(chǎn)業(yè)業(yè)態(tài)主要包括語言翻譯、語言文字信息處理、語言培訓(xùn)、語言出版、語言能力測評等(賀宏志、陳鵬 2012)。在德國語言技術(shù)中心(The Language Technology Center)提供,歐盟翻譯總司2009年發(fā)布的《歐盟語言產(chǎn)業(yè)規(guī)模研究報告》(Study on the Size of the Language Industry in the EU)中,語言產(chǎn)業(yè)業(yè)態(tài)主要包括8個領(lǐng)域:筆譯、口譯、語言技術(shù)工具、語言教學(xué)、字幕翻譯和配音、軟件本地化、網(wǎng)站全球化和會議組織及咨詢,其概念內(nèi)涵是以語言翻譯及本地化服務(wù)為核心。本文采用的則是以語言產(chǎn)品供給為核心的外延更加廣泛的語言產(chǎn)業(yè)概念,它在邏輯上包含相關(guān)的所有業(yè)態(tài)。
從語言產(chǎn)業(yè)研究的角度看,語言產(chǎn)業(yè)及其相關(guān)的語言服務(wù)概念興起于歐美。1999年1月美國語言學(xué)學(xué)會第73屆年會的主題定為:“語言事業(yè):未預(yù)料到的機會”(Linguitic Enterprises: Unexpected Opportunities)。在此次年會上,斯坦福大學(xué)語言學(xué)教授、語音學(xué)家Williame Leben做了題為“命名產(chǎn)業(yè)”(The Naming Industy)的專題學(xué)術(shù)報告。美國語言行業(yè)協(xié)會(the Association of Language Companies,ALC)于2004年起發(fā)布年度語言服務(wù)行業(yè)調(diào)查報告。美國卡門森公司(Common Sense Advisory,CSA)自2005年起發(fā)布《語言服務(wù)全球市場年度報告》(Annual Survey on the Global Language Services and Technology Market),據(jù)2005年年度報告顯示,當年全球外包語言服務(wù)市場總額預(yù)計達88億美元,報告按年均增長率7.5%估算,2006年將達90億美元,2010年將達120億美元。報告發(fā)布了全球35強語言服務(wù)企業(yè)名單及其簡介,中國的海輝公司、統(tǒng)一數(shù)位翻譯和傳神聯(lián)合信息技術(shù)公司榜上有名。在歐洲,瑞士語言經(jīng)濟學(xué)家弗朗斯瓦·格林教授及其團隊2008年的研究表明,語言產(chǎn)業(yè)每年為瑞士約創(chuàng)造500億瑞士法郎的收入,約占瑞士國內(nèi)生產(chǎn)總值的10%。瑞士有著獨特的語言政策和語言環(huán)境,德語、法語、意大利語、羅曼什語四種語言都被認定為官方語言,瑞士還是眾多重要國際機構(gòu)的所在地,巨大的語言需求促成了這樣的產(chǎn)業(yè)規(guī)模(李宇明 2012)?!稓W盟語言產(chǎn)業(yè)規(guī)模研究報告》顯示,2008 年歐盟成員國的語言市場總產(chǎn)值達84 億歐元,該報告當時預(yù)測,歐盟2015年語言市場產(chǎn)值可達到165 億歐元。①
從實際的語言經(jīng)營活動來說,語言培訓(xùn)、語言出版、語言翻譯、語言測試早已有之,但國內(nèi)這些經(jīng)營活動開始被稱為規(guī)?;恼Z言產(chǎn)業(yè),應(yīng)該是在20世紀90年代之后。概念反映總比實際事件要滯后一些,從21世紀起,這個業(yè)態(tài)系統(tǒng)開始作為語言產(chǎn)業(yè)引起人們的關(guān)注,國內(nèi)開始有人提及語言產(chǎn)業(yè)的概念。2010年前后語言產(chǎn)業(yè)概念開始受到較大范圍的關(guān)注,一些研究機構(gòu)成立,一系列研究成果產(chǎn)生(李宇明 2004;黃少安等 2012)。這在一定程度上是因為受到了國外數(shù)據(jù)信息輸入的影響,但在根本上是國內(nèi)語言產(chǎn)業(yè)發(fā)展到一定程度的自然結(jié)果。隨著改革開放的歷史進程,語言的基礎(chǔ)性地位、社會文化地位以及市場地位日益突顯,各方面的語言需求被激發(fā)出來,中國規(guī)?;恼Z言產(chǎn)業(yè)才得以呈現(xiàn)。概括起來,主要有以下幾個方面:
其一,社會的開放與流動激發(fā)語言需求。新時期以來中國社會進入一個全新的快速發(fā)展期,隨著社會開放程度和活躍程度的加強,語言在社會交往和經(jīng)濟發(fā)展中的作用日益突顯,開放、流動的社會對個人和團體的語言交往不斷提出新的要求。
其二,市場化進程促使語言能力成為一種重要的競爭力。從個體說,語言技能成為一種重要的人力資本,它是個體職業(yè)競爭力的重要組成部分。從企業(yè)說,語言能力(企業(yè)的命名、宣傳、網(wǎng)站、廣告語言設(shè)計、說明書等)是一個企業(yè)的重要競爭力(徐大明 2010)。
其三,語言類考試的剛性地位決定了語言經(jīng)濟活動最基本的市場地位。在新的職前職后教育體系中,語文、英語以及其他語言類考試占有相當重要的地位,考試結(jié)果直接關(guān)乎升學(xué)、就業(yè)、升職、出國等,由此帶來強勁不衰的語言學(xué)習(xí)需求??鋸堃稽c說,改革開放以來第一輪語言產(chǎn)業(yè)的興起就是由兩類語言考試決定的,一類是與升學(xué)有關(guān)的中高考中的語文、英語類考試;一類是與出國有關(guān)的托福、GRE、雅思等考試。
其四,國際化、全球化進程激發(fā)外語需求。隨著全球化進程的不斷深入,各種形式的跨國交流日益頻繁,多語交際能力已成為國家、單位和個人語言能力的重要組成部分。個人和單位出國學(xué)習(xí)、工作、交流、旅游等需求不斷增加,逐漸引發(fā)了一個包括語言培訓(xùn)、語言翻譯、語言出版、語言測試等業(yè)態(tài)的具有相當規(guī)模的語言產(chǎn)業(yè)。
其五,信息化導(dǎo)致新型語言產(chǎn)業(yè)的興起。語言技術(shù)特別是語言信息技術(shù)的發(fā)展,改變了語言學(xué)習(xí)和應(yīng)用的傳統(tǒng)方法,造就了新型語言產(chǎn)業(yè),使語言產(chǎn)業(yè)可以在全新技術(shù)平臺上實現(xiàn)新的整合和繁榮。
其六,綜合國力的提升促使?jié)h語的國際化需求迅速增長。海內(nèi)外以漢語為母語的人大約有13億,漢語是世界上使用人口最多的語言之一,中國綜合國力和國際地位的提升,使?jié)h語具有更重要的文化地位和經(jīng)濟地位,越來越多的外國人、外國企業(yè)開始重視漢語。漢語水平考試已成為世界上最重要的第二語言或外語水平測試之一,美國等許多國家已把漢語作為主要外語納入國民教育體系。
上面的因素聚合起來,加上國內(nèi)的人口規(guī)模和市場規(guī)模,中國語言產(chǎn)業(yè)的興起和持續(xù)增長就成了必然。其中,全球化(多語需求)和信息化(語言技術(shù)進步)是兩個最重要的引擎(李宇明 2011)。
值得注意的是,從全球視野看,并非先有一個全球的語言產(chǎn)業(yè),然后中國的語言產(chǎn)業(yè)才在它的刺激和影響下興起,實質(zhì)上是,伴隨著中國社會、經(jīng)濟的市場化、全球化、信息化進程,中國語言產(chǎn)業(yè)的興起勢在必行,中國的市場地位、市場規(guī)模以及漢語人口、漢語文化的地位就決定了中國語言產(chǎn)業(yè)的市場地位。當然,我們并不否認國外語言產(chǎn)業(yè)和語言服務(wù)業(yè)對中國語言產(chǎn)業(yè)的積極影響。
近30年,中國語言產(chǎn)業(yè)的發(fā)展勢頭一浪高過一浪,表現(xiàn)為三次浪潮。三次浪潮不同于三個發(fā)展階段,它們是前一波推著后一波,后一波在某種程度上疊加了前一波的內(nèi)容,或者說每一波都以某種方式匯入到新的浪潮之中。
二、第一次浪潮(1990年起):傳統(tǒng)語言產(chǎn)業(yè)的發(fā)展
傳統(tǒng)語言產(chǎn)業(yè)業(yè)態(tài)主要包括語言培訓(xùn)(面對面課堂培訓(xùn))、語言出版(紙質(zhì)圖書)、語言翻譯(人口翻譯)、語言測試(卷面測試)等,它是指語言信息技術(shù)廣泛應(yīng)用之前的語言產(chǎn)業(yè)形態(tài)。改革開放以后,市場經(jīng)濟快速發(fā)展,對外開放程度不斷增加,個人和單位的各類語言需求被空前地激發(fā)出來,因而導(dǎo)致了中國語言產(chǎn)業(yè)的第一波發(fā)展,這一波發(fā)展的主體是傳統(tǒng)語言產(chǎn)業(yè)。在這一波發(fā)展中,外語需求最為顯著:一類是個人的外語學(xué)習(xí)和外語考試需求,它的目標是提升個人的外語能力;一類是企業(yè)的外語需求,無論是中方企業(yè)“走出去”,還是外方企業(yè)“走進來”,都需要專業(yè)的多語種服務(wù)。以下分別從培訓(xùn)、出版和測試三個方面加以扼要說明。
(一)語言培訓(xùn)
自1990年以來,在培訓(xùn)需求的不斷刺激下,中國培訓(xùn)市場產(chǎn)生了多元化的產(chǎn)品結(jié)構(gòu),以語言培訓(xùn)、電腦培訓(xùn)和中小學(xué)生課外培訓(xùn)為三大支柱。中國語言培訓(xùn)自20世紀末開始進入快速增長期,比如,外語培訓(xùn)第一企業(yè)的新東方教育科技集團于1993年11月成立;1994年,李陽創(chuàng)辦國際英語推廣工作室,開啟了“瘋狂英語”的培訓(xùn)產(chǎn)業(yè)進程;著名英語培訓(xùn)機構(gòu)華爾街英語于2000年進入中國培訓(xùn)市場。1995年以后,語言培訓(xùn)業(yè)市場規(guī)模每年以20%左右的速度遞增;2010 年,中國語言培訓(xùn)行業(yè)產(chǎn)值已達 300 億元,到 2016 年中國語言培訓(xùn)行業(yè)產(chǎn)值超過800億元。①
新東方的發(fā)展歷程可以看作語言培訓(xùn)在這一波發(fā)展中的縮影。1993年俞敏洪創(chuàng)辦了北京市新東方學(xué)校。1995年底新東方學(xué)員突破1.5萬人次。1998年新東方英語人才培訓(xùn)體系初具規(guī)模并建立實用英語學(xué)院。到2000年,新東方學(xué)校就已經(jīng)占據(jù)了北京約80%、全國50%的出國外語培訓(xùn)市場。2003年成立新東方教育科技集團,2006年在紐約證券交易所正式上市,成為中國大陸在美國上市的第一家教育培訓(xùn)機構(gòu)。
(二)語言出版
語言出版的快速增長也出現(xiàn)在20世紀90年代后半段。外研社是中國最大的外語出版機構(gòu),也是全國規(guī)模最大的大學(xué)出版社,被認為是“英語圖書市場上真正意義的產(chǎn)業(yè)領(lǐng)導(dǎo)者”,其出版地位很大程度上就是靠這一階段的迅猛發(fā)展來奠定的。從1991年到2005年,外研社發(fā)行碼洋從1000多萬元增長到13億元。目前,它旗下有九大分社、12個獨立法人企業(yè),以及分布全國的16個信息中心?!队⒄Z周報》的輝煌歷程更是報業(yè)出版的一個傳奇,這個誕生于山西師范大學(xué)的曾經(jīng)的英語小報,自20世紀90年代以后,每年的發(fā)行量都上一個新臺階,1995年他們在同行業(yè)中率先自辦發(fā)行網(wǎng)絡(luò),創(chuàng)新發(fā)行體制,至2000年它的期發(fā)行量已突破千萬。2006年,《英語周報》達到1600多萬份的期發(fā)行量巔峰,此后開始下降。同樣誕生于山西師范大學(xué)的《語文報》系列產(chǎn)品覆蓋了語文教學(xué)的各個層次,它鼎盛時期的期發(fā)行量也逾500萬份。綜合書、報、刊,保守估計,2005年全國語言出版的產(chǎn)值應(yīng)該接近100億。
(三)語言測試
由于升學(xué)、出國、評職稱等的剛性需求,相關(guān)語言測試也就越來越火爆。托福、雅思、GRE等在中國市場不斷膨脹;英語四、六級的考生規(guī)模也是逐年遞增。同時,隨著中國經(jīng)濟實力的不斷提高以及“軟實力”的增長,“漢語熱”開始在全世界范圍流行開來,對外漢語測試也發(fā)展迅速。可以說,各種語言測試的不斷發(fā)展催生了一個新型測試產(chǎn)業(yè)。
據(jù)《中國教育考試年鑒》,“十一五”規(guī)劃(2006—2010)期間,參加海外考試的考生達到455萬人,相當于 “十一五”規(guī)劃前整個海外考試歷年考生人數(shù)總和的1.4倍。以雅思考試為例,自1989年雅思進入中國,迄今已28年,參加雅思考試的中國考生數(shù)量逐漸遞增(見圖1)。據(jù)統(tǒng)計,2013年共有超過35萬人次在中國參加雅思考試。
另一個大規(guī)模的英語類考試是大學(xué)英語四、六級考試,該考試于1987年開始,當時每年只有10萬人次,至2000年就已發(fā)展到500萬人次,2010年接近1800萬人次。與此同時,海外漢語水平測試(HSK)的規(guī)模也逐年增加:2008年,海外考試規(guī)模為67 558人次,到2009年為76 088人次,增長幅度為12.63%(羅民等 2011)。
總體上說,傳統(tǒng)語言產(chǎn)業(yè)的這一波發(fā)展浪潮大致起于1990年,在2005年前后達到高峰。之后,它雖然仍有一定的規(guī)模性增長,但從宏觀上來看,傳統(tǒng)形態(tài)的語言產(chǎn)業(yè)已經(jīng)增長乏力,如紙質(zhì)出版、面對面的課堂培訓(xùn)、人工翻譯以及卷面測試等產(chǎn)業(yè)形態(tài)已經(jīng)不可能對語言產(chǎn)業(yè)的內(nèi)部結(jié)構(gòu)產(chǎn)生根本性影響,也很難激發(fā)出新一輪的語言需求。
語言產(chǎn)業(yè)的發(fā)展并未止息,與這一波浪潮相隔不久,由于語言信息技術(shù)的全面開發(fā)和應(yīng)用,語言產(chǎn)業(yè)很快迎來了新的興盛時期。
三、第二次浪潮(2000年起):語言信息技術(shù)產(chǎn)業(yè)的興盛
中國是幸運的,近30余年中國產(chǎn)業(yè)的發(fā)展趕上了信息化和全球化雙重歷史機遇,在這個歷史進程中,信息技術(shù)和信息產(chǎn)業(yè)塑造了全球產(chǎn)業(yè)的基本結(jié)構(gòu)和總體走向。對于語言產(chǎn)業(yè)來說,信息技術(shù)的影響直接且深刻,因為任何一種語言技術(shù)都是信息技術(shù),反過來,信息技術(shù)的基礎(chǔ)性領(lǐng)域還是語言技術(shù)。傳統(tǒng)的語言技術(shù)不過是紙、筆、圖書,再好一點的就是打字機、話筒、錄音機、投影儀之類,而隨著計算機、網(wǎng)絡(luò)平臺和移動終端技術(shù)的產(chǎn)生和發(fā)展,語言技術(shù)也迎來它的信息化時代,使得我們習(xí)得語言、運用語言的方式均發(fā)生了革命性的變化。如果說語言產(chǎn)業(yè)的第一次浪潮主要是社會開放、語言交往的直接需求所導(dǎo)致的,那么語言產(chǎn)業(yè)的第二次浪潮則是語言信息技術(shù)革命所引領(lǐng)的。
簡要地說,語言信息技術(shù)是運用計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)字化技術(shù)以及移動技術(shù)等現(xiàn)代信息技術(shù)來處理自然語言的技術(shù)。從語言要素的角度,語言信息技術(shù)大致可以分為以下幾種類型:(1)語料技術(shù):對語言材料(字詞、語段、語篇等)進行分類、整理、檢索、貯存等處理的技術(shù);(2)語形技術(shù):將文字作為圖形的信息處理技術(shù),如文字輸入、語形識別等;(3)語音技術(shù),對語音進行信息處理的技術(shù),如語音識別、語音合成等;(4)語義技術(shù),對自然語言進行內(nèi)容處理的信息技術(shù),如機器翻譯、自動文摘、人機對話等,語義技術(shù)是人工智能的關(guān)鍵環(huán)節(jié);(5)語言綜合處理技術(shù),如語言能力測評、語言機能康復(fù)等。因此,所謂語言信息技術(shù)產(chǎn)業(yè)就是運用計算機、網(wǎng)絡(luò)等信息技術(shù)對自然語言進行信息化處理和運用的產(chǎn)業(yè)形態(tài),在這個產(chǎn)業(yè)形態(tài)中,語言信息技術(shù)及設(shè)備本身就是語言產(chǎn)品。以下我們以輸入法、智能翻譯、語音處理為代表來描述這一波語言信息產(chǎn)業(yè)的新浪潮。
(一)輸入法產(chǎn)業(yè)
從20世紀80年代中期到90年代末,中文信息處理研究進入了一個萬“碼”奔騰的時期。在聯(lián)想漢卡、四通中文電腦打字機之后,五筆字型、鄭碼、自然碼、智能ABC、拼音輸入法等不斷涌現(xiàn)。也正是從這個時期開始,中國的漢字輸入法產(chǎn)業(yè)逐漸形成規(guī)模,進入了繁榮發(fā)展期。進入21世紀以后,輸入法從電腦時代進入手機時代,迎來了新一輪爆炸式增長。工信部的統(tǒng)計數(shù)據(jù)顯示,2001年,中國手機用戶1.45億,此后幾乎每年都以近億的速度快速增長,截至2014年5月底,中國的手機用戶數(shù)量已達到12.56億人,相當于中國90.8%的人都在使用手機,其中手機網(wǎng)民的規(guī)模十分驚人(見圖2)。2015年,中國手機市場銷量3.86億部,再加上個人電腦每年近億的出貨量,這樣的數(shù)量意味著龐大的輸入法市場。有人估計,基于輸入法整合的手機應(yīng)用平臺所產(chǎn)生的相關(guān)收入將高達8000億元。①
十多年之前,80%以上的手機植入的漢字輸入法的知識產(chǎn)權(quán)屬于外國公司,中國企業(yè)每年需為此支付6億至7億元專利費,被稱為“洋碼奔騰”。經(jīng)過十多年的努力,這種情況已大有改觀。搜狗、百度、訊飛、QQ等輸入法均表現(xiàn)不俗,搜狗輸入法在2009年的裝機量已過億。作為首家支持語音輸入的輸入法,豐富的語音功能已成為訊飛輸入法的獨特標志。近期,訊飛輸入法的語音識別率提升至98%,可以適應(yīng)不同場景,不同語速、音高,而且支持21種方言,訊飛輸入法越來越受到用戶的青睞。在移動互聯(lián)領(lǐng)域,訊飛輸入法用戶達4億。③
(二)智能翻譯產(chǎn)業(yè)
傳統(tǒng)翻譯是人工翻譯,主要是口譯和筆譯。計算機的出現(xiàn)促使人們探索新的翻譯技術(shù),可以稱之為機器翻譯。到20世紀70年代,機器翻譯的技術(shù)日趨成熟,基于統(tǒng)計和實例的機器翻譯逐漸替代了過去簡單的語言字面轉(zhuǎn)換。最近二三十年來,隨著計算語言學(xué)的發(fā)展,計算機處理語言的能力不斷增強,翻譯技術(shù)有了顯著的發(fā)展和進步。最新的翻譯技術(shù)已經(jīng)是計算機輔助翻譯、翻譯語料庫、大數(shù)據(jù)、云翻譯、語音語義處理等的信息技術(shù)整合,可以稱之為智能翻譯。智能翻譯技術(shù)對傳統(tǒng)翻譯形成很大沖擊,當前幾乎再也找不到一家大型翻譯公司可以完全依賴于傳統(tǒng)作坊式的翻譯模式而成功運作。在此,我們以文思海輝和中國傳神兩家公司為例簡要描述這一歷程。
1995年,文思海輝公司成立。隨著第一批跨國科技企業(yè)陸續(xù)進入中國,IT服務(wù)市場開始出現(xiàn)語言翻譯服務(wù)需求,文思海輝抓住機遇,將公司的語言服務(wù)從最初單一的中文擴充到如今囊括亞、非、拉、歐美主要語種的147種語言,從基礎(chǔ)的語言翻譯擴展到如今涵蓋本地化咨詢、技術(shù)研發(fā)、內(nèi)容翻譯和營銷、測試、語音轉(zhuǎn)錄、商務(wù)會議同傳等一站式服務(wù)體系;服務(wù)團隊從最初的20人發(fā)展到今天分布在100多個國家的10 000多人。其產(chǎn)值從2009年9億美元提高到2013的36億美元。美國著名語言調(diào)查機構(gòu)卡門森公司的研究顯示,2009至2016年,文思海輝連續(xù)八年入選“全球語言服務(wù)企業(yè)25強”,位列中國第一、全球第十六。
2005年3月,傳神公司成立,同年成功開發(fā)中國首個基于互聯(lián)網(wǎng)的協(xié)同翻譯及流程管理平臺系列軟件。2010年,傳神公司打造“云翻譯服務(wù)平臺”,公司總部正式遷入武漢,建立中國第一家翻譯產(chǎn)業(yè)園——“全球多語言處理中心”。公司通過互聯(lián)網(wǎng)技術(shù)和產(chǎn)品建立網(wǎng)絡(luò)化的語言服務(wù)平臺——“語聯(lián)網(wǎng)”,該平臺整合中國乃至全球的個人譯員和翻譯機構(gòu)等各種翻譯資源,將用戶的語言需求分類聚合,借助語聯(lián)網(wǎng)平臺的智能基因匹配技術(shù),將需求和產(chǎn)能進行快速精準的分層對接,向用戶輸出各種不同種類的高質(zhì)量的語言服務(wù)或產(chǎn)品。2012年產(chǎn)值突破80億元。據(jù)市場調(diào)查報告顯示:目前傳神(中國)網(wǎng)絡(luò)技術(shù)有限公司已經(jīng)成為亞洲第七、全球第三十三的語言服務(wù)供應(yīng)商。傳神公司表示,計劃用3年時間,成為全球最大的中文翻譯服務(wù)提
供商。①
(三)智能語音產(chǎn)業(yè)
從語言技術(shù)的角度講,語言信息產(chǎn)業(yè)的最高級形態(tài)就是語言智能產(chǎn)業(yè),而語音智能產(chǎn)業(yè)是它的重要支柱,現(xiàn)稱智能語音產(chǎn)業(yè)。智能語音產(chǎn)業(yè)是指以智能語音技術(shù)為核心,提供智能語音技術(shù)、產(chǎn)品和服務(wù)的產(chǎn)業(yè)形態(tài)。智能語音技術(shù)主要包括語音增強、語音合成、語音識別、自然語言處理和理解等技術(shù),特別是相關(guān)人機自然對話技術(shù)的發(fā)展突破了傳統(tǒng)語音技術(shù)的范圍,為其在日常生活中的應(yīng)用打開了無限廣闊的空間。中國智能語音產(chǎn)業(yè)起步時間基本上與國外同步,以語音識別技術(shù)研究開發(fā)為起點,大致經(jīng)歷了技術(shù)萌芽階段(20世紀 50—70 年代)、技術(shù)突破階段(20 世紀 80—90 年代)和產(chǎn)業(yè)化階段(20 世紀 90 年代末—21 世紀初)。自20世紀90年代末,科大訊飛、捷通華聲等智能語音企業(yè)相繼成立,智能語音技術(shù)逐步在通信、交通、教育、金融、郵政、電力等各行業(yè)推廣應(yīng)用,開啟了國內(nèi)智能語音的產(chǎn)業(yè)化時代。根據(jù)工信部的數(shù)據(jù),2011至2015年中國智能語言產(chǎn)業(yè)規(guī)模每年都有較高增長(見圖3)。
科大訊飛公司的發(fā)展歷程可謂中國智能語音產(chǎn)業(yè)發(fā)展的一個縮影。1999年,科大訊飛公司成立。2001年11月,訊飛推出第一塊語音合成單芯片,同年12月,又推出了具有語音合成和語音編解碼功能的板卡。在公司成立后的短短3年時間內(nèi),訊飛就獲得了國內(nèi)電信、證券等語音合成技術(shù)主流應(yīng)用市場80%的份額。2007年,科大訊飛成功上市,成為中國語音產(chǎn)業(yè)的唯一上市企業(yè)。 2009年,科大訊飛實現(xiàn)營業(yè)總收入3.07億元,同比增長19.25%;2010年實現(xiàn)營業(yè)總收入4.36億元,比2009年增長41.98%。正是由于以科大訊飛為代表的一批國內(nèi)語音企業(yè)的崛起,以及信息技術(shù)發(fā)展進程中“智能語音時代”的來臨,2012 年 8 月在工信部指導(dǎo)下,中國智能語音產(chǎn)業(yè)聯(lián)盟正式成立,這是中國語言信息產(chǎn)業(yè)發(fā)展史中的一個里程碑。
我們正著手收集、整理2010年以來中國整體語言產(chǎn)業(yè)的發(fā)展狀況,這個“語言產(chǎn)業(yè)整體”力圖涵蓋語言出版、語言培訓(xùn)、語言翻譯、語言信息、語言測試等多個語言產(chǎn)業(yè)業(yè)態(tài)并且盡可能明確這個產(chǎn)業(yè)的基本邊界。當然,無論是厘清邊界,還是獲取數(shù)據(jù)都非常困難。以2010年為例,據(jù)估算,國內(nèi)包含語言翻譯、語言培訓(xùn)、語言出版、語言信息技術(shù)等的整個語言產(chǎn)業(yè)的總產(chǎn)值應(yīng)不少于2000億。其中嚴格意義上的語言信息技術(shù)產(chǎn)業(yè)應(yīng)不少于300億,至于其他與語言信息技術(shù)應(yīng)用直接相關(guān)的語言教育、語言出版等產(chǎn)值應(yīng)占有更大的比例(陳鵬 2016)。
四、第三次浪潮(2010年起):基于全方位語言信息技術(shù)的語言產(chǎn)業(yè)
一波未平,一波又起,在語言產(chǎn)業(yè)的第二次浪潮和第一次浪潮之間產(chǎn)生融合效應(yīng)之后(不是簡單疊加),當互聯(lián)網(wǎng)技術(shù)和智能手機終端深度整合成新的應(yīng)用平臺時,便催生了語言產(chǎn)業(yè)發(fā)展的第三次浪潮,即基于全方位語言信息技術(shù)平臺的語言產(chǎn)業(yè),換一種說法就是專業(yè)語言服務(wù)或語言產(chǎn)業(yè)的信息化時代。語言信息技術(shù)的發(fā)展首先是催生了新型的語言信息產(chǎn)業(yè),諸如輸入法產(chǎn)業(yè)、智能語音產(chǎn)業(yè)、機器翻譯產(chǎn)業(yè)、語義智能產(chǎn)業(yè)等;同時,這些語言信息技術(shù)不斷滲透到培訓(xùn)、出版、翻譯、測試等傳統(tǒng)語言產(chǎn)業(yè)之中,形成一個基于現(xiàn)代信息技術(shù)的語言產(chǎn)業(yè)形態(tài);尤其是互聯(lián)網(wǎng)技術(shù)和智能手機終端的廣泛應(yīng)用,使得語言產(chǎn)業(yè)的新一輪發(fā)展不再是規(guī)模性數(shù)量上的增長,而是質(zhì)的變化。與傳統(tǒng)語言產(chǎn)業(yè)相比,我們可以把這個基于信息技術(shù)的語言產(chǎn)業(yè)稱為語言產(chǎn)業(yè)2.0版。這一波浪潮將長期引領(lǐng)語言產(chǎn)業(yè)的發(fā)展。下面我們以數(shù)字出版、在線語言教育以及“語音智能+”為例來說明這一輪語言產(chǎn)業(yè)的發(fā)展。
(一)數(shù)字出版
受益于互聯(lián)網(wǎng)特別是移動互聯(lián)網(wǎng)、移動終端的全面應(yīng)用,中國數(shù)字版權(quán)產(chǎn)業(yè)蓬勃發(fā)展,年增長速度穩(wěn)居30%之上,遠遠超越了其他行業(yè)。根據(jù)中國出版科學(xué)研究所《2015年度中國數(shù)字出版產(chǎn)業(yè)年度報告》的統(tǒng)計, 2009年中國數(shù)字出版業(yè)總值達795億元人民幣,首度超越傳統(tǒng)紙質(zhì)書、報、刊出版物的生產(chǎn)總值。到2015年中國數(shù)字出版產(chǎn)業(yè)整體收入規(guī)模為4403.85億元,其中包括移動出版(手機彩鈴、鈴音、移動游戲等)、網(wǎng)絡(luò)游戲、互聯(lián)網(wǎng)期刊、電子書、數(shù)字報紙(不含手機報)、在線音樂、在線教育等。當然,這是廣義的出版行業(yè),游戲、廣告、鈴音也占據(jù)相當大的份額。需要注意的是,2015年互聯(lián)網(wǎng)期刊、電子圖書、數(shù)字報紙的總收入只有74.45億元,在數(shù)字出版總收入中所占比例僅為1.69%,這說明傳統(tǒng)出版行業(yè)在數(shù)字化融合發(fā)展、數(shù)字化轉(zhuǎn)型升級方面仍有巨大的增長空間。
有數(shù)據(jù)顯示,人們的閱讀方式正在發(fā)生根本性的變化,調(diào)查顯示:2014 年,以手機閱讀、網(wǎng)上在線閱讀為代表的數(shù)字化閱讀方式的接觸率為58.1%,較2013 年上升了8.0 個百分點,首次超過了圖書閱讀率。①這在相當程度上說明了數(shù)字出版方式將逐漸取代傳統(tǒng)紙質(zhì)印刷出版而成為主流出版方式。
在語言出版領(lǐng)域,語言工具書的出版一直占有相當大的份額,有些金牌工具書甚至被比喻為印書如印鈔,但是它仍然要應(yīng)對數(shù)字化出版。隨著智能手機全覆蓋式的普及以及在線工具書的使用,紙質(zhì)工具書的地位不斷下降。比如,2008年至2010年間,上海譯文出版社的《新法漢詞典》年銷量從13 000冊下降到3000冊。根據(jù)開卷公司的調(diào)查,2013年紙質(zhì)工具書銷量比去年下降5%,除了中小學(xué)生常用的《新華字典》《現(xiàn)代漢語詞典》銷量平穩(wěn)以外,語言類工具書總體下降9.2%,外文工具書總體下降9.3%。外研社有關(guān)人士也提到該社紙質(zhì)字典銷售呈逐年下降之勢,年均下降7%至8%。越來越嚴峻的現(xiàn)實逼迫傳統(tǒng)工具書進行數(shù)字化變革。商務(wù)印書館《新華字典》紙質(zhì)圖書發(fā)行量迄今已有近6億冊,但它仍不能高枕無憂。在國內(nèi)出版社中,商務(wù)印書館較早著力于數(shù)字化出版的打造。2006年商務(wù)印書館與方正集團合作啟動“工具書在線”,為自己豐富的工具書資源打造數(shù)字化平臺。商務(wù)印書館可以提供總計1000余種工具書,商務(wù)版工具書的權(quán)威性和專業(yè)性都是不容置疑的,這些數(shù)字資源可以提供在線使用、電子書、資源庫、手機APP等多種服務(wù)。目前商務(wù)印書館數(shù)字出版的利潤當然無法與傳統(tǒng)出版相比擬,但前景是無比開闊的,作為中國現(xiàn)代出版發(fā)源地的商務(wù)必須跟上時代的步伐。
一些信息企業(yè)正在成為另一種意義上的出版企業(yè)。以方正集團為例,2000年起,在漢字激光照排技術(shù)的基礎(chǔ)上方正集團著手研發(fā)適應(yīng)互聯(lián)網(wǎng)時代的數(shù)字出版系統(tǒng)。2007年,方正集團發(fā)布數(shù)字出版戰(zhàn)略,向全媒體的數(shù)字復(fù)合出版技術(shù)發(fā)展,積極研發(fā)包括數(shù)字印刷、手持閱讀、互聯(lián)網(wǎng)出版等在內(nèi)的數(shù)字復(fù)合出版技術(shù),被稱為方正的“第二次技術(shù)革命”。方正阿帕比(Apabi)公司已發(fā)展成為全球領(lǐng)先的數(shù)字出版技術(shù)提供商,阿帕比以因特網(wǎng)為紐帶,將傳統(tǒng)出版的供應(yīng)鏈有機地聯(lián)結(jié)起來,實現(xiàn)完全數(shù)字化的出版。
(二)在線語言教育
在線教育是一種通過信息科技和互聯(lián)網(wǎng)進行教育和學(xué)習(xí)的方法,在線教育的顯著特征是任何人在任何時間、地點,選擇任何課程,從任何章節(jié)開始的一種完全超現(xiàn)實的學(xué)習(xí)或教育方法。它超越了課堂、教室、書本等實體條件的限制,帶來一種非常自由、靈活的學(xué)習(xí)狀態(tài)。在線教育改變了人們的學(xué)習(xí)方式,尤其是自主學(xué)習(xí)這一塊。在語言教育這一領(lǐng)域,艾瑞咨詢公司的調(diào)查顯示,在線語言學(xué)習(xí)正在成為語言學(xué)習(xí)的主流方式(見圖4)。
據(jù)該公司的調(diào)查報告,2010 年之后,在線語言教育市場每年都保持高于 20%的增長速度,到 2017 年將達到 360億元。2016 年中國在線語言培訓(xùn)占互聯(lián)網(wǎng)教育市場份額的21%,在投資領(lǐng)域,語言培訓(xùn)占據(jù) 35% 的市場份額。報告顯示,至2016年,80%的用戶選擇通過智能手機進行語言學(xué)習(xí),智能手機已成為在線語言學(xué)習(xí)的第一終端工具,用戶比例已超過PC終端(見圖5)。在線語言培訓(xùn)已與傳統(tǒng)語言培訓(xùn)分庭抗禮,它遲早會取代后者而占據(jù)主流地位。
(三)“語音智能+”
根據(jù)《2013年智能語音產(chǎn)業(yè)白皮書》的介紹,目前智能語音完整的產(chǎn)業(yè)鏈基本形成,智能語音技術(shù)已在移動互聯(lián)網(wǎng)語音搜索服務(wù)、智能手機、平板電腦等移動終端設(shè)備、汽車電子和車載終端、智能家電、智能家居等方面得到廣泛應(yīng)用。同時,智能語音技術(shù)應(yīng)用及服務(wù)在公共服務(wù)、智慧城市、教育、醫(yī)療、法律等領(lǐng)域不斷滲入,市場前景無可比擬。僅從智能手機終端來看,預(yù)計到 2017 年底,全球移動終端 90%以上將配備語音功能,智能語音用戶規(guī)模將超過 20 億,其中中國用戶規(guī)模達將達到 10 億。
以科大訊飛的語音智能發(fā)展為例。它始終包含兩個線索,一是語音技術(shù)的發(fā)展,一是語音技術(shù)的廣泛應(yīng)用所帶來的產(chǎn)業(yè)整合效應(yīng)??拼笥嶏w起家的核心技術(shù)是語音識別、語音合成和語音評測,目前占有中文主流語音市場70%以上市場份額。隨著人工智能時代的來臨,2014年,科大訊飛發(fā)布“訊飛超腦”計劃,核心就是讓機器從“能聽會說”到“能理解會思考”,努力實現(xiàn)語音處理和語義智能的融合。在語音識別和語義理解方向上,針對人與人之間自由交流的語音轉(zhuǎn)寫正確率已突破85%的實用門檻,針對會議演講等實際場景應(yīng)用已達到95%以上的識別率,并且已經(jīng)研制完成軟硬件一體化的遠場語音識別系統(tǒng)。在機器評測方向上,訊飛的技術(shù)從口語評測進一步向紙筆試卷評測延伸,在正式承擔了廣東英語高考的全部口語評測任務(wù)后,基于試卷掃描識別的中英文作文自動評分技術(shù)在重點考試的實際數(shù)據(jù)驗證上已達到與人工專家評分高度吻合的水平。此外,其語音—語義智能技術(shù)在醫(yī)療、汽車、法院、電視娛樂等許多方面都有應(yīng)用。
隨著萬物互聯(lián)時代的到來,越來越多的設(shè)備沒有屏幕了,越來越多的設(shè)備需要我們在幾米之外來操控它,比如說機器人,它必須在幾米之外能夠?qū)崿F(xiàn)交互,并能夠隨時打斷。在這種大趨勢下,語音聯(lián)通將是重要入口,語音合成和識別就成為萬物互聯(lián)時代人機交互的最主要的方式。2016年底,科大訊飛首先在發(fā)布會上提出信息產(chǎn)業(yè)已經(jīng)從“互聯(lián)
網(wǎng)+時代”進入“人工智能+”時代,訊飛認為,未來5到10年,人工智能會像水和電一樣,進入我們每個人的生活。
從全球角度看,中國的語言產(chǎn)業(yè)進程基本與世界同步,這主要是因為中國抓住了全球化、信息化的產(chǎn)業(yè)發(fā)展機遇。從語言產(chǎn)業(yè)的內(nèi)在進程看,語言產(chǎn)業(yè)的發(fā)展就是與信息技術(shù)不斷融合的過程。由于自然語言本身就是一種信息形態(tài),導(dǎo)致語言產(chǎn)業(yè)的“信息技術(shù)+”與其他產(chǎn)業(yè)的“信息技術(shù)+”有著根本的不同。語言產(chǎn)業(yè)的最新發(fā)展將圍繞人工語言智能展開。從技術(shù)的角度,人工智能是一種用智能機器(如計算機、翻譯機器、機器人等)來模擬人的某些思維過程和智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃、行為活動等)的技術(shù);從計算機科學(xué)的角度,人工智能研究包括語言識別、圖像識別、自然語言處理、核心算法、專家系統(tǒng)和機器人等。可以看出,語言智能是人工智能的重要組成部分,甚
至是基礎(chǔ)性的部分。從實際應(yīng)用的角度,使用自然語言的人機對話將是未來萬物互聯(lián)的基本方式,人工智能不僅會聽會說我們的語言,而且能最大限度地模仿和聚合我們的語言智能。不同形態(tài)的語言產(chǎn)品都將不同程度地融入語言智能這一新的技術(shù)平臺,未來語言產(chǎn)業(yè)的發(fā)展無疑將是“語言智能+”的時代。
參考文獻
陳 鵬 2016 《語言產(chǎn)業(yè)經(jīng)濟貢獻度研究的若干理論問題》,《語言文字應(yīng)用》第3期。
賀宏志主編 2012 《語言產(chǎn)業(yè)導(dǎo)論》,北京:首都師范大學(xué)出版社。
黃少安 蘇 劍 張衛(wèi)國 2012 《語言經(jīng)濟學(xué)與中國的語言產(chǎn)業(yè)戰(zhàn)略》,《光明日報》3 月2日。
李宇明 2004 《強國的語言與語言的強國》,《光明日報》7月28日。
李宇明 2011 《語言也是硬實力》,《華中師范大學(xué)學(xué)報》(人文社會科學(xué)版)第5期。
李宇明 2012 《認識語言的經(jīng)濟學(xué)屬性》,《語言文字應(yīng)用》第3期。
羅 民 張晉軍 謝歐航 黃賀臣 2011 《新漢語水平考試(HSK)海外實施報告》,《中國考試》第4期。
徐大明 2010 《關(guān)于語言經(jīng)濟學(xué)的七個問題》,《云南師范大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)第9期。
責任編輯:戴 燃