劉虹伶
近日,搜狗公司與新華社新媒體中心聯(lián)合發(fā)布站立式AI合成主播,新的AI合成主播將從過去的“坐著播新聞”升級(jí)成結(jié)合肢體動(dòng)作的“站立式播報(bào)”,這是全球首個(gè)AI合成主播。
全球首個(gè)AI主播驚艷落地
在2018年的互聯(lián)網(wǎng)大會(huì)開幕當(dāng)天,全球首個(gè)“AI合成主播”第一次亮相于眾人眼前。據(jù)了解,它由搜狗和新華社新媒體中心共同打造,以新華社主持人邱浩為原型,實(shí)現(xiàn)高效的新聞播報(bào)。
AI主播不僅僅是新華社將AI技術(shù)引入新聞報(bào)道中的一次嘗試,也是“搜狗分身”技術(shù)在新聞行業(yè)的一次實(shí)踐。
搜狗CEO王小川表示,搜狗分身打造了AI合成主播,它利用搜狗的AI能力,從人類的聲音語言習(xí)慣、表情及嘴唇動(dòng)作等層面對(duì)AI進(jìn)行擬人化訓(xùn)練,然后“克隆”出人類的分身,進(jìn)而幫助人類提高信息表達(dá)和傳遞的效率。
說得通俗易懂一些,真人主播小吳面對(duì)鏡頭錄制一段播報(bào)新聞的視頻,搜狗分身通過這段視頻可以將小吳的聲音、嘴唇動(dòng)作和表情這些特征進(jìn)行提取,再通過語音、嘴唇動(dòng)作、表情三者合成,加之深度學(xué)習(xí)等技術(shù),“克隆”出于主播小吳幾乎一模一樣具備新聞播報(bào)能力的AI分身。
舉例來說,主播小吳每天工作10個(gè)小時(shí),一周工作七天,這樣下來他每周工作時(shí)間是70小時(shí)。然而,只要有足夠多的服務(wù)器,AI合成主播呈現(xiàn)無數(shù)個(gè)AI分身,就可以有N個(gè)主播小吳的AI分身在一天24小時(shí)不間斷地工作。
相較于傳統(tǒng)視頻新聞需要漫長錄制過程而言,AI主播只需要人工將文本輸入就可以在短時(shí)間內(nèi)生成新聞播報(bào)視頻,并且無形中減少了主播播報(bào)新聞過程中的“失誤率”。由此可見,AI主播的誕生和落地大大地節(jié)省了人力成本,同時(shí)也提升了傳媒行業(yè)的效率。
據(jù)了解,AI主播從互聯(lián)網(wǎng)大會(huì)落地開始就已經(jīng)正式上崗,成為了新華社報(bào)道隊(duì)伍中的一員。上崗至今的這三個(gè)月以來,首批入職的一中一英兩位AI主播,已經(jīng)生產(chǎn)3400余條新聞報(bào)道,累計(jì)時(shí)長達(dá)10000多分鐘,其間還參與了第五屆世界互聯(lián)網(wǎng)大會(huì)、首屆進(jìn)博會(huì)、2019春運(yùn)、春節(jié)等若干重要報(bào)道。
全球首個(gè)“AI合成主播”無疑是中國人工智能與傳媒業(yè)大膽融合并付諸規(guī)模化應(yīng)用的典型案例。
搜狗AI主播再次升級(jí)
如果說AI合成主播的落地給新聞主播們帶來了“失業(yè)危機(jī)”的壓力,那么主播們壓力又升級(jí)了。
因?yàn)?,搜狗再次升?jí),帶來了全球首個(gè)站立式AI合成主播。對(duì),這個(gè)AI主播除了能夠播報(bào)新聞之外,還擁有了肢體語言能力。
據(jù)了解,搜狗此次升級(jí)除了讓AI主播肢體語言豐富起來之外,聲音更具有真實(shí)情感和表現(xiàn)力,在圖像生成方面也實(shí)現(xiàn)了更加逼真的表情生成、自然的肢體動(dòng)作以及嘴唇動(dòng)作預(yù)測(cè)等能力。簡(jiǎn)單來說,AI主播可以站起來用更生動(dòng)的方式播報(bào)新聞了。
AI主播的此次升級(jí),不僅僅是提升了AI主播的表現(xiàn)力,同時(shí)也保持了搜狗在這一領(lǐng)域的全球領(lǐng)先。
除了可以站著播新聞,這位工作了三個(gè)月的AI主播還有了自己的名字——“新小浩”。而近日搜狗給新小浩帶來了一位新同事,一個(gè)叫“新小萌”的全球首個(gè)AI女主播?!靶滦∶取钡穆涞卣故玖恕八压贩稚怼奔夹g(shù)的通用能力,這項(xiàng)技術(shù)可以持續(xù)“克隆”不同類型、不同特點(diǎn)的AI主播的“分身”。
據(jù)搜狗方面透露,最新推出的站立式AI合成主播將參與2019年全國兩會(huì)的報(bào)道,并將在搜狗搜索、輸入法等資訊平臺(tái)上與用戶見面。
隨著搜狗與新華社達(dá)成的長期合作,更多的AI主播將不斷涌現(xiàn)。由此也可以預(yù)見,AI主播正在成為AI時(shí)代信息資訊傳播鏈條最重要的一環(huán)。
搜狗分身技術(shù)“克隆”人類
以“搜狗分身”技術(shù)為核心的AI主播交出的亮眼成績單,我們可以看出以輸入法、瀏覽器、搜索引擎起家的搜狗正在圍繞人工智能展開更多觸角。
搜狗分身是搜狗在多模態(tài)合成技術(shù)上的一次探索,它是人工智能在模仿人類領(lǐng)域的一次新進(jìn)展。與此同時(shí),搜狗的AI商業(yè)化落地也在同步推進(jìn)。
新華社的AI主播是搜狗分身技術(shù)的第一個(gè)落地場(chǎng)景,它除了在新聞播報(bào)領(lǐng)域的應(yīng)用外,其實(shí)還有更廣泛的應(yīng)用空間可以探索。
例如在線教育場(chǎng)景,利用搜狗分身做音視頻的合成,在提升教育行業(yè)效率的同時(shí),也可以增強(qiáng)與用戶的互動(dòng)性。
又比如虛擬助理,相較于目前應(yīng)用最多的語音助手,帶有形象的虛擬助理親民度更高,在交互中也更加貼近人類的期待,這在未來也會(huì)是一個(gè)巨大的場(chǎng)景。
據(jù)搜狗CEO王小川介紹,“搜狗分身”技術(shù)未來還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個(gè)領(lǐng)域。而搜狗也將在今年推出更加大眾化的消費(fèi)級(jí)智能硬件,目的為“爭(zhēng)奪用戶入口”。
搜狗AI商業(yè)化加速
從對(duì)AI主播的產(chǎn)品定位不難看出,對(duì)于人工智能技術(shù)的應(yīng)用探索,搜狗還是致力于讓機(jī)器成為輔助表達(dá)與信息獲取的分身以及助理,這同時(shí)也是搜狗給技術(shù)落地提出的戰(zhàn)略目標(biāo)。
除了搜狗分身外,搜狗也在圍繞語言與交互搶占行業(yè)賽道。
在搜狗搜索中,搜狗可以做到輸入中文一鍵連接全球網(wǎng)頁。
在C端場(chǎng)景,將AI引入搜狗輸入法,推出AI制音坊,為自然交互的愿景代言。在智能硬件領(lǐng)域,發(fā)布拳頭產(chǎn)品翻譯寶Pro,圍繞新聞媒體推出搜狗翻譯筆,助力中英文的無縫轉(zhuǎn)換。
在B端場(chǎng)景,搜狗推出機(jī)器同聲傳譯、智能分診,落地手機(jī)語音助手等搶占行業(yè)賽道。
以上種種舉措,皆在傳遞著搜狗正在全方位釋放人工智能技術(shù)的實(shí)力,在讓溝通與表達(dá)變得更加簡(jiǎn)單和高效的理念指引下,切實(shí)為廣大用戶提供更加貼近生活并貼近人性的產(chǎn)品。
同時(shí)也可以明顯感受到,搜狗的AI商業(yè)化也在加速。
根據(jù)公開數(shù)據(jù),2018年搜狗輸入法日均語音功能調(diào)用量已經(jīng)達(dá)到了5.34億次,這樣的數(shù)據(jù)一方面凸顯了搜狗輸入法的頭部地位,另一方面也彰顯了人工智能技術(shù)在搜狗的各條產(chǎn)品線存在著更加廣闊的應(yīng)用場(chǎng)景與發(fā)展?jié)摿Α?/p>
搜狗由文字輸入作為基礎(chǔ),不斷地在語音、搜索、翻譯等相關(guān)領(lǐng)域取得進(jìn)展和突破,這些探索與嘗試為搜狗在人工智能時(shí)代布局積累了大量且豐富的應(yīng)用場(chǎng)景。
不可否認(rèn)的是,兼具應(yīng)用場(chǎng)景與技術(shù)實(shí)力將為搜狗發(fā)力人工智能提供原動(dòng)力,我們有理由相信在未來搜狗將帶給我們比AI合成主播更大的驚艷。
鋅刻度記者觀點(diǎn):搜狗的AI商業(yè)化,未來可期
搜狗分身技術(shù)的推出代表著搜狗在多模態(tài)交互、語音合成、唇語合成等前沿技術(shù)上的進(jìn)一步探索。而另一方面搜狗開始推動(dòng)這項(xiàng)技術(shù)進(jìn)入行業(yè),此次是與新華社一起推出AI主播,未來還會(huì)進(jìn)入更多行業(yè),以及探索更多的商業(yè)落地。
除了要夯實(shí)基礎(chǔ)技術(shù)的積累沉淀,還要深化AI落地,一向低調(diào)的搜狗正全面加速AI的商業(yè)化進(jìn)程。