全球首個俄語AI合成主播亮相俄羅斯
近日,在第23屆圣彼得堡國際經(jīng)濟論壇上,中國新華社、俄羅斯塔斯社和中國搜狗公司聯(lián)合推出了全球首個俄語AI合成主播。據(jù)了解,未來,它將被應(yīng)用于塔斯社的新聞報道中。塔斯社是俄羅斯的國家通訊社,作為全球五大通訊社之一,對外向115個國家和地區(qū)提供新聞信息,在全球范圍都具有廣泛影響力。
據(jù)介紹,作為目前全球首個能真正實現(xiàn)AI真人影像模型構(gòu)建的人工智能技術(shù),“搜狗分身”誕生于搜狗“自然交互+知識計算”這一人工智能理念之下,是搜狗人工智能核心技術(shù)之一,同時也是AI合成主播的基礎(chǔ)。
它通過采集學(xué)習(xí)真人的聲音、嘴唇動作和表情,再結(jié)合聲音合成、表情合成、唇型合成等技術(shù)對AI進行擬人化訓(xùn)練,便能克隆出與真人無異的AI分身,進而幫忙人類提高信息表達和傳遞的效率。
AI合成主播技術(shù)的迅速迭代、多語言語種的不斷豐富,都離不開“搜狗分身”技術(shù)的支持。隨著“搜狗分身”技術(shù)的發(fā)展,AI合成主播對數(shù)據(jù)采集的需求越來越小,目前可以在一天時間內(nèi)采集完一個人所有的音頻和視頻素材,僅用幾個小時的視頻資料就可以形成一個逼真的形象。
此次由三方共同推進的全球首個俄語AI合成主播項目,將會良好地推進塔斯社在人機智能交互領(lǐng)域的建設(shè),加快塔斯社在新聞播報領(lǐng)域的智能化進程。隨著其在俄羅斯日常新聞報道中的運用,搜狗AI合成主播概念將被更多大眾所認(rèn)知,AI合成主播在國際上的影響力也將進一步得到擴大。
事實上這并不是搜狗第一次與世界頂級媒體的合作。早在2018年11月,搜狗就與新華社聯(lián)合推出了一中一英兩位AI合成主播。數(shù)據(jù)顯示,這兩位AI主播入職半年便已生產(chǎn)5100多條新聞報道,累計時長達13000多分鐘。
同時這也并非搜狗的第一次國際合作,今年3月,搜狗便獲得阿聯(lián)酋王室的熱切關(guān)注,與阿聯(lián)酋阿布扎比媒體集團達成了合作,雙方將共同打造全球首個阿語AI合成主播,通過多項人工智能技術(shù)幫助阿聯(lián)酋實現(xiàn)媒體智能化升級。
未來,結(jié)合搜狗以知識計算為基礎(chǔ)的對話和問答等核心能力,分身技術(shù)將被引入到更多行業(yè)的建設(shè)中,將能夠為娛樂、醫(yī)療、健康教育、法律、金融等多個領(lǐng)域的多種場景賦予更強大的功能,不斷實現(xiàn)各種“科幻到現(xiàn)實”的轉(zhuǎn)變。
亞馬遜CEO貝索斯試玩全球首款觸摸式遠程機器手
亞馬遜CEO杰夫·貝索斯(Jeff Bezos)在拉斯維加斯的亞馬遜機器人大會上控制了一對巨大的遙控機器人手(Dexterous Hand)。
這位全球首富用這雙機器人手疊杯子和彩虹環(huán),把球從一只手傳給另一只手。在接過一個魔方后,貝索斯回答說:“不,謝謝,我甚至不能用我的手去做?!?/p>
貝索斯表示,反饋“很強烈”,使用它們感覺“不可思議的自然”。這雙機器手可以進行24個動作,并配有129個集成傳感器,可跟蹤位置、力度和壓力等因素。它可以舉起重達5公斤(11磅)的物品。
機器人是由Shadow Robot和HaptX共同設(shè)計。 Shadow Robot專門打造機器人手,并與特斯拉首席執(zhí)行官Elon Musk共同創(chuàng)辦的AI研究機構(gòu)OpenAI合作。 HaptX開發(fā)的技術(shù)為人們提供了遠程操作機器人以及VR的觸覺。
為了這個特殊的演示,雙手還配備了由南加州大學(xué)分拆公司SynTouch制造的BioTac觸覺傳感器。每個傳感器都包含柔軟、柔韌的皮膚和指紋狀的脊,覆蓋一個液體填充物。當(dāng)皮膚在表面上移動時,由脊產(chǎn)生的振動通過液體產(chǎn)生共振,并通過內(nèi)置的水聽器進行檢測。這允許傳感器識別紋理,并且還可以感知溫度。
配備BioTec的機器人手由戴著HaptX制造的一對觸覺反饋手套的用戶遠程控制。利用運動跟蹤技術(shù),手套能夠感知佩戴者的手和手指的運動,并且它利用130個微流體觸覺傳感器通過選擇性地按壓皮膚來提供觸覺。在最近的測試中,加利福尼亞州的一名操作人員遠程操作了一個在倫敦的電腦鍵盤,通過手套上的指尖傳感器檢測到每一次擊鍵。以這種方式將觸摸和遠程操作結(jié)合起來是突破性的,并指出未來的應(yīng)用,我們可以進行遠程操作,例如炸彈處理、深海工程,甚至是在不同的州執(zhí)行的手術(shù)。
TensorFlow官宣新功能 攻克語言AI模型預(yù)處理偏差
谷歌發(fā)布TensorFlow優(yōu)化新功能TF.Text庫,可對語言文本AI模型進行周期性預(yù)處理,大大節(jié)約了AI開發(fā)者對文本模型的訓(xùn)練時間,簡化訓(xùn)練流程。
TensorFlow幫助用戶利用圖像和視頻數(shù)據(jù)構(gòu)建模型。但是,許多模型是以文本開頭的,從這些模型構(gòu)建的語言模型需要進行一些預(yù)處理,才能將文本輸入到模型中。比如關(guān)于使用IMDB數(shù)據(jù)集的文本分類教程,就是從已經(jīng)轉(zhuǎn)換為整數(shù)ID的文本數(shù)據(jù)開始入手的。
如果模型訓(xùn)練和推理的時間不一樣,在訓(xùn)練過程以外完成的預(yù)處理可能會和模型產(chǎn)生偏差,這就需要額外投入更多的時間和精力對預(yù)處理的過程進行協(xié)調(diào)。
TensorFlow本次推出的TF.Text就是為了解決這個問題,TF.Text是一個TensorFlow 2.0庫,可以使用PIP命令輕松安裝。它可以在基于文本的模型中定期執(zhí)行這些預(yù)處理過程,并提供TensorFlow核心組件中并未提供的、關(guān)于語言建模的更多功能和操作。
其中最常見的功能就是文本的詞條化(tokenization)。詞條化是將字符串分解為token的過程。這些token可能是單詞、數(shù)字和標(biāo)點符號,或是上述幾種元素的組合。TF.Text的Tokenizer使用RaggedTensors,這是一種用于識別文本的新型張量。
大疆發(fā)布首款教育機器人“機甲大師RoboMaster S1”
6 月 12 日,大疆發(fā)布首款教育機器人“機甲大師RoboMaster S1”,主打以硬核科技為基礎(chǔ)的機器人教育和機器人競技,將教育和娛樂的元素融入機器人產(chǎn)品中。
這個源自RoboMaster 機甲大師機器人比賽的消費級機器人,具備準(zhǔn)工業(yè)級硬件,擁有性能充足的中央處理器、31 個傳感器、可模擬皮膚觸覺的感應(yīng)裝甲、抖動控制精度在正負(fù) 0.02 度的云臺、全向移動的底盤。
這些配置讓RoboMaster S1 的大腦、感官和機體性能遠超同類的教育機器人產(chǎn)品,同時也是一款可玩性相當(dāng)高、足夠酷炫的競技玩具。
RoboMaster S1 標(biāo)準(zhǔn)套裝售價為 3499 元,另有包括手柄在內(nèi)的拓展包會在未來發(fā)售。該款機器支持設(shè)計自定義配件。
總的來說,RoboMaster S1 是目前消費級教育機器人領(lǐng)域技術(shù)集成度相當(dāng)高的一款產(chǎn)品。它擁有性能優(yōu)異的硬件和完備的基礎(chǔ)功能,是一臺真正的機器人,更重要的是它足夠好玩和酷炫,有足夠的吸引力驅(qū)動用戶去探索現(xiàn)實世界。在此基礎(chǔ)上,它擁有精心設(shè)置的視頻課程和項目教程,可以讓入門者保持探索學(xué)習(xí)的興趣,并具有足夠的可拓展空間,可以讓用戶盡情地?fù)v鼓鉆研。RoboMaster S1 的出現(xiàn)將大大拉低人們接觸和擁有競技、教育機器人的門檻。