文 / 本刊記者 黎沖森
愛數(shù)智慧提出二八原則,即幫助車企解決底層80%的標準數(shù)據(jù)和20%的定制數(shù)據(jù),以更好的性價比和更快的速度來幫助車企完成整個智能化模型構(gòu)建工作。
作為一家對話式AI數(shù)據(jù)服務商,愛數(shù)智慧擁有海量對話式AI訓練數(shù)據(jù)集,比如擁有超過150000小時自有數(shù)據(jù)集,其中超過90000小時對話式AI訓練數(shù)據(jù)集,能幫助AI開發(fā)者快速提高模型性能,從而加速智能產(chǎn)品市場化進程。愛數(shù)智慧還自主研發(fā)了SaaS智能化數(shù)據(jù)標注平臺,并于今年4月推出了針對AI開發(fā)者的開源社區(qū)MagicHub.io,賦能生態(tài)。
至今只有5年創(chuàng)業(yè)歷史的愛數(shù)智慧,發(fā)展非常快,在語音識別、自然語言處理、語音合成、計算機視覺等人工智能領(lǐng)域已嶄露頭角,服務業(yè)務涵蓋智慧金融、智慧出行、智能社交、智能家居、智能終端等五大行業(yè),應用場景覆蓋車載語音助手、消費級機器人、語音商務及客戶服務、智能家居控制、語音審核、智慧醫(yī)療等,能提供50多種語言的數(shù)據(jù)采集和標注服務。
作為演講嘉賓,愛數(shù)智慧創(chuàng)始人兼CEO張晴晴參加了由中國汽車工業(yè)協(xié)會主辦的2021中國汽車論壇,并接受了采訪,分享了其“從零到一”的創(chuàng)業(yè)進階經(jīng)驗。
眾所周知,智能語音等在車載場景中非常重要,而愛數(shù)智慧為正在智能化轉(zhuǎn)型的車企提供相關(guān)的底層數(shù)據(jù)服務。
“在車載場景里,核心之一是人機交互。對于人機交互,我們強調(diào)對話式,要自發(fā)式、自然式地與車進行交互,而不是很死板的命令控制方式進行交互。這里面最重要的是形成對話式,但這會比命令控制式的交互難度大很多,會加大機器識別語音的難度?!睆埱缜缯f,“我們一直在對話式AI領(lǐng)域深耕,著手人和機器以及人和人之間進行自然式對話。我們希望將最真實的數(shù)據(jù)反饋到車廠,應用智能化模型優(yōu)化理念,幫助他們更好地迭代出更智慧化的語音操控系統(tǒng)。”
據(jù)張晴晴介紹,愛數(shù)智慧在車載系統(tǒng)的人機交互場景和發(fā)展在不斷進階。最早,主要做控制類型語音交互,比如開窗、關(guān)窗、打開空調(diào)和座椅調(diào)節(jié)等,再慢慢加入內(nèi)容交互,比如音樂檢索等。在這種情況下,交互語音內(nèi)容開始迭代更新。接著,進入比較自然式的人機交互,不再只是命令控制。比如調(diào)節(jié)溫度,說“我覺得好熱”時,車就給一個建議調(diào)低空調(diào)溫度等。現(xiàn)在,人機交互場景增加到“千人千面”。比如,在聽電臺時,在車機交互過程中,是不是有個性化定制需求,比如導航播報是不是可以定制成自己所喜歡的聲音等。
在張晴晴看來,與同行相比,愛數(shù)智慧的核心優(yōu)勢是采用對話式AI。傳統(tǒng)非對話式AI主要是命令控制,比較機械式,需先把文本規(guī)劃設計好,然后朗讀錄制。朗讀式和對話式主要差異是,朗讀式文本是設定死的,所有錄音人和采集人是按照文本來,變化性很少。按照文本朗讀出來,自然性不夠強。而愛數(shù)智慧的對話式,盡可能保證說話人采用最自然的方式交流,更貼合真實的使用場景。“在對話式AI里,我們已經(jīng)拓展到很多語種。伴隨著車企出海過程,我們可以提供相應的數(shù)據(jù)解決能力?!?/p>
在汽車人機交互領(lǐng)域,愛數(shù)智慧的技術(shù)已在智能座艙、線上線下智能客服等場景應用。比如,愛數(shù)智慧推出了“標準數(shù)據(jù)集”產(chǎn)品。張晴晴說:“我們發(fā)現(xiàn),車企不管哪個車型,在做命令交互時有很多相似處,比如打開空調(diào)、調(diào)低溫度等,這些東西我們可以把它形成一個行業(yè)的標準數(shù)據(jù)集,定期擴充它,保證它的時效性。這樣,客戶可以直接采購這樣的數(shù)據(jù)集,而不是從零開始定制服務,以免耽誤時間。作為車企人機交互的底層數(shù)據(jù)集,可以很快地幫助客戶把基礎(chǔ)能力先搭建起來。為此,我們提出了數(shù)據(jù)行業(yè)的二八原則,即幫助車企解決底層80%的標準數(shù)據(jù)和20%的定制數(shù)據(jù),以更好的性價比和更快的速度來幫助車企完成整個智能化模型構(gòu)建工作。這是我們提供智能方案的整體邏輯?!?/p>
在車載交互領(lǐng)域,人機交互呈現(xiàn)出多模態(tài)發(fā)展趨勢,比如在智能座艙里就有應用。張晴晴說:“去年底,我們開始布局多模態(tài)數(shù)據(jù)處理系統(tǒng)。同時,由于音頻本身信息量很大,所以音頻在多模態(tài)演進過程中,整體音頻部分的需求量在不斷增加,只是在音頻外還伴隨著其他模態(tài)需要處理。今年我們推出多模態(tài)數(shù)據(jù)處理系統(tǒng)。這個系統(tǒng)在迭代過程中將加速音頻在多模態(tài)中的需求量?!?/p>
愛數(shù)智慧創(chuàng)始人兼CEO張晴晴在2021中國汽車論壇期間接受采訪
據(jù)了解,愛數(shù)智慧創(chuàng)立于2016年。而作為一位女性創(chuàng)業(yè)者,張晴晴為何選擇在人機交互領(lǐng)域創(chuàng)業(yè)?
“我已在人工智能領(lǐng)域?qū)W習和從業(yè)17年,做對話式AI,研究語音識別。我的博士研究方向就是人機交互,就是語音、語言對話式場景。我覺得語音交互方式是人類和機器交流的一個最自然的方式,這是我開始就選擇語音領(lǐng)域發(fā)展的重要原因?!睆埱缜缯f,“汽車行業(yè)需要人機交互。在人工智能領(lǐng)域,女性占比開始比傳統(tǒng)的IT領(lǐng)域多起來。重要原因是人工智能本質(zhì)上是一個數(shù)據(jù)行業(yè),因為所有算法要靠數(shù)據(jù)驅(qū)動,而對于數(shù)據(jù)的認知和拆解,女性的優(yōu)勢開始顯現(xiàn)出來。女性對世界的感知度、敏感度可能高一些,女性思考得比較多,同時對數(shù)據(jù)要有耐心分析和拆解。另外,女性特有的心思細膩、換位思考等能力,不同于男性的理解方式,也對機器理解人提供了很大幫助。在音頻方面,可能更明顯。”
其實,張晴晴曾是中科院科研人員,主要研究方向是如何構(gòu)建一個更好的AI模型,從而讓機器更好地理解人說的話。據(jù)張晴晴介紹,愛數(shù)智慧已經(jīng)從10多人發(fā)展到150多人?!拔覀冎饕獮榭蛻籼峁┫鄳臄?shù)據(jù)服務,其中兩類企業(yè)是我們的重要客戶:一是車企。比如車企自己有一些AI研發(fā)解決方案,我們可以對接到他的研發(fā)部門,提供相應的咨詢和數(shù)據(jù)服務。二是屬于垂直在車企行業(yè)提供解決方案的算法或者解決方案的公司,我們?yōu)樗峁┫鄳臄?shù)據(jù)支持。”
在愛數(shù)智慧成長過程中,有一件事給張晴晴留下了深刻印記。公司剛成立一年時,即2017年,當時公司有50多位員工,因為公司那時條件有限,租不起高大上的辦公樓,就在北京大興區(qū)租了一個比較小的商住兩用房子辦公。剛好那時北京大興區(qū)發(fā)生了幾場大火,愛數(shù)智慧自然受到影響。張晴晴清楚地記得,當年11月27日,那是周日下午五點,消防隊在整頓消防隱患房屋時,通知其所在的辦公樓因消防不合規(guī)必須當晚立即搬走。
要在幾個小時內(nèi)把50多人的辦公物品撤走并非易事,而且當時根本就不知道要搬到哪里去。張晴晴回憶說:“當時我的心情非常忐忑,因為我不知道怎么跟所有員工講我們需要立刻搬家這件事情。如果我是員工,聽到老板這么講,我也會覺得這家公司不太靠譜。當時我在微信群里把大家請回來,還不好意思地告訴大家發(fā)生了什么。但所有同事回到公司后,我跟他們講需要立刻搬家時,沒有一個人抱怨和遲疑,大家都積極配合和出謀劃策,有的員工甚至開自家車來幫公司搬家。大家齊心協(xié)力,一個晚上就把物品搬到了新辦公樓。所以我說,創(chuàng)業(yè)是團隊創(chuàng)造奇跡的過程。”
幸運的是,這并沒有影響愛數(shù)智慧當年的成功融資。當年,愛數(shù)智慧獲得了明勢資本的Pre-A輪投資。張晴晴說:“那時我們正在籌備A輪融資,投資人看到了我們整個過程,毅然決然地決定投資?!?018年,愛數(shù)智慧又獲得策源創(chuàng)投和梅花創(chuàng)投的A輪投資;2019年,獲得策源資本和杭州復琢的A+輪投資;2021年初,獲得凡創(chuàng)資本的數(shù)千萬元B輪融資。
談到與資本方打交道時,張晴晴的心得是,彼此要相互理解,并且雙方認可彼此價值。至于未來要把公司做成什么樣的問題,張晴晴說:“我覺得應該回歸到創(chuàng)業(yè)初心。我在AI領(lǐng)域已經(jīng)歷練17年,希望AI智能化浪潮可以一直前行,這樣對整個行業(yè)甚至人類都有非常好的價值和作用?!?/p>
現(xiàn)在愛數(shù)智慧不僅獲得了投資人的認可,也獲得了不少行業(yè)客戶的肯定,目前已為近100家頂級客戶提供數(shù)據(jù)服務,并獲得了多家全球頂級客戶的一流供應商資質(zhì)。在張晴晴看來,創(chuàng)業(yè)者要知道目標在哪里,并堅持下去,這樣未來無論成敗都是英雄。
今年6月《數(shù)據(jù)安全法》通過,9月開始施行。作為數(shù)據(jù)服務商,張晴晴說:“數(shù)據(jù)安全性是我們的立命之本,我們完全遵照數(shù)據(jù)安全法,并將不遺余力地投入和迭代優(yōu)化。我們是數(shù)據(jù)服務行業(yè)里較早一批拿到ISO/IEC 27701:2019標準認證的企業(yè)。這是全球最新的個人隱私認證?!?/p>
在給車企客戶提供解決方案時,愛數(shù)智慧通常建議客戶80%采用標準數(shù)據(jù)集,20%使用定制服務,其中80%的標準數(shù)據(jù)集由愛數(shù)智慧自行進行相應的數(shù)據(jù)包裝處理和入庫。張晴晴說:“我們采用兩種方式來保證數(shù)據(jù)的安全性。在數(shù)據(jù)處理環(huán)節(jié),對于個人信息,進行脫敏處理,讓企業(yè)在使用數(shù)據(jù)時沒有安全風險;在數(shù)據(jù)處理定制部分,我們使用我們的數(shù)據(jù)私有化系統(tǒng),這對車企來說是一種比較安全的方式?!?/p>
顯然,數(shù)據(jù)越來越重要,但企業(yè)做數(shù)據(jù)服務需要懂數(shù)據(jù)的人才,比如懂音頻、懂視頻和懂文本等,并擁有提供相應解決方案的能力。張晴晴說:“我做了很長時間的AI研發(fā),最后我選擇做數(shù)據(jù),就是因為我覺得在AI行業(yè)需要有專業(yè)的數(shù)據(jù)公司為所有算法以及研發(fā)人員提供更好的數(shù)據(jù)解決能力。只有這樣,整個人工智能才有機會更好地向前發(fā)展。我希望愛數(shù)智慧能幫助人工智能更好地向前發(fā)展,并希望所有想向智能化轉(zhuǎn)型的車企能更好地向前發(fā)展。這是我的初心?!?/p>