劉巖
如果你在百度、必應(yīng)等搜索引擎中輸入“明晚從上海到廣州的航班,東航”等類似問題,得到的答案往往是航班時刻表鏈接等模糊答案,甚至是各種風(fēng)馬牛不相及的答案。最終還需要進(jìn)一步搜索,通過多步操作才能找到想要的航班信息。
“出門問問”語音助手則能幫用戶找到想要的信息。這款語音工具能從出發(fā)地、目的地、去程日期、返程時間、價格、航空公司等多個維度幫助用戶查詢,答案還能一步到位,而且精準(zhǔn)度非常高。它還能聰明地解析出口語中常用的“東航”即為“東方航空”等各種復(fù)雜的詢問信息。除了查詢航班信息外,出門問問還能查詢火車票和酒店、餐館、藥店、銀行等各種周邊生活信息。目前,他們首選微信公眾平臺進(jìn)行推廣。
怎么想到做這個方向的?
這是一個靠技術(shù)驅(qū)動的創(chuàng)業(yè)團(tuán)隊。2012年底,出門問問創(chuàng)始人李志飛拿到天使投資后回國創(chuàng)業(yè)。早在2000年之前,他已經(jīng)開始從事移動互聯(lián)網(wǎng)相關(guān)工作,一直想在移動互聯(lián)網(wǎng)領(lǐng)域成就一番作為,之后在約翰霍普斯金大學(xué)攻讀博士期間的研究方向?yàn)橹悄軝C(jī)器人翻譯,當(dāng)時他寫了很多相關(guān)領(lǐng)域的學(xué)術(shù)論文,他曾開發(fā)的一個開源機(jī)器翻譯軟件已經(jīng)成為世界學(xué)術(shù)界兩大主流機(jī)器翻譯軟件之一,斯坦福、麻省理工大學(xué)等都會使用。畢業(yè)之后,李志飛加入谷歌總部擔(dān)任科學(xué)家,從事機(jī)器翻譯的研究和開發(fā)工作。
隨著移動互聯(lián)網(wǎng)的需求放量,李志飛認(rèn)為計算能力的提高、大數(shù)據(jù)量的存在等各方面已經(jīng)取得突破。語音識別、機(jī)器翻譯等技術(shù)在經(jīng)歷幾波熱潮之后,他感覺是時候加入創(chuàng)業(yè)大軍中來了。
跟同類產(chǎn)品的差異是什么?
目前市場上有智能360、小i機(jī)器人、搜狗語音助手、訊飛等各種Siri跟隨者。就產(chǎn)品形態(tài)來看,他們多是以打電話、發(fā)短消息、信息查找等形式展開查詢,強(qiáng)調(diào)上下文對話時語義的解析功能。
出門問問弱化了對話功能,不存在上下文對話解析,即不允許用戶進(jìn)行先問“上海明天的天氣如何”再問“那北京呢”這種提問方式。出門問問更突出信息搜索功能。這樣做的好處是避免了“所問非所答”現(xiàn)象的出現(xiàn)。之所以不做上下文解析和多對話解析的原因在于,李志飛認(rèn)為目前這種技術(shù)實(shí)現(xiàn)難度比較高。目前,出門問問跟定位于國外市場的Google Now產(chǎn)品形態(tài)更為相似。
特色在哪里?
出門問問的工作原理分為三部分:第一步,語音識別,即將聲音轉(zhuǎn)化成文字;第二步,語義分析,將時間、地點(diǎn)等關(guān)鍵字轉(zhuǎn)化成表格;第三步,應(yīng)用對接,即所謂垂直領(lǐng)域的搜索。出門問問最擅長、最核心的是第二步:語義分析。
拿機(jī)票查詢案例說明。出門問問會將出發(fā)地、目的地、時間、價位、班次等多維度查詢參數(shù)轉(zhuǎn)化成表格。解析時,能判斷“下星期二是幾號”,即使句式顛倒也不影響查詢效果。哪怕輸入“魔都”去“帝都”的飛機(jī)班次,也能識別出來。
在李志飛看來,要做好任何一種機(jī)器學(xué)習(xí)系統(tǒng)必須具備三大元素:核心算法、系統(tǒng)架構(gòu)、基礎(chǔ)數(shù)據(jù)量。具備一定的數(shù)據(jù)量和核心算法之后,是否具備圍繞核心算法的輔助性工具非常關(guān)鍵。于是,李志飛團(tuán)隊用六個多月時間搭建了一套系統(tǒng),系統(tǒng)的亮點(diǎn)在于實(shí)現(xiàn)了模塊化、工具化。這就是他們的核心競爭力之所在。
因此,即使不懂編程的員工也能在系統(tǒng)中添加數(shù)據(jù)。這意味著出門問問的可擴(kuò)展性比較強(qiáng),若他們想轉(zhuǎn)向生活消費(fèi)類外的其他細(xì)分領(lǐng)域,只需要非技術(shù)性人員花兩三天時間就能完成一套垂直領(lǐng)域類語義分析系統(tǒng)的搭建。這套通用性、自動化系統(tǒng)搭建成型之后,出門問問以后的工作是不斷優(yōu)化系統(tǒng),繼續(xù)提高系統(tǒng)查詢精準(zhǔn)度。