每個(gè)中文用戶都需要學(xué)會(huì)的一項(xiàng)基礎(chǔ)PC操作技能就是“打字”,從單字輸入到詞語輸入,再到借助搜索引擎技術(shù)實(shí)現(xiàn)的整句輸入,如今的漢字輸入法已經(jīng)處在一個(gè)新的發(fā)展拐點(diǎn)。將搜索引擎技術(shù)與輸入法結(jié)合之后,候選詞的動(dòng)態(tài)排序和詞庫的動(dòng)態(tài)更新功能大大提高了漢字輸入的準(zhǔn)確性和命中率,但可惜的是中文輸入法對(duì)于搜索引擎技術(shù)的挖掘也止步于此,在技術(shù)創(chuàng)新上并沒有走得更遠(yuǎn)。
經(jīng)過微軟亞洲研究院與微軟中國(guó)Office商務(wù)軟件部1年左右的聯(lián)合研發(fā),微軟終于推出了自己的第一款云輸入法——“英庫拼音”。該產(chǎn)品基于微軟的“英庫(Engkoo)”技術(shù)。“英庫”是微軟于2009年推出的自然語言領(lǐng)域的技術(shù)集合。它借助云計(jì)算平臺(tái)以及先進(jìn)的自然語言處理技術(shù)和語音處理技術(shù),為中英文詞典、機(jī)器翻譯、語言輔助學(xué)習(xí)、中英文輸入以及寫作等語言相關(guān)的應(yīng)用提供基礎(chǔ)技術(shù)。英庫拼音輸入法是繼英庫詞典(現(xiàn)名必應(yīng)詞典)之后,微軟亞洲研究院在“英庫”技術(shù)基礎(chǔ)上的又一項(xiàng)研究成果。通過云計(jì)算技術(shù)提供的強(qiáng)大存儲(chǔ)和處理能力,英庫拼音不僅讓中文輸入更快捷、精準(zhǔn)和智能,而且創(chuàng)新性地將輸入由文本擴(kuò)展至更為豐富的多媒體信息,為用戶帶來了與眾不同的使用體驗(yàn)。
基本輸入命中率
對(duì)于漢字輸入系統(tǒng)而言,準(zhǔn)確性是最核心的競(jìng)爭(zhēng)力。在包含“非主流、微電影、火星文、秒殺、人肉搜索、經(jīng)濟(jì)適用男、蘿莉、腐女、傷不起、鳳凰男、裸婚、御姐、穿越、吐槽、車震、跑酷、基友、你懂的、腹黑、正太”在內(nèi)的20個(gè)當(dāng)前最熱門的搜索關(guān)鍵詞的輸入測(cè)試中,英庫拼音測(cè)試版將其中的18個(gè)熱門詞匯排列在了候選詞的首位,只有“腐女”的默認(rèn)排序是第3位,“基友”的默認(rèn)排序是第12位。而目前國(guó)內(nèi)用戶量最大的輸入法搜狗拼音將17個(gè)熱門詞匯排在候選詞的首位,“腐女”、“基友”和“你懂的”都排位靠后。
在最容易寫錯(cuò)的20個(gè)成語測(cè)試中,英庫拼音的準(zhǔn)確率為100%,而搜狗拼音在保證首個(gè)候選詞正確的同時(shí),畫蛇添足地將括號(hào)中的錯(cuò)誤寫法排在了候選詞的第2位,例如按部就班(按步就班)、別出心裁(別出新裁)和矯揉造作(撟揉造作)。另外,從實(shí)際體驗(yàn)來說,英庫拼音在整句輸入上的準(zhǔn)確率之高也令人刮目相看。
不難看出,還處在公開測(cè)試階段的英庫拼音的中文引擎核心性能擁有極高的水準(zhǔn),甚至在一些關(guān)鍵指標(biāo)上優(yōu)于已經(jīng)“出道”多年的主流拼音輸入法。但英庫拼音輸入法真正的獨(dú)家秘笈并不在于此。
增強(qiáng)的字詞輸入
云計(jì)算技術(shù)使英庫拼音輸入法創(chuàng)新性地實(shí)現(xiàn)了更自然的中英文混合輸入,用戶無需通過額外按鍵(通常是[Shift]鍵)反復(fù)切換中英文的輸入模式,拼音和英文即可被準(zhǔn)確識(shí)別,而且能夠很自然地融合在一起輸入。例如可以直接輸入“weiruankinect”得到“微軟kinect”或者輸入“chipxindiannao”得到“chip新電腦”。英庫拼音輸入法的這一功能對(duì)于用戶,尤其是有雙語輸入習(xí)慣的用戶而言有重要的意義,目前還沒有任何其他產(chǎn)品可以做到這一點(diǎn)。
另外,英庫拼音還能夠更智能地輸入英文單詞。開啟“英文輸入小幫手”功能后,在英文輸入模式下,英庫輸入法可以智能地輔助我們完成英文輸入任務(wù)。像其他英文輸入法一樣,它擁有最基本的單詞自動(dòng)補(bǔ)充和糾正功能。更特別的地方在于,如果我們一時(shí)想不起單詞的拼寫,那么直接按照漢語拼音的拼寫方式將單詞的讀音大致拼出來,英文輸入助手就會(huì)提供讀音相近的詞供我們選擇;如果完全不知道要用哪個(gè)單詞,那么直接輸入該單詞的漢語拼音,英庫拼音還可以為我們提供英文單詞的建議。例如輸入“feiniks”就可以得到我們想輸入的單詞“phoenix”(鳳凰),輸入漢語拼音“hangtianfeiji”,就可以得到單詞“space shuttle”(航天飛機(jī))。
懂你的輸入法
傳統(tǒng)的中文輸入法只能輸入文字和一些簡(jiǎn)易的表情。但是英庫拼音輸入法創(chuàng)新性地將輸入由文本擴(kuò)展至更為豐富的圖片、地圖和網(wǎng)頁等多媒體信息。
輸入字母[v],然后選擇第一個(gè)候選種類“圖片”,接下來輸入想要的關(guān)鍵詞,例如“超極本”,就可以得到來自必應(yīng)圖片搜索引擎搜索到的圖片“候選詞”,我們不需要打開瀏覽器就可以將搜索到的圖片(縮略圖)插入到正在編輯的文檔中;選擇第二個(gè)候選種類“地圖”,然后輸入想要的地名,例如“奧體中心”,就可以得到當(dāng)?shù)貖W體中心的地圖位置信息;選擇第三個(gè)候選種類“網(wǎng)頁”,然后輸入關(guān)鍵詞,例如“新電腦”,就可以得到從必應(yīng)搜索中截取的搜索結(jié)果摘要和網(wǎng)址。
除了能幫助用戶輸入更豐富的信息之外,英庫拼音還能更好地解讀用戶的輸入意圖,它可以智能地識(shí)別用戶所處的情景和輸入習(xí)慣。例如在MSN聊天窗口中輸入“哈哈”,就會(huì)出現(xiàn)表情圖片,但在記事本中輸入相同關(guān)鍵字,表情圖片這種候選結(jié)果則不會(huì)出現(xiàn);在Word中使用“V模式”搜索地圖可以得到地圖的圖片截圖,但是在記事本中輸入相同關(guān)鍵字則能得到該地圖的鏈接地址;和朋友聊天時(shí)說到想去看最近流行的電影(例如“看變形金剛”),就可以在候選詞中看到電影視頻的縮略圖,將鼠標(biāo)放在縮略圖上,視頻即可自動(dòng)播放。
另外,聰明的輸入法還應(yīng)該會(huì)不斷地“自學(xué)習(xí)”。例如,當(dāng)英庫拼音輸入法發(fā)現(xiàn)很多用戶選擇進(jìn)入“V模式”搜索某個(gè)詞條的圖片時(shí),它就會(huì)知道并記錄下來,下一次直接輸入這個(gè)詞條即會(huì)顯示出圖片候選項(xiàng)。
結(jié)論
雖然英庫拼音輸入法剛剛推出第一個(gè)公開測(cè)試版本,很多創(chuàng)新的功能還處在雛形階段,還有許多難題需要攻克,例如目前的“V模式”還有很多限制,實(shí)用性有待考驗(yàn),但是它的設(shè)計(jì)理念為我們帶來了驚喜。隨著后續(xù)版本功能上的不斷完善和設(shè)計(jì)上的進(jìn)一步優(yōu)化,相信微軟產(chǎn)品的中文輸入體驗(yàn)將會(huì)迎來大幅度的革新。不過更重要的是,它意味著更智能的云輸入2.0時(shí)代即將到來,借助云計(jì)算、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù),更懂用戶的輸入體驗(yàn)就在不遠(yuǎn)處。
讓輸入法更聰明
微軟的基礎(chǔ)研究之一就是千方百計(jì)通過網(wǎng)絡(luò)挖掘來發(fā)現(xiàn)剛剛出現(xiàn)的新詞匯。網(wǎng)絡(luò)挖掘與機(jī)器學(xué)習(xí)也是相關(guān)聯(lián)的。他們教會(huì)機(jī)器,什么是詞匯,什么是語言,其中的基本內(nèi)容之一是建立語言模型。這也是輸入法的核心。基礎(chǔ)研究的意義在于從最基本的層面上改善IME體驗(yàn),讓它更加精確、速度更快。
英庫是以前的工作和現(xiàn)在的工作之間的一次過渡。他們希望把頂尖的研發(fā)成果帶給大家,這也是英庫拼音輸入法的重要差別化因素之一。未來版本中,英庫拼音還將增加更多的功能,讓它變得更聰明,這樣用戶就可以集中精力進(jìn)行交談或者完成寫作任務(wù),而無需擔(dān)心其背后的細(xì)節(jié)。
研發(fā)挑戰(zhàn)
在基礎(chǔ)研究過程中,你必須沿著一條從未走過的道路前行,如何判斷自己所走的是一條正確的道路,這是最主要的挑戰(zhàn)。但幸運(yùn)的是,車?yán)^偉的Office團(tuán)隊(duì)在工程設(shè)計(jì)方面為我們提供了極大的支持,讓我們判斷出自己是否在朝著正確的方向前進(jìn),因此我們能夠按時(shí),甚至提前交付高質(zhì)量的產(chǎn)品。
——Matthew Scott
微軟亞洲研究院創(chuàng)新工程中心高級(jí)研發(fā)主管
用戶行為調(diào)研是一個(gè)很復(fù)雜的過程,我們有傳統(tǒng)的行為調(diào)研、數(shù)據(jù)分析,也會(huì)做前一版的數(shù)據(jù)分析,看現(xiàn)在的設(shè)計(jì)模式。微妙之處在于,有些決定是設(shè)計(jì)主導(dǎo),有些決定則是數(shù)據(jù)或者行為分析主導(dǎo),我們需要在兩者之間取得平衡。同樣,在用戶選擇和機(jī)器智能之間取得平衡,也是比較大的挑戰(zhàn)。
——車?yán)^偉
微軟中國(guó)Office商務(wù)軟件部產(chǎn)品規(guī)劃總監(jiān)