任何足夠先進的技術,就像變魔術。你看到它在運作.但它的原理卻不是一目了然,這種技術就是研究院專注的目標。
2019年9月15日上午10點半,Jackson收到了醫(yī)院通過電子郵件發(fā)來的診斷報告,“禁聲”兩個字在報告中特意用紅色的字體標注了出來。他最近正被嚴重的咽炎所困擾,但下午還有一個重要的客戶會議等待著他。Jackson思考了一下,打開電腦,把精心準備好的講稿輸入語音合成系統(tǒng)……
下午3點,Jackson充滿磁性的嗓音回蕩在會議室里,幾乎沒有人覺得這個聲音有什么異常,對于客戶提出的問題,他照樣對答如流,只不過說“話”的可不是Jackson的嗓子,而是裝置在PC端的“虛擬播音員”,他需要做的,只是把要說的內容即時輸入電腦而已。
“我們十年前就開始做虛擬播音員的項目了,期間對算法有很多提高、改進,這個過程就好像科幻小說一樣,”微軟亞洲研究院技術戰(zhàn)略總監(jiān)張益肇笑著說,“雖然現(xiàn)在使用虛擬播音員的成本還很高,但在未來十年,我們期望大家在互聯(lián)、交流的時候能夠更順暢,在使用周圍器材的時候能夠更容易。我一直期待這樣的驚喜?!?/p>
十年一個周期。剛剛走過了第一個十年的微軟亞洲研究院已經開始了對下一個十年的計劃,在張益肇看來,十年之后,互聯(lián)網上累積的知識和智慧將會被更全面地發(fā)揮出來。
研究院的C3PO
《星球大戰(zhàn)》出現(xiàn)以前的世界,是一個沒有手機和個人電腦的世界,更沒有人聽說過“互聯(lián)網”這個名詞,人類才剛開始探索太空。出于對于太空的無限憧憬,喬治·盧卡斯使用了當時最先進的數字手段,創(chuàng)造了一個令人匪夷所思的太空世界。而這部充滿想象力的影片除了創(chuàng)下嘆為觀止的票房收入外,還有著里程碑的意義——電影開始全面進入數字化時代。
“跟大家介紹自己工作的時候,我會開玩笑地借用《星球大戰(zhàn)》一個叫C3PO的角色?!睆堃嬲貙ψ趯γ娴谋究浾哒f,“這3個C分別是connect(連接)、communicate(溝通)和collaborate(合作);P則指代patent(專利),研究員們都希望能有所產出,我們每年對專利的投資也相當多;O是others (其它)?!?/p>
在微軟亞洲研究院工作,就好像踏入了《星球大戰(zhàn)》的航程,勇于冒險的精神是推動“劇情”不斷向前發(fā)展的驅動力。
奧巴馬訪華期間,擁有奧巴馬科技顧問、微軟首席研究及戰(zhàn)略官雙重身份的克瑞格·蒙迪特意來到微軟亞洲研究院。“他來提醒我們,我們的工作就是冒險,”張益肇說,“從研究的立場來講,要做技術創(chuàng)新,首先要看到足夠大的問題或挑戰(zhàn)。只有足夠大的問題和挑戰(zhàn),才可以看到這個研究項目是否值得讓你做得長遠,比如三年五年,而不是說很簡單地一看到就知道該怎么做。這種對研究院來講,就不是一個非常適合的項目?!?/p>
“如果每個項目都成功的話,整個研究院本身是失敗的。這樣就表示,我們沒有冒足夠的風險?!?/p>
但冒險并非冒進,對于微軟這樣一家“不甘落后”的企業(yè)而言,冒險的目的是要對未來的技術或者生活方式產生影響?!盀榱藢崿F(xiàn)這種大的目標,更有效的方法是鼓動大家跟你一起追尋夢想,一起達成目標。因為這種包含大風險的事情,通常需要很多不同專長的人一起來合作,才能真正找出提高成功率的辦法?!倍缃M的合作,成為微軟亞洲研究院2009年最主要的研發(fā)模式。
著名科幻學家克拉克曾說過,任何足夠先進的技術,就像變魔術。你看到它在運作,但它的原理卻不是一目了然,它有它的內涵在里面。這種技術就是微軟亞洲研究院專注的目標。
實踐為導向的研究
“我們跟外界的相關度越來越大了?!睆堃嬲卦谡勂鹂缃M合作以及和研究院和產品組之間的合作時,舉了虛擬播音員和英庫(Engkoo)的例子?!啊摂M播音員’這個概念是由好幾個組合作完成,其中語音組是最主要的,也得到了視覺計算等其它組的支持。因為你要把這個技術做好的話,除了處理聲音,你還要處理臉的各種特征的變化,然后再銜接,經過彼此間的很多合作,才能把結果做出來?!倍靹t走出了研究院,開始出現(xiàn)在MSN的頁面上?!拔覀兏a品部門合作,希望更多的人能知道它(英庫)、使用它、提供反饋,然后我們可以根據用戶的需求,來做進一步的改進?!?/p>
這種把研究成果放在網站上來收集用戶意見的研究模式在微軟亞洲研究院被稱為以實踐驅動的研究(Deployment Driven Research)。技術正在以人們無法想象的速度向前發(fā)展著,計算機科學技術正在從單一的學科領域逐步滲入到不同的應用場景中去。“在以前,計算機科學技術往往是單純去解答一個已經規(guī)范得很好的題目,但現(xiàn)在出現(xiàn)了更大的問題,只有你真正了解社會上如何應用這個技術,才有辦法解決它?!?/p>
其實,在中國有講英語需求的人比美國人口還要多,但目前的語言工具還不足以幫助人們更好的寫英文、說英文,而要真正了解人們的需求在哪里,哪一項功能特別有效或者哪些功能的使用頻率最大,必須和真正的用戶做全面的溝通?!耙詫嵺`驅動的研究,它的好處就在于我們可以以大量的規(guī)模方法來了解用戶的需求。拿英庫來說,它的設計現(xiàn)在主要針對白領和高校學生。有些用戶就會說,是不是可以做一個不同的界面,給初中生或者小學生來使用,對他們來講,色彩更豐富的用戶界面會更友善一點。很多類似的思路我們當時并沒有想到,但的確反映了用戶的需求?!?張益肇說。
通過和實際用戶的接觸,研究院可以更好的了解到技術到底適合不適合放入產品,應該在什么時機放入產品,新技術在和用戶的不斷交流中層出不窮,不斷升級。
關于未來的狂想
互聯(lián)網在悄無聲息中將人與人、機器與機器甚至是人與機器連接起來了。未來的世界將有可能超出人類現(xiàn)有的想象。
11月3日,國務院總理溫家寶向首都科技界發(fā)表的題為《讓科技引領中國可持續(xù)發(fā)展》的講話中指出,信息網絡產業(yè)是世界經濟復蘇的重要驅動力。
社交網站正在把人們日常的交流數據化,文化遺產的數字化保護也成為一種常態(tài),數字醫(yī)療、智慧鐵路等正在把海量數據的采集、存儲、分析、應用有序的組織起來?!皵祿迷谖磥硪矔纬梢粋€越來越規(guī)?;男枨?。”張益肇頓了頓,“‘云’和‘端’的關聯(lián)將會越來越多,比如現(xiàn)在這個機器上面的數據,怎么樣去跟別的機器上的數據同步,或者怎么樣去進行積極的處理。如果我們的思考模式更寬一點的話,‘三屏一云’(PC、手機、電視+云計算)或許就是你想要的未來?!?/p>
不管你在哪里,只要攜帶最輕便的一種終端,就可以接收到你所需要的信息,并在發(fā)現(xiàn)更大屏幕時,將數據平穩(wěn)地自動傳輸到大屏幕之上?!霸谌绾胃谩⒏行У馗藴贤ń涣鞯姆矫?,我們現(xiàn)在還有很多可以做得更好的地方?!?/p>
在采訪快要結束的時候,張益肇告訴記者:微軟亞洲研究院獨特的地方,就在于可以讓優(yōu)秀的同事們在這兒追尋他們自己想要做的研究,更獨特的是在這里也可以找到發(fā)揮他們影響力的機會,比如說把你的研究轉化成產品,然后擴大你影響力的機會。而微軟關于未來的狂想,往往就從這里開始。