T:大數(shù)據(jù)這個(gè)概念自誕生以來,深受輿論追捧,但也存在種種誤讀,如何準(zhǔn)確而言簡意賅地定義大數(shù)據(jù)?
F:簡單說,大數(shù)據(jù)關(guān)乎那些可以改變我們生活的應(yīng)用,比如運(yùn)動健康、食品運(yùn)輸、零售、智能城市等。能否成為“大數(shù)據(jù)”的關(guān)鍵在于,你能否將這些數(shù)據(jù)真實(shí)運(yùn)用到現(xiàn)實(shí)中。不能用的話,數(shù)據(jù)本身無意義,并不能保證讓你做出更好的決定。
關(guān)于大數(shù)據(jù)最大的誤解我想在于“大”這個(gè)概念。雖然叫做“大數(shù)據(jù)”,但不一定要“大”才會產(chǎn)生影響。切入的視角和分析手段更重要,真正有意義的并非數(shù)據(jù)的規(guī)模,而是它能如何產(chǎn)生影響。
T:大數(shù)據(jù)真的會改變很多行業(yè)嗎?具體來說,它究竟是怎樣改變行業(yè)既定規(guī)則的?
F:IT業(yè)當(dāng)然是最明顯的,大數(shù)據(jù)可以影響服務(wù)器、基礎(chǔ)設(shè)施、計(jì)算機(jī)的管理等。
另一個(gè)是零售行業(yè),尤其是電商,交易規(guī)模、消費(fèi)偏好、購物興趣等,大數(shù)據(jù)都可以在你做決策時(shí)給出參考。
此外還有健康管理。醫(yī)生可以根據(jù)大數(shù)據(jù)來監(jiān)測病人的健康情況,你也可以監(jiān)測自己的健康。
還有可能涉及教育產(chǎn)業(yè),去發(fā)現(xiàn)一種更具自我驅(qū)動力的學(xué)習(xí)方式,定制化的APP可以知曉如何用更好的方式去教育特定的學(xué)生。
教育產(chǎn)業(yè)獲得數(shù)據(jù)的方式可能有兩種:其一,當(dāng)學(xué)生在學(xué)校遇到困難時(shí)——完成作業(yè)通常很慢,在測試中表現(xiàn)不佳,逃課,這些都是學(xué)生的數(shù)據(jù)碎片。如果你擁有了成百上千個(gè)學(xué)生的數(shù)據(jù)碎片,就可能預(yù)測在哪些時(shí)間段哪種學(xué)生會需要何種幫助,從而讓老師能更合理有效地分配工作時(shí)間。
其二,紙質(zhì)材料已經(jīng)很傳統(tǒng)了,更有自我驅(qū)動力的個(gè)性化數(shù)字教材,可以在你學(xué)習(xí)的過程中“學(xué)習(xí)”你。
不過,與其探討大數(shù)據(jù)會最多改變哪些行業(yè),不如探討,大數(shù)據(jù)會以怎樣的順序改變這些行業(yè)。因?yàn)楝F(xiàn)在幾乎所有領(lǐng)域都看到了大數(shù)據(jù)的影響力。我的書名副標(biāo)題是“大數(shù)據(jù)如何改變我們的學(xué)習(xí)、生活甚至愛”,這是個(gè)大題目,但這是真的。生活的衣食住行和教育都顯現(xiàn)出大數(shù)據(jù)的作用了,至于愛這個(gè)話題——社交媒體、在線約會,人與人之間的關(guān)系在這些工具和數(shù)據(jù)上都有點(diǎn)滴積累,據(jù)此可以更了解你的愛好。
T:創(chuàng)業(yè)者和大公司對大數(shù)據(jù)的利用有何不同?
F:大公司很有錢、有很多人、有很多數(shù)據(jù)。這是他們最有利的一點(diǎn),也是最薄弱的一點(diǎn),因?yàn)闊o法像創(chuàng)業(yè)者那樣很快推進(jìn)。非常有自我驅(qū)動力的創(chuàng)業(yè)者可以在自己的領(lǐng)域找到缺口,迅速行動。人們之所以認(rèn)為速度對大數(shù)據(jù)應(yīng)用很重要,一個(gè)原因在于,當(dāng)你去和客戶談合作時(shí),他們已經(jīng)準(zhǔn)備好大數(shù)據(jù)方面的預(yù)算了。能快速建立起你的數(shù)據(jù)庫,就容易賣出產(chǎn)品。
另一個(gè)原因是,現(xiàn)在獲得數(shù)據(jù)的成本比以前低很多,廉價(jià)渠道為大數(shù)據(jù)生意制造了很多利潤空間。
比如,我認(rèn)為Netflix就是一家了不起的公司,有非常龐大的數(shù)據(jù)分析部門,很多聰明人根據(jù)數(shù)據(jù)來推薦電影和電視劇。在他們根據(jù)數(shù)據(jù)制定電視劇拍攝計(jì)劃后,數(shù)據(jù)有效性會自動體現(xiàn)在股市上,股市可以作為數(shù)據(jù)有效的一個(gè)映射。我完全相信Netflix的數(shù)據(jù)是有效的。他們在搭建數(shù)據(jù)平臺和分析方面都十分有創(chuàng)意。
T:公司在利用大數(shù)據(jù)做決策時(shí),有哪些方式可以考量數(shù)據(jù)的有效性?
F:這是個(gè)很好的問題。在20年前,人們也同樣懷疑過電子郵件在工作中是否真能提高效率,怎么測量這種有效性。有一部分公司選擇觀望,也有公司比如微軟,大膽擁抱了這項(xiàng)新技術(shù)。他們也沒有什么量化途徑,只是堅(jiān)信會帶來改觀。
我認(rèn)為,大數(shù)據(jù)現(xiàn)在也面臨同樣情形。有人懷疑,有人擁抱,但最終事實(shí)會證明它的確有效。當(dāng)然,對大數(shù)據(jù)的評估當(dāng)然也同樣重要,你得經(jīng)常回顧你的數(shù)據(jù)。
T:影響大數(shù)據(jù)發(fā)揮更大作用的關(guān)鍵因素有哪些?
F:我認(rèn)為,成本是首要因素。當(dāng)分析數(shù)據(jù)的成本變得越來越便宜時(shí),數(shù)據(jù)影響力也會更大。
另外,獲取數(shù)據(jù)的移動設(shè)備也會發(fā)揮很大作用。人們越黏在手機(jī)上玩各種APP,手機(jī)就會越了解你,數(shù)據(jù)對你的影響就會越大。
同時(shí),也需要更多創(chuàng)業(yè)者去創(chuàng)造更多有趣的APP,挖掘更多層面的數(shù)據(jù)。
在云服務(wù)更普及時(shí),數(shù)據(jù)應(yīng)用會更快捷。云端存儲、計(jì)算會省去數(shù)據(jù)應(yīng)用者很多硬件麻煩。
T:在大數(shù)據(jù)概念興起的同時(shí),一些全新的細(xì)分行業(yè)也在IT業(yè)中崛起,以可穿戴設(shè)備為例,大數(shù)據(jù)將在其中扮演什么角色?
F:谷歌眼鏡、智能手表、運(yùn)動手環(huán)等已有移動端,會更主動地收集數(shù)據(jù)。
這個(gè)領(lǐng)域還在起步,但5至10年后會是我們生活的一部分。智能硬件是軟件和硬件的結(jié)合,硬件可能發(fā)展出很多形態(tài),穿戴式的甚至植入式的,對消費(fèi)者最有吸引力。但硬件傳感器只是收集數(shù)據(jù)的工具,數(shù)據(jù)分析還要依靠軟件完成。
大數(shù)據(jù)給智能硬件創(chuàng)業(yè)者帶來的機(jī)會可能是,他們不必費(fèi)心想該如何分析數(shù)據(jù),就像蘋果不會自己塞滿APP Store一樣,會有很多APP創(chuàng)業(yè)者基于可穿戴設(shè)備硬件這個(gè)平臺,利用其收集的數(shù)據(jù),來做出很多你想象不到的分析和用途。在大數(shù)據(jù)的思路下,智能硬件就是新平臺。
T:大數(shù)據(jù),從某種層面可看做是互聯(lián)網(wǎng)技術(shù)把人的信息存留于網(wǎng)絡(luò)上,隨之引發(fā)的問題是,該如何保護(hù)人的隱私?
F:隨時(shí)在線的最大問題就是,你隨時(shí)都會留下很多數(shù)據(jù),有很多公司都在收集。我認(rèn)為,公司必須對所收集的數(shù)據(jù),以及這些數(shù)據(jù)可能的用途,非常透明地告訴給用戶。在這一點(diǎn)上,眼下的很多公司還有極大的改進(jìn)空間。
但進(jìn)入可穿戴時(shí)代,比如,你不想被谷歌眼鏡認(rèn)出時(shí),這個(gè)辦法未必奏效,所以可穿戴時(shí)代中,大數(shù)據(jù)隱私問題非常復(fù)雜。
或許,我們正在進(jìn)入一個(gè)全新的紀(jì)元,人們?yōu)榱耸褂眠@些新設(shè)備,必須共享更多信息。隱私的邊界可能要被重新定義了。