沈建苗
如今,你經(jīng)??梢月牭饺斯ぶ悄芎蜋C(jī)器學(xué)習(xí)方面的話題。雜志文章和電視廣告紛紛報(bào)道這些技術(shù)有望帶來變革。不過我們需要注意,人工智能和機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)存儲(chǔ)有著幾乎永不滿足的要求。它們將耗用龐大的存儲(chǔ)容量,同時(shí)要求極高的吞吐量。
國際數(shù)據(jù)公司(IDC)的最新報(bào)告顯示,存儲(chǔ)收入持續(xù)上漲,這對(duì)于力求提高銷售額的存儲(chǔ)供應(yīng)商們來說是個(gè)好消息。但由于分析引擎與數(shù)據(jù)存儲(chǔ)庫相競爭,期望以分析引擎渴望的速度獲取信息,存儲(chǔ)行業(yè)的產(chǎn)能有可能達(dá)到極限。
DataDirect Networks公司的產(chǎn)品營銷高級(jí)主管勞拉·謝潑德(Laura Shepard)說:“采用機(jī)器學(xué)習(xí)會(huì)很快給底層的數(shù)據(jù)訪問和管理基礎(chǔ)設(shè)施帶來負(fù)擔(dān)。機(jī)器學(xué)習(xí)的原型和第一代機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施通常建立在現(xiàn)有企業(yè)存儲(chǔ)的基礎(chǔ)上,或者搭建基礎(chǔ)設(shè)施的團(tuán)隊(duì)決定用白盒服務(wù)器,同時(shí)結(jié)合開源、自主開發(fā)和商用的工具和應(yīng)用軟件來自行搭建?!?/p>
因此,即使是最成功的機(jī)器學(xué)習(xí)計(jì)劃也經(jīng)常會(huì)遇到規(guī)模方面的問題。一般而言,人工智能,可以整合的數(shù)據(jù)越多,得到的結(jié)果就越好。這促使機(jī)器學(xué)習(xí)項(xiàng)目越來越龐大。
出現(xiàn)這種情況后,我們看到第一代基礎(chǔ)設(shè)施開始不堪重負(fù),出現(xiàn)規(guī)模擴(kuò)展方面的失敗,比如無法讓用戶以所需的速度來訪問數(shù)據(jù),無法擴(kuò)大所處理的數(shù)據(jù)量以改進(jìn)結(jié)果,無法在管理起來簡單或經(jīng)濟(jì)高效的存儲(chǔ)環(huán)境下擴(kuò)展數(shù)據(jù)存儲(chǔ)。謝潑德表示,任何一個(gè)這樣的失敗都可能讓整個(gè)項(xiàng)目偏離正常軌道,因?yàn)槿绻銦o法增加輸入,或無法更進(jìn)一步增加網(wǎng)絡(luò)的深度,也就無法擴(kuò)展輸出。
機(jī)會(huì)找上門
但一個(gè)人的挑戰(zhàn)是另一個(gè)人的機(jī)會(huì)。隨著人工智能和機(jī)器學(xué)習(xí)日益得到采用,它勢必會(huì)吸引越來越多渴望解決許多相關(guān)問題的初創(chuàng)公司。
IT Brand Pulse公司的高級(jí)分析師弗蘭克·貝里(Frank Berry)說:“管理數(shù)據(jù)中心基礎(chǔ)設(shè)施向來是個(gè)主動(dòng)的過程,我們要走在業(yè)務(wù)需求的前頭。機(jī)器學(xué)習(xí)有望通過自動(dòng)化來提升存儲(chǔ)性能、提高可用性服務(wù)級(jí)別、提高效率(每個(gè)存儲(chǔ)單元需要更少的管理員)。”
Zadara Storage公司的營銷副總裁凱文·利布爾(Kevin Liebl)進(jìn)一步闡述了這個(gè)主題。他認(rèn)為,人工智能會(huì)大大提高數(shù)據(jù)存儲(chǔ)的自我管理性(想想自動(dòng)駕駛的數(shù)據(jù)中心,就像自動(dòng)駕駛的汽車那樣)。
利布爾說:“自動(dòng)化將大大增加管理員可以管理的服務(wù)器數(shù)量,從如今同類中最多可管理VMware環(huán)境中的大約500臺(tái)服務(wù)器,增加到將來每個(gè)管理員可能管理20000臺(tái)服務(wù)器,到時(shí)候服務(wù)器完全由分析技術(shù)和自動(dòng)化服務(wù)器管理軟件來監(jiān)控和管理,這將使存儲(chǔ)和管理更容易、更省時(shí)、更高效?!?/p>
他補(bǔ)充道:“存儲(chǔ)是自動(dòng)駕駛的數(shù)據(jù)中心的核心,因?yàn)樗械淖詣?dòng)化都需要記錄各種活動(dòng),這些活動(dòng)當(dāng)然會(huì)生成數(shù)據(jù)。由于云計(jì)算、移動(dòng)技術(shù)、物聯(lián)網(wǎng)、社交媒體和分析技術(shù)大行其道,將來生成的數(shù)據(jù)只會(huì)更龐大。這就是為什么總的數(shù)據(jù)存儲(chǔ)量會(huì)繼續(xù)每兩年翻一番?!?/p>
利布爾說:“人工智能對(duì)存儲(chǔ)行業(yè)的最大需求可能就在于需要存儲(chǔ)管理功能,好讓系統(tǒng)得以處理數(shù)據(jù)洪流?!?/p>
人工智能和機(jī)器學(xué)習(xí)的興起很可能會(huì)影響存儲(chǔ)行業(yè),就像個(gè)人計(jì)算機(jī)當(dāng)初重塑企業(yè)IT那樣。就像PC從個(gè)人生產(chǎn)力應(yīng)用軟件發(fā)展到大規(guī)模企業(yè)數(shù)據(jù)庫和自動(dòng)化項(xiàng)目一樣,人工智能和機(jī)器學(xué)習(xí)可能會(huì)從消費(fèi)類功能演變成推動(dòng)全球企業(yè)發(fā)展的全面的數(shù)據(jù)驅(qū)動(dòng)項(xiàng)目。
Cloudian公司的首席執(zhí)行官邁克爾·楚(Michael Tso)表示:“在今后的20年內(nèi),許多公司會(huì)演變成人工智能輔助的組織。到時(shí)候,數(shù)據(jù)將支持合作,機(jī)器收集信息,學(xué)會(huì)幫助人們做出實(shí)時(shí)決策,以滿足客戶的要求?!?/p>
已經(jīng)有這方面的例子了。亞馬遜等購物網(wǎng)站上的推薦引擎已經(jīng)在使用這項(xiàng)技術(shù)。與之相仿,廣告投放系統(tǒng)會(huì)基于網(wǎng)站訪問量,更精準(zhǔn)地投放廣告。Cloudian還使用了將廣告與每個(gè)司機(jī)和汽車相匹配的數(shù)字廣告牌。
楚說:“對(duì)于存儲(chǔ)行業(yè)來說,這意味著許多公司需要保留大量的非結(jié)構(gòu)化數(shù)據(jù)來‘訓(xùn)練機(jī)器。一旦機(jī)器能自我學(xué)習(xí),它們將收集并生成新的大量數(shù)據(jù),這些數(shù)據(jù)需要存儲(chǔ)、智能化標(biāo)記和分析。”
許多專家提到了自動(dòng)駕駛汽車。值得一提的是,自動(dòng)駕駛汽車使用大量的傳感器來“讀取”環(huán)境,然后與精確的地圖數(shù)據(jù)進(jìn)行比較。
最后,再?zèng)Q定如何轉(zhuǎn)向、剎車和加速。這增加了存儲(chǔ)的復(fù)雜性。來自攝像頭和雷達(dá)等傳感器的數(shù)據(jù)以每秒幾十GB的速度進(jìn)入。所有數(shù)據(jù)都要經(jīng)過壓縮和處理。
攝像頭和雷達(dá)收集的汽車在路面上的數(shù)據(jù)與高清(HD)地圖數(shù)據(jù)進(jìn)行比較。這是獲得準(zhǔn)確車輛位置信息的一個(gè)重要部分。這些高清地圖堆疊在包括額外信息(比如車道標(biāo)記、路緣和標(biāo)志)的標(biāo)準(zhǔn)地圖數(shù)據(jù)的上面。所有這些會(huì)帶來幾十GB的額外存儲(chǔ)量,再乘以一輛車需要執(zhí)行的動(dòng)作數(shù)量,以及路上行駛的車輛數(shù)量,數(shù)據(jù)就會(huì)大得嚇人。
此外,每輛汽車都要記錄一些駕駛數(shù)據(jù),并保存數(shù)天或數(shù)月,這取決于OEM和監(jiān)管部門的要求。這很重要,因?yàn)榧词惯@些數(shù)據(jù)上傳到云端,本地拷貝也幾乎肯定要保存起來。
相關(guān)的數(shù)據(jù)量僅僅是個(gè)開始,每輛車會(huì)生成數(shù)據(jù),確保車輛安全、暢通行駛的系統(tǒng)也會(huì)生成數(shù)據(jù)。
各種人工智能和機(jī)器學(xué)習(xí)系統(tǒng)將訪問這些數(shù)據(jù),才能將信息變成實(shí)用的智能。這意味著存儲(chǔ)系統(tǒng)會(huì)不斷演變,以便能夠以所需的速度存儲(chǔ)、移動(dòng)和處理數(shù)據(jù)。
StorageIO Group的分析師格雷格·舒爾茨(Greg Schulz)表示:“人工智能還可能導(dǎo)致幾乎感覺不到有什么價(jià)值的現(xiàn)有數(shù)據(jù)擁有隱藏或未知的價(jià)值,只不過還沒有被利用起來?!?/p>
存儲(chǔ)方面的改進(jìn)
人工智能不僅僅是一條單行道。不僅存儲(chǔ)需要解決如何能夠存儲(chǔ)更多的數(shù)據(jù)、更快地處理數(shù)據(jù)、更快地將數(shù)據(jù)饋送給分析引擎,存儲(chǔ)與人工智能之間還存在相互影響,即人工智能和機(jī)器學(xué)習(xí)將如何回報(bào)、如何改進(jìn)存儲(chǔ)技術(shù)。
舒爾茨說:“存在這種場景,人工智能和其他支持算法的分析技術(shù)可以用來幫助管理數(shù)據(jù)、存儲(chǔ),以及管理相關(guān)的數(shù)據(jù)基礎(chǔ)設(shè)施資源。這意味著不僅僅局限于基本的分析,以及傳統(tǒng)的基于策略的系統(tǒng)或軟件管理?!?/p>
他預(yù)計(jì),人工智能和分析技術(shù)對(duì)于額外的CPU處理和內(nèi)存會(huì)有更高的要求,另外還需要將數(shù)據(jù)轉(zhuǎn)換為信息的工具。
相關(guān)鏈接
人工智能(Artificial Intelligence),是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)和應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。 人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以與人類智能相似的方式做出反應(yīng)的智能機(jī)器。該領(lǐng)域的研究包括機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。
人工智能是對(duì)人的意識(shí)、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考,也可能超過人的智能。人工智能是包括十分廣泛的科學(xué),它由不同的領(lǐng)域組成,如機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺等??傊?,人工智能研究的一個(gè)主要目標(biāo)是使機(jī)器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。但不同的時(shí)代、不同的人對(duì)這種“復(fù)雜工作”的理解是不同的。
IDC預(yù)測,到2018年,全球近1/3的行業(yè)領(lǐng)導(dǎo)者將被全面執(zhí)行數(shù)字化轉(zhuǎn)型戰(zhàn)略的競爭對(duì)手顛覆?!叭斯ぶ悄?行業(yè)”有助于催生新的商業(yè)模式。如今,人工智能技術(shù)已經(jīng)在醫(yī)療、工業(yè)、農(nóng)業(yè)、金融、商業(yè)、教育、政府、公共安全等行業(yè)初露鋒芒。不同行業(yè)在人工智能的接受程度上存在差異。金融、零售、醫(yī)療和智慧城市這4個(gè)領(lǐng)域的人工智能技術(shù)的應(yīng)用更為成熟。
IDC認(rèn)為,未來兩年,人工智能的發(fā)展將呈現(xiàn)以下三大趨勢:人工智能產(chǎn)業(yè)分工日趨細(xì)化;越來越多的開源平臺(tái)的出現(xiàn)將助力人工智能技術(shù)的發(fā)展;無論是高科技產(chǎn)品還是傳統(tǒng)產(chǎn)品,都將嵌入人工智能技術(shù)。
人類正開始全面邁入人工智能時(shí)代,在不久的將來,我們將看到整個(gè)社會(huì)和經(jīng)濟(jì)水平由于人工智能的推動(dòng)而發(fā)生巨大的變化。人工智能在帶來變革的同時(shí),自身也在快速演變。