傳感器抓取各式各樣的數(shù)據(jù),這些信息哪些有用?哪些是垃圾?哪些需要?dú)w檔?哪些僅僅是需要短暫保留的中間信息?物聯(lián)網(wǎng)應(yīng)該具備基本的分辨能力。
物聯(lián)網(wǎng)的第一階段是完善信息獲取途徑,通過各式各樣的傳感器抓取信息;隨之而來的,就是如何處理急速膨脹的數(shù)據(jù)。這些信息哪些有用?哪些是垃圾?哪些需要?dú)w檔?哪些僅僅是需要短暫保留的中間信息?物聯(lián)網(wǎng)應(yīng)該具備基本的分辨能力。
在日前舉行的“第八屆全球電子峰會(huì)”(Electronics Summit 2010)上,IBM Fellow(院士)、系統(tǒng)與科技事業(yè)部戰(zhàn)略聯(lián)盟副總裁及首席技術(shù)官Bernard S. Meyerson強(qiáng)調(diào),建設(shè)物聯(lián)網(wǎng),現(xiàn)在就應(yīng)該關(guān)注如何處理紛繁復(fù)雜的數(shù)據(jù),否則,當(dāng)傳感器網(wǎng)絡(luò)越來越完善時(shí),隨之而來的數(shù)據(jù)爆炸將讓企業(yè)淹沒在信息洪流中,無法自拔。
“物聯(lián)網(wǎng)讓物與物之間對(duì)話,但首先要研究傳感器如何與IT更好地對(duì)話?!?Meyerson認(rèn)為,終端設(shè)備采集來的數(shù)據(jù)進(jìn)入IT系統(tǒng)之前,就應(yīng)該被智能地處理。IBM研發(fā)的流計(jì)算(Stream Computing)系統(tǒng)可以應(yīng)對(duì)信息的爆增,包括網(wǎng)站、博客、電子郵件、視頻和新聞短片,尤其是物聯(lián)網(wǎng)時(shí)代傳感器收集上來的龐大信息流。
在通常情況下,數(shù)據(jù)分析的步驟是:首先搜集數(shù)據(jù),將其存儲(chǔ)在數(shù)據(jù)庫程序中,然后再用模型對(duì)數(shù)據(jù)庫進(jìn)行搜索。這種高度結(jié)構(gòu)化的方式通常需要耗費(fèi)很多時(shí)間。在流計(jì)算模式下,先進(jìn)的軟件算法在數(shù)據(jù)流入的同時(shí)即對(duì)其進(jìn)行分析,機(jī)器可以實(shí)時(shí)分析上百個(gè)數(shù)據(jù)流,讓用戶在短時(shí)間內(nèi)對(duì)環(huán)境變化做出回應(yīng)。
“可以設(shè)想一下,當(dāng)智能交通深入應(yīng)用時(shí),駕駛員開車行進(jìn)過程中,汽車可能會(huì)實(shí)時(shí)采集許多信息,有車速、溫度、交通流量、車輛間距等大量數(shù)據(jù)。當(dāng)他來到一個(gè)路口時(shí),其實(shí)最需要的是看到前方道路擁堵情況,可是傳感器采集來的各式各樣的數(shù)據(jù)會(huì)讓人迷惑不清,也增加了有效數(shù)據(jù)篩選的難度。” Meyerson舉例說,這個(gè)時(shí)候的智能,就不是以數(shù)據(jù)量的多少來衡量的,而是在合適的時(shí)候告訴駕駛員該直行,還是右轉(zhuǎn)。
如今,泛在計(jì)算發(fā)展迅猛,網(wǎng)絡(luò)、傳感器、計(jì)算機(jī)等價(jià)格急速下降,為物聯(lián)網(wǎng)的建設(shè)提供了技術(shù)上的可能性。復(fù)雜的實(shí)時(shí)分析處理和大范圍的傳感器數(shù)據(jù)需要不同的處理進(jìn)程相互交叉校驗(yàn),IBM云交付管理系統(tǒng)設(shè)計(jì)與處理的多樣性讓IT資產(chǎn)的利用率得到優(yōu)化,比如使CPU使用率達(dá)到80%~90%。
除了基礎(chǔ)設(shè)施外,Meyerson認(rèn)為,建設(shè)物聯(lián)網(wǎng)還必須著眼于“系統(tǒng)的系統(tǒng)”,就是要把各行業(yè)IT系統(tǒng)整合在一起,才能體現(xiàn)出多種多樣的可管理性。這也是處理高速膨脹的數(shù)據(jù)的另一個(gè)著眼點(diǎn),即關(guān)注數(shù)據(jù)的流向。數(shù)據(jù)如何從眼前相對(duì)封閉的某個(gè)行業(yè)信息系統(tǒng)流轉(zhuǎn)到另一個(gè)應(yīng)用系統(tǒng),而且保證數(shù)據(jù)始終有效。在很多情況下,數(shù)據(jù)在產(chǎn)生它的系統(tǒng)中能發(fā)揮作用,但當(dāng)進(jìn)入另一個(gè)系統(tǒng)時(shí),由于格式、標(biāo)準(zhǔn)、體系的差異,很可能它就變成了垃圾數(shù)據(jù),無法發(fā)揮應(yīng)有的效能。
物聯(lián)網(wǎng)要依賴數(shù)據(jù),更要控制好數(shù)據(jù)!