Bob Violino 陳琳華
數據捕獲、數據治理和服務可用性是IT在創(chuàng)建物聯(lián)網分析環(huán)境時面臨的最大挑戰(zhàn)。
物聯(lián)網(IoT)的發(fā)展對企業(yè)IT中的許多領域產生了巨大影響,數據分析就是其中之一。
企業(yè)正在從連接的各種對象那里收集大量信息,例如消費者使用某些產品的方式、企業(yè)資產的業(yè)績、系統(tǒng)運行的環(huán)境條件等。通過對這些流入的數據流進行高級分析,企業(yè)可以獲得新的洞察力,這有助于在采取行動時做出更明智的決策。隨著企業(yè)將物聯(lián)網傳感器放置在越來越多的對象上,流入的數據量也將持續(xù)增長。
市場研究公司IDC的分析師Maureen Fleming指出,“基于傳感器的計算是數字化轉型的核心趨勢。通過基于狀態(tài)的監(jiān)控,運營智能可確保企業(yè)知曉連接傳感器的設備、機器和系統(tǒng)的健康狀況。根據使用情況,將機器學習(ML)應用于傳感器數據可預測宕機概率、購買傾向、健康問題等等?!?/p>
Fleming表示,用機器學習處理傳感器數據,并結合來自企業(yè)應用程序的數據,可以從根本上改變企業(yè)的工作方式,預測客戶服務級協(xié)議中的問題或是供應鏈中的物流問題。
市場研究公司Forrester Research的副總裁兼首席分析師Brian Hopkins稱:“物聯(lián)網正在推動數字世界和物理世界的融合。幾乎所有的企業(yè)都希望物理世界的實時數據能夠在他們利用洞察力獲得競爭優(yōu)勢的探索中進一步發(fā)揮作用。”
在通過分析獲得洞察力方面,Forrester總結出了三種主要的洞察力。第一種是對智能互聯(lián)產品本身的洞察力;第二種是對互聯(lián)事物如何有效地協(xié)同工作,幫助企業(yè)改進相關的物理資產流程的洞察力;第三種是對來自供應商等業(yè)務合作伙伴的物聯(lián)網數據所反映出的人和事的洞察力。
物聯(lián)網需要新的基礎設施
對于許多企業(yè)而言,現有的數據分析基礎設施無法充分處理未來物聯(lián)網可能生成的大量數據。他們需要改變自己的IT環(huán)境,做好迎接物聯(lián)網的準備。
市場研究公司Gartner的研究副總裁Mark Hung稱:“物聯(lián)網在數量和速度方面都在企業(yè)中創(chuàng)造了前所未有的數據量。為了從這些數據中提取價值,企業(yè)的數據分析架構需要進行改造?!?/p>
Hung表示,企業(yè)要想及時地使用物聯(lián)網數據,流分析或實時分析通常是必須的。這需要將流分析等新分析模式與邊緣網關等新基礎設施整合在一起,而這些需求又在架構上對現有的基礎設施提出了新的要求。
與其他類型的數據分析相比,物聯(lián)網分析有一些獨特的要求。這包括數據格式、數據豐富度、時間敏感性、存儲數據的位置以及存儲時間。
Hopkins稱:“關鍵的分析需求是縮小物理世界中數據生成與物理或數字世界中的行動需求之間的差距。這意味著不可避免地要將一些分析邏輯推向云端或數據中心的邊緣。問題在于服務器和設備缺乏足夠的計算力。有些存在電池或電源方面的限制,有些存儲空間遠遠低于分析所需的要求。因此,分析工作需要分散出去。有些分析工作是在設備上完成的,有些是在邊緣服務器和網關上完成的,有些則是在在中央處理環(huán)境中完成的?!?/p>
Hopkins同時指出,構建實時數據捕獲、數據治理和服務可用性是IT在創(chuàng)建物聯(lián)網分析環(huán)境時面臨的最大挑戰(zhàn)。
Hopkins認為:“由于并非所有數據都整齊有序地保存在數據庫中,因此必須對每個可生成數據的設備進行編目并將其生成的數據納入管理。許多的安全和隱私問題傳統(tǒng)上屬于IT層面。問題在于很多物聯(lián)網投資都發(fā)生在IT領域之外(屬于運營領域),但是IT部門仍然感到了要確保系統(tǒng)和數據安全的壓力。”
物聯(lián)網分析也為網絡基礎設施帶來了新壓力。Hopkins稱:“隨著數據量不斷增長,網絡必須要變得更加靈活,擁有更高的吞吐量,同時又要保證安全。這是一個非常苛刻的要求?!?/p>
Hung則指出,根據應用程序和行業(yè)的不同,物聯(lián)網將需要更多的額外帶寬,同時對網絡基礎設施內的延遲將越來越難以容忍。
他說,確定一個企業(yè)是應當部署外部服務還是應當部署內部分析一直以來都是一個復雜話題,這涉及到許多方面?!捌渲幸恍┮蛩匕ㄆ髽I(yè)的數據隱私要求和內部分析能力?!?/p>
Fleming認為,技能的可用性是一個基本考慮因素。她說:“另一個問題是,是否有開箱即用的庫,與構建專利算法相比,這樣可以提高開發(fā)速度。另外,物聯(lián)網分析通常側重于時間序列,這可能需要開發(fā)一些新的功能?!?/p>
Hung表示,率先部署物聯(lián)網分析的行業(yè)包括能源勘探(如石油和天然氣),傳統(tǒng)上這些行業(yè)一直都處于采用物聯(lián)網分析的最前沿。他說:“其他的關鍵行業(yè),如制造業(yè)和運輸業(yè)也開始越來越積極地評估物聯(lián)網分析?!?/p>
選擇物聯(lián)網分析平臺
許多供應商都推出了物聯(lián)網分析系統(tǒng)。例如,IBM開發(fā)了Watson物聯(lián)網平臺。該平臺為云托管服務,提供了設備注冊、連接、快速可視化和物聯(lián)網數據存儲等功能。IBM Watson為物聯(lián)網應用程序提供了自然語言處理、機器學習以及圖像和文本分析。
負責管理IBM Watson物聯(lián)網平臺的副總裁Stephan Biller表示,為了能夠近實時地使用Watson分析和人工智能(AI)做出決策,客戶需要使用該平臺來采購和存儲嵌入在設備中的數據。傳感器會通過Z-Wave無線網絡將數據發(fā)送至連接有線LAN與互聯(lián)網的網關。數據將被捕獲并存儲在IBM Cloud上。
Biller稱:“物聯(lián)網分析規(guī)則可設置為根據特定條件觸發(fā)特定操作?!崩纾蛻艨赡軙?chuàng)建一些規(guī)則以確保在設備掉落或設備溫度高峰時,警報能夠被發(fā)送到數據儀表盤上,同時向管理員發(fā)送電子郵件。
Biller表示,IBM認為物聯(lián)網平臺需求將穩(wěn)步增長。他說:“隨著項目從概念驗證轉向生產,我們看到企業(yè)物聯(lián)網的采用正在不斷增長。對平臺的投資至關重要,因為客戶已經認識到連接傳感器和設備以及管理、存儲和保護數據是最基本的要求?!?/p>
像Watson IoT這樣的平臺主要是為了幫助客戶執(zhí)行基本分析,如生成警報和從數據流中發(fā)現異常。Biller 稱:“我們看到的大部分增長都來自客戶,因為他們已經認識到真正的價值遠遠超出了最基本的‘連接與收集'。這些客戶對高級分析、機器學習和其他人工智能技術都非常感興趣,因為這些技術可用于幫助他們了解數據并帶來諸如提高運營效率和資產正常運行時間等優(yōu)勢?!?/p>
Biller認為,針對特定行業(yè)的物聯(lián)網分析對于客戶來說非常重要。他說:“通常這些都是以行業(yè)模型模板的形式出現的。這些模型模板是我們與IBM研究人員、客戶共同構建的。雖然某些跨行業(yè)技術可用于基本的數據準備和初步分析,但是我們發(fā)現每個客戶的業(yè)務條件和獨特的數據源都需要更高程度的定制?!?/p>
亞馬遜的AWS IoT Analytics為一項托管服務,旨在讓用戶對海量物聯(lián)網數據執(zhí)行復雜分析變得更加便捷,同時無需擔心通常構建物聯(lián)網分析平臺所面臨的成本和復雜的棘手問題。
AWS技術副總裁Marco Argenti表示,AWS IoT Analytics讓分析物聯(lián)網設備數據的每個步驟都實現了自動化。在將物聯(lián)網數據存儲至時間序列數據存儲中以進行分析之前,其對物聯(lián)網數據進行了過濾和豐富。企業(yè)可以將服務設置為僅從設備中收集需要的數據,然后應用數學變換來處理數據,并在存儲經過處理的數據之前使用諸如設備類型和位置等設備專用元數據來豐富數據。
它們可通過運行使用內置SQL查詢引擎的臨時或計劃查詢來分析其數據,或執(zhí)行更為復雜的分析和機器學習推理。Argenti表示,AWS IoT Analytics包含了針對常見物聯(lián)網用例的預建模型。
企業(yè)可在AWS IoT Analytics上執(zhí)行自己的定制分析(打包在容器中)。該平臺能夠自動執(zhí)行在Jupyter Notebook中創(chuàng)建的自定義分析,或是企業(yè)自己的工具。
此外,AWS還在其物聯(lián)網產品組合中加入了AWS Greengrass。Agranti表示,AWS Greengrass軟件可讓企業(yè)為連接的設備運行本地計算、消息傳遞、數據緩存、同步和機器學習推理功能。
借助AWS Greengrass,即使未連接至互聯(lián)網,連接的設備也可以保持數據同步,并安全地與其他設備通信。通過AWS Lambda,Greengrass可確保物聯(lián)網設備能夠快速響應本地事件,能夠使用在Greengrass Core上運行的Lambda函數與本地資源交互,以及能夠使用間歇性連接進行操作。
Argenti稱:“由于物聯(lián)網數據的獨特挑戰(zhàn)導致分析需求一直被壓抑,連接設備制造商和企業(yè)必須構建定制的軟件和硬件應用程序來專門管理這些特定設備及其數據。這些應用程序的構建成本很高,并且不能很好地擴展到由不同設備類型組成大型設備群中。此外,它們還往往還非常笨重?!?/p>
利用物聯(lián)網分析獲得成功
完成了物聯(lián)網分析平臺部署的企業(yè)已經看到了其中的優(yōu)勢。
Georgia Pacific是全球領先的紙巾、紙漿、紙張、包裝、建筑產品和相關化學品制造商之一。目前該公司已部署了AWS IoT Analytics。
物聯(lián)網項目架構師兼產品負責人Erik Cordsen表示,該公司的分配器允許向客戶提供產品,但Georgia Pacific的重點是通過增加傳感器和連接性使這些分配器“智能化”。
Cordsen稱,通過提供有關產品水平和其他統(tǒng)計數據的實時信息,企業(yè)可以提升客戶體驗。隨著數以千計的終端不斷地提供數據,Georgia Pacific可使用AWS IoT Analytics來豐富帶有位置和產品元數據的消息,以便提供更好的客戶服務。
從事電梯、自動扶梯和自動門行業(yè)的通力集團美洲部正在使用IBM平臺分析物聯(lián)網數據。通力集團負責服務的高級副總裁Danilo Elez稱:“我們一直在尋找新技術和創(chuàng)新,以便我們能夠更好地為客戶服務。”
Elez稱:“電梯和自動扶梯會生成大量的數據。我們希望利用這些數據為客戶帶來一些價值,讓客戶在大樓內的電梯乘坐體驗更具個性化?!?/p>
在2016年部署了IBM平臺構建了智能與數據分析能力后,通力推出了一些新的產品,如通力24/7連接服務。這些服務使公司能夠在故障發(fā)生之前更好地預測故障并提高設備性能和可靠性。Elez表示,“這意味著安全性、透明性和易用性得到了提升,因為在某些事情發(fā)生之前,我們就已經提前知道了?!?/p>
通力目前正在為45萬多名客戶和120萬部電梯與自動扶梯提供服務。IBM Watson IoT平臺和IBM Cloud可以實時分析來自電梯和自動扶梯內部的傳感器的大量數據。當物聯(lián)網數據分析檢測到即將發(fā)生的故障時,技術人員會帶著需要使用到的零部件及時出現在現場,并進行必要的維修。
Elez說:“這有助于準確預測設備需求,幫助我們的技術人員在合適的時間進行正確的維護”。好處是通力可以更好地實時預測和響應技術問題,保持設備正常運行,同時節(jié)省時間和資金。
Elez表示,“物聯(lián)網使我們全球2萬多名技術人員能夠為消費者提供更好的服務,更高的設備可用性和更加個性化的體驗?!?/p>
本文作者Bob Violino現居紐約,為Computerworld、CIO、CSO、InfoWorld和Network World網站的特約撰稿人。
原文網址
https://www.networkworld.com/article/3311919/internet-of-things/iot-analytics-guide-what-to-expect-from-internet-of-things-data.html