◆陳 剛 / 文
大數據時代的質量管理
◆陳 剛 / 文
編者按
在第18屆中國國際工業(yè)博覽會質量創(chuàng)新論壇暨第十一屆上海國際質量研討會上,上海開源大數據研究院院長陳剛作了題為“大數據時代的質量管理”的演講。他指出:大數據帶給人們一種數據驅動的思維模式,這種思維模式是可以落地的,正在為質量管理帶來美好的前景。
大數據研究院成立于2015年11月16日,它致力于大數據共性的研究,成員主要來自NTO組織的研究員、上海市數據方面的企業(yè)、投資人以及其他利國利民的行業(yè)投資者。今年6月份,我們投資四億成立了中云開源技術公司,它是一家面向工業(yè)大數據尤其重裝備業(yè)的儲存、分析一體化的服務型公司。
本人基于自身的研究體會和經驗,借助項目對標公司的案例,按照大數據的內涵和外延、質量管理、案例分析的次序,與大家分享一些共性技術方面的內容。
大數據為何物?仁者見仁智者見智。我認為大數據恰如原油,之所以做此番比喻,不僅僅是從數據本身的積累過程而言,更關鍵的是當前人們對大數據的態(tài)度與一百年前人們對原油的態(tài)度很像。一百年前,原油的主要產品煤油用來取暖,而汽油被視為不安全的副產品被冷落一旁。因此,那時的很多公司、個人都熱衷于囤積原油從而提煉出煤油。反觀當今,大家,不可能將自己公司的數據存到別處,尤其是國企,會儲存在自己公司的數據庫里,不會在乎幾臺服務器的錢。
大數據像原油,更主要的是和原油一樣大數據也有助于進行科學研究、工程研究、技術的應用。
數據是對客觀世界的描述,語言是記載數據的一種方式。大數據源與原來計算機統(tǒng)計有根本性的差別。語言包括語法、語意、語用等層級,我們可以從這三個層級來理解數據。
大數據像原油,意味著它不僅能生產出一系列的產品,還應具備一系列的功能。在此我們借用了人類科研史上早已出現的模型:AKW模型。大數據可以變成一系列新的數據產品,繼而變成信息,再變成知識,最后變成智慧,這些數據產品具備相應的四類功能:一是對過去事情的描述,二是對過去發(fā)生事情的診斷,三是客觀的預測未來發(fā)生的事情,四是人為干預未發(fā)生的事情朝著有利于我們的方向發(fā)展。
大數據作為原材料,既然它具備相應的功能,那么一定需要相關的設備和工藝才能把材料變成產品。圖1是大數據平臺的參考架構,它是各行各業(yè)建立大數據平臺的標準形式。圖的下面是它的工業(yè)流程,亦即把數據源變成相應的產品并具有相應功能的最終結果。
設備的關鍵點在于多元異構。數據來源包括文本文件、傳感性文件、圖像、人的五官獲取的信息。不同的結構顯示意味著原來的所謂數據庫不再能完好地儲存數據。多元異構的數據變成相應的產品,主要經過數據的獲取、數據的儲存、數據的分析這三個環(huán)節(jié)。這是數據變成產品的工藝流程。
如果想要深入地理解大數據,有三點需要了解清楚:
第一是大數據和統(tǒng)計的區(qū)別。這也是當今談論質量管理必須要理解的,因為包括六西格瑪在內,過去很多質量分析的軟件都基于統(tǒng)計。大數定論是統(tǒng)計的理論基礎,而大數據恰好挑戰(zhàn)了這一點。
圖1
第二是大數據和超算的區(qū)別。大數據的定義,直白點說,大數據是用計算機對物理或社會進行描述。物理、社會和計算機系統(tǒng)構在一起是CPS(信息物理系統(tǒng))。談到大數據很多資料都會用若干個V,如volume(數量)、velocity(效率)、variety(多樣性)、value(價值)、volatility(易變性),等最多的時候有8個V。如果要想抓住大數據和傳統(tǒng)數據的區(qū)別,就看它是不是很好的抓住這幾個V。
第三是大數據最核心之處在于它不僅是一種科學、工程、技術,更代表著一種可以落地的新思維模式,亦即數據驅動的思維模式。畢竟只有改變了人們觀念的工藝才能夠放在時代前面定義。談到思維模式,嚴格意義上講,漢語和英語分別對應著思維方式和笛卡爾思維。西醫(yī)是還原論,中醫(yī)是系統(tǒng)論,前者是局部思維,認為局部好了總體一定會好;后者是系統(tǒng)性思維。思維范式下具體的推理方式主要有邏輯、統(tǒng)計、啟發(fā)、概率。譬如,2013年通用汽車要召回一批有瑕疵的車,結果只召回了四輛車就解決了此問題。要解決這件事用傳統(tǒng)的概率、邏輯、推理肯定無法實現,只能靠對過去的數據、原材料、語音數據進行系統(tǒng)性的分析。
關于數據驅動,還有一種說法叫第四范式,它由微軟公司一位獲得圖靈獎的技術家提出。所謂第四范式就是把人類對科研的做法進行統(tǒng)計,從實驗觀測到理論推導、再到模擬仿真、最后到數據驅動。這是六西格瑪最基本的原理,也就是說,拿一個產品進行質量管理,先建立一個Y=F(X),然后進行大量的實驗,僅保留吻合的數據。然而這種做法是有缺陷的。首先,建立模型意味著我們知道自己知道的,而不知道自己不知道的,這個模型就會有問題;其次,將不吻合的數據全扔掉,也許扔掉的數據中會有新的重要發(fā)現。這就是第四范式或者新的數據驅動的魅力所在。
大數據時代的基礎是數字化。在互聯(lián)網時代,一定要有一個數據去跟蹤一個物體在整個生命周期的走線,同時還要對應一個Digital Twin(數字映射),以及數字化的載體CPS,這三者的融合形成閉環(huán),演化為數據閉環(huán)之后再進行全面的數據分析。
許多工業(yè)4.0的數據圖都會提及到CPS。工業(yè)4.0實質創(chuàng)導的理念不是具體的技術,也不是規(guī)范,而是倡導一種新的思維模式和解決問題的方式。我認為,工業(yè)4.0更準確來說是產業(yè)4.0,它對各個產業(yè)均有相應的指導意義,其中最核心的是它強調了三個集成:一是制造業(yè),它強調的是端到端的數字化,每一點都要有對應的數字化,繼而形成主線,最后形成推理;二是垂直的,將生產線和管理數據融合起來;三是端到端,將供應商和銷售出去的數據融合起來。在還原論做好局部優(yōu)化的基礎上進行整體思維的管理和決策,最終將這三者整合,進而實現整體的思維和做法。
再來看大數據與質量管理體系。質量管理體系的目標永遠是滿足客戶的需求,讓顧客滿意。具體內容包括質量控制、質量規(guī)劃等。質量管理體系要常新,一方面滿足質量管理和技術管理要常新,另一方面人們對質量的要求也要常新。技術是逐步演進的,譬如今年九月出來的ISO18404,它面向數據,把精益、制造、六西格瑪分開。
雖然質量管理的方法不斷創(chuàng)新,但是那些不可逾越的難題依然存在,譬如,六西格瑪也有數據采集不到位的問題。大數據給傳統(tǒng)的質量管理帶來了機遇和挑戰(zhàn)。
這種挑戰(zhàn)不僅來自于技術,更來自于企業(yè)的決策者對大數據的重視程度。雖然有一系列成熟的模型可用于分析企業(yè)是否適合用大數據,但關鍵取決于決策者對數據重要性的認識程度。
在質量管理技術總體演進的過程中,把生產視為整個系統(tǒng),這種思想在當時不僅完全正確而且很超前,但是因數據的采集手段不到位,所以很難落地。
區(qū)塊鏈作為一個分布式的數據庫新技術,對大型設備的制造商而言具有十分重要的意義,它有助于降低賣出產品的保修成本、維護設備的相關信息。這里最關鍵的一點是一定要實現整個產品線數據流的閉環(huán),設計階段、生產階段到售后都是如此。數據流采用某種技術手段,要實現兩個關鍵點:一是實時,二是按需。只要實現這兩個關鍵點的循環(huán),質量管理就能提升到非常高的程度。
包括通用、陶氏化學等一系列知名企業(yè),均是我們的對標對象。我相信,通過自身堅持不懈的努力,以及向優(yōu)秀企業(yè)孜孜不倦的學習,我們一定會在大數據共性研究與服務方面創(chuàng)造更大的價值!
(本文根據演講速記整理)