胡 彬,馬 越,張 健,王浩宇
(國能大渡河檢修安裝有限公司,四川 成都 610000)
在互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)技術(shù)快速發(fā)展的背景下,智能城市、智能醫(yī)療、智能社區(qū)和智能企業(yè)都在全力以赴。水電企業(yè)的智慧檢修、狀態(tài)檢修也開始了不斷的研究和探索,特別是以國家能源集團(tuán)大渡河公司為代表的大型水電中央企業(yè),從2017年開始已經(jīng)大力發(fā)展和探索智慧企業(yè)和智慧檢修建設(shè)。
“基于檢修要素感知的檢修方案智能生成模型研究”課題的提出,即考慮到在日常工作中遇到的實(shí)際問題,如檢修資源不足、專家力量緊張等。隨著越來越多信息系統(tǒng)的部署,在制定檢修方案時(shí),所需要權(quán)衡考量的因素也越來越多,此時(shí),如果能將制定檢修方案的工作交由大數(shù)據(jù)分析工具來輔助完成,將顯著提高人員效率,降低成本。
本文的設(shè)計(jì)是依托于歷年的檢修數(shù)據(jù),以及水電站諸多信息管理系統(tǒng)和生產(chǎn)管理系統(tǒng)中,每天生成的大量的設(shè)備運(yùn)行信息、檢修維護(hù)信息。
因此在本文中,將借助NLP自然語言處理技術(shù)、深度神經(jīng)網(wǎng)絡(luò)算法對(duì)已有的大量歷年檢修數(shù)據(jù)進(jìn)行收集、歸納、整理,形成與設(shè)備運(yùn)行狀態(tài)、檢修狀態(tài)相關(guān)聯(lián)的檢修要素,納入到知識(shí)庫中,再通過大數(shù)據(jù)機(jī)器學(xué)習(xí)算法,對(duì)轉(zhuǎn)化的檢修信息數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,將歷史檢修方案與檢修需求建立關(guān)聯(lián)模型,實(shí)現(xiàn)檢修方案智能生成模型,模型如圖1所示。
圖1 檢修方案智能生成模型
本文中嘗試將歷史檢修信息、現(xiàn)場(chǎng)檢修需求、檢修知識(shí)庫利用NLP自然語言處理算法及大數(shù)據(jù)機(jī)器學(xué)習(xí)算法進(jìn)行歸納、建模,給出檢修方案制定建議,并根據(jù)檢修完成后的評(píng)價(jià)功能,對(duì)前述功能進(jìn)行反饋,形成迭代優(yōu)化。
首先將其用于對(duì)沒有納入模型學(xué)習(xí)的設(shè)備歷史故障信息進(jìn)行驗(yàn)證,將模型的檢修方案計(jì)算結(jié)果與歷史檢修工單記錄進(jìn)行比對(duì)。通過驗(yàn)證后,在檢修工作開展的同時(shí),用模型根據(jù)設(shè)備故障信息和運(yùn)行狀態(tài)進(jìn)行檢修方案推薦,形成檢修方案參考建議。模型具備以下技術(shù)要求。
檢修詞條的自然語言處理技術(shù),對(duì)檢修需求、檢修要素進(jìn)行處理識(shí)別,包括圖表類、文本類的信息,轉(zhuǎn)化為計(jì)算機(jī)能夠識(shí)別和查詢的結(jié)構(gòu)化知識(shí)。
檢修知識(shí)庫自動(dòng)匹配識(shí)別算法,依托大數(shù)據(jù)機(jī)器學(xué)習(xí)算法,包括模糊聚類以及基于深度學(xué)習(xí)的KBQA(Knowledge Base Question Answering)技術(shù),快速為其進(jìn)行畫像,并匹配已有檢修知識(shí)庫中對(duì)應(yīng)的檢修詞條,生成初步的檢修建議方案。
檢修方案優(yōu)化算法,系統(tǒng)能根據(jù)不同的檢修任務(wù)關(guān)注維度,生成有差異性的檢修優(yōu)化方案,比如安全優(yōu)先、經(jīng)濟(jì)性優(yōu)先、工期優(yōu)先等。
檢修績(jī)效指標(biāo)自動(dòng)評(píng)價(jià)體系,系統(tǒng)能夠根據(jù)檢修目標(biāo),自動(dòng)為檢修任務(wù)的完成進(jìn)行評(píng)判。
構(gòu)建模型所需要的數(shù)據(jù)來源于歷年生產(chǎn)管理數(shù)據(jù),大部分工作數(shù)據(jù)每月形成電子表格匯總得到,主要是人身風(fēng)險(xiǎn)預(yù)控活動(dòng)、檢修工序卡活動(dòng)數(shù)據(jù)、風(fēng)險(xiǎn)預(yù)控活動(dòng)數(shù)據(jù)、項(xiàng)目管理數(shù)據(jù)。各個(gè)數(shù)據(jù)源來源不同,人身風(fēng)險(xiǎn)預(yù)控活動(dòng)將采集檢修工作的人員姓名、工種、消耗性材料、工器具、工期、防范措施等信息,檢修工序卡將采集工藝標(biāo)準(zhǔn)、檢修質(zhì)量等信息,風(fēng)險(xiǎn)預(yù)控活動(dòng)將采集項(xiàng)目風(fēng)險(xiǎn)、風(fēng)險(xiǎn)等級(jí)預(yù)估等信息,項(xiàng)目管理數(shù)據(jù)將采集人員、工種工期、檢修成本等信息,初步建立智慧檢修知識(shí)庫。
檢修需求畫像:檢修需求畫像的主要工作包括短語挖掘、學(xué)習(xí)預(yù)測(cè)和關(guān)系分析3部分。
通過實(shí)現(xiàn)短語挖掘、關(guān)系分析和學(xué)習(xí)預(yù)測(cè)的功能,將對(duì)新生成的檢修需求自動(dòng)匹配識(shí)別算法,系統(tǒng)將根據(jù)檢修需求中關(guān)鍵字如“瀑布溝”“3號(hào)水輪發(fā)電機(jī)組”“推力軸承”“外循環(huán)冷卻器”“管路”“滲漏”,快速為檢修需求進(jìn)行畫像,并匹配已有檢修知識(shí)庫中對(duì)應(yīng)的檢修詞條。
在本文中,短語挖掘方法將采用基于有監(jiān)督學(xué)習(xí)的短語挖掘算法實(shí)現(xiàn)(圖2)。
圖2 基于有監(jiān)督學(xué)習(xí)的檢修需求短語挖掘流程
如圖2所示,短語挖掘算法主要通過計(jì)算候選短語的統(tǒng)計(jì)指標(biāo)特征來挖掘,其中:
(1)學(xué)習(xí)預(yù)測(cè):在深度神經(jīng)網(wǎng)絡(luò)模型中,“發(fā)電機(jī)組”、“推力軸承”、“外循環(huán)冷卻器”、“管路”、“滲漏”等詞或字符將被表示為一個(gè)低維稠密空間中的向量?;谶@些向量表示,可使用典型的網(wǎng)絡(luò)結(jié)構(gòu)(如卷積神經(jīng)網(wǎng)絡(luò)CNN、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN)抽取字詞之間的組合特征及關(guān)聯(lián)關(guān)系。與傳統(tǒng)方法相比,深度神經(jīng)網(wǎng)絡(luò)能捕捉到更多隱性的語義特征,能取得更優(yōu)異的性能。
(2)關(guān)系分析,檢修要素尋優(yōu):系統(tǒng)能根據(jù)不同的檢修任務(wù)關(guān)注維度,包括人員姓名、工種、消耗性材料、工器具、工期、防范措施、工藝標(biāo)準(zhǔn)、檢修質(zhì)量、風(fēng)險(xiǎn)因素、風(fēng)險(xiǎn)等級(jí)10個(gè)維度,通過粒子群PSO尋優(yōu)算法,生成有差異性的檢修優(yōu)化方案,比如安全優(yōu)先、經(jīng)濟(jì)性優(yōu)先、工期優(yōu)先等可以作為檢修方案的優(yōu)先項(xiàng),自動(dòng)生成與之對(duì)應(yīng)的檢修優(yōu)化方案。
(3)檢修績(jī)效指標(biāo)自動(dòng)評(píng)價(jià):系統(tǒng)為檢修任務(wù)的完成進(jìn)行評(píng)判,比如量化目標(biāo)檢修工期與實(shí)際檢修工期差異、人工消耗差異、工器具使用差異、消耗性材料差異、風(fēng)險(xiǎn)因素差異,并作為反饋,指導(dǎo)后續(xù)同類型檢修任務(wù)優(yōu)化的生成。
檢修要素與檢修需求匹配關(guān)聯(lián)的構(gòu)建,是語義識(shí)別、自然語言處理與數(shù)據(jù)挖掘技術(shù)的綜合應(yīng)用,核心在于建立起自然語言形式的需求與計(jì)算機(jī)知識(shí)之間的映射關(guān)系。在本課題方案中,將把建立映射關(guān)系的過程分為兩個(gè)子過程,即實(shí)體鏈接和屬性理解。其中,實(shí)體鏈接是指識(shí)別檢修需求所提及的內(nèi)容,并將其鏈接到構(gòu)建的數(shù)據(jù)庫中。屬性理解則是指識(shí)別檢修需求提及內(nèi)容,其對(duì)應(yīng)關(guān)聯(lián)的檢修詞條和檢修要素,這其中便要應(yīng)用到模糊聚類算法以及基于深度學(xué)習(xí)的KBQA技術(shù)進(jìn)行匹配計(jì)算。本文方案中,知識(shí)應(yīng)用部分的工作流程如圖3所示。
圖3 檢修需求與檢修要素匹配以及檢修方案智能生成
以某容量63 MW混流式機(jī)組A修為例,通過其他類似機(jī)組檢修歷史數(shù)據(jù)建立模型,模型包含人員姓名、工種、成本、工期、檢修質(zhì)量、風(fēng)險(xiǎn)等因素,通過粒子群PSO尋優(yōu)算法繪制的工期、質(zhì)量、成本兩兩之間的關(guān)系圖,擬合了相應(yīng)的函數(shù)。
圖4 項(xiàng)目工期——質(zhì)量——成本關(guān)系曲線
然后以最高進(jìn)度要求、最低預(yù)算成本、質(zhì)量達(dá)標(biāo)要求為約束條件,以工期——質(zhì)量——成本最優(yōu)化為目標(biāo)函數(shù),優(yōu)化生成檢修方案,其中包含檢修順序、持續(xù)工期優(yōu)化調(diào)整等。
本文提出,在應(yīng)用大數(shù)據(jù)機(jī)器學(xué)習(xí)算法、自然語言處理技術(shù)、深度神經(jīng)網(wǎng)絡(luò)算法等先進(jìn)技術(shù)的同時(shí),也充分考慮到公司日常工作中遇到的實(shí)際問題與技術(shù)需求,如檢修資源不足、專家力量緊張,檢修方案的確定與實(shí)施存在滯后;此外,隨著越來越多信息系統(tǒng)的部署,在制定檢修方案時(shí),所需要權(quán)衡考量的因素也越來越多。通過本課題方案的實(shí)現(xiàn),把制定檢修方案的工作交由大數(shù)據(jù)分析工具來輔助完成,此舉將顯著提高人員效率,降低成本,切實(shí)推動(dòng)數(shù)字化轉(zhuǎn)型。
本文依托NLP自然語言處理技術(shù)對(duì)檢修需求、檢修要素進(jìn)行處理,將圖表類、文本類的信息,以及已有的各類檢修數(shù)據(jù),轉(zhuǎn)化為計(jì)算機(jī)能夠識(shí)別和查詢的結(jié)構(gòu)化知識(shí)。而利用大數(shù)據(jù)機(jī)器學(xué)習(xí)算法,包括模糊聚類算法以及基于深度學(xué)習(xí)的KBQA技術(shù),對(duì)轉(zhuǎn)化的檢修信息數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,從而建立檢修方案智能生成模型,形成檢修建議。除此之外,系統(tǒng)還通過粒子群PSO尋優(yōu)算法,根據(jù)不同的檢修任務(wù)關(guān)注維度,完成檢修方案自動(dòng)尋優(yōu)。在檢修任務(wù)完成后,系統(tǒng)還可根據(jù)目標(biāo)檢修工期與實(shí)際檢修工期差異、人工消耗差異、工器具使用差異、消耗性材料差異、風(fēng)險(xiǎn)因素差異作為考量維度,對(duì)檢修任務(wù)進(jìn)行評(píng)價(jià),生成反饋并指導(dǎo)后續(xù)同類型的檢修任務(wù)的優(yōu)化生成。