◎中國運載火箭技術(shù)研究院研究發(fā)展中心 畢經(jīng)元等
基于大數(shù)據(jù)的知識挖掘技術(shù)在航天領(lǐng)域應(yīng)用展望
◎中國運載火箭技術(shù)研究院研究發(fā)展中心 畢經(jīng)元等*
近年來,中國運載火箭技術(shù)研究院開展了知識梳理、知識采集、知識分類等多項工作,形成了專業(yè)分類、型號產(chǎn)品等維度的知識庫,不斷積累、完善的知識庫勢必在航天產(chǎn)品研制過程中發(fā)揮重要作用。知識庫的利用程度依賴于知識挖掘技術(shù),尤其在航天產(chǎn)品研制過程中的知識挖掘,涉及多專業(yè)、多部門、多領(lǐng)域。知識庫內(nèi)容龐大、維度多、交叉多,無法依賴人工手段進(jìn)行系統(tǒng)化的知識挖掘工作,需要充分借助以人工智能、大數(shù)據(jù)以及語義網(wǎng)絡(luò)為基礎(chǔ)的知識挖掘技術(shù),實現(xiàn)對知識庫的充分利用。
1.知識挖掘含義
知識挖掘是知識管理工作的關(guān)鍵環(huán)節(jié),不僅可以提高知識管理效率,更能夠促進(jìn)知識的不斷創(chuàng)新。知識挖掘通常包含2種方式:一種是通過分析大量知識之間的隱含關(guān)系,發(fā)現(xiàn)顯性知識之間的關(guān)聯(lián),注重采用信息技術(shù)對大量結(jié)構(gòu)化與非結(jié)構(gòu)化知識內(nèi)容進(jìn)行自動化分析;另一種側(cè)重于通過引導(dǎo)與交流挖掘隱性知識,注重發(fā)現(xiàn)難以用文字、語言以及圖像等形式描述和交流的個人經(jīng)驗、情感、組織文化等。
大數(shù)據(jù)技術(shù)影響著從商業(yè)、科技到醫(yī)療、政府、經(jīng)濟(jì)、教育、人文以及社會的各個領(lǐng)域。若將數(shù)據(jù)挖掘提取“粗糙知識”稱為“一次挖掘”過程,那么可將“粗糙知識”與主觀知識相結(jié)合而產(chǎn)生的“智能知識”稱作“二次挖掘”過程,類似事物“量”到“質(zhì)”的飛躍。結(jié)構(gòu)化的“粗糙知識”可以被主觀知識加工處理并轉(zhuǎn)化,從而生成半結(jié)構(gòu)化和非結(jié)構(gòu)化的“智能知識”。因此,尋求“智能知識”是大數(shù)據(jù)研究的核心價值。
數(shù)據(jù)挖掘、語義處理以及大數(shù)據(jù)技術(shù)是當(dāng)前主流的知識挖掘技術(shù)。其中,大數(shù)據(jù)技術(shù)涵蓋了數(shù)據(jù)挖掘、語義處理的主要技術(shù),并融合了大容量數(shù)據(jù)處理的IT技術(shù),形成了高效、快速的知識挖掘技術(shù)體系。
2.知識挖掘關(guān)鍵技術(shù)
大數(shù)據(jù)定義為無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,且大數(shù)據(jù)具有數(shù)據(jù)量巨大、類型多、流動快及潛在價值高四大特征。
數(shù)據(jù)挖掘技術(shù)利用統(tǒng)計分析技術(shù)和人工智能,通過對某類對象關(guān)聯(lián)數(shù)據(jù)的匯總、分析和比較,進(jìn)行關(guān)聯(lián)度分析、聚類分析、概念分類、偏差檢測、自動趨勢預(yù)測、信息摘要提取等處理,從大量數(shù)據(jù)中提取其中隱含且具有潛在價值的知識和信息。
語義處理技術(shù)可以將文字、圖像、聲音、位置等信息轉(zhuǎn)變?yōu)槿伺c機(jī)器、機(jī)器與機(jī)器之間可以相互理解的上下文知識。目前,逐步成熟并商用的多種人機(jī)交互模式,如語音交互、姿態(tài)感知、腦波控制、眼球控制、穿戴式設(shè)備等,均需要以強(qiáng)大的語義處理技術(shù)作為核心。
1.專業(yè)維度知識挖掘
研究院按照專業(yè)層級構(gòu)建了基于專業(yè)的知識分類體系,分類科學(xué)且內(nèi)容豐富,同時在“十二五”期間完成了各專業(yè)知識資源的梳理與采集工作。屆時知識庫內(nèi)容將足夠龐大,如何有效利用研究院50余年積累的寶貴知識財富已成為新的問題。針對航天產(chǎn)品研制知識資源的數(shù)量大、復(fù)合類型多、知識異構(gòu)等特點,研究院已采用基于語義處理技術(shù)的知識地圖以及知識統(tǒng)一表達(dá)的技術(shù)手段實現(xiàn)了專業(yè)知識資源的語義管理。
2.工程維度知識挖掘
航天產(chǎn)品研制是系統(tǒng)工程,研制周期長、涉及的工程崗位多。在工程維度進(jìn)行知識挖掘應(yīng)用,首先需要對航天產(chǎn)品研制工作場景進(jìn)行辨識。
一是基于知識挖掘的研發(fā)設(shè)計方法。
基于知識挖掘的研發(fā)設(shè)計是現(xiàn)代產(chǎn)品設(shè)計的一種復(fù)用方法,可實現(xiàn)以知識為核心的產(chǎn)品創(chuàng)新設(shè)計,大幅縮短設(shè)計周期、降低產(chǎn)品成本。該方法將充分借鑒和利用以往研制經(jīng)驗,并將研制經(jīng)驗轉(zhuǎn)化為指導(dǎo)航天產(chǎn)品研發(fā)的定量化知識,形成基于設(shè)計實例、專家經(jīng)驗、流程模板等的知識庫內(nèi)容,驅(qū)動產(chǎn)品的需求分析、方案設(shè)計、設(shè)計優(yōu)化、綜合權(quán)衡與評估等多個環(huán)節(jié)。筆者以專業(yè)設(shè)計模板與成本分析技術(shù)為例進(jìn)行說明。
專業(yè)設(shè)計模板技術(shù)以成熟的設(shè)計知識和專家經(jīng)驗為基礎(chǔ),提煉出航天產(chǎn)品研發(fā)設(shè)計階段專業(yè)模板的構(gòu)成、接口規(guī)范化、封裝方法以及組件化等的定義,以實現(xiàn)研發(fā)設(shè)計的快速建模。對航天產(chǎn)品研發(fā)設(shè)計分析流程、支撐知識資源、軟件算法以及專業(yè)耦合關(guān)系進(jìn)行深入分析,構(gòu)建航天產(chǎn)品研發(fā)設(shè)計的專業(yè)設(shè)計模板。在設(shè)計新產(chǎn)品時,通過在設(shè)計模板庫中選擇合適的模板并設(shè)置相應(yīng)的參數(shù),即可利用已有知識和經(jīng)驗快速生成新的方案與模型,實現(xiàn)設(shè)計知識的共享復(fù)用,提高航天產(chǎn)品快速設(shè)計的能力,提升總體設(shè)計效率。
成本分析技術(shù)是設(shè)計方案評估的重要手段。在成本分析工作中最困難、最基礎(chǔ)、最關(guān)鍵的是歷史成本數(shù)據(jù)的高質(zhì)量搜集和管理。構(gòu)建基于知識挖掘的航天產(chǎn)品成本知識庫,可在方案設(shè)計過程中對產(chǎn)品全生命周期成本進(jìn)行合理、準(zhǔn)確的估算與分析,將數(shù)據(jù)轉(zhuǎn)化為可復(fù)用的成本模型和知識,并預(yù)測成本與性能、能力、技術(shù)之間的變化趨勢。
二是基于知識挖掘的故障診斷知識庫建設(shè)。
故障診斷系統(tǒng)通常與設(shè)計、制造、裝配以及維護(hù)保障等工作緊密結(jié)合,其核心是對特定模型進(jìn)行描述、歸納形成故障模式集。該集合可具備多種形態(tài),如先驗知識集、邏輯規(guī)則集、設(shè)備功能模型集等,分別從專家經(jīng)驗、設(shè)備運行過程以及設(shè)備數(shù)學(xué)模型等角度挖掘故障模式。通常,先驗知識與設(shè)備功能模型集都偏簡單或過于復(fù)雜,實際應(yīng)用中以邏輯規(guī)則集為主。
故障診斷邏輯規(guī)則集的知識挖掘過程可分為2類:一類是注重隱性知識挖掘,主要在產(chǎn)品應(yīng)用前完成;另一類側(cè)重于顯性知識挖掘,采用統(tǒng)計等知識挖掘模型歸納知識庫。
基于統(tǒng)計的故障診斷知識挖掘方法以統(tǒng)計學(xué)和人工智能為技術(shù)基礎(chǔ),不需要提供除數(shù)據(jù)以外的任何先驗知識,采用從數(shù)據(jù)中提取的客觀規(guī)則對問題的不確定性進(jìn)行描述,將大量數(shù)據(jù)融合成有序的層次化故障診斷知識。常用的挖掘方法包括神經(jīng)網(wǎng)絡(luò)、粗糙集、統(tǒng)計分析以及模糊邏輯等,其中粗糙集方法在兼具統(tǒng)計優(yōu)點的同時可以導(dǎo)出精簡的規(guī)則,因此在故障診斷知識挖掘系統(tǒng)中較常采用,其流程如圖1所示。
圖1 基于粗糙理論的故障知識挖掘系統(tǒng)典型流程
3.管理維度知識挖掘
航天產(chǎn)品在預(yù)研、演示驗證、研制以及運行維護(hù)過程中,產(chǎn)生了大量與設(shè)計、試驗、制造、維護(hù)相關(guān)的質(zhì)量、進(jìn)度、技術(shù)狀態(tài)、試驗結(jié)果等多維度數(shù)據(jù),如何使這些數(shù)據(jù)有力地支撐航天產(chǎn)品管理是當(dāng)前面臨的難題。在管理實踐中,迫切需要采用大數(shù)據(jù)技術(shù)精確衡量預(yù)研、設(shè)計工作對產(chǎn)品、運維的進(jìn)度與質(zhì)量的影響。筆者以成本管理為例,說明管理維度的知識挖掘模式。
成本管理是航天產(chǎn)品項目管理的重要組成部分。在航天產(chǎn)品的研制過程中,用戶方需要推行競爭性采辦,加大價格審查和成本控制的力度;生產(chǎn)者需要開展成本工程建設(shè),實現(xiàn)目標(biāo)化、精細(xì)化、全生命周期的成本管理。航天產(chǎn)品研制是典型的大協(xié)作、多元化任務(wù)模式,各分系統(tǒng)單位的任務(wù)分工不同,成本類型差別很大,又相互關(guān)聯(lián),造成了成本管理和控制的復(fù)雜性。只有構(gòu)建一個異構(gòu)協(xié)同的成本體系,既兼顧考慮各分系統(tǒng)和各專業(yè)不同的成本類型特點,又具有統(tǒng)一計費、估算與核算的規(guī)范,才能更好地為方案評估和報價服務(wù)。
成本體系構(gòu)建工作涉及單位多,需要記錄全過程各環(huán)節(jié)的成本數(shù)據(jù),需要將數(shù)據(jù)轉(zhuǎn)化為可復(fù)用的成本模型和知識,需要分析成本與性能、能力、技術(shù)之間的變化趨勢。因此,可根據(jù)航天產(chǎn)品在方案評估、項目報價、成本概算等方面的需求,構(gòu)建知識挖掘算法,通過對多業(yè)務(wù)系統(tǒng)數(shù)據(jù)抓取、分析、聚合以及抽取處理,形成型號歷史成本知識庫以及成本估算模型,對產(chǎn)品的全生命周期成本進(jìn)行估算與分析,快速評估各備選方案的費用,為項目決策人員在經(jīng)費控制、費效比分析等方面提供決策依據(jù),從而加強(qiáng)項目決策的科學(xué)性、可行性。
隨著知識挖掘技術(shù)與大數(shù)據(jù)技術(shù)的深入融合,航天知識庫將反應(yīng)更為快速、涵蓋更為全面、挖掘更為智能,盤活航天產(chǎn)品研制的歷史存量知識,將會直接影響到產(chǎn)品的管理決策水平、成本控制、技術(shù)選用以及生產(chǎn)制造等方方面面。
*其他作者:楊秋皓、張巍(中國運載火箭技術(shù)研究院),王立偉、賈倩(中國運載火箭技術(shù)研究院研究發(fā)展中心)