雷亞莉,吳恒玉,何 玲
(海南軟件職業(yè)技術(shù)學院 電子工程系,海南 瓊海 571400)
隨著辦公自動化需求的變化與技術(shù)改進,工作流技術(shù)逐漸出現(xiàn)在金融、教育、物業(yè)服務業(yè)等領(lǐng)域.工作流是一類能夠完全或部分自動執(zhí)行的經(jīng)營過程,其建模通常是建模者根據(jù)工作流文檔或咨詢流程參與者來定義模型的,這種方式易受建模者個人能力及參與者主觀經(jīng)驗的影響,同時完全依賴建模者建模.針對這些問題,提出了一種新的工作流建模方式,即基于過程日志的工作流自動化建模,又稱為工作流挖掘,其目標是通過顛倒工作流過程和收集運行期數(shù)據(jù)以支持工作流的設計和分析.
工作流挖掘,又稱過程挖掘,是建立從信息系統(tǒng)的執(zhí)行日志中提取出被記錄的商業(yè)行為的結(jié)構(gòu)化的過程模型.這種建模方式采用數(shù)據(jù)挖掘思想,利用數(shù)據(jù)挖掘技術(shù)從工作流日志中重構(gòu)工作流模型,達到流程分析和流程優(yōu)化的目的.通過分析業(yè)務交互記錄(即工作流日志),挖掘算法自動化推導企業(yè)工作流模型.工作流挖掘的一般步驟如圖1所示,包括事件日志收集、過程挖掘及模型展現(xiàn).
目前大多數(shù)企業(yè)都建立了如ERP、CRM、SCM以及WFMS等系統(tǒng).隨著業(yè)務的不斷執(zhí)行,系統(tǒng)記錄的工作流日志為企業(yè)的工作流挖掘提供了大量的數(shù)據(jù)基礎(chǔ).由這種建模方式建立的模型能反映出企業(yè)業(yè)務的實際執(zhí)行過程,而且建模過程是自動化的,不僅減少建模者及參與者對建模的影響,同時建模效率也得到較大的提高.
圖1 工作流挖掘的一般步驟
近年來,工作流挖掘已引起國內(nèi)外很多專家的注意.工作流挖掘的研究主要包括工作流模型重構(gòu)、工作流監(jiān)控與評價和組織視圖挖掘等方面,其中工作流模型重構(gòu)研究成果較多.早期,Cook和Wolf[1]提出了3種工作流挖掘方法,其中KTail方法(圖論算法)和Markovian方法的實用性強于RNet(神經(jīng)網(wǎng)絡).但這3種方法皆用有限狀態(tài)機(finite-state machine,F(xiàn)SM)作為工作流的形式化描述模型,因此只能表示具有順序結(jié)構(gòu)的工作流模型.1998年,Agrawal[1]基于有向圖較早提出了工作流挖掘模型,并提出了模型挖掘的目標.此后Agrawal還進行了一系列擴展性的研究.2003年,Aalst[1]提出了基于Petri網(wǎng)的算法,他的研究小組在此基礎(chǔ)上不斷對其算法進行了許多改進.2003年以后產(chǎn)生了許多新的工作流挖掘算法,這些算法增加了對日志的預處理和流程模型的評價,從而克服了原有算法中的不足之處.除了工作流模型重構(gòu)外,其他方面也有一定的研究成果.例如,關(guān)于流程監(jiān)控的研究很早就出現(xiàn)了,但用工作流挖掘研究流程監(jiān)控是最近才產(chǎn)生的,流程監(jiān)控方面的研究主要集中在流程頻繁模式挖掘和流程性能實時監(jiān)控、評價等方面.在組織視圖挖掘方面,主要集中在角色工作流研究方面,如何實現(xiàn)工作流角色間的有效協(xié)作是面向角色工作流研究的核心,組織視圖挖掘的發(fā)展趨勢是能夠挖掘流程中更加復雜的參與者之間的協(xié)作關(guān)系[2].
目前的工作流挖掘算法主要分為兩種:形式化挖掘算法(以α算法為代表)和啟發(fā)式挖掘算法.形式化算法是通過形式化的方式從工作流日志中推導工作流模型,要求日志完整并且無噪音,這種算法簡單,易于理解,可操作性強;而啟發(fā)式算法通過啟發(fā)式規(guī)則推導日志中活動間的基本邏輯關(guān)系,建立工作流模型,這種算法對工作流日志無要求,并且適用于挖掘各種復雜的工作流過程[3].
工作流挖掘的主要作用包括工作流柔性機制管理、工作流模型的優(yōu)化和工作流的智能管理等方面.
工作流挖掘可以用于工作流中人造模型的設計與運行時模型之間的差異分析,即檢測在設計階段所定義的內(nèi)容和在實現(xiàn)階段的實際執(zhí)行情況之間的差異.由于業(yè)務變化以及異常處理的不斷需要,使工作流正朝著柔性的方式發(fā)展.柔性工作流的最大特點是可以應對企業(yè)流程中存在著大量的執(zhí)行邏輯,無法事先確定的半結(jié)構(gòu)化和非結(jié)構(gòu)化的經(jīng)營過程,包括各種任務變更和流程異常,因此需要對工作流進行實時監(jiān)控.而工作流管理系統(tǒng)中存在著工作流在執(zhí)行過程中的所有日志信息,工作流挖掘從工作流執(zhí)行階段提取日志,通過將挖掘出來的模型與原模型進行比較,以實現(xiàn)工作流柔性管理機制.
工作流管理系統(tǒng)由預先建立的工作流模型所驅(qū)動,其重要功能之一就是工作流建模.傳統(tǒng)的工作流建模非常耗時而且易錯,在大部分情況下需要專家的參與,而且可能會出現(xiàn)建立時的過程定義與運行時的過程執(zhí)行并不能完全相符合的情況,它主要集中在工作流的設計和部署,對工作流運行和更新階段的關(guān)注較少.與傳統(tǒng)工作流管理相比,工作流挖掘則是從系統(tǒng)運行階段的日志中提取工作流模型,可以不斷地提取運行時的更改信息,對運行時的數(shù)據(jù)信息進行分析,以實現(xiàn)模型的優(yōu)化.
在傳統(tǒng)的流程管理中,流程分析往往是由管理者根據(jù)經(jīng)驗,手工完成的,這種方式準確度較低且不全面.利用工作流日志可以精確地記錄工作流執(zhí)行過程并實現(xiàn)更智能化的流程分析.工作流管理系統(tǒng)可以對業(yè)務流程執(zhí)行信息進行記錄,所以在工作流中分析并發(fā)現(xiàn)重要的數(shù)據(jù),以幫助企業(yè)分析流程的缺陷.數(shù)據(jù)挖掘本身就是一個知識挖掘的過程,通過分析挖掘出的重要知識,并運用到工作流管理的各個階段,可以更好地完善和管理工作流模型.因此,工作流挖掘是智能化管理的一種手段,企業(yè)可以通過自身運營時挖掘出的重要數(shù)據(jù)信息來分析自身的優(yōu)點與不足,以便不斷地完善其管理模式.
目前,工作流挖掘技術(shù)的研究取得了很大進展,但還存在一些問題.
1) 過程挖掘算法的度量.在目前研究的挖掘算法中,沒有一個很好的算法可以應對所有的情況,例如KTail方法、Markovian方法等只能表示具有順序結(jié)構(gòu)的工作流模型;基于有向圖的工作流模型可以推導出具有因果及循環(huán)關(guān)系的工作流模型,但卻難以處理具有同步和選擇關(guān)系的過程;過程挖掘工具可以處理有層次結(jié)構(gòu)的工作流挖掘算法,但卻難以推導出具有循環(huán)結(jié)構(gòu)的工作流業(yè)務過程模型.而在實際應用中,工作流模型的結(jié)構(gòu)往往是比較復雜的,可能存在順序、選擇、循環(huán)、過程同步等多種問題.
2) 工作流日志的數(shù)據(jù)質(zhì)量.工作流日志一般都存在噪音,日志的部分內(nèi)容有可能是不正確、不完整或不正常的.由于人為或技術(shù)的錯誤,事件會被錯誤地記進日志.如果某些任務是手動的或由另外的系統(tǒng)或組織單元處理的,與其相關(guān)的事件將不在日志中出現(xiàn).這些噪音數(shù)據(jù)的處理將直接影響模型挖掘的結(jié)果.
3) 抽象層次的交互.由于很難準確地知道能夠在工作流日志數(shù)據(jù)中發(fā)現(xiàn)什么,因此其挖掘過程應該是交互的.用這種抽象層次的交互方法,可以從不同的角度觀察數(shù)據(jù)和發(fā)現(xiàn)模式.
本文從工作流挖掘的概念、作用、研究現(xiàn)狀及存在的問題對工作流控掘技術(shù)進行了探討.目前的工作流挖掘技術(shù)研究取得了初步進展,未來可能會在算法的改進及適用范圍上得到更大的突破.
[1] 趙衛(wèi)東,范力. 工作流挖掘研究的現(xiàn)狀與發(fā)展[J]. 計算機集成制造系統(tǒng),2008,14(12):2289-2296.
[2] 羅海濱,范玉順,吳澄.工作流技術(shù)綜述[J]. 軟件學報,2000,11(7):899-907.
[3] 文一憑,劉潔. 工作流模型挖掘算法及其應用研究[J]. 計算機技術(shù)與發(fā)展,2008(7):93-95.