關(guān) 宇,鄧 輝,王 鋒,2,季凱帆
(1.昆明理工大學(xué)云南省計算機技術(shù)應(yīng)用重點實驗室,云南 昆明 650051;2.中國科學(xué)院云南天文臺,云南 昆明 650011)
上世紀(jì)后期以來,天文學(xué)研究取得了突飛猛進的進展,主要推動力來自眾多的地面和空間的大中型觀測設(shè)備產(chǎn)生的海量觀測數(shù)據(jù)。例如斯隆數(shù)字巡天(SDSS)[1]、帕洛馬巡天和UK Schmidt巡天、紫外IUE衛(wèi)星、IRAS紅外巡天、ROAST X射線巡天、哈勃空間望遠(yuǎn)鏡、FIRST和NVSS等射電巡天,以及眾多的非巡天式望遠(yuǎn)鏡。在此基礎(chǔ)上,產(chǎn)生了眾多的數(shù)據(jù)釋放平臺(天文數(shù)據(jù)庫)。同時,一些重要的多波段天文數(shù)據(jù)交叉證認(rèn)檢索、查詢數(shù)據(jù)庫也應(yīng)運而生,例如NED[2]、SIMBAD[3]、CDS等等,數(shù)據(jù)的開放和共享使得科學(xué)產(chǎn)出趨于最大化和最優(yōu)化,成為促進天文學(xué)飛速發(fā)展的一個關(guān)鍵保障,也是天文學(xué)發(fā)展的潮流所趨。為了更加有效地利用這些開放共享的海量數(shù)據(jù)資源,虛擬天文臺(VO)[4-9]應(yīng)運而生。國際虛擬天文臺聯(lián)盟(IVO)目前已經(jīng)包括全球18個國家和地區(qū),其中包括中國虛擬天文臺(China-VO)。
在數(shù)據(jù)處理與展現(xiàn)系統(tǒng)的實現(xiàn)過程中,科學(xué)工作流(Scientific Workflow)技術(shù)起到了關(guān)鍵作用。科學(xué)工作流針對科學(xué)研究工作的特點,專注于大規(guī)模科學(xué)處理(e-Science)的定制[10],對科學(xué)數(shù)據(jù)進行管理、分析、模擬、仿真,提供輔助科學(xué)發(fā)現(xiàn)的環(huán)境。在生物學(xué)領(lǐng)域、經(jīng)濟學(xué)領(lǐng)域已經(jīng)有了科學(xué)工作流的系統(tǒng)原型[11]和初步應(yīng)用,如 Taverna 系統(tǒng)[12-13]、Kepler[14]、Triana[15-16]系統(tǒng)、GridNexus[17]系統(tǒng),以及EPSRC資助的DiscoveryNet[18]系統(tǒng)等。天文領(lǐng)域中,包括美國等發(fā)達國家在內(nèi),對科學(xué)工作流技術(shù)的應(yīng)用尚處于起步階段。在我國,受到客觀條件的制約,工作流技術(shù)被人更多地理解為業(yè)務(wù)工作流(Business Workflow),這極大地限制了廣大天文工作者對科學(xué)工作流技術(shù)的理解,影響了其推廣應(yīng)用。
工作流技術(shù)起源于20世紀(jì)70年代中期對辦公自動化領(lǐng)域的研究,但至今仍沒有一個對工作流的統(tǒng)一定義。在工作流技術(shù)發(fā)展的初期,不存在業(yè)務(wù)工作流與科學(xué)工作流的區(qū)分,隨著科學(xué)工作流的出現(xiàn),從工作流中分離出所謂的業(yè)務(wù)工作流。
工作流管理聯(lián)盟(WfMC)曾在1996年定義:工作流(Workflow)是一類能夠完全或者部分自動執(zhí)行的經(jīng)營過程,根據(jù)一系列過程規(guī)則,文檔、信息或任務(wù)能夠在不同的執(zhí)行者之間傳遞、執(zhí)行[19]。一般來說,一個工作流包括:任務(wù)、它們的關(guān)系以及它們的啟動和終止條件。也有文獻將工作流簡化定義為一系列用來管理業(yè)務(wù)處理或計算活動的運營操作或任務(wù)[20]。
隨著e-Science的興起,目前一般定義的科學(xué)工作流(Scientific Workflow),是指將一系列在科學(xué)研究中遇到的數(shù)據(jù)管理、計算、分析、展現(xiàn)等工作變成一個個獨立的服務(wù),再把這些服務(wù)通過數(shù)據(jù)鏈接組合在一起,滿足研究人員在科學(xué)實驗和數(shù)據(jù)處理中的需要,從而實現(xiàn)相應(yīng)的處理與科學(xué)計算。
盡管從技術(shù)角度來說,科學(xué)工作流與業(yè)務(wù)工作流之間的差異非常明顯,但從用戶應(yīng)用的角度來看,兩者的區(qū)別不大。這使得天文研究者經(jīng)常對兩種工作流的概念產(chǎn)生混淆,不理解科學(xué)工作流區(qū)別于業(yè)務(wù)工作流的內(nèi)涵與應(yīng)用價值。事實上,隨著網(wǎng)格計算、云計算的發(fā)展,今后的天文科學(xué)數(shù)據(jù)處理必然基于新的模式,了解與掌握科學(xué)工作流,對于理解和發(fā)展虛擬天文技術(shù)具有較大的推動作用。
首先需要明確地指出,科學(xué)工作流與業(yè)務(wù)工作流的本質(zhì)都是工作流,兩者的基礎(chǔ)是一致的。工作流系統(tǒng)的主要工作是在一個分布式環(huán)境中控制復(fù)雜活動(Activity)的執(zhí)行[21-23]??茖W(xué)工作流和業(yè)務(wù)工作流都是基于工作流系統(tǒng)來實現(xiàn)。業(yè)務(wù)工作流中,每次業(yè)務(wù)處理過程可看作是一次活動,比如公文的編寫、發(fā)送等;而科學(xué)家在研究實驗過程中,每次實驗都可看作是工作流中對數(shù)據(jù)的收集、獨立的數(shù)據(jù)處理等多個有序的數(shù)據(jù)處理活動。對比分析兩種工作流技術(shù),科學(xué)工作流有如下鮮明的特點:
(1)科學(xué)工作流采用數(shù)據(jù)驅(qū)動模式
科學(xué)工作流采用數(shù)據(jù)驅(qū)動(Data Driven)模式。由于科學(xué)研究依賴于實驗數(shù)據(jù),科學(xué)工作流趨向于建立一個以數(shù)據(jù)流為導(dǎo)向的可執(zhí)行模型。在整個數(shù)據(jù)處理過程中,前一級的數(shù)據(jù)輸出成為后一級處理的數(shù)據(jù)輸入。而業(yè)務(wù)工作流是命令驅(qū)動(Command Driven)機制,業(yè)務(wù)工作流以業(yè)務(wù)為導(dǎo)向,設(shè)計好之后被實施。業(yè)務(wù)工作流把重點放在控制流的模式與活動,工作流中的某個任務(wù)在滿足規(guī)定的控制條件才會被觸發(fā)執(zhí)行。
(2)科學(xué)工作流的定義與設(shè)計是全動態(tài)的
科學(xué)工作流的設(shè)計目的是由科學(xué)家自己構(gòu)建處理流程,將一個科學(xué)實驗具體化,以完成對科學(xué)家提出的科學(xué)設(shè)想或假說的驗證??蒲械哪康氖窍M谀愁I(lǐng)域的研究中,對本領(lǐng)域的某些知識有更深的理解。科學(xué)工作流設(shè)計過程中,科學(xué)家對工作流的整個任務(wù)序列是未知或者不確定的,需要依據(jù)某一任務(wù)的處理結(jié)果才能確定下一處理任務(wù),或者需要隨時動態(tài)調(diào)整某幾個處理任務(wù)盡可能滿足研究需求。這個動態(tài)過程反映了科學(xué)工作流與業(yè)務(wù)工作流很顯著的一個特征——增量式[24]。此外科學(xué)工作流還必須可重用,可不斷完善,可重現(xiàn)、借鑒給同領(lǐng)域的其他科學(xué)家[25]。
業(yè)務(wù)工作流是由工程師用專業(yè)軟件(如辦公自動化軟件)創(chuàng)建的。創(chuàng)建的工作流一旦使用就不會輕易改變。創(chuàng)建好的工作流在使用過程中如果發(fā)現(xiàn)一些關(guān)鍵流程處理有問題,就需要將此工作流廢除,重新創(chuàng)建一個新的工作流,而不是在原來的基礎(chǔ)上進行改變。從這方面來看,業(yè)務(wù)工作流可以看作是靜態(tài)的工作流[26]。
(3)科學(xué)工作流處理的數(shù)據(jù)量大、數(shù)據(jù)類型更為復(fù)雜
業(yè)務(wù)工作流通常處理的是一些像文檔(Word文件,PDF文件)、電子數(shù)據(jù)表(Excel文件)、電子表單等結(jié)構(gòu)簡單的小規(guī)模的數(shù)據(jù),而且其數(shù)據(jù)量是可以預(yù)知的。然而,在科研方面,科學(xué)家面對的往往是海量數(shù)據(jù),結(jié)構(gòu)也較為復(fù)雜自由。天文研究領(lǐng)域的數(shù)據(jù)量基本上都達到TB量級,比如SDSS的數(shù)據(jù)量就高達40 TB以上。數(shù)據(jù)量的巨大差異,給科學(xué)工作流的實現(xiàn)帶來了巨大的困難,采用常規(guī)的數(shù)據(jù)復(fù)制技術(shù)進行數(shù)據(jù)傳遞是不現(xiàn)實的。
(4)科學(xué)工作流強調(diào)數(shù)據(jù)的可信度
業(yè)務(wù)工作流以一個整體的長時間運行的商業(yè)事務(wù)方式協(xié)調(diào)一些商業(yè)系統(tǒng)的更新,當(dāng)工作流中的某個子任務(wù)執(zhí)行出錯,整個事務(wù)能夠回退,以保證本次處理的狀態(tài)跟未改變前是相同的。然而在科學(xué)工作流中,如果科學(xué)家認(rèn)為工作流中的某一個任務(wù)執(zhí)行得出的結(jié)果錯誤,整個處理會立即停止,不強調(diào)工作流的“事務(wù)”性??茖W(xué)工作流對每一步處理過程的可信度存在較高要求,對全程數(shù)據(jù)的變化過程需要進行監(jiān)控,在需要的時候,可以重現(xiàn)整個計算過程,即實現(xiàn)數(shù)據(jù)的“溯源”[27-30]。
長期以來,天文學(xué)家對數(shù)據(jù)的處理,更多地是習(xí)慣于利用單臺計算機,通過桌面應(yīng)用軟件(如IRAF[31]、IRIS等),或者直接采用高級語言(Fortran等)編寫程序或腳本對數(shù)據(jù)進行處理,為確保數(shù)據(jù)的準(zhǔn)確性,不得不對程序與腳本的可靠性與正確性進行大量的驗證。這樣的處理模式要求天文學(xué)家必須具有較強的計算機軟件設(shè)計能力,天文學(xué)家不得不投入巨大的精力學(xué)習(xí)計算機領(lǐng)域的相關(guān)知識,在很大程度上影響了其天文研究的開展。
為了降低程序開發(fā)難度,提高數(shù)據(jù)處理效率,天文研究中開始出現(xiàn)把程序代碼模塊化,對模塊進行調(diào)用的方法,由此誕生了若干的科學(xué)處理包(Library)軟件,對代碼進行重用。天文觀測中的自動觀測系統(tǒng),數(shù)據(jù)處理中的批處理(Batch Process),管道技術(shù)(Pipeline)等開始被天文工作者所掌握和使用。顯而易見,這樣的處理模式提高了工作效率與科研產(chǎn)出。
近幾年來,SOA[32](Service-Oriented Architecture面向服務(wù)的體系結(jié)構(gòu))成為分布式系統(tǒng)體系結(jié)構(gòu)中的代表架構(gòu)。SOA將異構(gòu)平臺上應(yīng)用程序的不同功能部件定義為服務(wù),服務(wù)之間通過定義良好的接口和規(guī)范按松耦合方式整合在一起,即將多個現(xiàn)有的應(yīng)用軟件通過網(wǎng)絡(luò)整合成一個新系統(tǒng)??茖W(xué)工作流技術(shù)的發(fā)展,正是在網(wǎng)格計算、分布式計算、云計算這樣一個大時代背景下,對原有批處理與管道技術(shù)等從系統(tǒng)架構(gòu)、程序設(shè)計模式、處理模式等各方面進行一次根本性提升,是e-Science未來發(fā)展的一個重要方向。從天文研究角度看,科學(xué)工作流可以視為一種可以定制的自動批處理系統(tǒng)。處理的對象可以是數(shù)據(jù),也可以是一個計算方法??茖W(xué)家的工作,就是根據(jù)自己科研的需要,通過簡單的設(shè)置,對數(shù)據(jù)、處理方法進行組合,構(gòu)建一個自動數(shù)據(jù)處理系統(tǒng)。其基本應(yīng)用思想是:
(1)業(yè)務(wù)標(biāo)準(zhǔn)化。對當(dāng)前天文數(shù)據(jù)處理中的主要功能進行抽象,對常用算法進行整理,對可以形成標(biāo)準(zhǔn)化處理的功能進行設(shè)計,并確保其可靠性。如前所述天文數(shù)據(jù)處理已經(jīng)存在很多成熟的軟件包,充分利用這些軟件包提供的功能就能滿足常規(guī)計算的要求,也可以確保計算結(jié)果的可靠性。
(2)功能服務(wù)化。利用Web Service將上述標(biāo)準(zhǔn)化后的功能進一步服務(wù)化,這與程序中的函數(shù)設(shè)計思想類似。這些服務(wù)可以部署于一臺或多臺服務(wù)器,并可以采用集群技術(shù)以適應(yīng)業(yè)務(wù)量的不同變化。事實上,通過Web Service技術(shù),實現(xiàn)可靠、標(biāo)準(zhǔn)的功能服務(wù)也是虛擬天文臺中的基本要求。原有的科學(xué)計算模式強調(diào)的是代碼重用,而新一代計算模式強調(diào)的是服務(wù)重用。
(3)處理分布化。通過分布處理技術(shù),調(diào)用位于不同服務(wù)器的標(biāo)準(zhǔn)功能服務(wù),實現(xiàn)業(yè)務(wù)處理。同時,利用數(shù)據(jù)的分布存儲以提高海量數(shù)據(jù)的訪問效率。
(4)功能定制化。對網(wǎng)絡(luò)上的各類服務(wù)進行任意定制與調(diào)用,并根據(jù)業(yè)務(wù)處理需要,快速變化、組合,以滿足科學(xué)研究的需要。
以一個標(biāo)準(zhǔn)天文光譜CCD數(shù)據(jù)處理為例。光譜測量的數(shù)據(jù)處理過程是天文學(xué)家很熟悉的一個管道處理過程,包括扣除(Overscan)、合并暗場(Bias)、扣除暗場(Bias)、合并平場(Flat)、歸一化平場(Flat)、改正平場(Flat)、剔除宇宙線、抽取一維光譜、抽取定標(biāo)光譜、波長定標(biāo)、波長系統(tǒng)轉(zhuǎn)換、流量定標(biāo)(根據(jù)需要)一系列過程。經(jīng)過上述處理過程,天文學(xué)家可以進一步測量光譜的基本參數(shù)、譜線輪廓、強度、紅移、譜線不對稱性等等,從而進行深入的天文學(xué)研究。
圖1A表示了上述計算模式。所有處理程序安裝于一臺服務(wù)器上,當(dāng)數(shù)據(jù)量巨大時,可以部署多臺服務(wù)器,每臺服務(wù)器均安裝同樣的程序,實現(xiàn)從扣除一直到波長系統(tǒng)轉(zhuǎn)換等全過程處理。在面向科學(xué)工作流的應(yīng)用中,服務(wù)器上部署的是各類標(biāo)準(zhǔn)服務(wù),原則上每臺計算機承擔(dān)不同的處理功能,多臺服務(wù)器在處理工作站的調(diào)度下實現(xiàn)整個計算的并行處理(圖1B)。
圖1 傳統(tǒng)單機批處理與科學(xué)工作流處理示意圖Fig.1 Traditional single-machine batch-processing and new Scientific Work flow processing
比較兩者,在處理工作量較小,且處理流程完全固定的情況下,傳統(tǒng)的批處理方式部署簡單,有一定優(yōu)勢。隨著處理工作量不斷增大,支持并行處理的科學(xué)工作流處理模式優(yōu)勢將得以發(fā)揮:
(1)在處理中可以根據(jù)處理任務(wù)的變化動態(tài)調(diào)整某一個處理單元的數(shù)量,確保整體的計算能力。傳統(tǒng)批處理雖然可以采用多機提高數(shù)據(jù)的處理效率,但這樣的擴展方式是一種縱向擴展,而采用科學(xué)工作流系統(tǒng)的擴展方式是典型的橫向擴展方式。兩者相比,橫向擴展更利于實現(xiàn)任務(wù)擴展,可以有針對性地解決計算中存在瓶頸的服務(wù)單元,單獨針對某一特別消耗CPU資源的任務(wù)進行擴展。
(2)科學(xué)工作流可以動態(tài)調(diào)整處理過程,能靈活地對計算流程進行重組與再定制,可以根據(jù)實際情況的變化新增或刪除某些處理模塊,對數(shù)據(jù)的處理可以更有針對性。同時,根據(jù)科研要求的變化,科學(xué)工作流可以快速地完成系統(tǒng)構(gòu)建,并確保計算的質(zhì)量。
(3)很容易構(gòu)建定時執(zhí)行(Schedule)與自動執(zhí)行(Auto)機制,滿足全自動處理的需求。從圖1B可以看出,部署環(huán)境中可以根據(jù)需要靈活地部署多臺處理工作站,各個工作站可以根據(jù)各自的需要實現(xiàn)對不同處理的靈活調(diào)用。這樣一方面充分利用了各服務(wù)器的資源,另一方面也可以構(gòu)建針對關(guān)鍵應(yīng)用的快速運行環(huán)境。
網(wǎng)格計算的發(fā)展和云計算的提出,給天文數(shù)據(jù)處理帶來了新的機遇。云計算提出了IaaS、PaaS和SaaS的思想,代表了今后的發(fā)展趨勢。在這種情況下,構(gòu)建云計算平臺,并把當(dāng)前的若干處理業(yè)務(wù)向云計算方向遷移,可能是下一階段天文研究的一個發(fā)展趨勢。從科學(xué)工作流的發(fā)展看,在云計算時代,科學(xué)工作流的作用更加明顯。當(dāng)前在天文研究中應(yīng)用科學(xué)工作流,迫切需要解決以下問題:
(1)科學(xué)工作流的整體定位,將由簡單的服務(wù)定制與調(diào)度執(zhí)行,向云計算的核心服務(wù)調(diào)度平臺發(fā)展。其中,除了當(dāng)前主要支持的Web Service調(diào)用,今后的科學(xué)工作流還需要支持云計算的標(biāo)準(zhǔn)調(diào)用接口,如Amazon EC2等。調(diào)用接口的多樣化可以使科學(xué)工作流獲得更多的可調(diào)用資源,從而擴展科學(xué)工作流的應(yīng)用面。
(2)以BPEL4WS作為科學(xué)工作流描述語言會逐漸成為一種趨勢。目前BPEL實際上已經(jīng)成為標(biāo)準(zhǔn)工作流語言,很多供應(yīng)商開發(fā)的工作流系統(tǒng)軟件都支持BPEL,但如何利用BPEL描述科學(xué)工作流系統(tǒng)仍是一個值得研究的問題。
(3)針對智能語義的數(shù)據(jù)交換接口(Interface)是一項急待解決的任務(wù)。在進行不同的服務(wù)調(diào)用時,服務(wù)之間如何自由地交換數(shù)據(jù),特別是如何實現(xiàn)服務(wù)間數(shù)據(jù)的格式、定義、含義等的智能語義匹配,是一個急待研究的關(guān)鍵問題。面對海量的天文數(shù)據(jù)和不同的數(shù)據(jù)格式(Fits、VOTable、自定義二進制、Raw Image等),工作流設(shè)計中完全靠人工進行指定與區(qū)配是不現(xiàn)實的。
本文主要介紹了科學(xué)工作流、業(yè)務(wù)工作流的概念,對兩者從多方面做了較為詳細(xì)的比較,并通過實例討論了科學(xué)工作流在天文中的應(yīng)用。結(jié)果表明,科學(xué)工作流的優(yōu)勢可以有效地滿足當(dāng)前天文數(shù)據(jù)處理、展現(xiàn)、發(fā)布等多種需要,可以在我國當(dāng)前LAMOST、HXMT、FAST、云臺2.4 m望遠(yuǎn)鏡等新一代觀測設(shè)備的科學(xué)數(shù)據(jù)處理中起到關(guān)鍵作用。
[1]斯隆數(shù)字巡天.The Sloan Digital Sky Survey [EB/OL].http://www.sdss.org/.
[2]NASA/IPAC.NASA/IPAC Extragalactic Database [EB/OL].http://www.ipac.caltech.edu/.
[3]斯特拉斯堡天文數(shù)據(jù)中心.SIMBAD Astronomical Database[EB/OL].http://simbad.ustrasbg.fr/simbad/.
[4]崔辰州,李文,于策,等.指尖上的宇宙——虛擬天文臺 [J].科學(xué)畫報,2004,(9):34-37.
[5]趙永恒.互聯(lián)網(wǎng)時代的天文學(xué)革命——虛擬天文臺 [J].科學(xué),2002,54(2):13-20.Zhao Yongheng.Revolution of Astronomy on Internet——Virtual Observatory [J].Science,2002,54(2):13-20.
[6]張彥霞,趙永恒.虛擬天文臺的科學(xué)意義 [J].天文學(xué)進展,2004,22(4):350-353.Zhang Yanxia,Zhao Yongheng.The Science of the Virtual Observatory [J].Progress in Astronomy,2004,22(4):350-353.
[7]崔辰州.虛擬天文臺 [J].世界科學(xué),2003,(2):16-18.
[8]張彥霞,趙永恒.虛擬天文臺:科學(xué)、工具及應(yīng)用 [J].天文學(xué)進展,2006,24(3):189-199.Zhang Yanxie,Zhao Yongheng.Science,Tools and Applications of the Virtual Observatory[J].Progress in Astronomy,2006,24(3):189-199.
[9]陳東.網(wǎng)絡(luò)控制技術(shù)與虛擬天文臺——理論和初步實踐 [D].昆明:中國科學(xué)院云南天文臺,2003.
[10]Ian J Taylor,E D Dennis Gannon,Matthew S Shields.Workf lows for e-Science [M].Heidelberg:Springer-Verlag Berlin,2006.
[11]Jia Yu,Rafkumar Buyya.A Taxonomy of Scientific Workflow Systems for Grid Computing [J].Sigmod Record,2005,34(3):44.
[12]Wei Tan,Paolo Missier,Ravi Madduri,et al.Building Scientific Workflow with Taverna and BPEL:A Comparative Study in caGRID [M].Heidelberg:Springer-Verlag Berlin,2009.
[13]Oinn T,Addis M,F(xiàn)erris J,et al.A Tool for the Composition and Enactment of Bioinformatics Workflows [J].Bioinformitics,2004,20(17):3045-3054.
[14]Bertram Lud?scher,Ilkay Altintas,Chad Berkley,et al.Scientific Workflow Management and the Kepler System [J].Concurrency and Computation Practice and Experience,2006,18(10):1039-1065.
[15]Shalil Majithia,Ian Taylor,Matthew Shields,et al.Triana:A Graphical Web Service Composition and Execution Toolkit[C]//Proceedings IEEE International Conference on Web Services,2004:514-521.
[16]Ian Taylor,Matthew Shields,Ian Wang,et al.Distributed P2P Computing within Triana:A Galaxy Visualization Test Case[M].Washington:IEEE Computer Society,2003.
[17]Jeffrey L Brown,Clayton S Ferner,Thomas C Hudson,et al.GridNexus:A Grid Services Scientific Workflow System [J].The International Journal of Computer and Information Science,2005,6(2):72-82.
[18]V M Ghanem,M Ghanem,Y Guo,et al.Wendel Discovery Net:Towards a Grid of Knowledge Discovery [J].Computer and Information Science,2002:658-663.
[19]羅海濱,范玉順,吳澄.工作流技術(shù)綜述 [J].軟件學(xué)報,2000,11(7):899-907.Luo Haibin,F(xiàn)an Yushun,Wu Cheng.Overview of Workflow Technology [J].Journal of Software,2000,11(7):899-907.
[20]Shields M.Control-Versus Data-Driven Workf lows [J].Workf lows for e-Science,2006:167-173.
[21]Rob Allen.United Kingdom Chair,WfMC External Relations Committee Workflow:An Introduction[M].Url:Open Image Systems,2001.
[22]Gustavo Alonso,Divyakant Agrawal,Amr E Abbadi,et al.Functionality and Limitations of Current Workflow Management Systems [J].Ieee Expert Intelligent Systems And Their Applications,1997,12(5):632-635.
[23]M Weske,G Vossen,C Bauzer Medeiros.Scientific Workflow Management:WASA Architecture and Application [M]. Fachbericht Angewandte Mathematik und Informatik 03/96-I,Universitat Munster,1996.
[24]Jacques Wainer Mathias,Mathias Weske,Gottfried Vossen,et al.Scientific workflow systems(Short Paper) [J/OL].[2010-10-05].http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.6464.
[25]Barker A,J Van Hemert.Scientific workflow:A Survey and Research Directions[C]//Roman Wyrzykowski,Jack Donqarra,Konrad Karczewski,et al.Parallel Processing and Applied Mathematics In Parallel Processing and Applied Mathematics,2008,4967:746-753.
[26]Roger Barga,Dennis Gannon.Scientific Versus Business Workflows [J].Workflows for e-Science,2007,2:9-16.
[27]Davidson S,Cohen-Boulakia S,Eyal A,et al.Provenance in Scienti?c Workf l ow Systems[J].IEEE Data Engineering Bulletin,2007,30(4):44-50.
[28]Luciano A Digiampietri,Claudia B Medeiros,Joao C Setubal,et al.Traceability Mechanisms for Bioinformatics Scienti?c Workf l ows [J].Proceedings of the AAAI2007's Workshop on Semantic E-Science,2007:26-33.
[29]Susan B Davidson,Juliana Freire.Provenance and Scienti?c Workf l ows:Challenges and Opportunities[J].Sigmod Conference,2008:1345-1350.
[30]Yogesh L Simmhan,Beth Plale,Dennis Gannon.A Survey of Data Provenance in e-Science[J].Sigmod Record,2005,34(3):31-36.
[31]蘇云寶,郭永國,張雄.利用IRAF軟件進行CCD測光 [J].云南師范大學(xué)學(xué)報:自然科學(xué)版,2009,29(6):1-4.Su Yunbao,Guo Yongguo,Zhang Xiong.CCD Photometry with IRAF [J].Journal of Yunnan Normal University:Natural Sciences Edition,2009,29(6):1-4.
[32]Lin Cui,Lu Shiyong,F(xiàn)ei Xubo,et al.A Reference Architecture for Scientific Workflow Management Systems and the VIEW SOA Solution [J].IEEE Transactions on Services Computing,2009,2(1):79-92.