亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向交互式建模的科學(xué)工作流活動(dòng)推薦方法

        2022-11-07 05:32:48文一憑侯俊杰劉建勛許小龍
        關(guān)鍵詞:語義建模節(jié)點(diǎn)

        文一憑,侯俊杰,譚 錚,劉建勛,許小龍

        (1.湖南科技大學(xué) 知識(shí)處理與網(wǎng)絡(luò)化制造湖南省普通高校重點(diǎn)實(shí)驗(yàn)室,湖南 湘潭 411201;2.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院,江蘇 南京 210044)

        0 引言

        科學(xué)工作流管理系統(tǒng)(Scientific Workflow Management Systems, SWfMS)是對(duì)復(fù)雜科學(xué)計(jì)算或科學(xué)實(shí)驗(yàn)過程進(jìn)行自動(dòng)化管理的重要工具,已成功應(yīng)用于氣象、地理、生物信息、高能物理等眾多領(lǐng)域[1-2]。其中,科學(xué)工作流建模是SWfMS應(yīng)用中的重要步驟,通常需要根據(jù)實(shí)際需求組合大量的應(yīng)用程序并對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行頻繁操作。因此,與業(yè)務(wù)工作流(business workflow)相似,構(gòu)建一個(gè)可有效描述科學(xué)計(jì)算或科學(xué)實(shí)驗(yàn)過程的科學(xué)工作流模型通常非常復(fù)雜耗時(shí)且容易出錯(cuò)[1,3-5]。

        近年來,隨著SWfMS的廣泛應(yīng)用,大量科學(xué)工作流模型被收集于myExperiment,CrowdLabs,SHIWA等在線平臺(tái)[6],雖然這些平臺(tái)提供了關(guān)鍵詞檢索等功能以便于分享、復(fù)用或再利用科學(xué)工作流模型,但是如何從這些模型中獲取有價(jià)值的信息以輔助建模,仍具挑戰(zhàn)性。而且與業(yè)務(wù)工作流不同,在SWfMS應(yīng)用中,科研人員需要根據(jù)工作流的當(dāng)前執(zhí)行結(jié)果對(duì)科學(xué)工作流模型進(jìn)行修改,如修改活動(dòng)節(jié)點(diǎn)等,而科研人員通常不是專業(yè)的模型設(shè)計(jì)人員,難以高效完成修改。因此,有必要研究如何通過與用戶交互來推薦一組活動(dòng)節(jié)點(diǎn)作為當(dāng)前科學(xué)工作流模型中下一個(gè)活動(dòng)節(jié)點(diǎn)的候選項(xiàng),從而有效輔助用戶完成科學(xué)工作流建模。

        針對(duì)該問題,本文提出一種面向交互式建模的科學(xué)工作流活動(dòng)推薦方法,該方法可通過輔助建模工具與科研人員或模型設(shè)計(jì)人員交互,為其推薦一組符合當(dāng)前科學(xué)工作流建模需求的候選活動(dòng)節(jié)點(diǎn)。

        1 相關(guān)研究

        科學(xué)工作流起源于業(yè)務(wù)工作流,然而在模型描述上,業(yè)務(wù)工作流建模大多采用面向控制的模型表達(dá)工作流活動(dòng)之間的順序、并行、選擇、循環(huán)、條件等控制依賴關(guān)系;而科學(xué)工作流建模大多采用面向數(shù)據(jù)的模型或面向數(shù)據(jù)與控制的混合模型,主要由數(shù)據(jù)驅(qū)動(dòng),后繼活動(dòng)的輸入數(shù)據(jù)通常依賴前驅(qū)活動(dòng)的數(shù)據(jù)處理結(jié)果。例如,現(xiàn)有的SWfMS在流程建模方面均支持順序、并行控制結(jié)構(gòu),但一些SWfMS并不支持條件、選擇和循環(huán)控制。而且,許多SWfMS提供了圖形化的流程建模工具,并支持對(duì)子流程進(jìn)行建模,以方便用戶建立復(fù)雜的、具有層次性的科學(xué)工作流模型。

        工作流模型推薦有助于提升工作流建模的正確率和效率,但其仍然是一個(gè)相對(duì)較新的領(lǐng)域,現(xiàn)有研究成果相對(duì)不多[3-5,7],而且工作流表示及工作流之間的相似度度量是與科學(xué)工作流推薦相關(guān)的兩個(gè)重要問題。對(duì)此,BERGMANN等[8]針對(duì)業(yè)務(wù)工作流、科學(xué)工作流的特點(diǎn),采用語義工作流圖表示這兩類工作流,該圖中的節(jié)點(diǎn)分為工作流節(jié)點(diǎn)(用于描述工作流的通用屬性)、任務(wù)節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)和控制流節(jié)點(diǎn),邊分為部分邊(用于描述工作流節(jié)點(diǎn)與其他節(jié)點(diǎn)間的連接語義)、數(shù)據(jù)流邊(用于描述任務(wù)節(jié)點(diǎn)間的數(shù)據(jù)依賴)、控制流邊(用于描述任務(wù)節(jié)點(diǎn)間的控制依賴)和約束邊(用于描述數(shù)據(jù)節(jié)點(diǎn)屬性間的語義約束)。在此基礎(chǔ)上,工作流之間的相似度可根據(jù)語義描述以及邊與節(jié)點(diǎn)間的相似度計(jì)算得到。STARLINGER等[6]根據(jù)myExperiment等在線平臺(tái)采用有向無環(huán)圖(Directed Acyclic Graph, DAG)描述科學(xué)工作流的特點(diǎn),提出一種層分解方法來計(jì)算工作流間的相似度。該方法首先將DAG中的節(jié)點(diǎn)進(jìn)行拓?fù)渑判颍瑢⒖茖W(xué)工作流分解為多層,然后通過計(jì)算各個(gè)層間的相似度得出科學(xué)工作流間的相似度。

        在科學(xué)工作流推薦研究方面,MOHAN等[9]針對(duì)SWfMS在支持流程建模與共享上的不足以及myExperiment等在線平臺(tái)的特點(diǎn),提出一種可提升工作流模型設(shè)計(jì)效率的科學(xué)工作流推薦框架,并構(gòu)建了原型系統(tǒng)。該系統(tǒng)可根據(jù)用戶當(dāng)前正在構(gòu)建的科學(xué)工作流模型,從科學(xué)工作流模型庫中選擇在句法和語義方面與當(dāng)前所構(gòu)建模型相匹配的科學(xué)工作流模型,并將其推薦給用戶作為參考。ZHOU等[10]和CHENG等[11]考慮科學(xué)工作流描述中的層次性特點(diǎn),通過綜合工作流的層次性關(guān)系、文本描述語義、先序與后序遍歷節(jié)點(diǎn)列表等信息來計(jì)算科學(xué)工作流之間的相似度,在此基礎(chǔ)上提出一種基于層次模型的科學(xué)工作流推薦方法。該方法首先通過圖骨架聚類算法將已有科學(xué)工作流模型進(jìn)行聚類,根據(jù)用戶需求描述選擇合適的聚類簇,然后從該聚類簇中選擇最相關(guān)的科學(xué)工作流模型作為推薦結(jié)果。WEN等[7]進(jìn)一步采用異構(gòu)信息網(wǎng)絡(luò)表示科學(xué)工作流,并結(jié)合元路徑等信息計(jì)算科學(xué)工作流間的相似度,基于密度峰值聚類算法進(jìn)行科學(xué)工作流模型聚類,提出一種基于異構(gòu)信息網(wǎng)絡(luò)模型的科學(xué)工作流推薦方法。ZHANG等[12]針對(duì)單個(gè)工作流或多個(gè)工作流中相互關(guān)聯(lián)的服務(wù)鏈,用工作單元描述工作流中的連通子圖,提出一種工作單元驅(qū)動(dòng)的科學(xué)工作流推薦框架。該框架首先根據(jù)用戶的歷史搜索查詢信息(如用戶查詢意圖、最終目的等)構(gòu)建侯選工作單元集,然后根據(jù)當(dāng)前的搜索查詢信息為用戶推薦合適的工作單元,以方便工作流模型設(shè)計(jì)。然而這些方法均未考慮如何通過推薦一組活動(dòng)節(jié)點(diǎn)作為當(dāng)前待構(gòu)建科學(xué)工作流模型中下一個(gè)活動(dòng)節(jié)點(diǎn)的候選項(xiàng),來輔助提升科學(xué)工作流建模效率。另外,ZHANG等[13]的研究與本文最為接近,其提出一種名為FlowRecommender的工作流推薦方法,該方法首先挖掘工作流節(jié)點(diǎn)與其上游子路徑間的模式,然后根據(jù)當(dāng)前工作流與各模式間的結(jié)構(gòu)相似度推薦工作流節(jié)點(diǎn)。然而,該方法并未考慮相關(guān)人員的科學(xué)工作流建模需求,也未考慮將當(dāng)前建模需求與歷史工作流片段間的語義相似度等因素作為推薦依據(jù)。DIAO等[14]考慮科學(xué)工作流開發(fā)者之間的社交網(wǎng)絡(luò)與交互信息,提出一種連接感知的、基于規(guī)則的科學(xué)工作流推薦方法,可根據(jù)用戶需求描述文本推薦所需的工作流模型。然而,該方法并未考慮相關(guān)人員的當(dāng)前科學(xué)工作流建模情況,而且其所推薦的為新構(gòu)建的科學(xué)工作流模型而非科學(xué)工作流活動(dòng)。因此,本文在上述研究基礎(chǔ)上,進(jìn)一步提出一種面向交互式建模的科學(xué)工作流活動(dòng)推薦方法。

        2 問題描述與相關(guān)定義

        在SWfMS應(yīng)用環(huán)境下,順序和并行控制結(jié)構(gòu)在科學(xué)工作流模型中最常見,部分SWfMS并不支持條件、選擇和循環(huán)控制結(jié)構(gòu)建模。而且,以交互式方式輔助科學(xué)工作流建模有助于為相關(guān)人員推薦下一步可供選擇或參考的科學(xué)工作流活動(dòng),從而提升建模效率。因此,本文主要針對(duì)下一個(gè)科學(xué)工作流活動(dòng)的構(gòu)建場(chǎng)景解決如下問題:假設(shè)相關(guān)人員正在執(zhí)行流程建模,給定一個(gè)未完成的科學(xué)工作流模型和一個(gè)對(duì)科學(xué)工作流活動(dòng)的搜索需求,推薦合適的科學(xué)工作流活動(dòng)以滿足當(dāng)前流程建模需求。

        對(duì)此,本文從科學(xué)工作流模型的圖結(jié)構(gòu)特點(diǎn)出發(fā),提出基于科學(xué)工作流片段的科學(xué)工作流活動(dòng)推薦策略。與科學(xué)工作流片段相關(guān)的概念與定義介紹如下:

        定義1科學(xué)工作流模型。一個(gè)科學(xué)工作流模型可描述為sw=nm,sw_dsc,sw_D,sw_A,sw_L,sw_s,其中nm為sw的名稱;sw_dsc為sw的描述性信息;sw_D為一組包含在sw中的子科學(xué)工作流集合;sw_A為一組包含在sw中的活動(dòng)(Activity)集合,每個(gè)活動(dòng)擁有不同的活動(dòng)名稱和描述性信息;sw_L為一組邊的集合,連接著sw_D中的子工作流與sw_A中的活動(dòng);sw_s為sw的開始點(diǎn),sw_s∈sw_D∪sw_A。

        值得說明的是,科學(xué)工作流模型描述中的活動(dòng)指直接包含在該科學(xué)工作流中的活動(dòng),并不涉及該科學(xué)工作流中子科學(xué)工作流的活動(dòng)。另外,一個(gè)子科學(xué)工作流也可描述為一個(gè)科學(xué)工作流模型。

        定義2科學(xué)工作流子圖。給定一個(gè)科學(xué)工作流模型sw,科學(xué)工作流子圖是從sw中提取的一個(gè)連通子圖,可描述為psw=psw_D,psw_A,psw_L,sw_s,并滿足以下條件:

        (1)psw_D?sw_D,psw_A?sw_A,psw_L?sw_L,sw_s∈psw_D∪psw_A。

        (2)?swdi∈psw_D,psw中存在一條從sw_s到swdi的路徑。

        (3)?ai∈psw_A,psw中存在一條從sw_s到ai的路徑。

        定義3科學(xué)工作流活動(dòng)的上游子圖。給定一個(gè)科學(xué)工作流子圖psw和psw中的一個(gè)科學(xué)工作流活動(dòng)a,活動(dòng)a的上游子圖為從psw中提取出活動(dòng)a后所得的一個(gè)連通子圖,可描述為psw′=psw_D′,psw_A′,psw_L′,sw_s′,其中sw_s′為psw的開始點(diǎn),并滿足以下條件:

        (1)psw_A′=psw_A-{a},psw_D′=psw_D,psw_L′?psw_L。

        (2)若sw_s′為空,則psw_D′,psw_A′,psw_L′均為空。

        (3)若sw_s′不為空,則?swdi∈psw_D′,psw′中存在一條從sw_s′到swdi的路徑,且?ai∈psw_A′,psw′中存在一條從sw_s′到ai的路徑。

        定義5用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求。在交互式建模環(huán)境中,用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求可描述為Q,ISW,其中Q為用戶提交的活動(dòng)查詢,ISW為用戶當(dāng)前構(gòu)建中的一個(gè)科學(xué)工作流模型。

        定義6語義及結(jié)構(gòu)相似度??茖W(xué)工作流片段與用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求間的語義相似度是其相關(guān)文本描述間的相似度,結(jié)構(gòu)相似度是其所包含的相關(guān)科學(xué)工作流活動(dòng)之間的連接關(guān)系方面的相似度。

        3 面向交互式建模的科學(xué)工作流活動(dòng)推薦方法

        3.1 基本思路

        本文提出一種面向交互式建模的科學(xué)工作流活動(dòng)推薦方法(Scientific Workflow Activity Recommendation for interactive modeling, SWAR),該方法的基本思想是將科學(xué)工作流片段作為推薦的參考模型,若某參考模型中的科學(xué)工作流活動(dòng)能與用戶提交的活動(dòng)查詢匹配,且其上游子圖能與構(gòu)建中的科學(xué)工作流模型匹配,則該參考模型中的科學(xué)工作流活動(dòng)有可能被推薦。該方法可用算法1描述,主要包括構(gòu)建科學(xué)工作流片段集、選擇相似科學(xué)工作流片段子集、篩選相似科學(xué)工作流片段、推薦侯選科學(xué)工作流活動(dòng)4個(gè)步驟。其中,計(jì)算科學(xué)工作流片段與用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求之間的匹配度是該方法的關(guān)鍵。

        算法1SWAR。

        輸入:構(gòu)建中的科學(xué)工作流ISW、科學(xué)工作流庫SWR、用戶提交的活動(dòng)查詢Q、推薦時(shí)的相似度閾值thdsim、推薦的工作流活動(dòng)數(shù)量K。

        輸出:科學(xué)工作流活動(dòng)Arec。

        1.for each sw in SWR

        2. {subG=ExtractAllsubGraphs(sw_s);

        3.WF=WF ∪ CreatWorkflowFragments(subG);

        4. }

        5.Clusters=refGraphSimilarity_Clusting(WF);

        6.for each cluster∈Clusters

        7. {barycenter=ChooseCenterGraph(cluster);

        8.if IsMaxSimFragment(barycenter,Q, ISW)

        9. {Cls=cluster; }

        10. }

        11.for each Wfi∈Cls

        12.if SimFragment(Wfi,Q, ISW) > thdsim

        13. {Rec←append the workflow activity inWfi;}

        14.Arec← select the top K activities in Rec;

        15.Return Arec

        算法1的步驟如下:

        步驟1第1~5行,構(gòu)建科學(xué)工作流片段。首先從科學(xué)工作流庫中獲取科學(xué)工作流模型,根據(jù)科學(xué)工作流模型的起始點(diǎn),利用圖挖掘等算法(如gSpan算法[15])提取符合要求的科學(xué)工作流子圖(第2行);然后根據(jù)這些科學(xué)工作流子圖,利用層次遍歷算法獲取不同的科學(xué)工作流活動(dòng)與其上游子圖,構(gòu)建符合要求的科學(xué)工作流片段集(第3行);最后,根據(jù)科學(xué)工作流片段中的上游子圖信息,基于科學(xué)工作流聚類方法[12]對(duì)科學(xué)工作流片段集進(jìn)行聚類,以劃分科學(xué)工作流片段集(第5行)。

        步驟2第6~10行,選擇相似科學(xué)工作流片段子集。首先對(duì)已劃分的科學(xué)工作流片段子集,基于科學(xué)工作流集重心查找方法[9-11],獲取已劃分的科學(xué)工作流片段子集中的重心科學(xué)工作流片段(第7行);然后根據(jù)Doc2vec模型[16]和圖編輯距離計(jì)算用戶的推薦需求與科學(xué)工作流片段之間的匹配度,并選擇具有最大匹配度的科學(xué)工作流片段子集(第8~9行)。其中,Doc2vec模型可用科學(xué)工作流相關(guān)描述文本等語料進(jìn)行訓(xùn)練。

        步驟3第11~13行,篩選相似科學(xué)工作流片段。根據(jù)預(yù)設(shè)置的匹配度閾值thdsim,在相似科學(xué)工作流片段子集中篩選出與用戶推薦需求的語義相似度、結(jié)構(gòu)相似度較高的科學(xué)工作流片段(第12行),并將其加入科學(xué)工作流片段侯選集(第13行)。

        步驟4第14~15行,推薦侯選科學(xué)工作流活動(dòng)。在科學(xué)工作流片段侯選集中選擇匹配度高的前K個(gè)科學(xué)工作流片段中的工作流活動(dòng),將其作為最終的科學(xué)工作流活動(dòng)推薦結(jié)果。

        3.2 基于Doc2vec與圖編輯距離的匹配度計(jì)算

        Doc2vec模型以Word2vec[17]模型為基礎(chǔ),可有效將段落或句子轉(zhuǎn)換成具有固定維度的向量表示,已被廣泛應(yīng)用于處理文本的相關(guān)任務(wù)。因此,本文采用基于Doc2vec與圖編輯距離的方法計(jì)算科學(xué)工作流片段與用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求之間的匹配度,如算法2所示,該算法可直接用于構(gòu)建算法1中的IsMaxSimFragment和SimFragment方法。

        算法2SimilarityComputation。

        輸入:科學(xué)工作流庫SWR、科學(xué)工作流片段Wfi、用戶提交的活動(dòng)查詢Q、構(gòu)建中的科學(xué)工作流ISW。

        輸出:匹配度。

        1.W,R=Doc2vecTraining(SWR);

        2.SemSim=SemanticSimilarity(W,R,Q,Wfi);

        3.DistSim=GraphEditDistance(ISW,Wfi);

        4.return α×(1-DistSim)+(1-α)×SemSim

        算法2的步驟如下:

        步驟1第1行,訓(xùn)練Doc2vec模型。訓(xùn)練的主要過程為:①通過提取科學(xué)工作流、子科學(xué)工作流及活動(dòng)的相關(guān)描述文本構(gòu)建科學(xué)工作流描述文本集,然后對(duì)該文本集進(jìn)行小寫化、分詞、詞干化、去停用詞等預(yù)處理后,形成語料庫Q={x1,x2,…,xj,…,xN},其中xj表示第j個(gè)詞語,N為該語料庫的詞語總量;②用語料庫Q={x1,x2,…,xj,…,xN}中xj的上下文數(shù)據(jù)P={xj-k,…,xj+k}作為輸入層數(shù)據(jù)(k為上下文窗口大小)訓(xùn)練Doc2vec模型,得到訓(xùn)練好的詞向量矩陣W和段落向量矩陣R。

        步驟2第2行,基于Doc2vec模型計(jì)算用戶提交的活動(dòng)查詢與科學(xué)工作流片段之間的語義相似度。首先將活動(dòng)查詢、科學(xué)工作流片段中的活動(dòng)描述文本分別輸入訓(xùn)練好的Doc2vec模型,得到這兩個(gè)文本對(duì)應(yīng)的向量表示,然后用余弦相似度計(jì)算兩個(gè)文本間的語義相似度。

        例如,假設(shè)活動(dòng)查詢?yōu)镼,活動(dòng)描述文本為dsc,則Q和dsc間的語義相似度

        (1)

        式中:vi和vj分別為Q和dsc輸入Doc2vec模型后的向量表示;‖vi‖為向量的模。

        步驟3第3行,基于圖編輯距離計(jì)算科學(xué)工作流片段Wfi和當(dāng)前所構(gòu)建科學(xué)工作流ISW之間的語義及結(jié)構(gòu)相似度。本文在參照文獻(xiàn)[18]基于圖編輯距離的過程模型相似性度量方法的基礎(chǔ)上,根據(jù)轉(zhuǎn)換操作的代價(jià)計(jì)算Wfi和ISW間的相似度,具體如下:①將節(jié)點(diǎn)增刪操作的代價(jià)記為1,節(jié)點(diǎn)替換操作的代價(jià)記為1-simsem(ni,nj),其中simsem(ni,nj)表示兩個(gè)活動(dòng)的語義相似度;②當(dāng)進(jìn)行節(jié)點(diǎn)增刪操作時(shí),節(jié)點(diǎn)對(duì)應(yīng)的每條邊所需進(jìn)行增刪操作的代價(jià)均記為1;③根據(jù)這些代價(jià)計(jì)算語義及結(jié)構(gòu)相似度。

        步驟4第4行,綜合前兩步所得的語義相似度與結(jié)構(gòu)相似度,輸出最終的科學(xué)工作流片段與用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求之間的匹配度。

        4 實(shí)驗(yàn)評(píng)估

        4.1 數(shù)據(jù)集

        本文在前期從myExperiment平臺(tái)爬取的科學(xué)工作流庫(https://github.com/yixinxunwu/myExperiment)的基礎(chǔ)上,選取Tarvena2類型科學(xué)工作流構(gòu)建數(shù)據(jù)集SW#100,并根據(jù)五折交叉驗(yàn)證的原理進(jìn)行實(shí)驗(yàn)。首先將整個(gè)數(shù)據(jù)集隨機(jī)劃分為5個(gè)大小相等的數(shù)據(jù)子集;然后不重復(fù)地每次取其中一個(gè)子集作為測(cè)試集,其余4個(gè)子集作為訓(xùn)練集,進(jìn)行五折交叉驗(yàn)證,獲取在5個(gè)測(cè)試集上關(guān)于不同指標(biāo)的評(píng)估結(jié)果;最后將評(píng)估結(jié)果按不同指標(biāo)取平均值,得到最終的評(píng)估結(jié)果。

        實(shí)驗(yàn)所用的數(shù)據(jù)集名為SW#100,該數(shù)據(jù)集涉及100個(gè)科學(xué)工作流和808個(gè)工作流活動(dòng),其中每個(gè)科學(xué)工作流包含2~126個(gè)工作流活動(dòng)。根據(jù)該數(shù)據(jù)集,應(yīng)用gSpan算法[14]并設(shè)置該算法中的參數(shù)minSup=1,可獲取9 885個(gè)符合實(shí)驗(yàn)要求的科學(xué)工作流子圖。

        4.2 評(píng)價(jià)指標(biāo)

        為了評(píng)估活動(dòng)推薦效果,構(gòu)建期望推薦的活動(dòng)列表Aept(表中活動(dòng)所對(duì)應(yīng)的科學(xué)工作流片段與用戶對(duì)科學(xué)工作流活動(dòng)的推薦需求之間的匹配度超過thdsim),以及實(shí)際推薦的活動(dòng)列表Arec(表中的活動(dòng)為實(shí)際推薦結(jié)果)?;诖耍x準(zhǔn)確率precision、召回率recall和F1(F-score)3個(gè)評(píng)價(jià)指標(biāo):

        (2)

        (3)

        (4)

        式中:|Arec|和|Aept|分別為列表Arec和Aept中的活動(dòng)數(shù);|Arec∩Aept|為兩個(gè)活動(dòng)列表中同時(shí)存在的活動(dòng)數(shù)。

        4.3 推薦結(jié)果評(píng)估

        本文選用FlowRecommender[13]作為對(duì)比方法(記為FlowRec),并從如下兩方面進(jìn)行實(shí)驗(yàn)評(píng)估分析:

        (1)匹配度閾值thdsim對(duì)推薦結(jié)果的影響

        為研究匹配度閾值thdsim對(duì)SWAR方法在準(zhǔn)確率、召回率和F1上的影響,將推薦的活動(dòng)數(shù)K設(shè)置為10,賦值thdsim=0.74,0.78,…,0.94。如圖1所示,隨著thdsim的增加,準(zhǔn)確率和召回率分別呈現(xiàn)下降和增長(zhǎng)的趨勢(shì),而且SWAR方法在準(zhǔn)確率、召回率和F1方面均優(yōu)于FlowRec方法。

        當(dāng)閾值thdsim設(shè)置為相對(duì)較大的值時(shí),Aept的活動(dòng)可能較少。因此,Arec中的大量活動(dòng)在Aept中并不存在,從而導(dǎo)致準(zhǔn)確率降低。如圖1a所示,當(dāng)thdsim設(shè)置為0.74~0.82時(shí),因?yàn)榇蠖鄶?shù)預(yù)期片段的相似性值在這兩個(gè)值范圍內(nèi),所以SWAR的準(zhǔn)確率相對(duì)穩(wěn)定;當(dāng)thdsim設(shè)置為0.86~0.98時(shí),因?yàn)檫@類相似度極高的預(yù)期活動(dòng)非常少,所以Aept中的活動(dòng)數(shù)急劇減少。另外,因?yàn)镕lowRec方法在活動(dòng)推薦中主要強(qiáng)調(diào)結(jié)構(gòu)相似度,而SWAR方法同時(shí)關(guān)注語義相似度與結(jié)構(gòu)相似度,所以SWAR方法相對(duì)優(yōu)于FlowRec方法。

        (2)推薦活動(dòng)數(shù)量K對(duì)推薦結(jié)果的影響

        為了研究推薦活動(dòng)數(shù)量K對(duì)SWAR方法推薦結(jié)果的影響,設(shè)置thdsim=0.86,K=6,10,…,30。如圖2所示,隨著K值的增加,準(zhǔn)確率和召回率分別呈現(xiàn)下降和增長(zhǎng)的趨勢(shì),而且SWAR方法在準(zhǔn)確率、召回率和F1方面均優(yōu)于FlowRec方法。

        如圖2a所示,當(dāng)K設(shè)置為較大值時(shí),兩種活動(dòng)推薦方法的準(zhǔn)確率都開始降低,因?yàn)檫@些方法推薦了過多的活動(dòng),而其實(shí)際上與相關(guān)人員需求的相關(guān)性不大,所以這些活動(dòng)可能并不存在于Aept中。當(dāng)K為6~14時(shí),這兩種活動(dòng)推薦方法的召回率均大幅提高。

        如圖2b所示,當(dāng)K為16~30時(shí),所有方法的召回率都逐漸變得相對(duì)穩(wěn)定,因?yàn)榇藭r(shí)在Aept中,大多數(shù)預(yù)期的活動(dòng)已經(jīng)被發(fā)現(xiàn)并推薦給相關(guān)人員。如圖2c所示,當(dāng)K被設(shè)置為6~14時(shí),兩種方法的F1值均有所提升,而當(dāng)K賦值為18甚至更高時(shí),所有活動(dòng)推薦方法的F1值均呈現(xiàn)下降的趨勢(shì)。

        5 結(jié)束語

        針對(duì)SWfMS環(huán)境中科學(xué)工作流建模的特點(diǎn)以及相關(guān)人員的交互式建模需求,本文在前期研究工作的基礎(chǔ)上,提出一種面向交互式建模的科學(xué)工作流活動(dòng)推薦方法,并通過基于真實(shí)數(shù)據(jù)集的實(shí)驗(yàn),驗(yàn)證了該方法在準(zhǔn)確率、召回率和F1等評(píng)估指標(biāo)方面均優(yōu)于對(duì)比方法。未來工作將考慮結(jié)合科學(xué)工作流的建模主題等,進(jìn)一步提升科學(xué)工作流活動(dòng)推薦的智能性。

        猜你喜歡
        語義建模節(jié)點(diǎn)
        CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
        Analysis of the characteristics of electronic equipment usage distance for common users
        聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃?chǎng)中做圓周運(yùn)動(dòng)”為例
        基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建
        語言與語義
        基于PSS/E的風(fēng)電場(chǎng)建模與動(dòng)態(tài)分析
        電子制作(2018年17期)2018-09-28 01:56:44
        不對(duì)稱半橋變換器的建模與仿真
        “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
        抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)
        認(rèn)知范疇模糊與語義模糊
        欧美喷潮系列在线观看| 无码av天天av天天爽| 久久久久亚洲av成人网人人网站| 亚洲人成无码网www| 高跟丝袜一区二区三区| 成人爽a毛片在线播放| 亚洲午夜成人精品无码色欲| 日本老熟欧美老熟妇| 国产亚洲欧美另类第一页| av黄色大片久久免费| 99热在线观看| 极品粉嫩嫩模大尺度无码| 成人自拍视频国产一区| 亚洲女同同性一区二区| 国产欧美日韩精品专区 | 国产美女在线精品亚洲二区| 亚洲色图视频在线观看,| 亚洲精品中文字幕一二三区 | 色妺妺在线视频| 亚洲青涩在线不卡av| 久久一区二区三区久久久| 国产av无码专区亚洲av中文| 在线视频这里只有精品| 国产av一区二区三区在线 | 一区二区三区观看在线视频| 亚洲一区精品无码| 亚洲精品国产成人| 日韩av无卡无码午夜观看| 日本刺激视频一区二区| 国产精品久久久久9999小说| h在线国产| 日本一曲二曲三曲在线| 亚洲国产精品成人久久| 丰满人妻无奈张开双腿av| 久草视频在线这里只有精品| 人妻少妇精品专区性色anvn| 天天躁日日躁狠狠久久| 97中文字幕在线观看| 亚洲av高清一区二区| 久久国产精品偷任你爽任你| 另类免费视频在线视频二区|