萬進(jìn)勇,史涯晴,黃 松,羅浩榕
(陸軍工程大學(xué)指揮控制工程學(xué)院,江蘇南京 210001)
隨著軍隊(duì)現(xiàn)代化建設(shè)進(jìn)程加快推進(jìn),越來越多的軍事軟件應(yīng)用到軍事活動(dòng)中,因而對(duì)這些軍事軟件的質(zhì)量要求越來越高。軟件測(cè)試作為裝備試驗(yàn)鑒定中的重要一環(huán),對(duì)裝備質(zhì)量起到保駕護(hù)航的作用,同時(shí)也對(duì)測(cè)試效率要求越來越高。軟件測(cè)試是程序的一種執(zhí)行過程,是在軟件生命周期中一項(xiàng)十分重要且復(fù)雜的工作,是軟件可靠性保證的有效方法。研究表明,軟件測(cè)試占用軟件開發(fā)過程的大量時(shí)間,提高軟件測(cè)試效率、縮短軟件研制周期是軟件工程領(lǐng)域亟待解決的問題[1]。近年來,圍繞提高軟件測(cè)試效率,研究者提出大量自動(dòng)化測(cè)試框架與測(cè)試方法,提高了軟件測(cè)試執(zhí)行階段的效率。
在測(cè)試設(shè)計(jì)階段,如何提高測(cè)試用例設(shè)計(jì)是軟件測(cè)試過程中的關(guān)鍵一步,測(cè)試用例復(fù)用的思想由此產(chǎn)生。測(cè)試用例設(shè)計(jì)是軟件測(cè)試過程中的重要環(huán)節(jié),利用歷史項(xiàng)目的測(cè)試用例,指導(dǎo)新項(xiàng)目測(cè)試用例的設(shè)計(jì)與執(zhí)行,實(shí)現(xiàn)測(cè)試過程中的資產(chǎn)復(fù)用是提高軟件測(cè)試效率的重要方式。軟件測(cè)試作為一項(xiàng)知識(shí)密集型活動(dòng),在歷史測(cè)試的各階段都會(huì)產(chǎn)生大量測(cè)試文本數(shù)據(jù),通過整理提取歷史測(cè)試資產(chǎn)庫中的測(cè)試用例相關(guān)測(cè)試數(shù)據(jù)建立軟件測(cè)試用例庫。在此基礎(chǔ)上通過Bert 語言模型[2]對(duì)測(cè)試用例庫的數(shù)據(jù)進(jìn)行處理,結(jié)合文本相似度計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用,以此提高測(cè)試人員測(cè)試用例設(shè)計(jì)效率。
目前,有關(guān)測(cè)試用例的復(fù)用研究可分為以下幾種類型:基于形式化建模的復(fù)用方法,使用XML、Z 語言等[3-4]方式對(duì)測(cè)試資產(chǎn)從不同層面建立統(tǒng)一規(guī)范的表述從而形成測(cè)試資產(chǎn)庫,在此基礎(chǔ)上使用基于關(guān)鍵字的檢索或相似性度量的方式實(shí)現(xiàn)測(cè)試資產(chǎn)復(fù)用;基于主題詞檢索復(fù)用方法[5]需要構(gòu)建軟件測(cè)試用例的檢索模型,通過模型匹配與檢索算法獲取測(cè)試資產(chǎn)庫中的測(cè)試用例信息;基于需求匹配模型,通過建立測(cè)試用例與軟件測(cè)試需求之間的關(guān)聯(lián)性,包括建立軟件需求—測(cè)試樹、獲取需求的向量表示并進(jìn)行需求分類[6]、利用TF-IDF 詞頻統(tǒng)計(jì)方法與向量模型[7]挖掘文檔標(biāo)簽信息進(jìn)而復(fù)用測(cè)試用例文檔。
通過相關(guān)文獻(xiàn)研讀,測(cè)試用例復(fù)用研究中還存在一些問題:歷史測(cè)試資產(chǎn)包含繁雜的測(cè)試信息且存在形式各異,對(duì)測(cè)試用例采集造成挑戰(zhàn);測(cè)試文本數(shù)據(jù)具有很強(qiáng)的文本語義信息,以往通過檢索的復(fù)用方式難以挖掘測(cè)試文本數(shù)據(jù)更深層的語義信息從而實(shí)現(xiàn)更小粒度的復(fù)用。
參考GJB/Z141 軍用軟件測(cè)試指南、GJB 438B 軍用軟件開發(fā)文檔中測(cè)試用例涉及的文本信息,本文分析測(cè)試用例復(fù)用所需的測(cè)試信息,通過SQL 語言等技術(shù)對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化的測(cè)試用例、測(cè)試需求進(jìn)行采集,形成比較標(biāo)準(zhǔn)的測(cè)試用例資產(chǎn)庫。為了獲取測(cè)試文本語義向量表示,引入自然語言處理領(lǐng)域中預(yù)訓(xùn)練語言模型,將構(gòu)建的測(cè)試數(shù)據(jù)訓(xùn)練集輸入到Bert 預(yù)訓(xùn)練語言模型,進(jìn)行微調(diào)以更新模型參數(shù)。通過微調(diào)的模型能夠獲取到測(cè)試文本數(shù)據(jù)更好的語義向量表示,結(jié)合文本相似度計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用。最后通過實(shí)驗(yàn)驗(yàn)證了該方法的有效性,提升了測(cè)試用例設(shè)計(jì)效率與質(zhì)量。
軟件測(cè)試用例復(fù)用的一個(gè)重要前提是構(gòu)建一個(gè)完備且規(guī)范的測(cè)試用例庫,測(cè)試用例、測(cè)試需求是軟件測(cè)試資產(chǎn)庫中的核心資產(chǎn)。測(cè)試團(tuán)隊(duì)?wèi)?yīng)具備全面、協(xié)調(diào)和可持續(xù)發(fā)展的特點(diǎn),構(gòu)建標(biāo)準(zhǔn)化、規(guī)范化的測(cè)試資產(chǎn)庫,用于指導(dǎo)今后測(cè)試設(shè)計(jì)與測(cè)試人員培訓(xùn)等工作。軟件測(cè)試貫穿于軟件開發(fā)生命周期,每個(gè)測(cè)試階段都會(huì)輸出相應(yīng)文檔,這就是基礎(chǔ)的測(cè)試資產(chǎn),不同測(cè)試階段,測(cè)試的輸入輸出如表1 所示。軟件測(cè)試資產(chǎn)不僅包括測(cè)試的全生命周期中輸出的各種文檔數(shù)據(jù),同時(shí)也包括測(cè)試團(tuán)隊(duì)積累的測(cè)試經(jīng)驗(yàn)、技能和思維,比如某類項(xiàng)目中的一些共性功能、同類缺陷、測(cè)試策略等。
Table 1 Assets output during testing表1 測(cè)試過程中輸出的資產(chǎn)
本文主要通過研究測(cè)試資產(chǎn)實(shí)現(xiàn)測(cè)試用例復(fù)用,測(cè)試用例復(fù)用是軟件復(fù)用中的一種類型,軟件復(fù)用是為避免重復(fù)勞動(dòng)、提高軟件質(zhì)量和生產(chǎn)效率的解決方案[8]。根據(jù)軟件復(fù)用對(duì)象可分為兩類:產(chǎn)品復(fù)用和流程復(fù)用,產(chǎn)品復(fù)用指軟件開發(fā)過程中的需求規(guī)范、軟件設(shè)計(jì)、測(cè)試計(jì)劃、測(cè)試數(shù)據(jù)等,流程復(fù)用是使用可復(fù)用的應(yīng)用生成器自動(dòng)或者半自動(dòng)復(fù)用開發(fā)過程并自動(dòng)生成所需系統(tǒng)[9]。
測(cè)試用例設(shè)計(jì)是軟件測(cè)試過程中的重要環(huán)節(jié),如何利用歷史項(xiàng)目的測(cè)試用例,指導(dǎo)新項(xiàng)目測(cè)試用例設(shè)計(jì)與執(zhí)行,實(shí)現(xiàn)軟件測(cè)試用例復(fù)用是軟件測(cè)試復(fù)用的主要研究方向。在已有的一些測(cè)試資產(chǎn)中,測(cè)試大綱能夠體現(xiàn)出軟件需求與測(cè)試需求的關(guān)系,由于特征相似的需求具有相似的測(cè)試項(xiàng),需提取測(cè)試大綱中測(cè)試需求建立測(cè)試用例資產(chǎn)庫。由于相似測(cè)試項(xiàng)對(duì)應(yīng)的測(cè)試用例也具有一定的相似性,通過測(cè)試需求與測(cè)試用例之間的關(guān)系完成測(cè)試用例資產(chǎn)庫建設(shè),作為測(cè)試用例復(fù)用的基礎(chǔ)。
測(cè)試需求與測(cè)試用例關(guān)聯(lián)最緊密,測(cè)試用例設(shè)計(jì)都是根據(jù)軟件軟件測(cè)試需求進(jìn)行精心設(shè)計(jì)。軟件測(cè)試需求明確了測(cè)試過程中待解決的問題,在建立的測(cè)試用例資產(chǎn)庫中,測(cè)試需求應(yīng)包含以下5 個(gè)屬性信息:需求項(xiàng)名稱表示為Name、所屬領(lǐng)域信息表示為Filed Information、需求描述表示為Description、需求類型Type、測(cè)試方法Method。因此,將測(cè)試需求(TR)表示為一個(gè)五元組:TR=
測(cè)試用例是指對(duì)一項(xiàng)特定的軟件產(chǎn)品進(jìn)行測(cè)試任務(wù)描述,為某個(gè)特殊目標(biāo)而編制的一組測(cè)試輸入、執(zhí)行條件以及預(yù)期結(jié)果,用于核實(shí)是否滿足某個(gè)特定軟件需求。測(cè)試用例資產(chǎn)庫中,測(cè)試用例包括7 個(gè)屬性信息,測(cè)試用例名稱表示為Name、測(cè)試說明表示為Description、測(cè)試類型表示為Type、測(cè)試步驟表示為Process、前置條件表示為Precondition、預(yù)期結(jié)果表示為Excepted,測(cè)試需求追蹤表示為Requirement Link,因此測(cè)試用例(TC)可表示為一個(gè)七元組:TC=
Fig.1 Test case example圖1 測(cè)試用例示例
測(cè)試用例是檢驗(yàn)測(cè)試過程是否有效的重要因素,設(shè)計(jì)良好的測(cè)試用例是測(cè)試工作的關(guān)鍵。同時(shí),測(cè)試用例的編寫要求測(cè)試人員對(duì)產(chǎn)品設(shè)計(jì)及軟件需求相關(guān)知識(shí)有比較清晰的認(rèn)知。歷史經(jīng)驗(yàn)表明,同一領(lǐng)域的測(cè)試項(xiàng)目往往遵循相同的行業(yè)規(guī)范、標(biāo)準(zhǔn)等,而同一類型軟件的使用場(chǎng)景、功能結(jié)構(gòu)、性能要求等方面的需求存在很大相似性,因此具備了知識(shí)復(fù)用的基礎(chǔ),進(jìn)而可以根據(jù)項(xiàng)目之間的軟件特征信息、測(cè)試需求相似性計(jì)算實(shí)現(xiàn)測(cè)試用例復(fù)用。
研究表明,當(dāng)兩個(gè)項(xiàng)目存在某種相似性時(shí),其測(cè)試需求、測(cè)試用例、潛在問題等也應(yīng)存在較大相似性,因此從軟件相似性角度研究測(cè)試用例復(fù)用。為了實(shí)現(xiàn)軟件測(cè)試用例復(fù)用,首先需要設(shè)計(jì)一個(gè)結(jié)構(gòu)完整并具有一定規(guī)模的測(cè)試用例資產(chǎn)庫,并且建立測(cè)試用例與測(cè)試需求的關(guān)聯(lián)關(guān)系。在設(shè)計(jì)好的測(cè)試資產(chǎn)庫基礎(chǔ)上,按照一定的準(zhǔn)則采取相應(yīng)的技術(shù)對(duì)軟件特征、軟件測(cè)試需求、軟件測(cè)試用例進(jìn)行處理,最終實(shí)現(xiàn)軟件測(cè)試用例的復(fù)用。本文設(shè)計(jì)軟件測(cè)試用例復(fù)用方法如圖2 所示。
首先,基于原有的軟件測(cè)試資產(chǎn)數(shù)據(jù)庫抽取測(cè)試用例、測(cè)試需求相關(guān)數(shù)據(jù),形成測(cè)試用例資產(chǎn)庫。根據(jù)測(cè)試資產(chǎn)庫中表單數(shù)據(jù)結(jié)構(gòu),通過SQL 語言對(duì)歷史項(xiàng)目數(shù)據(jù)庫進(jìn)行操作,提取軟件特征信息、測(cè)試需求、測(cè)試用例信息,并且根據(jù)需求追蹤表建立測(cè)試需求與測(cè)試用例之間的關(guān)聯(lián)關(guān)系,進(jìn)行合理的分類、管理、維護(hù),形成最初的測(cè)試資產(chǎn)庫。
其次,根據(jù)軟件特征信息檢索篩選候選集,根據(jù)軟件測(cè)試需求及測(cè)試人員輸入信息計(jì)算軟件信息之間的相似度,以相似度計(jì)算值作為測(cè)試用例推薦復(fù)用的參考指標(biāo)。信息檢索采用從上至下的策略輸入軟件所屬領(lǐng)域、軟件類型、測(cè)試類型、測(cè)試方法,層層遞進(jìn)獲取測(cè)試用例復(fù)用的候選集。相似度計(jì)算功能借助于Bert 詞向量模型,獲取測(cè)試相關(guān)數(shù)據(jù)向量表示,并通過計(jì)算兩個(gè)向量之間的距離評(píng)估它們的語義相似度。該步驟在測(cè)試資產(chǎn)庫的基礎(chǔ)上,利用檢索與相似度計(jì)算技術(shù),選擇出了測(cè)試推薦復(fù)用的候選集。
最后,通過對(duì)測(cè)試人員輸入與測(cè)試需求等數(shù)據(jù)之間的相似度值進(jìn)行綜合排序,選擇Top-K 進(jìn)行推薦,實(shí)現(xiàn)對(duì)測(cè)試用例復(fù)用,測(cè)試人員根據(jù)實(shí)際需求對(duì)推薦的測(cè)試數(shù)據(jù)進(jìn)行修改復(fù)用,并將新的測(cè)試用例入庫以便于后續(xù)模型的進(jìn)一步完善。
2.2.1 詞向量模型
本文使用Bert 系列語言模型獲取軟件測(cè)試數(shù)據(jù)的詞向量表示作為相似度計(jì)算的基礎(chǔ),語言模型的發(fā)展經(jīng)歷了從統(tǒng)計(jì)語言模型到神經(jīng)網(wǎng)絡(luò)語言模型的階段。早期的語言模型是預(yù)測(cè)某個(gè)文本序列在語言中出現(xiàn)的概率,并以此概率分布表示該文本序列。其中,在統(tǒng)計(jì)語言模型中最具代表性的就是N-gram 模型,它是一種典型的基于稀疏表示的語言模型。
2003 年,Bengio 等[10]提出了神經(jīng)網(wǎng)絡(luò)語言模型,在得到語言模型的同時(shí)也產(chǎn)生了副產(chǎn)品詞向量。神經(jīng)網(wǎng)絡(luò)語言模型將詞表中的單詞i映射為向量函數(shù)C(i)∈Rm,以此表示單詞的分布式向量表示(Distributed Feature Vectors),再通過一個(gè)函數(shù)將詞向量作為輸入序列(C(wt-n+1),…,C(wt-1))映射成下一個(gè)詞的概率分布。隨著神經(jīng)網(wǎng)絡(luò)語言模型與詞向量的提出,后繼研究者提出了Word2Vec、Glove、Elmo、GPT、Bert 系列等語言模型。
Word2Vec 有兩種訓(xùn)練方法:CBOW、Skip-gram[11],通過此方法將單詞表示為上下文無關(guān)的Static 詞向量,因此無法解決一詞多義的現(xiàn)象。Elmo 使用兩個(gè)獨(dú)立的單向Lstm實(shí)現(xiàn)根據(jù)上下文不同而獲取不斷變化的Dynamic 詞向量[12]。GPT 是一個(gè)生成式的預(yù)訓(xùn)練模型[13],采用遠(yuǎn)遠(yuǎn)優(yōu)于Lstm 的特征提取器Transformer。Bert 語言模型的文本特征抽取采用雙向的Transformer 結(jié)構(gòu),可以進(jìn)一步增加詞向量模型泛化能力,充分描述字符級(jí)、詞級(jí)、句子級(jí)之間的關(guān)系特征。
Fig.2 Test case reuse method圖2 測(cè)試用例復(fù)用方法
2.2.2 相似度計(jì)算方法
本文實(shí)驗(yàn)采用Bert 預(yù)訓(xùn)練語言模型,Bert 語言模型訓(xùn)練可分為預(yù)訓(xùn)練與微調(diào)兩個(gè)過程。其中,Bert 的預(yù)訓(xùn)練過程有兩個(gè)任務(wù),分別是:MaskedLanguageModel(MLM)、Next Sequence Prediction(NSP)。MLM 過程中使用上下文預(yù)測(cè)中心詞信息獲取詞向量表示,NSP 通過數(shù)據(jù)學(xué)習(xí)上下句子是否是噪聲以增強(qiáng)句子之間的關(guān)系判斷能力。Bert 語言模型中適用于計(jì)算句子相似度的句子對(duì)任務(wù)結(jié)構(gòu)如圖3 所示。
Fig.3 Bert sentence pair task structure圖3 Bert 句子對(duì)任務(wù)結(jié)構(gòu)
本文針對(duì)相似度計(jì)算任務(wù),構(gòu)建了針對(duì)Bert 模型進(jìn)行微調(diào)的訓(xùn)練數(shù)據(jù),訓(xùn)練集數(shù)據(jù)格式為:{Sentence1、Sentence2、Label}。Label 標(biāo)簽為0 和1,0 表示句子對(duì)不相關(guān)、1表示句子對(duì)相關(guān)或相似。通過收集一定數(shù)據(jù)量句子對(duì),構(gòu)造訓(xùn)練數(shù)據(jù)的數(shù)據(jù)處理類,針對(duì)模型進(jìn)行微調(diào)操作,強(qiáng)化模型在測(cè)試領(lǐng)域的適用性。
通過Bert 微調(diào)后的語言模型可以獲取到測(cè)試文本數(shù)據(jù)的向量表示,然后通過計(jì)算測(cè)試數(shù)據(jù)之間語義相似度衡量測(cè)試數(shù)據(jù)的相似程度。Bert 模型中可以將其分類任務(wù)改造成相似度計(jì)算問題,然后將CLS 對(duì)應(yīng)的embedding 輸入到一個(gè)sigmoid 函數(shù)表示文本向量。但此種方式學(xué)到的向量并沒有多少的語義信息,不足以用作測(cè)試文本語句的向量表示,因此在獲取文本向量表示后使用相似度計(jì)算的方式計(jì)算語義相似性。常用的語義相似度計(jì)算方法有歐式距離、余弦距離、杰卡德相似度、海明距離,其中選擇余弦距離是最為常見的文本向量語義相似度算法。因此,本文選擇余弦距離計(jì)算兩個(gè)文本向量之間的夾角余弦值,其計(jì)算公式如式(1)所示。
其中,Dis表示文本之間相似度計(jì)算結(jié)果,取值范圍為[0,1],值越大表示相似性越高。
根據(jù)測(cè)試資產(chǎn)庫中測(cè)試需求、測(cè)試用例與測(cè)試輸入數(shù)據(jù),本文設(shè)計(jì)測(cè)試文本數(shù)據(jù)相似度計(jì)算方法主要過程如下:
(1)根據(jù)新的測(cè)試項(xiàng)目輸入的特征信息,利用檢索技術(shù)獲取歷史庫中符合特征的軟件項(xiàng)目得到候選集1。
(2)在候選集1 中根據(jù)測(cè)試人員要求的測(cè)試階段、測(cè)試需求類型、測(cè)試方法等進(jìn)一步選擇出候選集2。
(3)在候選集2 中,計(jì)算測(cè)試人員輸入的需求名稱、需求描述與候選集2 中測(cè)試數(shù)據(jù)之間的相似性,通過式(1)分別計(jì)算需求名稱之間的相似性SimNa、需求描述之間的相似性SimDe、需求描述與測(cè)試說明之間的相似性SimDe-De、需求描述與預(yù)期結(jié)果之間的相似性SimDe-Pre,然后通過加權(quán)求和得到最終的相似度如式(2)所示。
其中,參數(shù)c1、c2、c3、c44 種屬性相似度所占權(quán)重,根據(jù)測(cè)試人員的經(jīng)驗(yàn)可分別取值為0.3、0.3、0.2、0.2。
(4)利用式(2)計(jì)算并獲取測(cè)試人員輸入與歷史數(shù)據(jù)之間的相似性,根據(jù)相似性值的大小進(jìn)行排序,選擇其中相似性值最高的6 條推薦給測(cè)試人員作為測(cè)試參考信息。
測(cè)試文本相似度計(jì)算過程偽代碼如下:
其中,item 表示歷史測(cè)試項(xiàng)目庫,λ 表示文本屬性相似度分配權(quán)值,f 表示新項(xiàng)目輸入的軟件特征,info 表示新測(cè)試輸入文本數(shù)據(jù)。
本次實(shí)驗(yàn)使用實(shí)驗(yàn)室積累的測(cè)試項(xiàng)目數(shù)據(jù),包括幾種不同類型項(xiàng)目包括功能測(cè)試、接口測(cè)試、性能測(cè)試在內(nèi)的數(shù)千條測(cè)試用例數(shù)集。為了評(píng)價(jià)測(cè)試用例復(fù)用效果,對(duì)某信息管理系統(tǒng)和指揮系統(tǒng)兩個(gè)不同類型的軟件系統(tǒng)進(jìn)行測(cè)試。測(cè)試實(shí)驗(yàn)過程中測(cè)試用例部分推薦信息如圖4 所示。
挑選4 位新手測(cè)試人員隨機(jī)分成AB 兩組,A 組人員不采用測(cè)試用例復(fù)用方法、B 組人員使用測(cè)試用例復(fù)用方法,統(tǒng)計(jì)用例設(shè)計(jì)效率即單位時(shí)間AB 兩組人員設(shè)計(jì)測(cè)試用例數(shù)以及評(píng)估測(cè)試用例質(zhì)量。實(shí)驗(yàn)中測(cè)試用例設(shè)計(jì)效率如表2 所示,通過統(tǒng)計(jì)發(fā)現(xiàn),相比于傳統(tǒng)的測(cè)試用例設(shè)計(jì),此方法測(cè)試用例設(shè)計(jì)效率提高近70%。
Fig.4 Recommended test case information圖4 推薦的測(cè)試用例信息
Table 2 Test case design efficiency statistics表2 測(cè)試用例設(shè)計(jì)效率統(tǒng)計(jì)
在測(cè)試用例復(fù)用過程中,B 組人員統(tǒng)計(jì)測(cè)試復(fù)用方法推薦6 條測(cè)試用例中有參考價(jià)值的用例數(shù)稱之為正確推薦用例數(shù),計(jì)算推薦復(fù)用的準(zhǔn)確率。實(shí)驗(yàn)中測(cè)試用例推薦準(zhǔn)確率如表3 所示,其中準(zhǔn)確率計(jì)算公式如式(3)所示。
其中,N 表示測(cè)試項(xiàng)目需求的個(gè)數(shù),ni表示根據(jù)每個(gè)需求推薦出的正確測(cè)試用例個(gè)數(shù)。實(shí)驗(yàn)結(jié)果表明,此方法的用例推薦準(zhǔn)確率均在60%以上。
Table 3 Test case recommendation accuracy rate statistics表3 測(cè)試用例推薦準(zhǔn)確率統(tǒng)計(jì)
通過兩個(gè)不同類型項(xiàng)目對(duì)測(cè)試用例復(fù)用方法進(jìn)行驗(yàn)證,結(jié)果表明,基于Bert 的測(cè)試用例復(fù)用方法可以提高軟件測(cè)試用例設(shè)計(jì)效率。此外,通過專業(yè)測(cè)試人員對(duì)AB 兩組的測(cè)試用例評(píng)估發(fā)現(xiàn),B 組設(shè)計(jì)的測(cè)試用例具有更好的可理解性與可維護(hù)性,提升了測(cè)試用例質(zhì)量。同時(shí),通過B 組人員統(tǒng)計(jì)出的結(jié)果表明,測(cè)試用例推薦的準(zhǔn)確率能夠滿足測(cè)試人員要求。
本文將歷史測(cè)試項(xiàng)目的測(cè)試需求、測(cè)試用例等數(shù)據(jù)進(jìn)行有效組織與利用,使用測(cè)試文本數(shù)據(jù)對(duì)Bert 語言模型進(jìn)行微調(diào),獲取到測(cè)試數(shù)據(jù)語義向量表示,以此計(jì)算測(cè)試文本語義相似性從而實(shí)現(xiàn)測(cè)試用例復(fù)用,提高了測(cè)試用例設(shè)計(jì)效率與測(cè)試用例質(zhì)量。后續(xù)工作中,將采用一種孿生網(wǎng)絡(luò)結(jié)構(gòu)[14],結(jié)合Bert 系列語言模型研究相似度計(jì)算參數(shù)的最優(yōu)取值以提升測(cè)試用例復(fù)用效果。同時(shí),通過提取關(guān)鍵詞[15]用于測(cè)試推薦,進(jìn)一步提升測(cè)試用例推薦復(fù)用準(zhǔn)確性。