尚福華 馬寧 解紅濤
關(guān)鍵詞:命名實(shí)體識(shí)別;深度學(xué)習(xí);主動(dòng)學(xué)習(xí);試油氣井控領(lǐng)域
近年來(lái)人工智能飛速發(fā)展,信息化技術(shù)被廣泛應(yīng)用到各個(gè)專業(yè)領(lǐng)域,通過知識(shí)圖譜系統(tǒng)能夠?qū)π畔⑦M(jìn)行結(jié)構(gòu)化的儲(chǔ)存,在檢索的同時(shí)也能夠比較完整地掌握有關(guān)知識(shí)點(diǎn)。知識(shí)圖譜的形成過程中最關(guān)鍵、最基礎(chǔ)的過程之一便是命名實(shí)體識(shí)別。
現(xiàn)階段部分學(xué)者對(duì)各個(gè)專業(yè)領(lǐng)域命名實(shí)體進(jìn)行了研究,例如Tang等進(jìn)行了司法領(lǐng)域的命名實(shí)體識(shí)別;Luo等在化學(xué)領(lǐng)域上完成了命名實(shí)體識(shí)別任務(wù);肖瑞等完成對(duì)醫(yī)案數(shù)據(jù)的命名實(shí)體識(shí)別。這些專業(yè)領(lǐng)域有較為豐富的知識(shí)庫(kù),可以作為訓(xùn)練數(shù)據(jù),能夠取得較好的識(shí)別效果。經(jīng)過本實(shí)驗(yàn)室在試油氣井控領(lǐng)域的長(zhǎng)期研究,發(fā)現(xiàn)油田試油氣井控領(lǐng)域的數(shù)據(jù)在數(shù)據(jù)類型分類方面缺乏歸納與整理,沒有形成相應(yīng)知識(shí)庫(kù),更沒有相應(yīng)的標(biāo)注數(shù)據(jù)。當(dāng)面對(duì)標(biāo)注數(shù)據(jù)少的問題,眾多學(xué)者把視野放到遷移學(xué)習(xí),以及監(jiān)督學(xué)習(xí)的方法上。遠(yuǎn)程監(jiān)督的方法也可被考慮是否真的能夠解決問題,如文獻(xiàn)[4]。文獻(xiàn)[5]則通過主動(dòng)學(xué)習(xí)的方式也可以達(dá)到預(yù)期結(jié)果,但在每次迭代時(shí)都會(huì)進(jìn)行一定數(shù)量的手工標(biāo)注。K近鄰的方法也被考慮進(jìn)來(lái),而文獻(xiàn)[6]則將視角鎖定在遷移學(xué)習(xí)上,通過遷移學(xué)習(xí)減少了人工標(biāo)記的工作量,文獻(xiàn)[7]提出了AdaBoost算法的解決思路,對(duì)此問題提出了解決方案。無(wú)論是遷移學(xué)習(xí)還是用K近鄰,都是監(jiān)督學(xué)習(xí)的方法,為了獲得監(jiān)督學(xué)習(xí)所需要的訓(xùn)練樣本,增加了整體工作量,不符合減少標(biāo)注工作量的初衷。主動(dòng)學(xué)習(xí)通過選擇方法和選擇算法,在大量初始數(shù)據(jù)集中選擇特色較鮮明的數(shù)據(jù),從而建立更貼合、更符合深度學(xué)習(xí)模式訓(xùn)練目標(biāo)的數(shù)據(jù)子集,采用這種方法有效降低了數(shù)據(jù)標(biāo)示的工作量。
提出了一種基于主動(dòng)學(xué)習(xí)的試油氣井控領(lǐng)域命名實(shí)體識(shí)別模型。該模型引入了主動(dòng)學(xué)習(xí)方法,通過使用少量標(biāo)注完成的數(shù)據(jù)對(duì)未標(biāo)注的數(shù)據(jù)進(jìn)行自動(dòng)標(biāo)注,解決了試油氣井控領(lǐng)域標(biāo)注數(shù)據(jù)樣本不足的問題,增加訓(xùn)練數(shù)據(jù),進(jìn)而提高命名實(shí)體識(shí)別的識(shí)別效果。
1試油氣井控領(lǐng)域命名實(shí)體識(shí)別模型
試油氣井控領(lǐng)域命名實(shí)體識(shí)別模型使用的是深度學(xué)習(xí)的方法。深度學(xué)習(xí)的優(yōu)點(diǎn)是對(duì)于更復(fù)雜的特征工程,依舊具備更優(yōu)秀的泛化學(xué)習(xí)技術(shù)能力,正是根據(jù)此特點(diǎn),深度學(xué)習(xí)技術(shù)在命名實(shí)體識(shí)別的各項(xiàng)任務(wù)中獲得了更普遍的運(yùn)用。比如,單向長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)就被廣泛用于任務(wù)中,因?yàn)長(zhǎng)STM有較強(qiáng)的序列特征提取學(xué)習(xí)技術(shù)能力,并且在與CRF結(jié)合(LSTM-CRF)后,能夠獲得更為出色的識(shí)別效果。Lample等為了得到上下文特征,使用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(BiLSTM),并在分析對(duì)比以后,決定與CRF融合,共同構(gòu)建BiLSTM-CRF神經(jīng)網(wǎng)絡(luò)模式,使得辨識(shí)的有效性逐步增強(qiáng),此后該模式逐步成為深度學(xué)習(xí)中解決各個(gè)應(yīng)用領(lǐng)域?qū)嶓w識(shí)別問題的首選模式。
在BiLSTM-CRF已有常用模型上加入BERT作為詞向量模型,并加入注意力機(jī)制,優(yōu)化識(shí)別效果。BERT在訓(xùn)練其詞向量時(shí),會(huì)消耗大量的數(shù)據(jù)資源,此過程歸類于無(wú)監(jiān)督的方式,正因如此,BERT才可以提取數(shù)目龐大的語(yǔ)法和豐富的語(yǔ)義特征,并得到試油氣井控領(lǐng)域的詞向量表示。BiL-STM負(fù)責(zé)隨對(duì)下層的特征提取進(jìn)行處理,其結(jié)果將以特征向量的形式傳達(dá)給注意力機(jī)制,注意力機(jī)制在分類任務(wù)中對(duì)特征獲得有著良好的表現(xiàn)。為了預(yù)測(cè)信號(hào),可以選擇使用CRF,這樣就能夠?qū)iLSTM的輸出重新編碼,為了讓試油氣井控領(lǐng)域的專業(yè)詞匯獲得更好的識(shí)別效果,引入Attention注意力機(jī)制,最終完成命名實(shí)體識(shí)別的任務(wù),模型整體結(jié)構(gòu)如圖1所示。
1.1 BERT模型
BERT的內(nèi)部模型構(gòu)造如圖2所顯示,其中,分別是輸入矢量和輸出矢量。其中所要求的參數(shù)通過訓(xùn)練而得到的數(shù)據(jù)來(lái)源是大規(guī)模無(wú)標(biāo)注數(shù)據(jù)。其相比于LSTM能捕捉更遠(yuǎn)距離的序列特征。BERT本質(zhì)上是一種使用遮蔽語(yǔ)言訓(xùn)練數(shù)據(jù)的過程,它的方法就是針對(duì)下一句進(jìn)行的特征提取與預(yù)測(cè)。通過對(duì)部分任意的詞匯進(jìn)行數(shù)據(jù)覆蓋,使原始單詞的數(shù)據(jù)集在模型訓(xùn)練的過程中得到部分?jǐn)?shù)據(jù)暫時(shí)缺失的效果,從而進(jìn)行預(yù)測(cè),進(jìn)而在文本的前后文中獲得更多的特征。
“井控是對(duì)油氣井的壓力控制”這句話中的“井控"80%都會(huì)直接進(jìn)行遮擋,然后隨機(jī)選擇10%更改成其他單詞,另外10%則仍然保留原單詞。在設(shè)計(jì)訓(xùn)練模型時(shí),一個(gè)句子會(huì)用上述的方式進(jìn)行相應(yīng)處理,再被多次喂到模型中進(jìn)行參數(shù)學(xué)習(xí)。下句的預(yù)測(cè)訓(xùn)練方法,是指兩個(gè)句子中間有無(wú)實(shí)際關(guān)聯(lián),判斷結(jié)束后,其結(jié)果以標(biāo)簽的形式進(jìn)行相應(yīng)標(biāo)注。在試油氣井控的數(shù)據(jù)集中選擇連續(xù)兩句話,當(dāng)IsNext關(guān)系超過50%符合后,將對(duì)這兩句話的內(nèi)容進(jìn)行保留,后續(xù)的任務(wù)是,從語(yǔ)料中提取剩余的一句話,此時(shí)NotNext則是對(duì)應(yīng)的關(guān)系。經(jīng)過此方法可以提取出更多的句子級(jí)特征,讓詞向量獲取更好的特征數(shù)據(jù)。
BERT在獲得詞向量時(shí)的優(yōu)點(diǎn)是明顯的,但它的資源消耗是巨大的,使用BERT自帶的微調(diào)的方式可以有效解決資源問題,根據(jù)BERT訓(xùn)練數(shù)據(jù)的格式,對(duì)試油氣井控領(lǐng)域的專業(yè)詞匯進(jìn)行標(biāo)注,訓(xùn)練過程中將不會(huì)變更BERT內(nèi)部的相關(guān)參數(shù),即直接應(yīng)用預(yù)訓(xùn)練好的模型。此方法避免了對(duì)資源的浪費(fèi),優(yōu)化了過程,而且使BERT在專業(yè)領(lǐng)域生成的詞向量更加準(zhǔn)確。
1.2BiLSTM和CRF神經(jīng)網(wǎng)絡(luò)模型
BERT獲得的只是試油氣井控的詞向量信息,為了提高識(shí)別效果,對(duì)試油氣井控?cái)?shù)據(jù)的全局上下文特征的獲取使用BiLSTM,通過它可以獲得更多的特征信息。BiLSTM由兩個(gè)部分組成,正向和反向的LSTM,分別是其內(nèi)部的兩部分,LSTM的內(nèi)部結(jié)構(gòu)是對(duì)RNN的升級(jí)。LSTM內(nèi)部的神經(jīng)元結(jié)構(gòu)中采用了三門控制單元,這部分正是對(duì)RNN升級(jí)的部分。三種控制門都有其獨(dú)特的功用,對(duì)信號(hào)監(jiān)控、決定、遺忘的決定權(quán)。各司其職,使LSTM具備了記憶功能,可以獲得長(zhǎng)序列特征,并且克服了在RNN訓(xùn)練過程中產(chǎn)生的階梯消失現(xiàn)象,甚至階梯破壞的現(xiàn)象問題。
BiLSTM提取出的依賴關(guān)系,需要進(jìn)一步使用約束條件進(jìn)行約束,過濾小的分類結(jié)果,保留可靠的預(yù)測(cè),獲得更為準(zhǔn)確的語(yǔ)義特征。CRF主要負(fù)責(zé)進(jìn)行一定規(guī)則上的處理,處理的內(nèi)容是對(duì)BiL-STM的輸出內(nèi)容增加一些約束條件,選擇出可能性小的部分,讓更大可能性的結(jié)果更多。比如:“井控是對(duì)油氣井的壓力控制”句子的第一個(gè)詞“井控”應(yīng)該是“B一”或“O”而不是“I”?!癇-NAME I-NAME”是正確的,而“B-NAME I-ORG”則是錯(cuò)誤的。條件隨機(jī)場(chǎng)負(fù)責(zé)對(duì)結(jié)果進(jìn)行更深一步的修正,條件隨機(jī)場(chǎng)的工作部分十分重要,準(zhǔn)確地提取標(biāo)簽之間的依賴關(guān)系,是命名實(shí)體識(shí)別模型識(shí)別的實(shí)體結(jié)果的關(guān)鍵,讓模型可以再標(biāo)注規(guī)則的范圍內(nèi)運(yùn)行。
1.3注意力機(jī)制
深度學(xué)習(xí)方法效果雖然較好,但訓(xùn)練過程通常難以解釋。注意力機(jī)制還能夠了解文本的全局上下文內(nèi)容,從而克服了對(duì)句子的長(zhǎng)距離依賴現(xiàn)象。在進(jìn)行命名實(shí)體識(shí)別之后,不同的文字往往產(chǎn)生不同影響,比較重要的詞可能僅是幾個(gè)專業(yè)詞匯,因此分類時(shí)需要關(guān)注更加有效的文字。比如,“一級(jí)井控”“二級(jí)井控”“井噴”“油氣層”等概念更為重要,在模型中需要獲得更多的權(quán)重。
在命名實(shí)體識(shí)別任務(wù)中,注意力機(jī)制可增加試油氣井控領(lǐng)域的專業(yè)詞匯的權(quán)重從而區(qū)分單詞的重要程度。對(duì)于句子的深層表示使用注意力機(jī)制計(jì)算單詞權(quán)重的公式如式(1)和式(2)所示:
其中w表示參數(shù)矩陣,Q為參數(shù)向量,6為偏置值。a為權(quán)重,代表句子中每個(gè)單詞。每個(gè)單詞應(yīng)該具有不同的關(guān)注點(diǎn),關(guān)注點(diǎn)的不同,最終句子用加權(quán)求和后向量進(jìn)行表示。
2引入主動(dòng)學(xué)習(xí)的命名實(shí)體識(shí)別模型
為了解決試油氣井控領(lǐng)域標(biāo)注數(shù)據(jù)缺失的問題,在試油氣井控領(lǐng)域命名實(shí)體模型的基礎(chǔ)上采用主動(dòng)學(xué)習(xí)方法,可以在標(biāo)注樣本較少的情況下,達(dá)到較好的識(shí)別效果,如圖3所示。
主動(dòng)學(xué)習(xí)的主要方法是為了從大量未標(biāo)注數(shù)據(jù)中,計(jì)算出可靠性最高的數(shù)據(jù)并加以標(biāo)記的訓(xùn)練,該方式克服了需要監(jiān)督練習(xí)過程,但又不能擁有大量標(biāo)記的數(shù)據(jù)作為實(shí)驗(yàn)樣本的困難。以使用盡可能少的標(biāo)注樣本數(shù)量為目的,從而獲得和監(jiān)督學(xué)習(xí)相似的結(jié)果,是使用主動(dòng)學(xué)習(xí)的最后任務(wù)。主動(dòng)學(xué)習(xí)的算法有很多,被廣泛使用并取得良好效果的方法主要有兩種。
基于流抽樣算法和基于池抽樣算法,但每次迭代都需要一定數(shù)量的手工標(biāo)注。采用的主動(dòng)學(xué)習(xí)是一種在深度學(xué)習(xí)中融合了聚類算法的方式,使用經(jīng)過試油氣井控領(lǐng)域的標(biāo)注詞匯微調(diào)后的BERT詞向量模型,獲得標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)的詞向量特征信息,使用K-means聚類算法對(duì)詞向量進(jìn)行分類,符合分類要求的數(shù)據(jù)自動(dòng)標(biāo)注,并作為訓(xùn)練集數(shù)據(jù)進(jìn)入下一個(gè)迭代過程,完成主動(dòng)學(xué)習(xí)過程。使用聚類算法進(jìn)行主動(dòng)學(xué)習(xí),充分利用深度學(xué)習(xí)模型得到的詞向量信息,解決了主動(dòng)學(xué)習(xí)中需要人工篩選數(shù)據(jù)的問題,大大降低了人工成本。
在x與y中間的一段距離應(yīng)該用公式方法d(x,y)表現(xiàn)為x,y間的相似之處,間距與樣品相似性之間成反比,也就是間距越大,樣品間的相似度和關(guān)聯(lián)性就越差,證明存在較大的差異,距離較近時(shí)則為相反情況。在二維空間使用歐氏距離也有它本身的優(yōu)點(diǎn),就是運(yùn)算簡(jiǎn)單。而對(duì)于更高維空間,則使用馬氏距離或者曼哈頓距離比較合理,也符合實(shí)際需要,歐式距離公式如式(3)所示:
應(yīng)用BERT將已標(biāo)記的數(shù)據(jù)與尚未標(biāo)記的數(shù)據(jù)以詞向量的方法加以描述,給定數(shù)據(jù)點(diǎn)為無(wú)傾向挑選聚類中心。根據(jù)式(3)計(jì)算每個(gè)樣本至聚類中心的間距,獲得間距的最小值min計(jì)算距離其最近中心,并將樣本歸類到中心所屬的類簇。每個(gè)聚類中,所有對(duì)象到中心的距離的平均值則為計(jì)算的目標(biāo),新的中心也就是這個(gè)距離的平均值,如式(4)所示:
選取石油地質(zhì)詞匯和井控概念詞匯兩個(gè)領(lǐng)域的專業(yè)詞匯,通過上述的方法進(jìn)行聚類,生成圖像如圖4所示,用顏色區(qū)分。可以看出屬于一類的詞匯,會(huì)緊密聚集在一起,就此完成了對(duì)未標(biāo)注數(shù)據(jù)的分類。對(duì)同屬于一個(gè)群的數(shù)據(jù),會(huì)按照關(guān)聯(lián)程度進(jìn)行分組,將離聚類中心較近的數(shù)據(jù)作為高置信率數(shù)據(jù)加以標(biāo)注,并將標(biāo)注的數(shù)據(jù)加入訓(xùn)練集,以增加訓(xùn)練樣本量,較遠(yuǎn)的數(shù)據(jù)則作為低置信率數(shù)據(jù),在下次自主學(xué)習(xí)的迭代練習(xí)中加以重新預(yù)測(cè)。
3實(shí)驗(yàn)設(shè)計(jì)和結(jié)果分析
為驗(yàn)證上述識(shí)別模型效果,使用試油氣井控領(lǐng)域數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別的實(shí)驗(yàn)。
3.1數(shù)據(jù)源
本實(shí)驗(yàn)以測(cè)試油氣井控制領(lǐng)域數(shù)據(jù)為例,搜集了試油氣領(lǐng)域的有關(guān)教科書、培訓(xùn)資料和歷年考核試題等作為實(shí)驗(yàn)文本,并加以說(shuō)明,數(shù)據(jù)源中涉及的主要知識(shí)類型有井下氣壓、土壤地層壓力、井控設(shè)計(jì)、外溢、關(guān)井程序、井中氣體、壓井工序、特殊井控方法、井控設(shè)備等九種,實(shí)體的類別如表1所示。本文共整理歸納了10589條語(yǔ)料作為實(shí)驗(yàn)數(shù)據(jù),采用交叉驗(yàn)證將標(biāo)記語(yǔ)料按照5:1的比例分為訓(xùn)練集、測(cè)試集。
3.2標(biāo)注規(guī)范
標(biāo)注主流的方式主要有兩種,分別是BIO三段式標(biāo)注法和BIOES五段式標(biāo)注法。本文使用的是BIO標(biāo)記方式,即試油氣井控領(lǐng)域?qū)嶓w的頭文字用B代表,實(shí)體的中間文字用I代表,和任何實(shí)物均不相關(guān)的中問文字則用O統(tǒng)一代表。
3.3評(píng)價(jià)標(biāo)準(zhǔn)
將通過準(zhǔn)確率P,召回值R和F。值對(duì)實(shí)體分辨結(jié)果的有效性做出評(píng)估,其計(jì)算方法如式(6)~式(8)所示,TP為模型辨識(shí)正確的實(shí)體數(shù)量,而FP為模型已識(shí)別的不關(guān)聯(lián)實(shí)體數(shù)量,F(xiàn)N為模型未能檢測(cè)到的關(guān)聯(lián)實(shí)體數(shù)量。
3.4實(shí)驗(yàn)結(jié)果和分析
命名實(shí)體識(shí)別模型有許多類型,主流的方法歸納總結(jié)后包含CNN_LSTM、CNN_LSTM_CRF、BiLSTM、BiLSTM_CRF、BERT_BiLSTM_CRF、BERT_BiLSTM_CRF_ATTENTION六個(gè),首先選取不同模型對(duì)相同數(shù)據(jù)集進(jìn)行訓(xùn)練,選取效果最好的模型,然后在效果最好的模型中引入聚類算法形成自主學(xué)習(xí)方法,比較模型在加入新的未標(biāo)注數(shù)據(jù)后的訓(xùn)練效果,確定最佳的識(shí)別模型。
3.4.1不同識(shí)別模型的對(duì)比實(shí)驗(yàn)
在同一實(shí)驗(yàn)環(huán)境下,六種命名實(shí)體的識(shí)別模型CNN_LSTM、CNN_LSTM_CRF、BiLSTM、BiL_STM_CRF、BERT_BiLSTM_CRF、BERT_BiL_STM_CRF_ATTENTION在準(zhǔn)確率、召回率以及F1三項(xiàng)指標(biāo)上進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如表2示??梢钥闯鯞iLSTM要略優(yōu)于CNN_LSTM的效果,二者在引入CRF后,其識(shí)別效果都有了提升??梢缘贸鼋Y(jié)論:BiLSTM提取出井控領(lǐng)域的全局上下文特征,隨后進(jìn)入CRF后,在最終預(yù)測(cè)的結(jié)果標(biāo)簽中添加一些必要約束,以確保識(shí)別的標(biāo)簽結(jié)果是有效的預(yù)測(cè)數(shù)據(jù),以此提升了準(zhǔn)確率和召回率。同時(shí),BERT預(yù)訓(xùn)練模型在語(yǔ)義表征方面的表現(xiàn)也非常出色,能夠?yàn)橄聦拥淖R(shí)別任務(wù)提供更為準(zhǔn)確的詞向量信息,在實(shí)驗(yàn)中確實(shí)提升BiLSTM_CRF模型的識(shí)別效果。BiLSTM模型對(duì)于局部信號(hào)丟失的情形,在引入ATTENTION后,能夠增加局部數(shù)據(jù)的權(quán)重,以此強(qiáng)調(diào)文本數(shù)據(jù)的局部特征,對(duì)BERT_BiLSTM_CRF識(shí)別模型有顯著的提升。
3.4.2主動(dòng)學(xué)習(xí)和非主動(dòng)學(xué)習(xí)模型對(duì)比
通過上一部分的實(shí)驗(yàn),得出BERT_BiLSTM_CRF_ATTENTION是較好的識(shí)別模型的結(jié)論,在此基礎(chǔ)上使用主動(dòng)學(xué)習(xí)的方法。分別用5%、10%、15%、20%、25%、30%、35%的標(biāo)注數(shù)據(jù)作為主動(dòng)學(xué)習(xí)模型的訓(xùn)練集,用100%標(biāo)注數(shù)據(jù)作非主動(dòng)學(xué)習(xí)的訓(xùn)練集,二者進(jìn)行實(shí)驗(yàn)比對(duì)觀察效果。
通過表3、圖5可以得出結(jié)論,在標(biāo)注數(shù)據(jù)的體量越來(lái)越大后,基于主動(dòng)學(xué)習(xí)方法的識(shí)別效果會(huì)逐步變好。并且在30%時(shí),增速開始趨于放緩,數(shù)據(jù)達(dá)到35%時(shí),與使用完整數(shù)據(jù)集的非主動(dòng)學(xué)習(xí)方法取得了十分相近的結(jié)果,由此說(shuō)明基于主動(dòng)學(xué)習(xí)算法的模型可以在少量數(shù)據(jù)的基礎(chǔ)上完成命名實(shí)體識(shí)別的任務(wù),有效降低了數(shù)據(jù)標(biāo)注的工作任務(wù)。
4結(jié)論
研究了試油氣井控領(lǐng)域的命名實(shí)體識(shí)別問題,并提供了一個(gè)基于主動(dòng)學(xué)習(xí)的命名實(shí)體識(shí)別方法。此方法使用了BERT預(yù)訓(xùn)練模式獲得單詞的向量化表示,隨后進(jìn)入由BiLSTM+CRF所構(gòu)成的深度學(xué)習(xí)模式中,當(dāng)進(jìn)入注意力機(jī)制后,準(zhǔn)確率有所上升。為了解決專業(yè)領(lǐng)域數(shù)據(jù)標(biāo)注不足的問題,引入主動(dòng)學(xué)習(xí)的概念,利用聚類算法對(duì)預(yù)測(cè)的標(biāo)簽進(jìn)行分類。此模型實(shí)現(xiàn)了在較少的標(biāo)注語(yǔ)料的基礎(chǔ)上,達(dá)到與監(jiān)督學(xué)習(xí)算法結(jié)果相近的標(biāo)注效果。試油氣井控領(lǐng)域的命名實(shí)體識(shí)別研究,是后續(xù)構(gòu)建相關(guān)領(lǐng)域知識(shí)圖譜的基礎(chǔ),解決了實(shí)際中的問題,此方法與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,不依賴于大量的人工,因此對(duì)其他的領(lǐng)域也有借鑒的作用。后續(xù)需要擴(kuò)大數(shù)據(jù)集的規(guī)模,進(jìn)一步完善相關(guān)數(shù)據(jù),讓此方法在試油氣井控領(lǐng)域得到更好的發(fā)展。
計(jì)算技術(shù)與自動(dòng)化2022年2期