實際工程問題的求解往往涉及跨領(lǐng)域、跨模態(tài)的海量碎片化知識,這些知識不能僅靠專家提供,而需要從環(huán)境中動態(tài)學(xué)習(xí)和融合生成.知識工程旨在研究計算機對知識的獲取、表征和處理.隨著UGC(User Generated Content)模式的興起,一種新的知識工程范式——大數(shù)據(jù)知識工程應(yīng)運而生.
和早期的專家系統(tǒng)相比,大數(shù)據(jù)知識工程的顯著特點是:實現(xiàn)了從以文本、小規(guī)模、靜態(tài)、人工方式的專家知識計算機表示,到多模態(tài)、大規(guī)模、動態(tài)不確定環(huán)境下知識的自動獲取與表征的跨越式發(fā)展.大數(shù)據(jù)知識工程的核心科學(xué)問題是大數(shù)據(jù)碎片知識的挖掘和融合.
《計算機研究與發(fā)展》推出了大數(shù)據(jù)知識工程及應(yīng)用專題,以促進該方向新的研究與發(fā)展.本專題得到同行的廣泛關(guān)注,通過公開征文收到18篇高質(zhì)量投稿稿件,這些論文闡述了大數(shù)據(jù)知識工程的重要研究成果和發(fā)展前景.特邀編委先后邀請了20余位相關(guān)領(lǐng)域的專家參與評審,歷經(jīng)初審、復(fù)審、終審等階段,最終遴選出3篇高質(zhì)量的論文入選本專題.內(nèi)容涵蓋了零樣本學(xué)習(xí)、表示學(xué)習(xí)等大數(shù)據(jù)知識工程的關(guān)鍵技術(shù),在一定程度上反映了當(dāng)前國內(nèi)學(xué)者在大數(shù)據(jù)知識工程的典型應(yīng)用.
零樣本學(xué)習(xí)旨在識別具有少量、甚至沒有訓(xùn)練樣本的未見類,這些類與可見類遵循不同的數(shù)據(jù)分布;已有方法通過共享生成器和解碼器,通過深度神經(jīng)網(wǎng)絡(luò)聯(lián)合傳統(tǒng)生成對抗網(wǎng)絡(luò)和變分自編碼器來實現(xiàn)樣本的合成.然而,由于這兩種生成網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)分布不同,聯(lián)合模型合成的數(shù)據(jù)不再滿足單一的模型分布,而是遵循復(fù)雜的多域分布,即生成器域分布和解碼器域分布.為此,劉歡等作者的“基于跨域?qū)箤W(xué)習(xí)的零樣本分類”一文提出跨域?qū)股删W(wǎng)絡(luò)(CrossD-AGN),將傳統(tǒng)生成對抗網(wǎng)絡(luò)和變分自編碼器有機結(jié)合起來,基于類級語義信息為未見類合成樣本,從而實現(xiàn)零樣本分類.
知識圖譜的核心為三元組形式的實體和關(guān)系,因此,如何通過實體關(guān)系抽取方法來補全或者構(gòu)建新的知識圖譜顯得至關(guān)重要.傳統(tǒng)流水線式的實體關(guān)系抽取方法會導(dǎo)致誤差傳遞,而已有的聯(lián)合抽取沒有充分考慮命名實體識別與關(guān)系抽取之間的聯(lián)系,從而降低抽取效果.針對上述問題,黃培馨等作者的“融合對抗訓(xùn)練的端到端知識三元組聯(lián)合抽取”一文提出了一種融合對抗訓(xùn)練的端到端知識三元組聯(lián)合抽取方法.首先采用了一種實體關(guān)系聯(lián)合標(biāo)注策略,通過端到端的神經(jīng)網(wǎng)絡(luò)抽取文本語義特征,并對文本進行自動標(biāo)注;其次,模型在神經(jīng)網(wǎng)絡(luò)中加入自注意力機制增強文本信息的編碼能力,并通過引入帶偏置項的目標(biāo)函數(shù)提高關(guān)系相關(guān)實體的辨識能力,最后,模型融合了對抗訓(xùn)練以提高魯棒性,改進模型抽取效果.
杜治娟等作者的“TransNS:基于鄰域和語義親和力的開放知識圖譜表示學(xué)習(xí)”一文針對允許新實體存在的開放知識圖譜(knowledge graph,KG),提出一種表示學(xué)習(xí)方法TransNS.它選取相關(guān)的鄰居實體作為實體的屬性來推斷新實體,并在學(xué)習(xí)階段利用實體之間的語義親和力選擇負(fù)例三元組來增強語義交互能力.
承蒙各位作者、審稿專家、編輯部各方面的全力支持,本專題得以順利出版.在審稿過程中難免出現(xiàn)不盡人意之處,希望各位作者和讀者包容諒解,同時也請各位同行不吝批評指正.
特別感謝《計算機研究與發(fā)展》編委會和編輯部,從專題的立項到征稿啟事的發(fā)布,從審稿專家的邀請到評審意見的匯總,以及最后的定稿、修改和出版工作,都凝聚了他們辛勤的汗水.本專題的出版期望能給廣大相關(guān)領(lǐng)域研究人員帶來啟發(fā)和幫助.