毛莉娜, 李衛(wèi)華
(1.廣東輕工職業(yè)技術(shù)學(xué)院 機電工程系,廣東 廣州 510300; 2.廣東工業(yè)大學(xué) 計算機學(xué)院,廣東 廣州 510006)
利用智能引導(dǎo)和KDML增強可拓模型人機建模能力研究
毛莉娜1, 李衛(wèi)華2
(1.廣東輕工職業(yè)技術(shù)學(xué)院 機電工程系,廣東 廣州 510300; 2.廣東工業(yè)大學(xué) 計算機學(xué)院,廣東 廣州 510006)
為了利用計算機協(xié)助人們建立待求解問題的可拓模型,必須讓計算機識別用自然語言描述的問題,而且要理解問題的含義,這是相當困難的任務(wù)。本文提出利用人機界面Agent的智能引導(dǎo)并結(jié)合知網(wǎng)(HowNet)中的知識系統(tǒng)描述語言(KDML),增強計算機語義處理能力的方法。以求職問題為實踐的結(jié)果說明了方法的有效性。由于KDML有較強的表示語義信息的作用,通過人機交互也能減輕計算機自然語言理解的困難。因此該方法能將自然語言描述的待求解問題的目標和條件進行分離和形式化,使計算機更有效地建立待求解問題的可拓模型。
智能引導(dǎo);KDML;自然語言理解;語義;可拓模型;Agent;人機交互;知網(wǎng)
中文引用格式:毛莉娜,李衛(wèi)華. 利用智能引導(dǎo)和KDML增強可拓模型人機建模能力研究[J]. 智能系統(tǒng)學(xué)報, 2017, 12(3): 348-354.
英文引用格式:MAO Li’na, LI Weihua. Research on enhancing the human-machine modeling ability for an extension model using the intelligent guide and KDML[J]. CAAI transactions on intelligent systems, 2017, 12(3): 348-354.
計算機為了判斷人們待求解的問題是否為矛盾問題(即判斷在當前條件下能否實現(xiàn)人們所希望的目標),必須分離待求解問題的目標和條件,并且形式化,即建立問題的可拓模型[1],才能針對不同類型的問題采取不同的解決方法(非矛盾問題用常規(guī)方法求解,矛盾問題用可拓學(xué)方法解決)。然而,用戶問題經(jīng)常是用自然語言表述的,比如,“我如何提高自己的職業(yè)能力才能應(yīng)聘項目經(jīng)理”,或者“我如何找到一份工作,工資待遇較好,符合個人興趣,而且工作條件不會太差”等。如果直接讓計算機理解這些自然語言信息是很困難的,導(dǎo)致可拓模型難以建立。文獻[2]曾介紹過如何借助Agent技術(shù)協(xié)助建立矛盾問題的可拓模型,該方案是讓Agent處理半結(jié)構(gòu)化的信息,而不涉及自然語言理解。但如何構(gòu)造半結(jié)構(gòu)化的信息也相當復(fù)雜,不容易實現(xiàn)。文獻[3]利用分類思想對矛盾問題建模,并要求用戶輸入目標句,但沒有提及條件,即默認用戶的條件一定不滿足目標(矛盾問題)。這就把那些非矛盾的問題排除在外,無法用計算機求解了。文獻[4]建立可拓模型的方法是:當用戶提供的需求語句可能只是目標或條件之中的一個,或者提供了不完整的目標和條件的情況時,利用數(shù)據(jù)庫中數(shù)據(jù)對可拓模型進行補充和完善[4]。然而,如果數(shù)據(jù)庫中沒有相關(guān)數(shù)據(jù)時則無法成功建模,也就無法用計算機求解該問題了。物元有各種屬性,文獻[3]介紹的方法是相關(guān)屬性由用戶自己輸入,此方法雖然靈活,但仍需要人的操作。文獻[4]的方法是預(yù)先準備好若干個屬性,再讓計算機處理。此方法發(fā)揮了計算機的作用,但靈活性不足。另外,文獻[3]和文獻[4]都未對文獻[5]中提出的對矛盾問題的界定與建模時出現(xiàn)的語義歧義問題進行處理。
針對這些不足,我們開展了深入的研究,探索更好的建立待求解問題可拓模型的方法。在研究過程中,我們分析了知網(wǎng)(HowNet)[6]的KDML(knowledge database mark-up language)——知網(wǎng)知識系統(tǒng)描述語言[7]。郝長伶等設(shè)計了這種知識描述規(guī)范體系,他們經(jīng)過對中英文兩種語言各8 萬多條概念的描述,證明這種體系便于對意義的計算,更直觀,有較好的可讀性[8]。文獻[9]認為中文詞語間的組合主要基于語義,并指出:與其他的中文語塊抽取系統(tǒng)不同的是,經(jīng)過用知網(wǎng)中文信息結(jié)構(gòu)抽取器處理后的中文信息結(jié)構(gòu)內(nèi)部的語義關(guān)系是清晰明確的,其每一個部分的語義都被確定并保留了[9]。本文在上述工作的基礎(chǔ)上,提出一種增強計算機建立待求解問題可拓模型能力的方法:結(jié)合人機界面Agent的智能引導(dǎo)能力,并充分利用KDML表達性,增強計算機的語義處理能力,使計算機能更有效地將自然語言描述的待求解問題的目標和條件進行分離和形式化,建立待求解問題的可拓模型,為進一步協(xié)助解決待求解問題奠定基礎(chǔ)。
有關(guān)KDML的詳細內(nèi)容請閱讀文獻[7],這里只做簡單介紹:
1)KDML總規(guī)定有7點,確定描述規(guī)范。
2)KDML 中的特定標識符有7種,分別是左括號({)、右括號(})、冒號(:)、逗號(,)、等號(=)、分號(;)、引號(“)。
3)3種特殊的指示符號:義原~、義原?、義原$。
4)事件類概念的描述方法包括簡單概念和復(fù)雜概念。
5)實體類概念的描述方法包括簡單概念和復(fù)雜概念。
6)屬性類概念的描述方法。
7)屬性值類概念的描述方法。
8)89種動態(tài)角色的使用,復(fù)雜概念需要用這些動態(tài)角色。
知網(wǎng)利用KDML把概念表示成義原(也叫義元)的DEF表達式,可稱為一個語義表達式。例如:“阿姨”這個詞知網(wǎng)用兩個不同的義項將它們的語義表達如下:
NO.=000808
W_C=阿姨
S_C=
E_C=
W_E=aunt
G_E=N
S_E=
E_E=
長輩}}
NO.=000807
W_C=阿姨
G_C=N [a1 yi2]
S_C=
E_C=
W_E=nurse
G_E=N
S_E=
E_E=
通過這樣的KDML語義表達,可以把兩個有歧義的概念區(qū)分開,不至于產(chǎn)生語義二義性。
KDML除了對詞語所代表的概念進行描述外,它還使得每一種信息結(jié)構(gòu)也都成為可以計算的對象[9]。因此,有利于計算機理解用戶輸入問題的目標和條件,減少語義模糊。
可拓學(xué)原理指出:必須把待求解問題解析出目標和條件,才能建立問題的可拓模型。如果計算機直接接收用戶用自然語言描述的問題,要解析出目標和條件無疑會陷入自然語言理解的困境中。因此,我們提出讓Agent引導(dǎo)用戶分別輸入問題的目標和條件,而不要兩者混雜在一起輸入。
以求職問題為例:Agent可以問用戶想應(yīng)聘什么職位,用戶必然輸入希望應(yīng)聘的職位,這相當于問題的目標部分;然后Agent再引導(dǎo)用戶輸入個人資質(zhì)信息,這相當于問題的條件部分。這樣,問題的目標和條件就基本分離了。
分離了問題的目標和條件后,還要形式化,以便計算機處理。我們可以用文獻[3]的分詞步驟或文獻[4]的組塊分析步驟對目標和條件句進行處理,也可以用國內(nèi)外文獻介紹的各種方法進行處理,但這些方法處理中文語義不如知網(wǎng)。本文提出用文獻[9]的描述基于“知網(wǎng)”的中文信息結(jié)構(gòu)抽取方法對問題目標和條件進行處理,再用KDML形式化。
假設(shè)用戶目標是“應(yīng)聘成本會計師”,該短語可以解析出兩個知網(wǎng)詞語,“應(yīng)聘”和“成本會計師”,其KDML表達式如下:
NO.=100746
W_C=應(yīng)聘
G_C=V
E_C=
W_E=accept an offer of employment
G_E=V
E_E=
NO.=017547
W_C=成本會計師
G_C=N [cheng2 ben3 kuai4 ji4 shi1]
S_C=
E_C=
W_E=cost accountant
G_E=N
S_E=
E_E=
NO.=100746的DEF表達式的語義是接受,內(nèi)容是雇用;NO.=017547的DEF表達式的語義清楚說明,“成本會計師”是人,是職位的宿主,該人屬于“金融”領(lǐng)域,是“計算”的施事者,計算內(nèi)容是“錢財”。對此表達式,用戶和計算機都不難理解其語義。
從知網(wǎng)-中文信息結(jié)構(gòu)庫[10]知道,“應(yīng)聘成本會計師”的信息結(jié)構(gòu)是SYN_S=V --> N,SEM_S=(事件) --> [內(nèi)容] (萬物/部件),其中SYN_S表示相應(yīng)的句法結(jié)構(gòu)式,SEM_S表示信息結(jié)構(gòu)模式,“應(yīng)聘”是(事件),而“成本會計師”是[內(nèi)容] (萬物/部件)。
假設(shè)用戶輸入的資質(zhì)條件是“大學(xué)本科畢業(yè),英語過了四級”?!按髮W(xué)本科畢業(yè)”可以解析出兩個知網(wǎng)詞語,即“大學(xué)本科”和“畢業(yè)”,“大學(xué)本科畢業(yè)”的信息結(jié)構(gòu)是SYN_S=N <-- V,SEM_S=(萬物/部件)[內(nèi)容] <-- (事件,行動),“大學(xué)本科”是(萬物/部件)[內(nèi)容],而“畢業(yè)”是(事件,行動)?!坝⒄Z過了四級”可以解析出4個知網(wǎng)詞語:“英語”“過”“四”“級”,“過四級”的信息結(jié)構(gòu)類似SYN_S=V <-- {NUM --> N},SEM_S=(事件,行動) <-- [動量]{(數(shù)量值) --> (物質(zhì),用具/部件,%動物)}。
目標和條件用KDML形式化后,為了建立可拓模型,還需要把KDML表達的詞語轉(zhuǎn)變成基元。本課題組曾研究過相關(guān)的內(nèi)容,主要是靠人來建立基元,存儲后作為基礎(chǔ)庫[11]。本文提出用人機交互方式建立基元,發(fā)揮計算機的作用,減輕人的勞動?;梢允俏镌狹、事元A、關(guān)系元R,詳細內(nèi)容見文獻[1]。比如,目標“應(yīng)聘成本會計師”的KDML表達式句法是SYN_S=V→ N,動詞“應(yīng)聘”為首,名詞“成本會計師”為后,計算機將前者轉(zhuǎn)變?yōu)榭赏貙W(xué)的事元A,后者轉(zhuǎn)變?yōu)槲镌狹。本文讓計算機從KDML表達式中提取物元各屬性值,再提交給用戶確認屬性名。經(jīng)用戶確認后,目標基元如下:
A=[應(yīng)聘, 支配對象,M]
A1=[計算,支配對象,錢財]
條件“大學(xué)本科畢業(yè),英語過了四級”是求職者的屬性,計算機把KDML表達式填入求職者物元屬性值中,再經(jīng)過用戶確認屬性名后建立起條件物元M1:
因此,用戶問題P:“我大學(xué)本科畢業(yè),英語過了四級,如何應(yīng)聘成本會計師?”就成功地被建立為以下可拓模型:
P=[應(yīng)聘,支配對象,M]·
綜上所述,增強計算機可拓建模能力的方法歸納如下:
1)引導(dǎo)用戶輸入待求解問題的目標部分;
2)引導(dǎo)用戶輸入待求解問題的條件部分;
3)用基于“知網(wǎng)”的中文信息結(jié)構(gòu)抽取方法分別解析目標和條件,用KDML形式化;
4)將KDML表示的目標和條件通過人機交互轉(zhuǎn)變成目標基元G和條件基元L;
5)形成待求解問題P的可拓模型P=G·L。
我們將職業(yè)學(xué)院畢業(yè)生求職問題作為應(yīng)用實踐來說明本文所提方法的有效性。
為了實現(xiàn)智能引導(dǎo),我們采用本課題組曾研究過的MVC架構(gòu)的人機界面Agent[12],不同之處是領(lǐng)域知識不一樣。文獻[12]的知識庫存放的是旅游領(lǐng)域知識,本文則要存放職業(yè)信息。我們搜集了國家職業(yè)大典,部分信息如圖1所示。
圖1 職業(yè)信息Fig.1 Occupational information
這些信息是Agent處理用戶目標的背景知識,用Excel表存放在計算機中備用。Agent用Java技術(shù)[13]開發(fā),運行在Web[14]環(huán)境下,系統(tǒng)采用開源的Tomcat服務(wù)器[15]和MySQL數(shù)據(jù)庫[16]。
3.1 引導(dǎo)目標和條件
為了使Agent引導(dǎo)用戶輸入目標,我們采用與文獻[17]相似的交互策略。在輸入界面給予示范,引導(dǎo)用戶輸入問題信息,并靈活對待不同的問題。
假設(shè)Agent問:“您想應(yīng)聘什么職位?”用戶輸入某職位名稱后,Agent先檢查國家職業(yè)大典Excel表有無此職位,有則Agent可以轉(zhuǎn)向引導(dǎo)用戶輸入,無則要求用戶進一步指明。我們在實踐中發(fā)現(xiàn)大致有3種情形:1)用戶有時輸入錯誤;2)用戶輸入的職位名稱不是職業(yè)大典使用的名稱,但實際上語義是一致的,比如用戶輸入“軟件開發(fā)人員”,而職業(yè)大典中的“計算機與應(yīng)用工程技術(shù)人員”的確解釋為“從事計算機硬件、軟件、網(wǎng)絡(luò)研究、設(shè)計、開發(fā)、調(diào)試、集成、維護和管理以及系統(tǒng)分析的工程技術(shù)人員”;3)職業(yè)大典未明確列出的新職位。對于這些情形,Agent巧妙地回答“我尚未發(fā)現(xiàn)此類職位,它屬于哪個大類?”同時列出職業(yè)大典的八大類職業(yè)名稱來請用戶選擇,并逐步引導(dǎo)至中類甚至小類,最后選項是“不便分類的其他從業(yè)人員”,至此解決目標問題。
目標明確后,Agent下一步又問“您目前有什么工作經(jīng)驗或知識水平”,請用戶輸入個人資質(zhì)條件,比如“愛好編程”“會Java語言”等。
3.2 KDML形式化
對于五花八門的目標和條件,如“應(yīng)聘軟件開發(fā)人員”“愛好編程”等,本文提出用基于“知網(wǎng)”的中文信息結(jié)構(gòu)抽取方法進行處理,知網(wǎng)-中文信息結(jié)構(gòu)庫是Word文檔,如圖2所示。
圖2 知網(wǎng)-中文信息結(jié)構(gòu)庫Fig.2 HowNet-Chinese information structure libraries
我們采用文獻[18]介紹的切分、組詞、消歧和中文語塊抽取步驟,可以做到最后從文本中抽取到的不只是句法結(jié)構(gòu),更是語義結(jié)構(gòu)[18]。如“愛好編程”的切分是“愛-好-編-程”,在知網(wǎng)知識庫的支持下組詞(本文采用知網(wǎng)中英雙語知識詞典 .txt文件,存放在計算機中)得到“愛好-編程”,因為組詞時可能會產(chǎn)生歧義[18],“愛好”可以是名詞,也可以是動詞(“編程”也是如此)。所以分別寫出“愛好”的兩個KDML語義表達式讓用戶確定:
NO.=001198
W_C=愛好
G_C=V [ai4 hao4]
E_C=~唱京戲,~跳舞,~書法,~滑冰,音樂~者
W_E=be fond of
G_E=V
E_E=
NO.=001202
W_C=愛好
G_C=N [ai4 hao4]
S_C=
E_C=~廣泛,不要因為你的~影響學(xué)習(xí),僅憑~學(xué)習(xí)會偏科
W_E=interest
G_E=N
S_E=
E_E=
Agent此時需要在人機交互下消歧,在屏幕顯示“愛好”的兩個KDML語義表達式后問用戶哪一個“愛好”是符合語義的詞,用戶選出這里的“愛好”應(yīng)該是動詞(NO.=001198),因此Agent將“愛好-編程”中“愛好”名詞消去,保留動詞(同理將“編程”動詞消去,保留名詞),再抽取信息結(jié)構(gòu):SYN_S=V--> N,SEM_S=(事件,精神狀態(tài)/變精神)-->[對象] (萬物/屬性)(例子:愛好-音樂),并將結(jié)果顯示給用戶,通過人機交互更有效地確認形式化。
“會Java語言”的切分是“會-Java-語-言”(英語不用切分),組詞得到“會-Java-語言”,“會”在知網(wǎng)中有多個義項數(shù),如:
Agent根據(jù)自主性[19]排除了與求職者屬性無關(guān)的義項,保留了以下義項:
NO.=039130
W_C=會
G_C=V
E_C=
W_E=grasp
G_E=V
E_E=
據(jù)此抽取信息結(jié)構(gòu):SYN_S=V-->N,SEM_S=(事件)-->[受事] (萬物/部件/屬性/時間)。
3.3 轉(zhuǎn)變?yōu)榛?/p>
Agent引導(dǎo)了目標和條件,并對目標和條件用KDML規(guī)范形式化后,還需轉(zhuǎn)變?yōu)榛?/p>
目標“應(yīng)聘軟件開發(fā)人員”根據(jù)句法表達式SYN_S=V→N可以轉(zhuǎn)變?yōu)槭略狝和物元M,物元M的屬性值是計算機從“軟件開發(fā)人員”的KDML表達式中抽取并填入的,屬性名通過人機交互由用戶確定:
A=[應(yīng)聘,支配對象,M]
A1=[編寫,支配對象,程序]
條件“愛好編程”和“會Java語言”是求職者的屬性,用類似的方法轉(zhuǎn)變?yōu)闂l件物元M1:
A2=[了解, 支配對象, Java語言]
3.4 形成待求解問題的可拓模型
經(jīng)過上述步驟,用戶問題P“我愛好編程,會Java語言,想應(yīng)聘軟件開發(fā)人員”被引導(dǎo)出,目標G=“應(yīng)聘軟件開發(fā)人員”,條件L=“愛好編程,會Java語言”,最后成功地建立為以下可拓模型P=G·L:
從我們的實踐來看,Agent對特定問題的智能引導(dǎo)還是有效的,因為我們對特定問題輸入的目標或條件的可能性基本都估計到了。但是,對于過于廣泛的問題,由于人本身無法預(yù)料全部輸入,因此也無法為Agent準備有效的應(yīng)對措施,目前只能輸出“抱歉”等字樣來表明Agent無法引導(dǎo)某些問題。另外,在人機交互時如果用戶對某詞語的多個(比較接近的)義項理解有偏差,會導(dǎo)致計算機建立的可拓模型不符合現(xiàn)實邏輯的情況,這點只能由集體智慧[20]來發(fā)現(xiàn)和糾正。
本文提出了利用KDML并結(jié)合人機界面Agent的智能引導(dǎo)的方法增強計算機建立可拓模型能力,本方法一方面減輕了計算機自然語言理解的困難,另一方面減少了語義歧義,計算機可以更快速有效地建模,從而為用計算機求解問題奠定了基礎(chǔ)。
如何評價所提方法的有效性?我們認為通過集體智慧發(fā)表意見比較可行。每當建立了一個可拓模型后,讓其他人對結(jié)果進行評議,如果多數(shù)人認為建模成功,該次建模就有效。如果多數(shù)人認為建模不正確,該次建模就失敗,這時就要分析原因,進行改進,不斷完善。
建立了待求解問題的可拓模型,只是計算機協(xié)助人們解決問題的第一步,后面的工作還很艱巨。因為“自然語言理解”這樣對人來說不太困難的任務(wù),計算機都完成得相當困難,那么后面的“求解問題”這樣對人來說很不輕松的任務(wù),計算機就更難解決了。然而我們認為,充分發(fā)揮人的智慧和機器智能進行人機交互,揚長避短,是利用計算機求解問題的有效方法,是未來的研究方向。
[1]楊春燕, 蔡文. 可拓學(xué)[M]. 北京: 科學(xué)出版社, 2014: 1-381.
[2]李衛(wèi)華. Agent協(xié)助建立矛盾問題的可拓模型研究[J]. 數(shù)學(xué)的實踐與認識, 2009, 39(4): 173-177. LI Weihua. The research of extension model for contradiction problems with Agent[J]. Mathematics in practice and theory, 2009, 39(4): 173-177.
[3]汪中飛, 李衛(wèi)華, 陶星. 基于分類的ESGS矛盾問題建模的研究[J]. 廣東工業(yè)大學(xué)學(xué)報, 2014, 31(4): 14-19. WANG Zhongfei, LI Weihua, TAO Xing. Research on ESGS contradiction problem modeling based on classification[J]. Journal of Guangdong university of technology, 2014, 31(4): 14-19.
[4]王定橋, 李衛(wèi)華, 楊春燕. 從用戶需求語句建立問題可拓模型的研究[J]. 智能系統(tǒng)學(xué)報, 2015, 10(6): 865-871. WANG Dingqiao, LI Weihua, YANG Chunyan. Research on building an extension model from user requirements[J]. CAAI transactions on intelligent systems, 2015, 10(6): 865-871.
[5]趙杰, 李衛(wèi)華. 基于知網(wǎng)的矛盾問題語義二義性研究[J]. 廣東工業(yè)大學(xué)學(xué)報, 2014, 31(2): 21-26. ZHAO Jie, LI Weihua. Research on the ambiguity of contradiction based on hownet[J]. Journal of Guangdong university of technology, 2014, 31(2): 21-26.
[6]董振東, 董強. 知網(wǎng)[EB/OL]. http://www.keenage.com/zhiwang/c_zhiwang.Html.
[7]KDML. 知網(wǎng)知識系統(tǒng)描述語言[EB/OL]. http://www.keenage.com/html/c_index.Html.
[8]郝長伶, 董強. 知網(wǎng)知識庫描述語言[C]//語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集. 哈爾濱: 中國中文信息學(xué)會, 2003: 371-377. HAO Changling, DONG Qiang. Knowledge database mark-up language of HowNet[C]//Language Computing and Content Based Text Processing, Proceedings of the 7th National Joint Academic Conference on Computational Linguistics. Harbin, 2003: 371-377.
[9]董強, 郝長伶, 董振東. 基于知網(wǎng)的中文信息結(jié)構(gòu)抽取[EB/OL]. http://www.keenage.com/html/c_index.html.
[10]董振東, 董強. 關(guān)于知網(wǎng)-中文信息結(jié)構(gòu)庫[EB/OL]. http://www.keenage.com/html/c_index.html.
[11]陶星. 基于知網(wǎng)的領(lǐng)域可拓基礎(chǔ)庫的研究與實現(xiàn)[D]. 廣州: 廣東工業(yè)大學(xué), 2015: 1-61. TAO Xing. Research and implementation of extension domain base on HowNet[D]. Guangzhou: Guangdong University of Technology, 2015: 1-61.
[12]方卓君. 基于Agent的用戶信息智能引導(dǎo)的研究[D]. 廣州: 廣東工業(yè)大學(xué), 2010: 1-54. FANG Zhuojun. Research on Agent-based intelligent guide for user information[D].Guangzhou: Guangdong University of Technology, 2010: 1-54.
[13]李衛(wèi)華. Java技術(shù)及其應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2009: 1-281.
[14]劉甫迎, 饒斌, 鄭顯舉, 等. Java EE Web編程技術(shù)教程[M]. 北京: 電子工業(yè)出版社, 2010: 1-374.
[15]孫衛(wèi)琴. Tomcat與Java Web開發(fā)技術(shù)詳解[M]. 2版. 北京: 電子工業(yè)出版社, 2009: 1-734.
[16]KOFLER M. MySQL 5權(quán)威指南[M]. 楊曉云, 王建橋, 楊濤, 等, 譯. 北京: 人民郵電出版社, 2006: 1-662.
[17]李衛(wèi)華, 楊春燕, 方卓君. 提高軟件Agent策略生成的語義互操作能力[J]. 數(shù)學(xué)的實踐與認識, 2012, 42(11): 131-138. LI Weihua, YANG Chunyan, FANG Zhuojun. Improve the semantic interoperability for software Agents strategy generation[J]. Mathematics in practice and theory, 2012, 42(11): 131-138.
[18]董強, 郝長伶, 董振東. 基于《知網(wǎng)》的中文語塊抽取器[C]//語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集. 哈爾濱: 中國中文信息學(xué)會, 2003: 234-239. DONG Qiang, HAO Changling, DONG Zhendong. HowNet- based Chinese chunk extractor[C]//Language Computing and Content Based Text Processing, Proceedings of the 7th National Joint Academic Conference on Computational Linguistics. Harbin, China, 2003: 234-239.
[19]WOOLDRIDGE M. 多Agent系統(tǒng)引論[M]. 石純一, 譯. 北京: 電子工業(yè)出版社, 2003: 1-258.
[20]莊子勻, 陳敬良, 羅堯成. 網(wǎng)絡(luò)集體智慧研究述評[J]. 情報雜志, 2014, 33(5): 31-37. ZHUANG Ziyun, CHEN Jingliang, LUO Yaocheng. A review on web-enabled collective intelligence[J] Journal of intelligence, 2014, 33(5): 31-37.
Research on enhancing the human-machine modeling ability for an extension model using the intelligent guide and KDML
MAO Li’na1, LI Weihua2
(1. Department of Mechanical and Electrical Engineering, Guangdong Industry Polytechnic, Guangzhou 510300, China; 2. School of Computers, Guangdong University of Technology, Guangzhou 510006, China)
When using a computer to establish an extension model for solving problems, the computer must be able to recognize problems described in natural languages, and, in particular, must understand the meaning of the problems. This is a very difficult task. Knowledge database mark-up language (KDML) in HowNet has a strong semantic information expression function. Through human-machine interaction, it can also reduce the difficulty that computers encounter when understanding natural language. A method to enhance the computer’s semantic processing ability, based on the human-machine interface agent’s intelligent guide and KDML, is proposed. The goals and conditions of the problems to be solved described in natural language are separated and formalized, making the computer establish the problem-solving extension model more effectively.
intelligent guide; KDML; natural language understanding; semantic; extension model; Agent; human-machine interaction; HowNet
10.11992/tis.201610017
http://kns.cnki.net/kcms/detail/23.1538.TP.20170404.1218.008.html
2016-10-14. 網(wǎng)絡(luò)出版日期:2017-04-04.
國家自然科學(xué)基金項目(61273306,61571141).
李衛(wèi)華. E-mail:lw@gdut.edu.cn.
TP3
A
1673-4785(2017)03-0348-07
毛莉娜,女,1988年生,講師,主要研究方向為自動控制技術(shù)、計算機技術(shù)、電子工程技術(shù)。主持廣東省發(fā)明專利產(chǎn)業(yè)化重點項目1項、江西省重點研發(fā)計劃項目1項,參與國家自然科學(xué)基金項目2項,其他項目多項。發(fā)表學(xué)術(shù)論文8篇。
李衛(wèi)華,女,1957年生,教授,主要研究方向為智能軟件、面向Agent計算、網(wǎng)絡(luò)信息系統(tǒng)。主持廣東省自然科學(xué)基金項目3項,參與國家自然科學(xué)基金項目2項。發(fā)表學(xué)術(shù)論文40余篇。