李 穎,王青海,池毓煥
(1.裝甲兵工程學(xué)院 科研部,北京100072;2.中國科學(xué)院 聲學(xué)研究所,北京100190)
地名識別作為未登錄詞識別的子內(nèi)容,一直是中文信息處理的熱點(diǎn)之一[1-7]。通行的辦法是 “統(tǒng)計(jì)與規(guī)則相結(jié)合”,即先通過統(tǒng)計(jì)模型大規(guī)模處理數(shù)據(jù),再通過語法語義等知識制定規(guī)則加以修正,以期取得比較理想的識別結(jié)果。據(jù)文獻(xiàn) [5],中文地名識別結(jié)果的F值多在84%-92%之間。
作戰(zhàn)文書是軍隊(duì)各級機(jī)關(guān)在作戰(zhàn)和其他軍事行動中形成和使用的電報(bào)、文件、圖表的統(tǒng)稱,是指揮員作戰(zhàn)決心的體現(xiàn),是軍隊(duì)作戰(zhàn)行動的依據(jù)和實(shí)施作戰(zhàn)指揮的重要工具。它通常采用文字記述式、表格式、地圖注記式、網(wǎng)絡(luò)圖式等形式,有著特定而嚴(yán)格的格式規(guī)定。
作戰(zhàn)文書自動處理是信息化戰(zhàn)爭條件下提高作戰(zhàn)指揮效能的必然要求。目前,以一體化指揮平臺和一體化信息系統(tǒng)為代表的指揮信息系統(tǒng)已陸續(xù)裝備部隊(duì),在部隊(duì)訓(xùn)練、戰(zhàn)備值勤和非戰(zhàn)爭軍事行動中發(fā)揮了重要作用。但文本情報(bào)信息生成態(tài)勢圖和作戰(zhàn)文書注記圖均依靠參謀業(yè)務(wù)人員手工標(biāo)繪,影響和制約了系統(tǒng)的運(yùn)行效率,迫切要求提高文-圖轉(zhuǎn)換的自動化水平。
原有的作戰(zhàn)文書自動處理通常采用模板方式。近年來,不少專家學(xué)者提出了用自然語言處理 (natural language processing,NLP)技術(shù)來重新布局作戰(zhàn)文書的計(jì)算機(jī)處理工作:顧曉明、翟玉慶[8]探討了基于本體的軍用文書理解,楊健等[9]、姜文志等[10]都對軍事文圖的自動轉(zhuǎn)換進(jìn)行了研究。從文獻(xiàn)上看,他們大多只是提出構(gòu)想或系統(tǒng)設(shè)計(jì),較少提供可資比較的實(shí)驗(yàn)數(shù)據(jù)。
我們有關(guān)作戰(zhàn)文書文圖自動轉(zhuǎn)換的總體思路如圖1所示。
圖1 作戰(zhàn)文書文圖自動轉(zhuǎn)換邏輯
其中,XML等標(biāo)記文件與態(tài)勢圖等標(biāo)圖文件之間的自動轉(zhuǎn)換已經(jīng)由標(biāo)繪軟件實(shí)現(xiàn)并進(jìn)入實(shí)用化,而面向文圖轉(zhuǎn)換的結(jié)構(gòu)化數(shù)據(jù)到XML等標(biāo)記文件的格式變換純粹是根據(jù)標(biāo)記語言約定進(jìn)行的嚴(yán)格變換,關(guān)鍵在于作戰(zhàn)文書到結(jié)構(gòu)化數(shù)據(jù)的作戰(zhàn)文書要素萃取。
從軍用要圖標(biāo)繪的角度看,作戰(zhàn)文書的要素之一是地名及其坐標(biāo)。作為三大軍隊(duì)標(biāo)號之一的地域線直接由一系列的坐標(biāo)構(gòu)成,其他標(biāo)圖類型的基本參數(shù)都包括坐標(biāo)。因此,地名識別構(gòu)成作戰(zhàn)文書處理的基本內(nèi)容之一。
無可否認(rèn),現(xiàn)有的中文地名識別方法可直接應(yīng)用于作戰(zhàn)文書地名識別,但其效果將受制于通用技術(shù)應(yīng)用于受限領(lǐng)域的隔靴搔癢效應(yīng)。
我們的作戰(zhàn)文書地名識別緊扣 “作戰(zhàn)文書行文規(guī)范”這一特點(diǎn),應(yīng)用了句類分析所確立的若干準(zhǔn)則,完全采用基于規(guī)則的方法。HNC (hierarchical networks of concepts)理論[11]是中國科學(xué)院聲學(xué)研究所黃曾陽先生創(chuàng)立的、面向整個自然語言理解處理的原創(chuàng)理論。HNC理論把語言分析的3個基本環(huán)節(jié)分別命名為句類分析、語境單元萃取和語境生成,對應(yīng)于組詞成句、聯(lián)句成群和形成段落篇章三級提升。可見,句類分析是HNC理論關(guān)于語句分析的專門術(shù)語。句類分析技術(shù)經(jīng)過數(shù)十年的發(fā)展,已經(jīng)比較成熟,廣泛應(yīng)用于文本分類[12]、信息過濾[13]、輿情分析[14]、機(jī)器翻譯[15]等領(lǐng)域,但在作戰(zhàn)文書自動處理領(lǐng)域應(yīng)用還是首次嘗試——中科院聲學(xué)所已有的關(guān)于中文地名的研究仍然是走統(tǒng)計(jì)技術(shù)路線的,并未應(yīng)用句類分析技術(shù)。
面向要圖標(biāo)繪這一特定目標(biāo),就地名識別這一專項(xiàng),我們的實(shí)驗(yàn)取得了預(yù)期的效果 (F值在88%-97%之間)。
對于中文地名構(gòu)成,文獻(xiàn) [1]首先提出了 “地名特征詞”、“地名前部詞”、“特征詞可信度”等概念并給出了較易實(shí)現(xiàn)的地名判斷方法,在后續(xù)研究中這些概念得到了沿用。在這里,我們把 “地名前部詞”稱作地名的中文命名,而把 “地名特征詞”稱為 “地名層級標(biāo)志符”,便于多層級串聯(lián)地名的遞歸辨識,如 “四川省廣安縣協(xié)興鄉(xiāng)牌坊村”。
中文地名存在嚴(yán)重的重名情況。根據(jù)含超過68萬條記錄的中國地名庫統(tǒng)計(jì),縣級及以上地名重名的共出現(xiàn)155例,占5% (分子為出現(xiàn)重名的記錄累計(jì)數(shù),下同;分母為3,592),主要是縣市同名;鄉(xiāng)級及以上地名重名的共出現(xiàn)5,202例,占30.9% (分母46,549);村級及以上地名重名的共出現(xiàn)70,594例,占58.9% (分母682,123)。由統(tǒng)計(jì)數(shù)據(jù)可以看出:越是底層,重名越多。
就使用語境而言,只要附近的地名不重復(fù),全國村級地名大量重復(fù)并不影響語言的使用和指稱的認(rèn)定。但是,作戰(zhàn)文書恰恰超越了地域限制,而所用地名很可能是村級或更細(xì)的某無名高地。人腦理解時自然而然用更高一層的地名管轄之,或者把心中的地圖拉近、聚焦于目標(biāo)區(qū)域,因此基本不受重名困擾。作戰(zhàn)文書無法容忍地名指稱的不確定性,因此作戰(zhàn)文書地名使用的一大特點(diǎn)就是為地名附上坐標(biāo)。有鑒于此,作戰(zhàn)文書地名識別要緊抓這一特點(diǎn)。
坐標(biāo)作為激活因子,基本確定了地名的右邊界,最大的問題是左邊界的識別。因此,作戰(zhàn)文書地名識別可歸結(jié)為空間概念短語的邊界感知問題。
空間概念首先要分出空間點(diǎn)、空間線和空間面 (空間體暫不考慮)。其中空間點(diǎn)通常帶坐標(biāo),也最常用;空間線由一系列的空間點(diǎn)構(gòu)成,主要用于戰(zhàn)斗分界線的表述;空間面主要用于總體作戰(zhàn)區(qū)域的表述。
關(guān)于空間點(diǎn) (地點(diǎn))的辨識,總策略是:充分利用坐標(biāo)的激活信息,以及坐標(biāo)加 “區(qū)域”、 “一線”、 “山區(qū)”、“方向”、“以東//西//……”、“左//右//后翼”等組合表示空間概念的詞語激活,也需要一定規(guī)模的現(xiàn)實(shí)地名庫支持。
1.1.1 坐 標(biāo)
坐標(biāo)統(tǒng)一采用以下格式:地名 (××、××)或地名(××,××),其中××系兩位阿拉伯?dāng)?shù)字。
1.1.2 右邊界
關(guān)于右邊界,除了坐標(biāo)終止符 “)”外,特別注意帶方位數(shù)量的后綴也要組合到該地點(diǎn)的表述中
后綴=方位詞+空間距離的數(shù)量詞 {+ “無名高地”}其中:方位詞=東//西//南//北//以東//以西//以南//以北//正東//正西//正南//正北//東側(cè)//西側(cè)//南側(cè)//北側(cè)//東北//東南//西南//西北//東北側(cè)//東南側(cè)//西南側(cè)//西北側(cè);空間距離的數(shù)量詞,一般以米為量詞,前帶阿拉伯?dāng)?shù)字,如 “250米”;{}中的成分為可選項(xiàng)。
1.1.3 左邊界
關(guān)于左邊界,涉及中文地名的命名規(guī)則:
中文地名=中文命名 (專名)+地名層級標(biāo)志符;
其中:中文命名 (專名)一般為2字,少數(shù)3字,較少1字,不能為空 (少數(shù)民族地區(qū)因音譯存在多于3字的情況);地名層級標(biāo)志符=國//省、直轄市、自治區(qū)、州//市、府、盟、縣、邑、縣城、旗//鎮(zhèn)、鄉(xiāng)、都、街道、蘇木//村、莊、社區(qū)、嘎查。
特別地,作戰(zhàn)文書最常用的是:
軍事專名=阿拉伯?dāng)?shù)字+ ‘高地’//‘高程點(diǎn)’
注意:軍事專名的阿拉伯?dāng)?shù)字可能帶小數(shù)點(diǎn)。另外,軍用地名常把層級標(biāo)志符省略。
縣級及以上中文命名字?jǐn)?shù)統(tǒng)計(jì)如表1所示 (總數(shù)3278)。
表1 縣級及以上中文命名字?jǐn)?shù)統(tǒng)計(jì)
可以說,三字以上多數(shù)為少數(shù)民族地名的音譯,除非所處理的地區(qū)涉及到才需予以考慮。單字中出現(xiàn)了高頻字“和”等,雖然與 ‘層級用字’組合匹配才識別成地名,但仍可能構(gòu)成歧義;地名專用字如 ‘隰’倒是可靠依據(jù)。
關(guān)于空間線的辨識,因其由若干空間點(diǎn)構(gòu)成,緊抓“一線”、“東西//南北+一線”、“相連之線”(“地段、方向”也作為備選)作為激活關(guān)鍵詞 (并作為此空間線表述的右邊界),依靠空間點(diǎn)識別的成果,按照 “至少兩點(diǎn)、系列地名最大化 (貪食算法)”的原則左向搜索第一點(diǎn),并把起始點(diǎn)的左邊界作為空間線表述的左邊界。
關(guān)于空間面的辨識,激活關(guān)鍵詞為:“地域”、“地區(qū)”、“附近地區(qū)”、……。其前可能是空間線、若干個地點(diǎn)或者只有一個地名,如 “丹東地區(qū)”,故左邊界較難確認(rèn),只能依托上述空間點(diǎn)和空間線的辨識成果。
根據(jù)字?jǐn)?shù)確定地名左邊界并不保險(xiǎn) (與地名庫完全匹配的除外,如 “贊皇”),因此還是要尋找文本中出現(xiàn)的自然語言邊界符,這就是我們引進(jìn)句類分析若干準(zhǔn)則的原因所在。
從句類分析的角度看,語句分析的根本任務(wù)是感知語塊邊界。
HNC理論認(rèn)為:自然語言的語句是無限的,但都可歸結(jié)為有限的句類,全部自然語言的句類就57組。語句由若干語塊構(gòu)成,而語塊分為主塊和輔塊兩大類,主塊是句類的函數(shù),輔塊不是語句的必選構(gòu)件。主塊又分兩類:特征塊EK (Eigen chunK)和廣義對象語塊 GBK (General oB-ject chunK),前者又根據(jù)在句子中所處層級二分為全局特征塊Eg(global)和局部特征塊El(local),EK大體對應(yīng)語法學(xué)中的謂語,后者三分為作用者語塊AK(Actor chunK)、對 象 語 塊 BK (oBject chunK)和 內(nèi) 容 塊 CK(Content chunK),這三者大體對應(yīng)于施事、受事及間接賓語。既然有對應(yīng)關(guān)系,似乎只是別出心裁另取他名,無特異之處。其實(shí)不然,因?yàn)镠NC給出了句類的數(shù)學(xué)物理表達(dá)式如下
其中,SC指句類 (sentence category),SCr指實(shí)際出現(xiàn)的句類 (r即real),fK指輔塊 (借用漢語拼音首字母)。 {}仍指該項(xiàng)為可選項(xiàng),說輔塊是可選的這好理解,因?yàn)檫@是輔塊的本意;關(guān)鍵是EK被加上了可選符號,即存在五類無EK句類,例如漢語非常常見的簡明狀態(tài)句,S04J=SB+SC,“他||精明能干”。
上述句類表達(dá)式中的GBK下標(biāo)m的取值最大為3,即一個句子最多有3個GBK (AK、BK和CK相繼出現(xiàn)),加上EK,就是4主塊,少則只有1個GBK。那么會不會出現(xiàn)沒有任何GBK的情況呢?若出現(xiàn),我們視為省略GBK1,因?yàn)榫漕愇锢肀磉_(dá)式中至少有1個GBK。這樣,全部句類可分成兩大類:有AK出現(xiàn)的廣義作用句,塊數(shù)為3-4;沒有AK出現(xiàn)的廣義效應(yīng)句,塊數(shù)為2-3。二者的重大區(qū)別是:廣義作用句的語塊移位通常都有主塊標(biāo)記符加以突顯,而廣義效應(yīng)句的語塊移位一定沒有 (不用)主塊標(biāo)記符。廣義作用句例如 (括號中標(biāo)注的是語句格式代碼):
有了這些句類知識,語句分析的任務(wù)就是把任何一個自然語言的語句映射到句類物理表達(dá)式中,也就是分出每個語塊的邊界并檢驗(yàn)其角色。
句類分析技術(shù)的實(shí)現(xiàn)過程中,曾提出了若干準(zhǔn)則,命名為lv準(zhǔn)則,即以邏輯概念l和動詞v的同現(xiàn)作為語塊邊界感知和角色認(rèn)定的根本依據(jù)。這些句類分析準(zhǔn)則簡要說明如下:
(1)語句的首尾邊界是首塊和末塊的天然首尾邊界,標(biāo)點(diǎn)符號提供了語塊邊界的重要信息,因此,標(biāo)點(diǎn)準(zhǔn)則是句類分析最基礎(chǔ)的準(zhǔn)則。
(2)漢語的語塊標(biāo)志符特別發(fā)達(dá),是語塊移位的重要工具,如 “把、被、由、向、……”等,更有輔塊的括號型標(biāo)志,如 “在……中”等,因此,抓塊標(biāo)可概括為介詞準(zhǔn)則。
(3)句類分析中把EK當(dāng)作其它語塊的天然邊界。而EK通常是復(fù)合結(jié)構(gòu),應(yīng)視作一體,例如 “表示贊賞”、“大大改善了”等。特別地,作戰(zhàn)文書中地名通常充當(dāng)轉(zhuǎn)移句的起、止、由對象,可以把地名或地名組直接當(dāng)作空間對象語塊。這是動詞準(zhǔn)則。
(4)指代在否定動詞的Eg角色中發(fā)揮著一定作用,在識別語塊邊界方面亦不可或缺,例如 “本發(fā)明提供了一種提取植酸鈣的方法”中的 “本”和 “一種”都否定其后動詞的Eg角色,也是所在語塊的左邊界。這是代詞準(zhǔn)則。
上述句類分析準(zhǔn)則應(yīng)用于作戰(zhàn)文書地名識別中,可形成如下具體規(guī)則:
規(guī)則1(頓號等標(biāo)點(diǎn)符號):‘、’肯定是其后地名的左邊界; ‘:’、 ‘——’、前單雙引號,也是;句子分割符‘,’、‘;’、‘?!?‘?’、‘!’ (即地名居于句首),若其后為單字 (地名非空),是左邊界;其后排除介詞、動詞、代詞的情況,基本也是左邊界;
規(guī)則2(介詞):在HNC中標(biāo)為lq02的 “在、向、從、自、到、至、……”和標(biāo)為hv的 “在、到、至、……”基本也是左邊界。因?yàn)?‘在’等字存在一定程度的多義性(‘在’若是句子中唯一動詞,仍不妨適用本規(guī)則),其可靠性略有下降 (注意:這些單字多是分詞處理后留下的孤立字,若是偽詞中的這些字,可靠性更低);
另外,構(gòu)成l5的概念如 ‘除’lq52ie2m…… ‘之外’lh52ie2m,也是左右邊界之一;
規(guī)則3(動詞):入選Eg//El的動詞也是地名的天然前邊界,如 “去、來、回、往、……”等及隱含空間概念的“進(jìn)攻、攻占、占據(jù)、占領(lǐng)、進(jìn)占、鎮(zhèn)守、……”等,但有些地名可能就含有動詞 (如云南邊境有一地名 ‘打落’,其得名就因?yàn)槿諜C(jī)在此地被打落),或者詞語知識庫對動詞的標(biāo)注太寬泛,其可靠性略低 (E+hv的情況在規(guī)則2中考慮;如有v+EH構(gòu)成EK的也暫不考慮);
規(guī)則4(代詞):常見 “我、敵、本、該、此、……”+地名層級標(biāo)志符//‘高地’//‘高程點(diǎn)’,用于指代地名,需要指代消解 (實(shí)際的具體地名代入),但也可能不省略作為專名的地名成份,則此代詞也構(gòu)成左邊界,功能上仍是地名指代。
作戰(zhàn)文書地名識別基本流程為:
(1)判斷帶括號的標(biāo)號段是否是地點(diǎn)坐標(biāo);
(2)以帶括號的地點(diǎn)坐標(biāo)為中心,向左尋找左邊界(以動詞和某些介詞為準(zhǔn));
(3)以帶括號的地點(diǎn)坐標(biāo)為中心,向右尋找右邊界(如果不是方向、地域等則停止)。
基于上述流程的處理結(jié)果為初步結(jié)果。然而,作戰(zhàn)文書中的地名也不是全部標(biāo)上坐標(biāo),若上文地名已有坐標(biāo)則常常不再重復(fù),因此由坐標(biāo)激活的地名識別結(jié)果 (在坐標(biāo)括號之前的部分)要形成一個動態(tài)地名庫,視同已經(jīng)帶坐標(biāo),用于下文的地名識別。如此安排就引進(jìn)了小小的動態(tài)記憶能力,其處理的結(jié)果則稱改進(jìn)結(jié)果。
我們選用了14篇共計(jì)3萬多字的真實(shí)文本,人工進(jìn)行軍用命名實(shí)體標(biāo)注,并以此測試處理結(jié)果。實(shí)驗(yàn)結(jié)果見表2。
表2 實(shí)驗(yàn)結(jié)果
左邊界誤識的例子如: “堅(jiān)守4號高地 (80、66);”,把 “堅(jiān)守”組合到地名中了,原因在于 “堅(jiān)守”未列入動詞準(zhǔn)則所用的動詞集內(nèi)。
未召回的例子如:
(1)向石家莊右翼進(jìn)攻;
(2)在大莊、大石橋張楞地區(qū)轉(zhuǎn)入防御;
(3)19××年11月18日21時30分于井陘縣。
未召回的主要原因是該地名在全文中均未有坐標(biāo)信息,按上述流程處理無法獲得激活信息。
通用地名庫中的地名如 “河北省”、“石家莊”、“井陘縣”等可能組合到機(jī)構(gòu)名中 (如 “河北省獨(dú)立第2師”),不宜直接作為地名識別結(jié)果。但在前述之頓號規(guī)則、介詞規(guī)則 (如 “在”、 “于”等)、后綴輔助規(guī)則 (如 “右翼”、“左側(cè)”、“地域”、“一線”等)共同作用下,也應(yīng)該適當(dāng)抓些通用地名,這是下一步改進(jìn)的方向。
總之,超過99%的地名識別準(zhǔn)確率已經(jīng)符合此前預(yù)期的 “高準(zhǔn)確率”要求,超過90%的召回率也堪用于后續(xù)的空間線//空間面識別、語塊分析、句類分析、要圖標(biāo)繪等。
以往的地名識別系統(tǒng)的F值的平均值為88%,我們的初步結(jié)果就高達(dá)88%,改進(jìn)結(jié)果達(dá)到97%,改進(jìn)效果明顯。
作戰(zhàn)文書地名識別的準(zhǔn)確率未達(dá)到100%,為什么我們?nèi)苑Q這個結(jié)果符合預(yù)期、“堪用”?除了自動標(biāo)圖的初步結(jié)果可以訴諸人工干預(yù)外,主要原因在于我們并不把這一結(jié)果當(dāng)作最終結(jié)果而僅僅是作戰(zhàn)文書預(yù)處理的步驟之一,后續(xù)的句類分析、語境分析還有糾錯功能。當(dāng)然,預(yù)處理的結(jié)果越接近于百分之百準(zhǔn)確越好,已發(fā)現(xiàn)的若干錯誤原因可用于進(jìn)一步改進(jìn)現(xiàn)有程序。
[1]LI Lishuang,HUANG Degen.Identifying Chinese place names based on support vector machines and rules [J].Journal of Chinese Information Processing,2006 (5):51-57 (in Chinese).[李麗雙,黃德根等.SVM與規(guī)則相結(jié)合的中文地名自動識別 [J],中文信息學(xué)報(bào),2006 (5):51-57.]
[2]QIAN Jing,ZHANG Jie,ZHANG Tao.Research on Chinese person name and location name recognition based on maximum entropy model [J].Journal of Chinese Computer Systems,2006,27 (9):1761-1765 (in Chinese).[錢晶,張杰,張濤.基于最大熵的漢語人名地名識別方法研究 [J].小型微型計(jì)算機(jī)系統(tǒng),2006,27 (9):1761-1765.]
[3]FENG Yuanyong,SUN Le,LI Wenbo,et al.A rapid algorithm to Chinese named entity recognition based on single character hints [J].Journal of Chinese Information Processing,2008 (1):1-22 (in Chinese).[馮元勇,孫樂,李文波,等.基于單字提示特征的中文命名實(shí)體識別快速算法 [J].中文信息學(xué)報(bào),2008 (1):1-22.]
[4]LI Nuo,ZHANG Quan.Chinese place name identification with Chinese characters features [J].Computer Engineering and Applications,2009,45 (28):230-232 (in Chinese).[李諾,張全.利用地名用字分析的中文地名識別處理 [J].計(jì)算機(jī)工程與應(yīng)用,2009,45 (28):230-232.]
[5]LI Nuo.Identification and annotation of Chinese place name and temporal information[D].Beijing:Institute of Acoustics,Chinese Academy of Sciences,Master Thesis,2009 (in Chinese).[李諾.中文地名與時間的識別和標(biāo)注 [D].北京:中國科學(xué)院聲學(xué)所碩士學(xué)位論文,2009.]
[6]QIU Sha,A Yuan.Study on automatic recognition of Chinese location names based on statistical method [J].Computer Technology and Development,2011 (11):35-38 (in Chinese).[邱莎,阿圓.基于統(tǒng)計(jì)的中文地名自動識別研究 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2011 (11):35-38.]
[7]LI Lishuang,DANG Yanzhong.Recognition of Chinese location names based on CRF and rules [J].Journal of Dalian University of Technology,2012 (2):285-289 (in Chinese).[李 麗雙,黨延忠.CRF與規(guī)則相結(jié)合的中文地名識別 [J].大連理工大學(xué)學(xué)報(bào),2012 (2):285-289.]
[8]GU Xiaoming,ZHAI Yuqing.Design of military document understanding system based on ontology [J].Modern Computer,2006,231 (3):69-72 (in Chinese).[顧曉明,翟玉慶.一種基于本體的軍用文書的理解系統(tǒng)設(shè)計(jì) [J].現(xiàn)代計(jì)算機(jī),2006,231 (3):69-72.]
[9]YANG Jian,GAO Wenyi,WANG Yanbo.Documents based automated military plotting method [J].Journal of PLA University of Science and Technology (Natural Science Edition),2006,7 (6):543-547 (in Chinese).[楊健,高文逸,王衍波.一種作戰(zhàn)文書軍事標(biāo)圖自動化方法 [J].解放軍理工大學(xué)學(xué)報(bào) (自然科學(xué)版),2006,7 (6):543-547.]
[10]JIANG Wenzhi,WANG Di.The design of key models for automatic generation of military instruction [J].Command Control &Simulation,2007,29 (6):28-30 (in Chinese).[姜文志,王迪.作戰(zhàn)指令自動生成的關(guān)鍵模塊設(shè)計(jì) [J].指揮控制與仿真,2007,29 (6):28-30.]
[11]JIN Yaohong.Natural language understanding technology based on HNC theory and its application [M].Beijing:Science Press,2006 (in Chinese).[晉耀紅.HNC語言理解技術(shù)及其應(yīng)用 [M].北京:科學(xué)出版社,2006.]
[12]JIA Ning.Using concept primitive feature for text classification [J].Computer Engineering and Applications,2007,43(1):24-26 (in Chinese).[賈寧.使用概念基元特征進(jìn)行自動文本分類 [J].計(jì)算機(jī)工程與應(yīng)用,2007,43 (1):24-26.]
[13]LI Ying,CHI Yuhuan.Applications of word tendentiousness to analysis of text orientation [C]//Recent Advances in Lexical Semantic:Symposis of the 10th Chinese Lexical Semantic Workshop,2009:89-94 (in Chinese).[李穎,池毓煥.詞語褒貶性在文本傾向性分析中的應(yīng)用 [C]//第十屆漢語詞匯語義學(xué)論文集,2009:89-94.]
[14]WEI Xiangfeng,ZHANG Quan.Event sentiment analysis based on semantic chunks [J].Journal of Chinese Information Processing,2012,26 (3):44-48 (in Chinese).[韋向峰,張全.基于語義塊的事件傾向性分析研究 [J].中文信息學(xué)報(bào),2012,26 (3):44-48.]
[15]LI Ying,WANG Kan,CHI Yuhuan.Semantic chunk transformation in Chinese-english machine translation [M].Beijing:Science Press,2009 (in Chinese).[李穎,王侃,池毓煥.面向漢英機(jī)器翻譯的語義塊構(gòu)成變換 [M].北京:科學(xué)出版社,2009.]