摘要:在國內(nèi)外機(jī)器翻譯、信息檢索等領(lǐng)域中英文及中文的命名實(shí)體研究技術(shù)基本成熟,但是維吾爾文命名實(shí)體識別還處于初步階段,本文中筆者通過條件隨機(jī)場模型(Conditional Random Fields,CRF)研究維吾爾文命名實(shí)體中的維吾爾族人名、新疆地名、及新疆組織機(jī)構(gòu)名,以此實(shí)驗(yàn)來驗(yàn)證這三類實(shí)體的識別正確率。
關(guān)鍵詞:維吾爾文;命名實(shí)體;條件隨機(jī)場(CRF)
中圖分類號:TP391.43 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-7712 (2012) 06-0151-01