李婷婷 趙鐵軍 張春越
摘要:采用基于統(tǒng)計(jì)的方法實(shí)現(xiàn)日本人名的識(shí)別和翻譯系統(tǒng)。將人名的識(shí)別轉(zhuǎn)換成序列標(biāo)注問(wèn)題,采用條件隨機(jī)場(chǎng)方法訓(xùn)練識(shí)別模型。訓(xùn)練語(yǔ)料在標(biāo)注時(shí)使用S/E(Starl/End)標(biāo)注風(fēng)格;利用人名在上下文中的關(guān)系、人名稱呼后綴詞和人名字典來(lái)設(shè)計(jì)特征模板。人名翻譯時(shí)將日本人名分為假名人名和漢字人名,漢字人名的翻譯通過(guò)建立日本人名常用漢字翻譯字典實(shí)現(xiàn):假名人名的翻譯通過(guò)Moses系統(tǒng)訓(xùn)練翻譯模型實(shí)現(xiàn)。該系統(tǒng)在人名的識(shí)別和翻譯測(cè)試中都取得了不錯(cuò)統(tǒng)計(jì)結(jié)果。