亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向電力行業(yè)的漢維哈文檔對齊工具的設計與實現

        2015-01-20 05:17:27尼加提·納吉米
        電腦知識與技術 2014年36期

        摘要:為了構建面向電力行業(yè)信息系統的漢維哈自動翻譯引擎,需要構建大量的漢維哈語種的平行語料庫。該文中,設計與實現了漢維哈平行語料庫構建系統的文檔導入及對齊功能。文檔導入登記文檔的屬性,并對文檔進行拼寫檢查等編輯操作,文檔對齊對漢語文檔與維吾爾語或哈薩克語文檔建立對齊關系。

        關鍵詞: 電力; 漢語; 維吾爾語;哈薩克語;文檔對齊

        中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)36-8657-02

        新疆維吾爾自治區(qū)的電力系統員工及用電群眾中都有漢語水平較差的少數民族群眾,為了給各族員工和群眾提供多語種的信息系統服務,新疆電力公司要求面向用戶的信息產品必須提供漢、維、哈語種的操作界面。為了提高系統開發(fā)速度、充分利用已翻譯的資源和統一電力術語的譯文,設計與開發(fā)了面向電力系統的信息系統漢語菜單、提示自動翻譯引擎。

        1 漢維哈文檔對齊工具的設計與實現

        文檔是所有語料庫建設工作的基礎,也是目前自然語言處理能夠考慮的最大的單元。為了構建機器翻譯系統需要構建大量的平行語料庫。因為維吾爾文在線平行語料庫不多,所以需要從出版社、日報社、有關行業(yè)單位收集圖書、雜志或文件等,對其進行文檔、句子級別的對齊處理,所以本文中設計與實現了整理文檔、編輯文檔及對齊文檔的工具軟件。

        1.1 文檔導入

        文檔導入模塊主要功能是完成各種文件的導入。文件成功導入到數據庫之后,等待文件編輯員檢查是否合理,若合理就提交給文件審核員,否則就修改并保存然后提交給審核員。如果需要導入新文檔,單擊“瀏覽”按鈕選擇你要導入的文檔。選擇文檔后你所選擇的文檔的部分信息將會顯示在下面的文本框中,如圖1所示。再選擇你所導入文檔的語種、領域和作者信息。然后單擊“提交文檔”按鈕,會彈出一個消息框,提示是否確認提交。單擊“確定”按鈕則完成該次文檔導入;如果需要重新寫入文檔信息,則可單擊“重寫信息”按鈕,重新選擇要導入的文檔;如果不需要導入文檔,則點擊“退出程序”按鈕,退出該模塊。單擊“已經導入的文檔”按鈕,即可進入查看已經導入的文檔界面。用戶可以根據導入時間和審核狀態(tài)來查詢,也可以選擇“顯示全部”按鈕來查詢所有已審核或未審核的文檔。

        1.2文檔編輯模塊

        該模塊的主要功能是對成功導入的文檔進行編輯。該模塊默認的功能界面是“查看新導入文檔”。單擊“查看新導入文檔”按鈕,可以選擇兩個對應的雙語文檔右鍵單擊彈出快捷菜單,如圖3所示。

        選擇“文檔編輯”即可對所選擇的文檔進行編輯,如圖4所示。在編輯狀態(tài)可以加載原始文檔、進行字體設置、維文校對、提交文檔、保存并更新等操作,還可以對已編輯的文本內容進行替換和查找操作。

        1.3 文檔對齊文檔

        該模塊的主要功能是找出所選擇文檔對應的另一種語言的文檔,必須是審核成功的文檔才能分配給用戶進行文檔對齊。文檔對齊是對兩種不同語種的文檔進行對齊,建立它們的對照關系。界面左邊是“維語文檔”,右邊是“漢文文檔”。如果用戶被系統管理員分配文檔對齊任務,則文檔對齊界面顯示給用戶所安排文檔的第一個文檔。如圖5所示。

        對齊:首先要選擇對應的兩個文檔(維語文檔一個或多個,漢語文檔一個或多個),然后右鍵單擊彈出快捷菜單選擇“對齊”子菜單,或者單擊界面下面的“對齊”按鈕,都可以建立所選擇的兩個文檔的對齊關系。

        取消對齊:取消對齊只能在已建立對齊的兩個文檔之間進行操作,取消對齊前確定所取消的文檔,選擇一個文檔系統會自動選擇給另一個語種對應的文檔。

        2 結論

        本文中對文檔導入、編輯及對齊進行了介紹,并實現了該工具軟件。該軟件提高了文獻整理工作的效率,質量,避免了以前的語料庫存儲松散及重復工作的問題。今后,繼續(xù)研究自動對齊漢維哈文檔算法,進一步提高語料庫的建設速度。

        參考文獻:

        [1] 武毅.基于 Lucene.Net 的全文檢索研究與應用[D].長沙:國防科學技術大學,2011.

        [2] 李穎,李志蜀,鄧歡.基于 Lucene 的中文分詞方法設計與實現[J].四川大學學報,2008,45(5):1095-1098.

        [3] 陳震明.智能機器翻譯前后端處理系統的設計和實現[D].北京:中國科學院計算技術研究所,1998.

        [4] 尼加提·納吉米,席小剛,馬斌,買合木提·買買提.多語種輔助翻譯系統研究與實現[J]. 電腦知識與技術,2012,8(2):345-350.

        [5] 黃河燕,陳肇雄.一種智能譯后編輯器的設計及其實現算法[J].軟件學報,1995,6(3):129-135

        [6] 王克非.雙語對應語料庫研制與應用[J].外語教學與研究,2004(4).endprint

        摘要:為了構建面向電力行業(yè)信息系統的漢維哈自動翻譯引擎,需要構建大量的漢維哈語種的平行語料庫。該文中,設計與實現了漢維哈平行語料庫構建系統的文檔導入及對齊功能。文檔導入登記文檔的屬性,并對文檔進行拼寫檢查等編輯操作,文檔對齊對漢語文檔與維吾爾語或哈薩克語文檔建立對齊關系。

        關鍵詞: 電力; 漢語; 維吾爾語;哈薩克語;文檔對齊

        中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)36-8657-02

        新疆維吾爾自治區(qū)的電力系統員工及用電群眾中都有漢語水平較差的少數民族群眾,為了給各族員工和群眾提供多語種的信息系統服務,新疆電力公司要求面向用戶的信息產品必須提供漢、維、哈語種的操作界面。為了提高系統開發(fā)速度、充分利用已翻譯的資源和統一電力術語的譯文,設計與開發(fā)了面向電力系統的信息系統漢語菜單、提示自動翻譯引擎。

        1 漢維哈文檔對齊工具的設計與實現

        文檔是所有語料庫建設工作的基礎,也是目前自然語言處理能夠考慮的最大的單元。為了構建機器翻譯系統需要構建大量的平行語料庫。因為維吾爾文在線平行語料庫不多,所以需要從出版社、日報社、有關行業(yè)單位收集圖書、雜志或文件等,對其進行文檔、句子級別的對齊處理,所以本文中設計與實現了整理文檔、編輯文檔及對齊文檔的工具軟件。

        1.1 文檔導入

        文檔導入模塊主要功能是完成各種文件的導入。文件成功導入到數據庫之后,等待文件編輯員檢查是否合理,若合理就提交給文件審核員,否則就修改并保存然后提交給審核員。如果需要導入新文檔,單擊“瀏覽”按鈕選擇你要導入的文檔。選擇文檔后你所選擇的文檔的部分信息將會顯示在下面的文本框中,如圖1所示。再選擇你所導入文檔的語種、領域和作者信息。然后單擊“提交文檔”按鈕,會彈出一個消息框,提示是否確認提交。單擊“確定”按鈕則完成該次文檔導入;如果需要重新寫入文檔信息,則可單擊“重寫信息”按鈕,重新選擇要導入的文檔;如果不需要導入文檔,則點擊“退出程序”按鈕,退出該模塊。單擊“已經導入的文檔”按鈕,即可進入查看已經導入的文檔界面。用戶可以根據導入時間和審核狀態(tài)來查詢,也可以選擇“顯示全部”按鈕來查詢所有已審核或未審核的文檔。

        1.2文檔編輯模塊

        該模塊的主要功能是對成功導入的文檔進行編輯。該模塊默認的功能界面是“查看新導入文檔”。單擊“查看新導入文檔”按鈕,可以選擇兩個對應的雙語文檔右鍵單擊彈出快捷菜單,如圖3所示。

        選擇“文檔編輯”即可對所選擇的文檔進行編輯,如圖4所示。在編輯狀態(tài)可以加載原始文檔、進行字體設置、維文校對、提交文檔、保存并更新等操作,還可以對已編輯的文本內容進行替換和查找操作。

        1.3 文檔對齊文檔

        該模塊的主要功能是找出所選擇文檔對應的另一種語言的文檔,必須是審核成功的文檔才能分配給用戶進行文檔對齊。文檔對齊是對兩種不同語種的文檔進行對齊,建立它們的對照關系。界面左邊是“維語文檔”,右邊是“漢文文檔”。如果用戶被系統管理員分配文檔對齊任務,則文檔對齊界面顯示給用戶所安排文檔的第一個文檔。如圖5所示。

        對齊:首先要選擇對應的兩個文檔(維語文檔一個或多個,漢語文檔一個或多個),然后右鍵單擊彈出快捷菜單選擇“對齊”子菜單,或者單擊界面下面的“對齊”按鈕,都可以建立所選擇的兩個文檔的對齊關系。

        取消對齊:取消對齊只能在已建立對齊的兩個文檔之間進行操作,取消對齊前確定所取消的文檔,選擇一個文檔系統會自動選擇給另一個語種對應的文檔。

        2 結論

        本文中對文檔導入、編輯及對齊進行了介紹,并實現了該工具軟件。該軟件提高了文獻整理工作的效率,質量,避免了以前的語料庫存儲松散及重復工作的問題。今后,繼續(xù)研究自動對齊漢維哈文檔算法,進一步提高語料庫的建設速度。

        參考文獻:

        [1] 武毅.基于 Lucene.Net 的全文檢索研究與應用[D].長沙:國防科學技術大學,2011.

        [2] 李穎,李志蜀,鄧歡.基于 Lucene 的中文分詞方法設計與實現[J].四川大學學報,2008,45(5):1095-1098.

        [3] 陳震明.智能機器翻譯前后端處理系統的設計和實現[D].北京:中國科學院計算技術研究所,1998.

        [4] 尼加提·納吉米,席小剛,馬斌,買合木提·買買提.多語種輔助翻譯系統研究與實現[J]. 電腦知識與技術,2012,8(2):345-350.

        [5] 黃河燕,陳肇雄.一種智能譯后編輯器的設計及其實現算法[J].軟件學報,1995,6(3):129-135

        [6] 王克非.雙語對應語料庫研制與應用[J].外語教學與研究,2004(4).endprint

        摘要:為了構建面向電力行業(yè)信息系統的漢維哈自動翻譯引擎,需要構建大量的漢維哈語種的平行語料庫。該文中,設計與實現了漢維哈平行語料庫構建系統的文檔導入及對齊功能。文檔導入登記文檔的屬性,并對文檔進行拼寫檢查等編輯操作,文檔對齊對漢語文檔與維吾爾語或哈薩克語文檔建立對齊關系。

        關鍵詞: 電力; 漢語; 維吾爾語;哈薩克語;文檔對齊

        中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)36-8657-02

        新疆維吾爾自治區(qū)的電力系統員工及用電群眾中都有漢語水平較差的少數民族群眾,為了給各族員工和群眾提供多語種的信息系統服務,新疆電力公司要求面向用戶的信息產品必須提供漢、維、哈語種的操作界面。為了提高系統開發(fā)速度、充分利用已翻譯的資源和統一電力術語的譯文,設計與開發(fā)了面向電力系統的信息系統漢語菜單、提示自動翻譯引擎。

        1 漢維哈文檔對齊工具的設計與實現

        文檔是所有語料庫建設工作的基礎,也是目前自然語言處理能夠考慮的最大的單元。為了構建機器翻譯系統需要構建大量的平行語料庫。因為維吾爾文在線平行語料庫不多,所以需要從出版社、日報社、有關行業(yè)單位收集圖書、雜志或文件等,對其進行文檔、句子級別的對齊處理,所以本文中設計與實現了整理文檔、編輯文檔及對齊文檔的工具軟件。

        1.1 文檔導入

        文檔導入模塊主要功能是完成各種文件的導入。文件成功導入到數據庫之后,等待文件編輯員檢查是否合理,若合理就提交給文件審核員,否則就修改并保存然后提交給審核員。如果需要導入新文檔,單擊“瀏覽”按鈕選擇你要導入的文檔。選擇文檔后你所選擇的文檔的部分信息將會顯示在下面的文本框中,如圖1所示。再選擇你所導入文檔的語種、領域和作者信息。然后單擊“提交文檔”按鈕,會彈出一個消息框,提示是否確認提交。單擊“確定”按鈕則完成該次文檔導入;如果需要重新寫入文檔信息,則可單擊“重寫信息”按鈕,重新選擇要導入的文檔;如果不需要導入文檔,則點擊“退出程序”按鈕,退出該模塊。單擊“已經導入的文檔”按鈕,即可進入查看已經導入的文檔界面。用戶可以根據導入時間和審核狀態(tài)來查詢,也可以選擇“顯示全部”按鈕來查詢所有已審核或未審核的文檔。

        1.2文檔編輯模塊

        該模塊的主要功能是對成功導入的文檔進行編輯。該模塊默認的功能界面是“查看新導入文檔”。單擊“查看新導入文檔”按鈕,可以選擇兩個對應的雙語文檔右鍵單擊彈出快捷菜單,如圖3所示。

        選擇“文檔編輯”即可對所選擇的文檔進行編輯,如圖4所示。在編輯狀態(tài)可以加載原始文檔、進行字體設置、維文校對、提交文檔、保存并更新等操作,還可以對已編輯的文本內容進行替換和查找操作。

        1.3 文檔對齊文檔

        該模塊的主要功能是找出所選擇文檔對應的另一種語言的文檔,必須是審核成功的文檔才能分配給用戶進行文檔對齊。文檔對齊是對兩種不同語種的文檔進行對齊,建立它們的對照關系。界面左邊是“維語文檔”,右邊是“漢文文檔”。如果用戶被系統管理員分配文檔對齊任務,則文檔對齊界面顯示給用戶所安排文檔的第一個文檔。如圖5所示。

        對齊:首先要選擇對應的兩個文檔(維語文檔一個或多個,漢語文檔一個或多個),然后右鍵單擊彈出快捷菜單選擇“對齊”子菜單,或者單擊界面下面的“對齊”按鈕,都可以建立所選擇的兩個文檔的對齊關系。

        取消對齊:取消對齊只能在已建立對齊的兩個文檔之間進行操作,取消對齊前確定所取消的文檔,選擇一個文檔系統會自動選擇給另一個語種對應的文檔。

        2 結論

        本文中對文檔導入、編輯及對齊進行了介紹,并實現了該工具軟件。該軟件提高了文獻整理工作的效率,質量,避免了以前的語料庫存儲松散及重復工作的問題。今后,繼續(xù)研究自動對齊漢維哈文檔算法,進一步提高語料庫的建設速度。

        參考文獻:

        [1] 武毅.基于 Lucene.Net 的全文檢索研究與應用[D].長沙:國防科學技術大學,2011.

        [2] 李穎,李志蜀,鄧歡.基于 Lucene 的中文分詞方法設計與實現[J].四川大學學報,2008,45(5):1095-1098.

        [3] 陳震明.智能機器翻譯前后端處理系統的設計和實現[D].北京:中國科學院計算技術研究所,1998.

        [4] 尼加提·納吉米,席小剛,馬斌,買合木提·買買提.多語種輔助翻譯系統研究與實現[J]. 電腦知識與技術,2012,8(2):345-350.

        [5] 黃河燕,陳肇雄.一種智能譯后編輯器的設計及其實現算法[J].軟件學報,1995,6(3):129-135

        [6] 王克非.雙語對應語料庫研制與應用[J].外語教學與研究,2004(4).endprint

        福利一区二区三区视频在线| 国产免费又色又爽又黄软件| 日本在线一区二区免费| 中国一级特黄真人片久久| 无码国产精品第100页| 丰满的少妇av一区二区三区| 国产精品网站夜色| 欧美寡妇xxxx黑人猛交| 国产一区二区三区最新地址| 日本久久久免费高清| 成年女人粗暴毛片免费观看| 日本一区二区三区爱爱视频| 国产男女无遮挡猛进猛出| 少妇被爽到高潮喷水免费福利 | 无码国产精品一区二区免费模式| 成人大片在线观看视频| 精品人妻VA出轨中文字幕| 久久精品国产亚洲av影院| 精品国产亚洲第一区二区三区| 国产麻豆极品高清另类| 中国精品久久久久国产| 亚洲av第一区综合激情久久久| 久久精品国产亚洲av成人文字| 乱人妻中文字幕| 亚洲成人福利在线观看| 四虎精品视频| 米奇亚洲国产精品思久久| 手机在线播放av网址| 真实国产老熟女无套中出| 国产亚洲蜜芽精品久久| 中文字幕一区二区va| 女色av少妇一区二区三区| 双腿张开被9个男人调教| 亚洲两性视频一三区| 国产免费精品一品二区三| 国产日产亚洲系列最新| 樱桃视频影视在线观看免费| 免费毛片在线视频| 一级二级三一片内射视频| 色综合久久蜜芽国产精品| 99热久久这里只精品国产www|