亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

平行語(yǔ)料庫(kù)檢索軟件SDAU-ParaConc設(shè)計(jì)與實(shí)現(xiàn)

2019-10-18 02:57:59葛曉帥翟紅華

軟件導(dǎo)刊 2019年9期

葛曉帥翟紅華

摘要：當(dāng)代語(yǔ)言研究離不開(kāi)語(yǔ)料庫(kù)，對(duì)語(yǔ)料庫(kù)的檢索需要計(jì)算機(jī)軟件支持，但平行語(yǔ)料庫(kù)檢索軟件數(shù)量極少，且存在不符合中國(guó)國(guó)情的情況。因此，有必要開(kāi)發(fā)一款符合中國(guó)國(guó)情、適應(yīng)大數(shù)據(jù)檢索需求、減少語(yǔ)言研究中重復(fù)勞動(dòng)的平行語(yǔ)料庫(kù)檢索軟件。在考察現(xiàn)有4款平行語(yǔ)料庫(kù)檢索軟件，對(duì)比分析它們各自的優(yōu)勢(shì)及不足后，結(jié)合中國(guó)國(guó)情及語(yǔ)言研究實(shí)踐經(jīng)驗(yàn)，提出了新的平行語(yǔ)料庫(kù)檢索軟件SDAU-ParaConc設(shè)計(jì)理念。介紹了SDAU-ParaConc的實(shí)現(xiàn)方式與特點(diǎn)。與之前的軟件對(duì)比結(jié)果表明，SDAU-ParaConc操作步驟平均簡(jiǎn)化了60%，檢索效率平均提升了9.5%。

關(guān)鍵詞：SDAU-ParaConc;平行語(yǔ)料庫(kù);檢索軟件;翻譯記憶庫(kù)

DOI：10. 11907/rjdk. 191027 開(kāi)放科學(xué)（資源服務(wù)）標(biāo)識(shí)碼（OSID）：

中圖分類號(hào)：TP319文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1672-7800（2019）009-0112-04

The Design and Implementation of SDAU-ParaConc：

A Paralleled Corpus Concordancer

GE Xiao-shuai，ZHAI Hong-hua

（Foreign Language School， Shangdong Agriculture University， Tai'an 271000，China）

Abstract： Linguistic studies nowadays rely heavily on corpora， and computer applications are needed in searching corpora. Paralleled corpus tools are rarely found home and abroad， worse still the tools from abroad often do not fit for Chinese language. Therefore， it is necessary to develop a handy tool that deals with Chinese language and big data. After analyzing the four existing concondancers and taking the Chinese context their own experience into consideration， the authors， as language researchers，propose the design of SDAU-ParaConc and introduce its implementation and features. The results show that on average SDAU-ParaConc simplifies 60% operational steps and the searching rate is 9.5% higher.

Key Words： SDAU-ParConc; paralleled corpora; concordancer; translation memory exchange

0 引言

語(yǔ)料庫(kù)是當(dāng)代語(yǔ)言研究與教學(xué)[1]的一項(xiàng)重要參考，不論是翻譯研究、詞典編纂抑或是教材編寫(xiě)都離不開(kāi)語(yǔ)料庫(kù)支持[2]。

語(yǔ)料庫(kù)指在一定原則下收集的批量口頭或筆頭語(yǔ)篇素材，以電子版本的形式存儲(chǔ)在電腦中，用于語(yǔ)言的調(diào)查和質(zhì)性分析[3]。當(dāng)代語(yǔ)料庫(kù)指電子語(yǔ)料庫(kù)，語(yǔ)料庫(kù)的快速發(fā)展主要是依賴電子計(jì)算機(jī)的快速發(fā)展與普及。語(yǔ)料庫(kù)的規(guī)模從第一代電子語(yǔ)料庫(kù)的百萬(wàn)詞次級(jí)別發(fā)展到現(xiàn)在上億詞次級(jí)別[4]，如此大規(guī)模的文本是不可能依靠人工去讀取分析的，因此語(yǔ)料庫(kù)檢索軟件在語(yǔ)料庫(kù)研究中十分重要。

平行語(yǔ)料庫(kù)由源語(yǔ)文本及平行對(duì)應(yīng)的譯語(yǔ)文本構(gòu)成雙語(yǔ)語(yǔ)料庫(kù)[5]。平行語(yǔ)料庫(kù)與單語(yǔ)語(yǔ)料庫(kù)相比有其自身特點(diǎn)：①平行語(yǔ)料庫(kù)包含兩種以上語(yǔ)言;②語(yǔ)料之間按照特定層次平行對(duì)齊。這些特點(diǎn)決定了平行語(yǔ)料庫(kù)的檢索無(wú)法使用單語(yǔ)語(yǔ)料庫(kù)軟件，需要專用的平行語(yǔ)料庫(kù)檢索軟件。

雖然語(yǔ)言研究者數(shù)量眾多，但研究工具卻十分匱乏。平行語(yǔ)料庫(kù)的研究主要集中在翻譯研究[6]、術(shù)語(yǔ)抽取和自動(dòng)對(duì)齊等方面 [7]。國(guó)內(nèi)外比較知名的平行語(yǔ)料庫(kù)檢索軟件僅有4款，分別是ParaConc、AntPConc、CUC_Paraconc、BFSU ParaConc。近年的語(yǔ)料庫(kù)應(yīng)用有逐步向云端遷移的趨勢(shì)，如最新開(kāi)發(fā)的在線平行語(yǔ)料庫(kù)檢索系統(tǒng)有3款是在線的：OPUS Search Interface[8]、TANGO Concordancer[9]以及WebParaNews[10];另有一款桌面軟件Bilingual KRC Concordancer只能找到一篇介紹性文獻(xiàn)[11]，無(wú)法獲取該軟件。在線版檢索系統(tǒng)有速度快、檢索方便等優(yōu)點(diǎn)，但也存在無(wú)法滿足研究者個(gè)性化檢索的缺點(diǎn)。如上述WebParaNews只能檢索系統(tǒng)設(shè)置好的英文—日文新聞?wù)Z料庫(kù)，無(wú)法自行添加修改語(yǔ)料庫(kù)。本文主要針對(duì)桌面軟件進(jìn)行研究分析，故對(duì)在線系統(tǒng)不多著筆墨。上述4款桌面軟件各有優(yōu)點(diǎn)但也存在不足，筆者在使用過(guò)程中發(fā)現(xiàn)其無(wú)法滿足中國(guó)語(yǔ)言研究者在大數(shù)據(jù)時(shí)代的需求，有必要開(kāi)發(fā)一款更加簡(jiǎn)潔易用、能夠處理大規(guī)模語(yǔ)料的檢索軟件。

1 現(xiàn)有平行語(yǔ)料庫(kù)檢索軟件

目前已開(kāi)發(fā)出了優(yōu)秀的平行語(yǔ)料庫(kù)檢索軟件，如新西蘭奧克蘭大學(xué)Micheal Barlow[12]研制的ParaConc，Laurence Anthony [13]開(kāi)發(fā)的AntPConc，程南昌[14]研制的CUC_Paraconc以及許家金、梁茂成、賈云龍[15]開(kāi)發(fā)的BFSU ParaConc。下面對(duì)現(xiàn)有4款軟件進(jìn)行簡(jiǎn)要介紹：

ParaConc是最早且最著名的平行語(yǔ)料庫(kù)檢索和建設(shè)軟件[16]，其功能強(qiáng)大，除了檢索功能外還有對(duì)齊語(yǔ)料功能，這一功能在早期沒(méi)有自動(dòng)對(duì)齊工具時(shí)期非常實(shí)用。該軟件支持Unicode文件編碼，并且有詞頻統(tǒng)計(jì)功能，但軟件需要對(duì)漢語(yǔ)語(yǔ)料進(jìn)行提前分詞才能檢索。該軟件是收費(fèi)軟件，單機(jī)版價(jià)格49美元，對(duì)于普通語(yǔ)言研究者有一定經(jīng)濟(jì)負(fù)擔(dān)。

AntPConc是最著名的免費(fèi)語(yǔ)料庫(kù)檢索軟件AntConc的同系列軟件，作者是日本早稻田大學(xué)的Laurence Anthony教授。軟件繼承了作者一貫簡(jiǎn)潔明快的風(fēng)格，界面十分友好，主要有建庫(kù)和檢索兩個(gè)功能。檢索結(jié)果界面分為上下兩部分，第一部分呈現(xiàn)目標(biāo)語(yǔ)料庫(kù)檢索結(jié)果，第二部分呈現(xiàn)參照語(yǔ)料庫(kù)檢索結(jié)果，可以保存檢索結(jié)果，不提供索引行的來(lái)源文件，不支持正則表達(dá)式檢索。該軟件也需要對(duì)漢語(yǔ)語(yǔ)料進(jìn)行提前分詞。另外值得注意的是，軟件存放的路徑不能有漢字，否則無(wú)法運(yùn)行。

CUC_Paraconc由中國(guó)傳媒大學(xué)程南昌博士開(kāi)發(fā)，可進(jìn)行雙語(yǔ)和多語(yǔ)平行語(yǔ)料庫(kù)檢索，支持任意編碼的純文本語(yǔ)料。軟件界面語(yǔ)言可自主設(shè)定，可對(duì)檢索結(jié)果進(jìn)行排序。軟件設(shè)計(jì)十分人性化，可自動(dòng)識(shí)別雙語(yǔ)保存在單文件中的對(duì)齊形式，支持字母語(yǔ)言正則表達(dá)式檢索，漢語(yǔ)不用分詞。每次檢索軟件都會(huì)對(duì)平行語(yǔ)料空行進(jìn)行彈窗提醒，作者本意應(yīng)該是提醒語(yǔ)料可能沒(méi)有對(duì)齊，但在實(shí)際對(duì)齊中很多句子可能會(huì)沒(méi)有譯文，這時(shí)提醒就會(huì)給使用者帶來(lái)不必要的麻煩。軟件在處理大規(guī)模語(yǔ)料時(shí)可能會(huì)崩潰，檢索結(jié)果不提供索引行的來(lái)源文件。

BFSU ParaConc由北京外國(guó)語(yǔ)大學(xué)許家金教授、梁茂成教授和賈云龍共同設(shè)計(jì)開(kāi)發(fā)。漢語(yǔ)文本無(wú)需提前分詞，支持正則表達(dá)式檢索，支持英文詞形還原檢索。檢索結(jié)果呈現(xiàn)索引行來(lái)源文本，支持包含或不包含檢索，但僅支持ANSI編碼文本。

將平行語(yǔ)料庫(kù)檢索軟件最常用的功能按照各軟件支持與否進(jìn)行整理如表1所示。

從表1可以看出，國(guó)外的檢索軟件并不適合我國(guó)國(guó)情，比如漢語(yǔ)需要提前分詞，AntPConc甚至不能在包含漢語(yǔ)的路徑下正常工作，兩款軟件都不呈現(xiàn)索引行的所在文本。國(guó)內(nèi)兩款軟件進(jìn)行了大膽改進(jìn)，都支持漢語(yǔ)不分詞檢索，支持正則表達(dá)式。這兩款軟件各有特色，如CUC_Paraconc 支持任意編碼的文本文件，BFSU支持不包含檢索，支持英文詞形還原檢索，并且是唯一呈現(xiàn)索引行文件的一款軟件。4款軟件都是非常優(yōu)秀的軟件，但也有各自的不足。因此，筆者借鑒其優(yōu)勢(shì)，根據(jù)翻譯研究中的實(shí)踐經(jīng)驗(yàn)設(shè)計(jì)并開(kāi)發(fā)了一款新的平行語(yǔ)料庫(kù)檢索軟件SDAU-ParaConc。

2 SDAU-ParaConc設(shè)計(jì)

SDAU-ParaConc以山東農(nóng)業(yè)大學(xué)英文縮寫(xiě)（SDAU）加平行語(yǔ)料庫(kù)檢索工具（ParaConc）命名（下載地址http：//corpus.bfsu.edu.cn/tools），基于Aardio與 Javascript開(kāi)發(fā)，在Windows操作系統(tǒng)運(yùn)行。其核心設(shè)計(jì)理念是簡(jiǎn)潔易用。軟件是免費(fèi)軟件，界面只有3個(gè)選項(xiàng)卡，創(chuàng)建語(yǔ)料庫(kù)選項(xiàng)卡包含檢索前語(yǔ)料的導(dǎo)入和語(yǔ)料數(shù)據(jù)文件的選擇功能，檢索語(yǔ)料庫(kù)選項(xiàng)卡包含檢索條件指定、結(jié)果呈現(xiàn)與保存功能，幫助選項(xiàng)卡有作者信息及幫助文檔。

軟件摒棄了ParaConc下拉菜單式的檢索條件指定方式，在同一界面提供檢索條件和結(jié)果呈現(xiàn)，方便迅速改變檢索條件查詢。

界面雖然簡(jiǎn)潔，但軟件沒(méi)有犧牲核心功能，如英文檢索詞提供了大小寫(xiě)敏感、正則表達(dá)式支持和英文詞形還原檢索功能，這些研究中最常用到的功能較完備，至于詞頻統(tǒng)計(jì)等功能完全可以結(jié)合AntConc，WordSmithTools等單語(yǔ)語(yǔ)料庫(kù)檢索軟件實(shí)現(xiàn)。

下面從創(chuàng)建語(yǔ)料庫(kù)和檢索語(yǔ)料庫(kù)兩個(gè)方面介紹SDAU-ParaConc的特點(diǎn)。

2.1 語(yǔ)料庫(kù)功能創(chuàng)建

2.1.1 智能識(shí)別文件命名

文本文件的平行語(yǔ)料庫(kù)如果是雙文件對(duì)齊的，也就是說(shuō)兩種語(yǔ)言分別存儲(chǔ)在兩個(gè)文本文件中，兩個(gè)文件首先要進(jìn)行匹配，否則無(wú)法進(jìn)行雙語(yǔ)對(duì)齊。國(guó)外兩款軟件的設(shè)計(jì)思路是兩種語(yǔ)言的文件放在不同的文件夾中，按照文件排列順序匹配。國(guó)內(nèi)兩款軟件的設(shè)計(jì)思路是將兩種文件放在同一個(gè)文件夾下，通過(guò)在文件名中添加前綴或后綴的方式進(jìn)行匹配。CUC_Paraconc支持前綴命名，并且支持自定義前綴，如漢語(yǔ)文本命名為ch-abc.txt，其對(duì)應(yīng)的英語(yǔ)文本命名為en-abc.txt。BFSU ParaConc支持特定后綴，中文文件名為*.ZH.txt，對(duì)應(yīng)英文文件名為*.EN.txt。

通過(guò)借鑒兩款優(yōu)秀國(guó)產(chǎn)軟件優(yōu)點(diǎn)，SDAU-ParaConc支持更加靈活的文件命名方式，可以用前綴也可以用后綴，前綴后綴均可自定義。只要符合命名規(guī)則，軟件將智能匹配兩種語(yǔ)言的文本，方便語(yǔ)言研究者根據(jù)自己的需求對(duì)文件命名，減少不必要的重復(fù)勞動(dòng)。

2.1.2 支持任意編碼文本文件

平行語(yǔ)料庫(kù)涉及至少兩種語(yǔ)言[17]，文件的存儲(chǔ)形式可以分為兩種情況：①兩種語(yǔ)言存儲(chǔ)在同一個(gè)文件內(nèi)，按照一行A語(yǔ)言一行B語(yǔ)言進(jìn)行對(duì)齊;②兩種語(yǔ)言分別存儲(chǔ)在兩個(gè)文件內(nèi)，兩種語(yǔ)言按照行號(hào)對(duì)齊。文本文件的存儲(chǔ)編碼標(biāo)準(zhǔn)分為ANSI及Unicode。簡(jiǎn)單來(lái)說(shuō)ANSI標(biāo)準(zhǔn)的文件節(jié)省存儲(chǔ)空間，但有可能造成非英語(yǔ)文字的亂碼情況，比如新建一個(gè)文本文件會(huì)默認(rèn)保存為ANSI編碼，輸入“聯(lián)通”兩字保存后再打開(kāi)就會(huì)出現(xiàn)亂碼。Unicode標(biāo)準(zhǔn)根據(jù)不同編碼方案又有一些變體，如UTF-8、UTF-16等[18]。其中最通用的是UTF-8編碼方案，它保證了字符的準(zhǔn)確存儲(chǔ)，兼容ANSI標(biāo)準(zhǔn)，又根據(jù)不同字符變長(zhǎng)，節(jié)省了空間。

在翻譯實(shí)踐中經(jīng)常會(huì)遇到一些特殊字符，如希臘字母、數(shù)學(xué)符號(hào)、音標(biāo)字符等，用ANSI格式存儲(chǔ)會(huì)有亂碼情況，破壞語(yǔ)料的準(zhǔn)確性。

綜上，SDAU-ParaConc設(shè)計(jì)為支持所有編碼標(biāo)準(zhǔn)，比如英文文本可以用ANSI格式存儲(chǔ)，節(jié)省空間;漢語(yǔ)文本用UTF-8存儲(chǔ)，保證準(zhǔn)確性。只要文本文件可以正常顯示，軟件均可正常識(shí)別，這樣既提高了軟件的靈活性，又兼顧了存儲(chǔ)空間的經(jīng)濟(jì)性。

2.1.3 支持TMX記憶庫(kù)文件直接導(dǎo)入

TMX是Translation Memory eXchange的縮寫(xiě)[19]，是翻譯記憶庫(kù)交換格式。各大翻譯輔助軟件如Trados、MemoQ、Déjà Vu、Google Translate、雪人CAT等均支持TMX格式的記憶庫(kù)。

所謂翻譯記憶庫(kù)，本質(zhì)上就是一一對(duì)齊的雙語(yǔ)句子，導(dǎo)入翻譯輔助軟件后，軟件會(huì)將新的翻譯任務(wù)與記憶庫(kù)中的句子進(jìn)行匹配，如果發(fā)現(xiàn)記憶庫(kù)中有過(guò)同樣或類似的句子，就會(huì)將翻譯結(jié)果自動(dòng)呈現(xiàn)出來(lái)，給譯者帶來(lái)極大方便，免去了很多重復(fù)勞動(dòng)。對(duì)齊工具對(duì)齊后的文本也常用TMX格式保存。具有這種特性的TMX文件其實(shí)就是天然的對(duì)齊平行語(yǔ)料，對(duì)于建設(shè)平行語(yǔ)料庫(kù)非常方便。

本文首創(chuàng)語(yǔ)料庫(kù)檢索軟件支持TMX格式，無(wú)需將TMX格式轉(zhuǎn)換為純文本格式，直接將TMX格式文件導(dǎo)入軟件即可進(jìn)行檢索分析，這對(duì)于翻譯工作無(wú)疑是一項(xiàng)十分實(shí)用的功能。TMX記憶庫(kù)現(xiàn)有多家平臺(tái)進(jìn)行共享和銷售，研究者可直接購(gòu)買TMX記憶庫(kù)進(jìn)行平行語(yǔ)料庫(kù)的建庫(kù)工作。

通過(guò)對(duì)比4款語(yǔ)料庫(kù)創(chuàng)建過(guò)程，結(jié)果表明SDAU-ParaConc比其它4款軟件平均簡(jiǎn)化了60%的操作步驟。

2.2 語(yǔ)料庫(kù)檢索功能特點(diǎn)

2.2.1 SQLite數(shù)據(jù)庫(kù)檢索

為了提高檢索速度，將平行語(yǔ)料庫(kù)導(dǎo)入SQLite數(shù)據(jù)庫(kù)進(jìn)行檢索，檢索效率明顯提升。對(duì)一個(gè)3萬(wàn)句對(duì)的平行語(yǔ)料庫(kù)進(jìn)行檢索對(duì)比測(cè)試，結(jié)果表明SDAU-ParaConc的檢索效率平均提升了9.4%，且在進(jìn)行大量文本文件檢索時(shí)也不會(huì)崩潰。語(yǔ)料庫(kù)的容量越來(lái)越大，適應(yīng)了大數(shù)據(jù)時(shí)代的平行語(yǔ)料檢索需求。

另外，SQLite數(shù)據(jù)庫(kù)文件除了SDAU-ParaConc.db外可以以任何文件名保存?zhèn)溆?，后續(xù)檢索無(wú)需再次生成語(yǔ)料數(shù)據(jù)庫(kù)，只需選擇SQLite數(shù)據(jù)庫(kù)文件導(dǎo)入即可，節(jié)省了語(yǔ)料導(dǎo)入分析時(shí)間。

2.2.2 支持中文不分詞檢索

英文等字母語(yǔ)言是依靠空格識(shí)別單詞的邊界，國(guó)外軟件設(shè)計(jì)時(shí)都采用了空格作為詞的邊界，這樣分詞可以方便進(jìn)行詞頻統(tǒng)計(jì)等分析[17]，國(guó)外軟件也因此無(wú)法對(duì)不分詞的漢語(yǔ)連續(xù)文本進(jìn)行檢索分析[20]。但即使是現(xiàn)在最優(yōu)秀的中文分詞引擎也不能做到百分百的分詞準(zhǔn)確率[21]，并且分詞標(biāo)準(zhǔn)不同也會(huì)造成結(jié)果不同，如把“北京大學(xué)”是看成一個(gè)詞還是“北京”和“大學(xué)”兩個(gè)詞？如果上述例子被分成了兩個(gè)詞，那么檢索“北京大學(xué)”就無(wú)法得到正確結(jié)果。當(dāng)然不分詞也可能造成將不是詞的連續(xù)文本識(shí)別為詞的結(jié)果，如檢索“中國(guó)”會(huì)將“發(fā)展中國(guó)家”也呈現(xiàn)出來(lái)。

為解決這一矛盾，設(shè)計(jì)的軟件檢索條件既要支持分詞的漢語(yǔ)文本也要支持不分詞的漢語(yǔ)文本，使用者可根據(jù)需要導(dǎo)入任何漢語(yǔ)文本。

2.2.3 自動(dòng)定位檢索結(jié)果句所在文件

4款軟件僅BFSU ParaConc會(huì)在檢索結(jié)果句后呈現(xiàn)文件名，其它3款只呈現(xiàn)索引行，使用者無(wú)法獲知索引行出自哪個(gè)文件，但這一信息非常重要。在需要查看上下文時(shí)，如果文件數(shù)量很多，查找該句的出處就會(huì)很困難，需要點(diǎn)開(kāi)文件夾反復(fù)查找。

SDAU-ParaConc不僅很清晰地呈現(xiàn)出索引行所在文件名，并且實(shí)現(xiàn)了點(diǎn)擊文件名（File）即可打開(kāi)句子所在文件的功能，如圖1所示。

在翻譯研究及教學(xué)過(guò)程中，如果單個(gè)句子無(wú)法給出確定信息需要進(jìn)行上下文查閱，或是發(fā)現(xiàn)翻譯錯(cuò)誤需要修改原文時(shí)，這一功能會(huì)帶來(lái)極大便利。

2.2.4 支持檢索結(jié)果保存

現(xiàn)有軟件對(duì)檢索結(jié)果大多以純文本格式保存，而該軟件不僅提供純文本格式保存，還提供HTML格式保存。HTML文件可以用任何瀏覽器打開(kāi)查看，與在軟件中查看效果一樣，檢索關(guān)鍵詞時(shí)高亮顯示。文件名以檢索條件命名，可以避免同一條件的反復(fù)檢索，也方便進(jìn)行結(jié)果對(duì)比。

3 結(jié)語(yǔ)

SDAU-ParaConc開(kāi)發(fā)并非重復(fù)勞動(dòng)，而是在吸收前人優(yōu)秀設(shè)計(jì)理念、摒棄不合理的繁瑣功能，結(jié)合我國(guó)語(yǔ)言研究者使用實(shí)際設(shè)計(jì)開(kāi)發(fā)的一款方便實(shí)用的平行語(yǔ)料庫(kù)檢索軟件。該軟件更加貼近一線研究者需求，簡(jiǎn)化重復(fù)性勞動(dòng)，提升研究效率。我國(guó)語(yǔ)言研究者眾多，但語(yǔ)言研究工具總體相對(duì)匱乏，SDAU-ParaConc的發(fā)布為語(yǔ)言研究者科研及教學(xué)帶來(lái)了方便。

參考文獻(xiàn)：

[1] CORTES V. Corpus tools for writing teachers[J]. The TESOL Encyclopedia of English Language Teaching， 2018（1）： 1-6.

[2] BREZINA V. Statistics in corpus linguistics： a practical guide[M]. Cambridge： Cambridge University Press， 2018.

[3] 何安平. 語(yǔ)料庫(kù)輔助英語(yǔ)教學(xué)入門[M]. 北京：外語(yǔ)教學(xué)與研究出版社， 2010.

[4] 王克非. 語(yǔ)料庫(kù)翻譯學(xué)探索[M]. 上海：上海交通大學(xué)出版社，2012.

[5] 王克非. 雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)：研制與應(yīng)用[M]. 北京：外語(yǔ)教學(xué)與研究出版社， 2004.

[6] 王若楓. 基于平行語(yǔ)料庫(kù)的計(jì)算機(jī)輔助翻譯軟件在翻譯教學(xué)中的應(yīng)用[D].哈爾濱：黑龍江大學(xué)，2015.

[7] 司莉，何依.2000年以來(lái)我國(guó)多語(yǔ)言語(yǔ)料庫(kù)研究進(jìn)展[J].現(xiàn)代情報(bào)，2016，36（6）：165-170.

[8] TIEDEMANN J. Parallel data， tools and interfaces in OPUS[C]. LREC，2012： 2214-2218.

[9] REYNOLDS B L. Action research： applying a bilingual parallel corpus collocational concordancer to Taiwanese medical school EFL academic writing[J]. RELC ?Journal， 2016， 47（2）： 213-227.

[10] CHUJO K， KOBAYASHI Y， MIZUMOTO A， et al. Exploring the effectiveness of combined web-based corpus tools for beginner EFL DDL[J]. Linguistics and Literature Studies， 2016，4（4）：262-274.

[11] HMIDA F，MORIN E，DAILLE B， et al. A bilingual KRC concordancer for assisted translation revision based on specialized comparable corpora[C]. Terminology and Knowledge Engineering Conference，2016.

[12] BARLOW M. Paraconc： concordance software for multilingual parallel corpora[C]. Proceedings of the Third International Conference on Language Resources and Evaluation，Workshop on Language Resources in Translation Work and Research，2002： 20-24.

[13] ANTHONY ?L. Antpconc （Version 1.1.0） [D]. Tokyo： Waseda University，2014.

[14] 程南昌. CUC_Paraconc[D].北京：中國(guó)傳媒大學(xué)，2013.

[15] XU J J，LIANG M C，JIA Y L. BFSU Paraconc 1.2[D]. Beijing： Beijing Foreign Studies University，2012.

[16] MOROPA K. Analysing the English-Xphosa parallel corpus of technical texts with Paraconc： a case study of term formation processes[J]. Southern African Linguistics and Applied Language Studies， 2007，25（2）：183-205.

[17] 胡開(kāi)寶. 語(yǔ)料庫(kù)翻譯學(xué)概論[M]. 上海：上海交通大學(xué)出版社，2013.

[18] UNICODE CONSORTIUM. The unicode standard， version 2.0[M]. Redwood City： Addison-Wesley Longman Publishing Co. Inc. 1997.

[19] WIKIPEDIA. Translation memory exchange[EB/OL]. https：//en.wikipedia.org/wiki/Translation_Memory_eXchange.

[20] 胡開(kāi)寶，鄒頌兵. 莎士比亞戲劇英漢平行語(yǔ)料庫(kù)的創(chuàng)建與應(yīng)用[J]. 外語(yǔ)研究，2009（5）： 64-71.

[21] 王建新. 計(jì)算機(jī)語(yǔ)料庫(kù)的建設(shè)與應(yīng)用[M].北京：清華大學(xué)出版社， 2005.

（責(zé)任編輯：杜能鋼）

軟件導(dǎo)刊2019年9期

軟件導(dǎo)刊的其它文章: 基于OBE理念的《數(shù)據(jù)庫(kù)技術(shù)與應(yīng)用》課程教學(xué)改革探索; 基于自編碼網(wǎng)絡(luò)模型的風(fēng)機(jī)故障檢測(cè)研究; 智能課堂助手：人工智能背景下的教學(xué)工具; 體感技術(shù)與教學(xué)深度融合：重塑學(xué)習(xí)體驗(yàn); 基于非銳化掩模與Beta變換的圖像增強(qiáng)研究; 一種小波域K-Means遙感圖像分類標(biāo)注算法