亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)絡(luò)信息采集技術(shù)的體育信息采譯編平臺的研制與應(yīng)用

        2019-11-02 01:33:40袁俊杰
        體育科技文獻通報 2019年11期
        關(guān)鍵詞:網(wǎng)頁子系統(tǒng)譯文

        袁俊杰,王 彬

        1 研究目的

        體育信息工作中,跟蹤國外體育最新動態(tài)是一項非常重要的常規(guī)性任務(wù)。外文信息的翻譯整理是其中的核心環(huán)節(jié)。雖然近年來機器翻譯準(zhǔn)確度隨著人工智能發(fā)展而不斷提高,但目前機器翻譯系統(tǒng)與人類譯文仍然差距尚遠(yuǎn),短期內(nèi)很難完全取代人類譯員。

        隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)信息更新速度加快,僅僅依靠人工搜集國外體育動態(tài)信息已愈來愈不能滿足實際需要。同時,采編團隊之間溝通不及時也容易造成不必要的重復(fù)勞動。這些都需要從技術(shù)手段上加以解決。

        網(wǎng)絡(luò)信息采集技術(shù)是目前時興的一種信息獲取方式,可以短時間里,智能的自動采集不同網(wǎng)站的信息,已在其他領(lǐng)域廣泛應(yīng)用。近兩年,筆者在網(wǎng)絡(luò)信息采集系統(tǒng)基礎(chǔ)上設(shè)計開發(fā)了體育信息采譯編系統(tǒng),將外文體育信息的采集、翻譯、校對、編輯等工作統(tǒng)一管理,取得了很好的成效。

        2 研究方法

        文獻資料法:查閱有關(guān)網(wǎng)絡(luò)信息采集、眾包翻譯、新聞采編等方面的文獻資料。

        專家訪談法:與部分體育信息專家、翻譯人員以及程序員進行訪談交流。

        軟件編程法:運用PHP、Java及MySQL進行系統(tǒng)編程。

        3 研究結(jié)果

        3.1 網(wǎng)絡(luò)信息采集技術(shù)簡介

        我們接觸最多的網(wǎng)絡(luò)信息是以網(wǎng)頁形式存在的,而網(wǎng)頁上的信息基本上是非結(jié)構(gòu)化的。利用時,一般需要轉(zhuǎn)為結(jié)構(gòu)化的信息,以便檢索和分類。

        網(wǎng)絡(luò)信息采集技術(shù)是指利用計算機軟件技術(shù),針對定制的目標(biāo)數(shù)據(jù)源,實時進行信息采集、抽取、挖掘、處理,將非結(jié)構(gòu)化的信息從大量的網(wǎng)頁中抽取出來保存到結(jié)構(gòu)化的數(shù)據(jù)庫中,從而為各種信息服務(wù)系統(tǒng)提供數(shù)據(jù)輸入的整個過程。

        匯集了各種網(wǎng)絡(luò)信息采集技術(shù)的程序集成系統(tǒng)稱為網(wǎng)絡(luò)信息采集系統(tǒng),主要用于門戶網(wǎng)站的新聞采集、行業(yè)資訊采集、競爭情報獲取等領(lǐng)域。

        圖一 網(wǎng)絡(luò)信息采集系統(tǒng)流程圖(來源:百度百科)

        但目前網(wǎng)絡(luò)信息采集系統(tǒng)也存在一些缺點,雖然可以自定義部分篩選規(guī)則,能自動屏蔽一些信息,但仍有不少無用信息會被采集入庫,不如人工搜集相關(guān)度高,后期仍需要人工介入。

        3.2 翻譯模式的選擇

        當(dāng)眾包翻譯首先在社交網(wǎng)站一展身手之后,逐漸在新聞、娛樂、語言學(xué)習(xí)、非營利組織及政府機構(gòu)等領(lǐng)域得到廣泛應(yīng)用。在眾包翻譯模式下,一篇原文通過網(wǎng)絡(luò)管理系統(tǒng)分割多塊交給多名翻譯員,最后匯總整合,翻譯、編輯和審校并行多向進行,譯員隊伍規(guī)模大,成員個體差異大,結(jié)構(gòu)松散,不受時間和地點限制,翻譯速度快,但譯文質(zhì)量很難控制。而傳統(tǒng)翻譯模式采用翻譯——編輯——審校自上而下的單向模式,譯員隊伍相對固定,結(jié)構(gòu)嚴(yán)謹(jǐn),成員個體差異小,翻譯速度較慢,譯文質(zhì)量容易控制,但受到一定的時間和空間限制。

        體育信息翻譯專業(yè)性較強,對譯文質(zhì)量要求較高,要符合中文表達習(xí)慣和行業(yè)規(guī)范,實際工作中合作的翻譯人員相對固定,因此,傳統(tǒng)翻譯模式更容易控制翻譯質(zhì)量,而其受時間和空間限制的缺點可以借鑒眾包翻譯模式中的網(wǎng)絡(luò)化管理加以解決。

        3.3 系統(tǒng)架構(gòu)

        整個信息采譯編平臺包括采集和譯編二個子系統(tǒng),相對獨立,通過同一后臺數(shù)據(jù)庫共享數(shù)據(jù)。平臺采用B/S結(jié)構(gòu),用戶通過瀏覽器訪問系統(tǒng)進行操作。

        采集子系統(tǒng)采用國內(nèi)先進的商業(yè)化采集軟件,譯編子系統(tǒng)在采集子系統(tǒng)后臺MySQL數(shù)據(jù)庫基礎(chǔ)上定制開發(fā)。原采集庫基本不動,增加譯編庫,人工篩選時自動將選定的采集庫數(shù)據(jù)拷貝到譯編庫,后續(xù)翻譯和編校操作均在譯編庫中進行。

        系統(tǒng)設(shè)管理員、組長、選稿員、翻譯員、審校員和主編等6類角色。管理員負(fù)責(zé)采集任務(wù)配置和系統(tǒng)管理;組長負(fù)責(zé)本組人員管理和角色分配;選稿員負(fù)責(zé)篩選信息,或另外上傳其他信息;翻譯員在線競爭選擇翻譯任務(wù);審校員負(fù)責(zé)初步校對本組譯文;主編負(fù)責(zé)所有譯文再次審校并改編成最終文稿。

        不同角色的用戶訪問界面不同,每個用戶可分配多個角色。

        3.4 系統(tǒng)功能設(shè)計

        系統(tǒng)主要功能是通過采集子系統(tǒng)每天自動跟蹤采集權(quán)威體育信息網(wǎng)站的最新動態(tài),經(jīng)人工篩選后,翻譯員在線競爭翻譯,再經(jīng)初步校對和再次審校,最后改編成最終文稿,實現(xiàn)信息采集、篩選、翻譯、審校、編輯一體化管理。

        3.4.1 信息采集和篩選

        采集任務(wù)配置是整個系統(tǒng)的基礎(chǔ),操作難度較大,要求管理員熟悉網(wǎng)頁結(jié)構(gòu)。采集子系統(tǒng)提供網(wǎng)頁探測器和任務(wù)配置器等輔助工具,幫助管理員配置采集任務(wù)。

        在任務(wù)配置開始前,需要通過網(wǎng)頁探測器分析擬采集的網(wǎng)頁,確定要抽取網(wǎng)頁的哪些信息、信息在頁面的哪個位置、采集時使用的遍歷方式以及是否有下一頁等。

        配置任務(wù)時,利用前面的分析結(jié)果把采集所需要的各種參數(shù)加入到任務(wù)文件中,例如標(biāo)題、作者、時間、來源、過濾規(guī)則等,以便任務(wù)執(zhí)行器按照我們的意圖進行采集。大部分外文網(wǎng)站的網(wǎng)頁結(jié)構(gòu)各不相同,需要單獨配置,少部分的網(wǎng)站可直接使用系統(tǒng)默認(rèn)的配置文件。

        最后設(shè)定采集任務(wù)開始執(zhí)行時間和執(zhí)行頻率,如每天6點執(zhí)行一次,每隔8小時執(zhí)行一次。

        采集系統(tǒng)按設(shè)定參數(shù)自動訪問各網(wǎng)站,下載最新動態(tài)信息并存儲在采集庫中。

        圖二 采集任務(wù)列表界面

        選稿員需要手動挑選出有針對性的信息,供各組翻譯員競爭翻譯,各組選稿員也可直接指定本組的某個翻譯員進行翻譯。選稿員可以對原文進行改編,還可以刪除或另外上傳新的信息。

        圖三 采集的信息列表及人工篩選界面

        3.4.2 信息翻譯

        各組翻譯員統(tǒng)一從待譯任務(wù)池中競爭任務(wù)。系統(tǒng)限制每個翻譯員同時承接的任務(wù)數(shù),若已達到限制數(shù),則不能承接新任務(wù)。承接后,任務(wù)自動鎖定,別人無法翻譯。翻譯過程中可以暫時保存,也可取消任務(wù),重新返回任務(wù)池。

        平臺提供了世界地名、外國人名、國際體育組織和體育項目等中英文術(shù)語對照表,供在線查詢參考。

        圖四 翻譯任務(wù)列表界面

        圖五 信息對照翻譯/校對界面

        3.4.3 譯文審校和編輯

        翻譯完成后,初譯稿自動進入初校任務(wù)池,由本組審校員進行初步審校。各組審校員只能審校本組成員翻譯的譯文,其他小組的譯文則無權(quán)審校。審校員還可以對譯文進行1-5星的評分,便于對翻譯員的能力進行評估。

        所有一校稿需要經(jīng)過主編最終審校,并改編成符合要求的最終文稿。一些重要信息還會由主編進一步整合或補充資料。

        3.5 應(yīng)用效果

        平臺完成后,合作的兩家院校的教師翻譯團隊以及十余位外語兼職人員進行了兩年多的使用,效果良好。平臺每天采集130余個外文體育信息網(wǎng)站的200余條信息,經(jīng)篩選和翻譯后,每天可提供10余條譯文,與以前每周提供一次相比,信息時效大大提高。

        4 結(jié)論

        整個平臺采用B/S結(jié)構(gòu)設(shè)計,用戶通過瀏覽器訪問,操作簡單,簡化了培訓(xùn)過程。采集管理和譯編管理相對獨立,安全性更高。

        平臺利用網(wǎng)絡(luò)信息采集技術(shù)每天定時自動采集上百家體育信息網(wǎng)站的最新信息,極大地節(jié)約了人工,提高了采集效率。

        平臺在傳統(tǒng)翻譯模式中引入了競爭翻譯和網(wǎng)絡(luò)化管理,既發(fā)揮了傳統(tǒng)翻譯模式質(zhì)量易控的長處,又發(fā)揮了網(wǎng)絡(luò)管理的便捷優(yōu)勢,對體育信息工作實現(xiàn)創(chuàng)新升級具有重要作用。

        猜你喜歡
        網(wǎng)頁子系統(tǒng)譯文
        不對中轉(zhuǎn)子系統(tǒng)耦合動力學(xué)特性研究
        Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
        GSM-R基站子系統(tǒng)同步方案研究
        譯文摘要
        駝峰測長設(shè)備在線監(jiān)測子系統(tǒng)的設(shè)計與應(yīng)用
        基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
        電子制作(2018年10期)2018-08-04 03:24:38
        基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
        電子制作(2017年2期)2017-05-17 03:54:56
        I Like Thinking
        網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
        電子測試(2015年18期)2016-01-14 01:22:58
        10個必知的網(wǎng)頁設(shè)計術(shù)語
        人妖一区二区三区视频| 国产精品亚洲A∨天堂| 国产亚洲日韩AV在线播放不卡| 精品国产女主播一区在线观看| 日韩av无码一区二区三区| 永久免费观看国产裸体美女 | 亚洲肥老熟妇四十五十路在线| 91极品尤物在线观看播放| 国产亚洲av综合人人澡精品| 人妻少妇精品无码专区| 无码人妻精品一区二区三18禁| 国产视频嗯啊啊啊| av新型国产在线资源| 欧美成人精品a∨在线观看| 天天干成人网| 97碰碰碰人妻视频无码| 女同性恋一区二区三区av| 无码精品人妻一区二区三区av| 精品国产亚洲AⅤ麻豆| 国产精品亚洲av国产| 亚洲国产精品成人av网| 97夜夜澡人人双人人人喊| 在线观看视频一区| 91桃色在线播放国产| 国产精品天天看天天狠| a级毛片在线观看| 国产成社区在线视频观看| 最新69国产精品视频| 精品国产性色无码av网站| 视频一区二区在线播放| 男女羞羞的视频免费网站| 麻豆精品国产专区在线观看| 精品麻豆国产色欲色欲色欲www| 日本久久久免费高清| 在线不卡av一区二区| 国产成人av综合色| 亚洲成av人最新无码| 精品一区二区三区女同免费| av在线免费观看蜜桃| 内射无码专区久久亚洲| 精品91精品91精品国产片|