摘 要:2021年俄羅斯總統(tǒng)普京簽署解密了新一批伯力審判檔案,涉及原侵華日軍第七三一部隊(duì)反人類(lèi)暴行的核心罪證,其史料價(jià)值不言而喻。與此同時(shí),面對(duì)復(fù)雜多變的外部局勢(shì),如何快速有效地翻譯、整理和挖掘史料,并迅速同我國(guó)細(xì)菌戰(zhàn)檔案研究形成互證聯(lián)系,成為亟待解決的領(lǐng)域問(wèn)題。本文嘗試從檔案的數(shù)智化建設(shè)、內(nèi)容的數(shù)智化挖掘和數(shù)智化形態(tài)傳播三個(gè)維度,探索新解密伯力審判檔案的數(shù)智化實(shí)踐道路,以為我國(guó)在國(guó)際社會(huì)的細(xì)菌戰(zhàn)話語(yǔ)權(quán)建設(shè)貢獻(xiàn)力量。
關(guān)鍵詞:伯力審判;細(xì)菌戰(zhàn);檔案數(shù)智化
中圖分類(lèi)號(hào):K265" "文獻(xiàn)標(biāo)志碼:A" "文章編號(hào):1002-2589(2024)06-0080-03
俄羅斯新解密伯力審判檔案作為揭示侵華日軍細(xì)菌戰(zhàn)罪行的關(guān)鍵史料,其研究對(duì)于還原歷史真相、維護(hù)二戰(zhàn)勝利成果具有不可替代的重要性。數(shù)智時(shí)代背景下,如何利用先進(jìn)技術(shù)手段系統(tǒng)保護(hù)、整理和深入挖掘檔案成為七三一問(wèn)題研究面臨的時(shí)代課題,本文將圍繞科技賦能伯力審判檔案研究展開(kāi)探討。
一、進(jìn)一步挖掘俄藏伯力審判檔案的現(xiàn)實(shí)意義
由于美國(guó)曾明確表示,在東京審判框架內(nèi)不會(huì)審議與發(fā)展和使用細(xì)菌武器有關(guān)的問(wèn)題[1]。1950年,蘇聯(lián)政府在伯力審判結(jié)束后,以多國(guó)文字的形式向世界公布了部分伯力審判文件。審判至今,囿于俄羅斯檔案保密規(guī)定,我國(guó)學(xué)界無(wú)法對(duì)俄檔案獲取更多信息。但在2021年,俄羅斯啟動(dòng)了“1949年哈巴羅夫斯克審判檔案”項(xiàng)目并以線上形式對(duì)外公布,至今已發(fā)掘出370份有關(guān)伯力審判的檔案,以此為線索又可查閱到4 300余條檔案信息[2]。本次公布的檔案涉及俄羅斯境內(nèi)14家檔案機(jī)構(gòu),檔案形式多樣,除審訊記錄外,還有語(yǔ)音檔案、新聞報(bào)道、漫畫(huà)等形式。內(nèi)容涉及侵華日軍第七三一部隊(duì)和第一○○部隊(duì)的核心罪證,這對(duì)我國(guó)針對(duì)該領(lǐng)域的研究意義重大。
(一)明晰罪行史實(shí)
伯力審判檔案的線上公布,其遵循國(guó)際法的審判流程以及突出的證據(jù)屬性,對(duì)我國(guó)七三一檔案系統(tǒng)挖掘與保護(hù)有著顯著意義。我國(guó)現(xiàn)存七三一部隊(duì)罪行檔案包含戰(zhàn)時(shí)與戰(zhàn)后調(diào)查檔案,戰(zhàn)時(shí)檔案以“特別移送”檔案為主。新解密檔案生動(dòng)還原了伯力審判過(guò)程。一方面,它更加詳盡地重現(xiàn)了歷史場(chǎng)景;另一方面,基于新解密出來(lái)的供詞,我們對(duì)日本侵華日軍細(xì)菌戰(zhàn)的作戰(zhàn)計(jì)劃、實(shí)施過(guò)程、隊(duì)伍建設(shè)等歷史真相有了更加清晰的認(rèn)識(shí)。
(二)發(fā)現(xiàn)罪行新線索
新解密的線上檔案中,細(xì)菌戰(zhàn)戰(zhàn)俘的系統(tǒng)審訊筆錄尤為引人關(guān)注?;谝酝徟泄_(kāi)的資料,我們只知道部分結(jié)果,而對(duì)其過(guò)程并不清楚。以山田乙三審訊筆錄為例,國(guó)內(nèi)資料有載:1949年11月3日、11月5日、11月17日、12月1日、12月6日,以及12月26日早庭。新解密的資料顯示,在1947年2月27日,山田就已經(jīng)受審。從公開(kāi)的這些審訊記錄來(lái)看,能夠更加清楚地了解到日本侵華細(xì)菌戰(zhàn)的罪行細(xì)節(jié),是對(duì)我國(guó)現(xiàn)有七三一問(wèn)題研究的重要補(bǔ)充。依據(jù)這些檔案,還可通過(guò)特定視角深入理解冷戰(zhàn)背景下東亞國(guó)際關(guān)系格局的演變[3]。
(三)完善罪證鏈條
當(dāng)前國(guó)際社會(huì)的細(xì)菌戰(zhàn)檔案呈現(xiàn)多國(guó)共存態(tài)勢(shì),包括中國(guó)、美國(guó)、日本和俄羅斯。以往我國(guó)主要關(guān)注日美檔案收集,對(duì)俄羅斯的館藏檔案知之甚少。本次線上解密后,我們可知蘇聯(lián)檔案的性質(zhì)迥異于日美兩國(guó)。它不僅能與我國(guó)七三一遺址檔案文物相互印證,還可通過(guò)綜合比對(duì)中美日俄等國(guó)多邊檔案的路徑,構(gòu)建侵華日軍細(xì)菌戰(zhàn)完整罪證鏈條。
二、伯力審判檔案數(shù)智化保護(hù)路徑
2021年俄羅斯檔案公開(kāi)窗口期非常珍貴,然而傳統(tǒng)歷史檔案翻譯與整理方法難以在短期內(nèi)取得顯著成果。哈爾濱市社會(huì)科學(xué)院七三一問(wèn)題國(guó)際研究中心同哈爾濱工業(yè)大學(xué)俄語(yǔ)系和人工智能實(shí)驗(yàn)室成立了“七三一檔案翻譯與傳播專(zhuān)題工作組”,探索伯力審判檔案的“新舊”系統(tǒng)保護(hù)與挖掘的數(shù)智化路徑。
(一)檔案數(shù)智化整理
2021年新解密的檔案,其史料價(jià)值無(wú)需贅述。在應(yīng)用方面,最現(xiàn)實(shí)的問(wèn)題就是數(shù)字化的整理。該批檔案語(yǔ)言復(fù)雜,字體風(fēng)格多樣,手寫(xiě)和打印內(nèi)容混雜,數(shù)字和字母差別對(duì)應(yīng)。傳統(tǒng)OCR(Optical Character Recognition)技術(shù)在精準(zhǔn)識(shí)別方面不盡如人意。為此,我們提出了一種基于視覺(jué)大語(yǔ)言模型(Vision-Language Model, VLM)的兩階段框架。視覺(jué)特征隨后經(jīng)過(guò)視覺(jué)—語(yǔ)言映射器,與語(yǔ)言信息進(jìn)行多模態(tài)融合,其特征被映射到共享嵌入空間中,由解碼器生成初步的文本識(shí)別結(jié)果,使模型能夠更精準(zhǔn)地應(yīng)對(duì)復(fù)雜俄語(yǔ)文檔的識(shí)別任務(wù)。此外,引入了中俄大語(yǔ)言模型,專(zhuān)注于糾錯(cuò)與格式優(yōu)化。有效提升了俄語(yǔ)檔案OCR的識(shí)別準(zhǔn)確性。通過(guò)采用基于視覺(jué)大語(yǔ)言模型的兩階段框架,可以顯著提升俄語(yǔ)檔案OCR的識(shí)別精準(zhǔn)度和輸出文檔的質(zhì)量。(見(jiàn)圖1)
(二)檔案數(shù)智化挖掘
2021年線上解密檔案是俄羅斯系統(tǒng)整合二戰(zhàn)檔案的一個(gè)縮影。近年來(lái),由俄羅斯政府主導(dǎo)、民間組織積極參與的二戰(zhàn)檔案普查行動(dòng)一直在進(jìn)行。其中較具代表性的是“搜索行動(dòng)”組織,共號(hào)召了45 000多名搜索隊(duì)員,組成1 500多個(gè)搜索隊(duì),歷時(shí)8年完成了俄羅斯境內(nèi)二戰(zhàn)檔案的“摸家底”。新解密俄藏伯力審判檔案可以同我國(guó)境內(nèi)多地的細(xì)菌戰(zhàn)博物館和遺址形成供詞和證物的互證關(guān)系,借助事理圖譜,可以在關(guān)鍵人物、時(shí)間線、地點(diǎn)、事件等重要?dú)v史參數(shù)上,清晰呈現(xiàn)檔案的知識(shí)層,也會(huì)將新解密檔案同我國(guó)檔案互證關(guān)系進(jìn)一步具體化。與此同時(shí),通過(guò)對(duì)檔案的知識(shí)抽取,還可挖掘不同事件關(guān)系,展現(xiàn)細(xì)菌戰(zhàn)檔案內(nèi)部、檔案與檔案之間、檔案同戰(zhàn)時(shí)語(yǔ)境、檔案同當(dāng)代國(guó)際形勢(shì)的復(fù)雜強(qiáng)弱邏輯關(guān)聯(lián),實(shí)現(xiàn)從史料研究跨越到多維學(xué)科研究。(見(jiàn)圖2)
在伯力審判的12名細(xì)菌戰(zhàn)戰(zhàn)犯和多名證人中,證詞最多的一名證人發(fā)揮著至關(guān)重要的作用。東京審判期間,蘇聯(lián)將川島清、柄澤十三夫押解到日本。通過(guò)事理圖譜的方法,我們初步還原了川島清的職業(yè)生涯。如圖2所示,川島清身居細(xì)菌戰(zhàn)研究與行政中樞,擔(dān)任過(guò)本部第一部部長(zhǎng)、第三部部長(zhǎng)和第四部部長(zhǎng)、總務(wù)部部長(zhǎng),不僅親自領(lǐng)導(dǎo)繁殖大批致命的細(xì)菌,還使用活人進(jìn)行細(xì)菌實(shí)驗(yàn)。這種可視化的圖譜呈現(xiàn),縮減了翻閱傳統(tǒng)史料的時(shí)間,更將其關(guān)系鏈條呈現(xiàn)得一覽無(wú)余。
(三)“數(shù)字人”建設(shè)
基于數(shù)智化的檔案整理和挖掘,在細(xì)菌戰(zhàn)構(gòu)筑的國(guó)內(nèi)和跨境記憶共同建設(shè)中,數(shù)智化也可活化記憶的敘事形式,加快新解密檔案進(jìn)入公眾視野。首先,采用大模型驅(qū)動(dòng)+RAG(Retrieval-Augmented Generation),確保每一次回答都能基于翔實(shí)、準(zhǔn)確的歷史數(shù)據(jù),減少因算法局限導(dǎo)致的事實(shí)性錯(cuò)誤。其次,考慮到用戶的多樣化需求,我們?cè)跀?shù)字人的設(shè)計(jì)上給予了高度的個(gè)性化選擇,無(wú)論是音色還是形象,都可以根據(jù)個(gè)人偏好進(jìn)行調(diào)整,讓每位用戶都能找到最適合自己學(xué)習(xí)方式的歷史伙伴。數(shù)字人可將歷史記憶與陳列展覽、宣傳教育結(jié)合起來(lái),在愛(ài)國(guó)主義和國(guó)防教育過(guò)程中注入AI元素,注重受眾對(duì)歷史的真聽(tīng)真看真感受。
三、伯力審判檔案研究數(shù)智化道路前瞻
長(zhǎng)期以來(lái),我國(guó)七三一問(wèn)題研究都存在罪證檔案不完整的“硬傷”。2021年俄羅斯線上解密的檔案僅是其細(xì)菌戰(zhàn)檔案的一部分,除已知伯力審判錄音檔案外,審判記錄、戰(zhàn)犯日記等新線索不斷涌現(xiàn)[4]。
(一)引入大語(yǔ)言模型,加快已有檔案的翻譯與整理工作
大數(shù)據(jù)分析技術(shù)在伯力審判檔案研究中的應(yīng)用,將為深入剖析日本細(xì)菌戰(zhàn)罪行的全貌與系統(tǒng)性特征提供強(qiáng)有力的工具。通過(guò)對(duì)檔案中的各類(lèi)數(shù)據(jù)進(jìn)行大規(guī)模、多維度的深度挖掘與關(guān)聯(lián)分析,歷史學(xué)研究人員能夠突破傳統(tǒng)研究方法的局限,探尋不同檔案資料之間隱藏的內(nèi)在聯(lián)系與邏輯關(guān)系。對(duì)不同時(shí)期罪證檔案的關(guān)聯(lián)分析,能夠清晰地梳理出細(xì)菌戰(zhàn)從策劃、籌備到實(shí)施、擴(kuò)散的歷史脈絡(luò)與演進(jìn)規(guī)律。同時(shí),借助數(shù)據(jù)建模與先進(jìn)的算法分析技術(shù),能夠從海量檔案數(shù)據(jù)中發(fā)現(xiàn)隱藏于其中的潛在規(guī)律與發(fā)展趨勢(shì),如細(xì)菌戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)與戰(zhàn)爭(zhēng)局勢(shì)變化之間的內(nèi)在關(guān)聯(lián)等。這些基于大數(shù)據(jù)分析得出的研究成果,為歷史學(xué)研究提供了更為豐富、多元且具有深度的視角與證據(jù)支持,有助于構(gòu)建更為系統(tǒng)、科學(xué)且全面的日本細(xì)菌戰(zhàn)罪行研究體系,從而在歷史學(xué)研究領(lǐng)域更精準(zhǔn)地還原歷史真相,傳承歷史記憶。
(二)采用大模型技術(shù),構(gòu)建細(xì)菌戰(zhàn)國(guó)際話語(yǔ)陣營(yíng)
我國(guó)是日軍細(xì)菌戰(zhàn)的第一受害國(guó),侵華日軍在中國(guó)犯下了滔天罪行。七三一部隊(duì)雖被稱(chēng)為“東方奧斯維辛”,但其社會(huì)影響力與之相去甚遠(yuǎn),西方社會(huì)對(duì)其知之甚少。細(xì)菌戰(zhàn)的受害記憶是個(gè)體到集體的創(chuàng)傷記憶[5],也是地方到民族的國(guó)家創(chuàng)傷記憶,更是不同民族的人類(lèi)創(chuàng)傷記憶。大模型技術(shù)的引入,可以打破檔案的“物理邊界”,共同構(gòu)筑細(xì)菌戰(zhàn)記憶共同體,凝聚細(xì)菌戰(zhàn)話語(yǔ)權(quán)的共同意識(shí)。強(qiáng)大的算力讓不同民族、不同文化的向往和平的人,都能走進(jìn)“共同的細(xì)菌戰(zhàn)記憶場(chǎng)”。同時(shí),還可依托“二戰(zhàn)博物館聯(lián)盟”,實(shí)現(xiàn)細(xì)菌戰(zhàn)主題博物館的國(guó)際合作,增強(qiáng)國(guó)際社會(huì)對(duì)日本軍國(guó)主義犯罪暴行的歷史認(rèn)同,形成和平共識(shí),助力七三一罪證檔案走出龍江,進(jìn)入民族和世界記憶。
(三)應(yīng)用大模型技術(shù),提升細(xì)菌戰(zhàn)傳播效能
“數(shù)字人”建設(shè)是活化細(xì)菌戰(zhàn)傳播形式的嘗試,未來(lái)如何更加有效地將大模型技術(shù)引入細(xì)菌戰(zhàn)傳播領(lǐng)域,形成細(xì)菌戰(zhàn)的數(shù)智化傳播模式,仍需多方支持和探索。面對(duì)大模型時(shí)代的傳媒媒介泛化,大模型技術(shù)在傳播方式和傳播效能兩個(gè)層面或可助力細(xì)菌戰(zhàn)的傳播工作。在創(chuàng)意傳播形式方面,大模型技術(shù)拓展“歷史+”的傳播內(nèi)容,生成各類(lèi)主題視覺(jué)元素,如主題插圖、微電影、影視特效等,可以活化罪證“講述”形式,將歷史記憶與陳列展覽、宣傳教育相結(jié)合??梢曰罨镒C“教育”形式,在愛(ài)國(guó)主義和國(guó)防教育基地建設(shè)中融入虛擬和仿真元素。在傳播效能方面,基于大模型技術(shù)迅速識(shí)別熱點(diǎn)話題和輿情趨勢(shì),繼而做出情感和邏輯關(guān)聯(lián)分析,更加有效地把握傳播動(dòng)態(tài)和方向。
參考文獻(xiàn):
[1]Тужилин С. В." Совершенные преступления являются гро-мадным злодеянием против человечества//Военно-исто-рический журнал. 2020. № 12. С. 23.
[2]宮文婧,鞠坤依.俄羅斯新解密伯力檔案的情況概述、價(jià)值闡釋與現(xiàn)實(shí)意義[J].學(xué)理論,2024(4):69-73.
[3]柳豐華.俄烏沖突促使俄羅斯轉(zhuǎn)向中國(guó)[J].俄羅斯學(xué)刊,2024(5):5-23.
[4]趙士見(jiàn),宮文婧.俄羅斯新解密伯力審判檔案探析[J].中國(guó)檔案,2024(8) :61-63.
[5]宮文婧,王宇,石巍巍.從地方記憶到國(guó)家記憶:侵華日軍第七三一部隊(duì)罪行檔案文獻(xiàn)[J].檔案與建設(shè),2023(12):92-94.
收稿日期:2024-11-29
基金項(xiàng)目:國(guó)家社科基金抗日戰(zhàn)爭(zhēng)研究專(zhuān)項(xiàng)工程“侵華日軍細(xì)菌戰(zhàn)罪行史料整理及專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)”(16KZD014);黑龍江省哲學(xué)社會(huì)科學(xué)研究規(guī)劃項(xiàng)目《東京審判后蘇聯(lián)與新中國(guó)對(duì)日本細(xì)菌戰(zhàn)犯的審判研究》(22ZSB259)
作者簡(jiǎn)介:賈明秀,講師,博士,從事俄漢翻譯理論與實(shí)踐、文化外譯、話語(yǔ)分析研究;李寶航,碩士研究生,從事大語(yǔ)言模型、機(jī)器翻譯研究。