在新聞發(fā)布會(huì)上,幫助DeepMind公司來(lái)創(chuàng)建該模型的歷史學(xué)家,同時(shí)也是一位機(jī)器學(xué)習(xí)專(zhuān)家的西婭·薩默西爾德告訴媒體,古代銘文有著十分重要的意義,因?yàn)樗枪┖笕肆私猱?dāng)時(shí)的思想、語(yǔ)言和社會(huì)的最直接的證據(jù)來(lái)源,尤其是因?yàn)樗怯晒糯酥苯幼约壕帉?xiě)的。
古希臘歷史銘文,這樣的銘文為了解古希臘的思想、語(yǔ)言和社會(huì)提供了第一手證據(jù)
然而,面對(duì)這樣寶貴的歷史證據(jù),現(xiàn)代人卻經(jīng)常感到鞭長(zhǎng)莫及,因?yàn)樵谖墨I(xiàn)展示的歷史真實(shí)面貌與當(dāng)代歷史學(xué)家之間隔著一道鴻溝,那就是要讀懂這些古代語(yǔ)言,也就是需要對(duì)這些古代文本的“翻譯”。這道鴻溝也很遺憾地導(dǎo)致人類(lèi)很難充分利用所有現(xiàn)有的歷史文獻(xiàn)相關(guān)數(shù)據(jù)。
此外,這些經(jīng)歷了歲月風(fēng)霜雨打的歷史銘文經(jīng)常由于年代久遠(yuǎn)已經(jīng)受到了不同程度的損壞,這也進(jìn)一步增加了修復(fù)這些歷史文獻(xiàn)的挑戰(zhàn)性。另一個(gè)難點(diǎn)是,由于古代的歷史銘文使用的書(shū)寫(xiě)工具不像現(xiàn)代的書(shū)寫(xiě)工具使用的多是紙張等有機(jī)材料,它們通常是刻在石頭或金屬等無(wú)機(jī)材料上,使得歷史學(xué)家無(wú)法使用放射性碳測(cè)年之類(lèi)的方法來(lái)確定它們的書(shū)寫(xiě)時(shí)間。
歷史學(xué)家薩默西爾德說(shuō),通常為了解決上面這些困難,研究銘文的歷史學(xué)家通過(guò)在類(lèi)似的其他銘文中尋找文本或上下文之間的相似之處,來(lái)探測(cè)銘文的歷史年代的。但是,這些并不足夠。
而發(fā)現(xiàn)潛在信息以及潛在模式規(guī)律這一點(diǎn),正是機(jī)器學(xué)習(xí)擅長(zhǎng)的地方,也是人工智能可以幫助歷史學(xué)家的地方。
DeepMind新發(fā)布的使用人工智能來(lái)助力考古的軟件名為伊薩卡,該軟件已經(jīng)經(jīng)過(guò)了在一個(gè)包含大約7.8608萬(wàn)條古希臘銘文的數(shù)據(jù)集上的訓(xùn)練,而且這些銘文中的每一條都標(biāo)注了元數(shù)據(jù),其中描述了由歷史學(xué)家考察出來(lái)的銘文的書(shū)寫(xiě)地點(diǎn)和時(shí)間。而伊薩卡所做的,就是像所有其他機(jī)器學(xué)習(xí)系統(tǒng)一樣,在這些信息中尋找模式和規(guī)律,并利用復(fù)雜的數(shù)學(xué)模型來(lái)對(duì)這些信息進(jìn)行編碼,然后進(jìn)一步使用這些推測(cè)出的信息來(lái)對(duì)其他銘文的內(nèi)容、編寫(xiě)地點(diǎn)和年限進(jìn)行推斷。
古希臘銘文往往是零散的,Ithaca軟件可以建議缺少哪些字母
有關(guān)這款人工智能考古模型工具伊薩卡的論文也已經(jīng)發(fā)表在了《自然》雜志上,在這篇論文中,創(chuàng)建該模型的科學(xué)家表示,在使用伊薩卡對(duì)受損歷史銘文進(jìn)行修復(fù)的測(cè)試中,發(fā)現(xiàn)伊薩卡的準(zhǔn)確率是62%。另外在從古代世界的84個(gè)地區(qū)推斷某一歷史銘文的具體書(shū)寫(xiě)地點(diǎn)方面,伊薩卡的準(zhǔn)確率是71%,而在推斷歷史銘文的書(shū)寫(xiě)時(shí)間方面,伊薩卡可以將銘文的書(shū)寫(xiě)日期追溯到誤差不超過(guò)30年。
但是薩默西爾德也強(qiáng)調(diào),盡管伊薩卡可以給我們提供十分有幫助的統(tǒng)計(jì)數(shù)據(jù),但是必須要記住伊薩卡是不能獨(dú)立于人類(lèi)專(zhuān)業(yè)知識(shí)而運(yùn)作的。以及伊薩卡所能做的,只是為歷史學(xué)家在基于傳統(tǒng)考古方法收集數(shù)據(jù)的基礎(chǔ)上提供一些建議,作為歷史學(xué)家解讀歷史文獻(xiàn)的許多輔助工具中的一種。也就是說(shuō),伊薩卡絕不是一個(gè)可以全自動(dòng)工作的人工智能歷史學(xué)家。
除了作為歷史學(xué)家的輔助工具,伊薩卡的更重要的價(jià)值,恐怕還在于它的靈活性。薩默西爾德也強(qiáng)調(diào)說(shuō),雖然這次發(fā)布的伊薩卡只接受過(guò)古希臘銘文的訓(xùn)練,但可以很容易地對(duì)其進(jìn)行配置,讓它進(jìn)行其他古代文字的訓(xùn)練,進(jìn)而可以解讀許多不同的古代文獻(xiàn)。伊薩卡這一模型的架構(gòu)賦予了它高度的靈活性,它可以適用于任何古代語(yǔ)言,例如拉丁語(yǔ)、瑪雅楔形文字等,而且它也將適用于任何其他書(shū)寫(xiě)媒介上的古代文獻(xiàn),例如紙莎草紙、手稿等等。伊薩卡可以探索的,還有很多很多。(綜合整理報(bào)道)(編輯/多洛米)
海外星云 2022年8期