近日,由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD刷新了排名,AI的閱讀能力在歷史上首次超越了人類。阿里巴巴方面稱,其憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,并且超越了人類82.304的成績(jī)。
據(jù)悉,SQuAD比賽構(gòu)建了一個(gè)大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬個(gè)問題),文章來源于500多篇維基百科文章。AI在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個(gè)基于文章內(nèi)容的問題,然后與標(biāo)準(zhǔn)答案進(jìn)行比對(duì),得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果。
“我們的機(jī)器閱讀理解準(zhǔn)確率超過人類”,阿里巴巴相關(guān)人員稱,此次技術(shù)的重大突破源于研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時(shí)的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。
阿里巴巴自然語言處理首席科學(xué)家司羅表示,對(duì)于解決wiki類客觀知識(shí)問答,機(jī)器已經(jīng)取得非常好的結(jié)果,將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會(huì)思考”的終極目標(biāo)邁進(jìn)。今后,研發(fā)的重點(diǎn)在于把這項(xiàng)技術(shù)真正應(yīng)用在廣大實(shí)際場(chǎng)景,讓機(jī)器智能普惠生活。此外,該自然語言處理團(tuán)隊(duì)還支撐了阿里巴巴整個(gè)生態(tài)的技術(shù)需求,由他們研發(fā)的AliNLP自然語言技術(shù)平臺(tái)每日調(diào)用1200億+次,Alitranx翻譯系統(tǒng)提供20個(gè)語種在線服務(wù)日調(diào)用量超過7億+次。(陳曲)endprint