□ 文 吳 甜
作者:百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室副主任
新技術(shù)的使命是要為人類服務(wù)的,抗疫過(guò)程中,大數(shù)據(jù)和人工智能技術(shù)發(fā)揮了很大的作用。
人工智能是第四次工業(yè)革命核心驅(qū)動(dòng)力量,已經(jīng)在各行各業(yè)廣泛地應(yīng)用起來(lái)。新技術(shù)的使命是要為人類服務(wù)的,在抗擊新冠病毒帶來(lái)的這場(chǎng)疫情過(guò)程中,大數(shù)據(jù)和人工智能技術(shù)發(fā)揮了很多作用。在抗疫一線,人工智能和大數(shù)據(jù)帶來(lái)的新產(chǎn)品和解決方案起到了重要作用。
通過(guò)數(shù)據(jù)分析的能力,能夠了解到整個(gè)疫情的發(fā)展態(tài)勢(shì),追蹤人群流動(dòng)情況,能夠?yàn)橛嘘P(guān)機(jī)構(gòu)從大數(shù)據(jù)分析角度給予輔助決策的幫助。在很多大規(guī)模重復(fù)性有接觸風(fēng)險(xiǎn)的場(chǎng)景下,篩查工作是必不可少的。AI測(cè)溫可以提供免接觸的測(cè)溫能力,在人群密集的情況下,能夠追蹤人群當(dāng)中是否有體溫超過(guò)了安全線的人;智能語(yǔ)音對(duì)話系統(tǒng)也可代替社區(qū)人員進(jìn)行大量的尋訪和隨訪工作,大幅提升了在排查工作中的效率;醫(yī)學(xué)科研方面,AI也在為病毒檢測(cè)、藥物研發(fā)等領(lǐng)域提供新的工具,帶來(lái)效率的提升。接下來(lái)圍繞這三方面展開(kāi)論述。
首先,大數(shù)據(jù)技術(shù)在支持疫情科學(xué)防控方面的作用。從群體分析的角度來(lái)說(shuō),傳統(tǒng)的流行病分析預(yù)測(cè)當(dāng)中,會(huì)采用很多的病例數(shù)據(jù)來(lái)進(jìn)行分析,比如說(shuō)確診者、疑似者,或者是密切接觸者,人群流動(dòng)和接觸是帶來(lái)疫情變化非常重要的因素。通過(guò)百度地圖上的時(shí)空大數(shù)據(jù),分析和預(yù)測(cè)疫區(qū)人員的流動(dòng)趨勢(shì),能夠識(shí)別出重點(diǎn)城市和區(qū)域。通過(guò)應(yīng)用人群的整體性流動(dòng)分析技術(shù),能夠知道人群走勢(shì),比如在武漢和湖北,在春節(jié)前向外流出的人群走勢(shì),流向了哪些重點(diǎn)城市和區(qū)域,進(jìn)而向相關(guān)機(jī)構(gòu)提供決策的幫助,能夠去分析未來(lái)一段時(shí)間內(nèi)疫情的發(fā)展態(tài)勢(shì),能夠開(kāi)展相應(yīng)的管控措施,以及儲(chǔ)備相應(yīng)的醫(yī)療物資。
對(duì)于個(gè)體來(lái)說(shuō),在這次整個(gè)抗疫過(guò)程中,風(fēng)險(xiǎn)人員的識(shí)別是非常重要的。因?yàn)檫@次病情傳播力非常強(qiáng),潛伏期非常長(zhǎng),在傳統(tǒng)方法當(dāng)中,會(huì)進(jìn)行面對(duì)面地訪談去了解人員的流動(dòng)情況,而實(shí)際上這樣的方法有三個(gè)缺點(diǎn);首先,它非常耗費(fèi)時(shí)間和人力。第二,這種訪談不一定完全真實(shí)可靠。第三,很多潛伏期人員和密切接觸者可能都不一定知道自己到底在什么時(shí)候和患者有過(guò)接觸,有可能是在同一個(gè)超市買了菜,或者一起乘坐了一輛公交車,或者在一個(gè)餐館吃了飯。像這些數(shù)據(jù),通過(guò)大數(shù)據(jù)的分析,能夠盡可能追蹤到每一個(gè)人的親密接觸人員。通過(guò)這樣的分析之后,得到了親密接觸人員的流向和數(shù)據(jù),也能夠?yàn)檎麄€(gè)疫情的管控和治理提供非常有力的支持幫助。在地域遷徙上,百度地圖推出的遷徙畫像,能夠看出全國(guó)的人員流動(dòng)情況,以及高速路網(wǎng)實(shí)時(shí)監(jiān)控,能看到整個(gè)宏觀的交通情況,在春運(yùn)這樣一個(gè)特殊時(shí)間段內(nèi),能夠看到人員的流動(dòng)變化。今天,很多企業(yè)已經(jīng)進(jìn)入到復(fù)工復(fù)產(chǎn)的狀態(tài),也能夠提供給企業(yè)復(fù)工復(fù)產(chǎn)相應(yīng)的信息和決策的幫助。
偏向于群體和宏觀的之外,對(duì)于個(gè)人防控來(lái)說(shuō),其實(shí)每一個(gè)人也會(huì)需要有貼心的防疫功能。舉兩個(gè)例子,一個(gè)是疫情小區(qū)地圖,一個(gè)是發(fā)熱門診地圖。這些都是在百度地圖上開(kāi)放給用戶使用的,基于地圖上的大數(shù)據(jù)進(jìn)行了智能預(yù)測(cè)。智能預(yù)測(cè)確診人員所在小區(qū)周圍,有哪些地方是有可能產(chǎn)生人員聚集的高危地區(qū),提供給用戶之后,能夠提高民眾的聯(lián)防聯(lián)控意識(shí),避免民眾再進(jìn)入到高危地區(qū)當(dāng)中,能夠使得整個(gè)抗疫過(guò)程深入到基層開(kāi)展。
百度的時(shí)空大數(shù)據(jù)技術(shù),從技術(shù)邏輯上來(lái)說(shuō),最底層是有大量的基礎(chǔ)數(shù)據(jù),對(duì)人類社會(huì)、信息空間、物理世界進(jìn)行了三元描述。在進(jìn)行了大量時(shí)空模型的建模,通過(guò)算法組建支撐到上面的應(yīng)用,百度的大數(shù)據(jù)應(yīng)該說(shuō)是積累了超過(guò)10年的時(shí)間,擁有非常廣泛的、大量的數(shù)據(jù),而這些數(shù)據(jù)本身具有非常強(qiáng)的移動(dòng)互聯(lián)網(wǎng)屬性及高精度屬性。一方面是時(shí)空大數(shù)據(jù)所提供的更宏觀的分析和支持,另一方面也可以通過(guò)互聯(lián)網(wǎng)產(chǎn)品上的用戶需求對(duì)民眾的關(guān)注點(diǎn)進(jìn)行分析,舉個(gè)例子:首先可以通過(guò)對(duì)大數(shù)據(jù)的分析,去時(shí)刻追蹤大家所關(guān)心的科普話題都有哪些。比如說(shuō),從穿戴防護(hù)的科普問(wèn)題當(dāng)中可以看到,排在第一位的是口罩多久更換一次,還有像消毒防護(hù)的科普問(wèn)題、傳播方式科普問(wèn)題,以及癥狀判別的科普問(wèn)題,我們將這樣一系列的數(shù)據(jù)分析結(jié)果提供給中國(guó)疾控中心,可以針對(duì)大眾所關(guān)注的疫情問(wèn)題給予權(quán)威的科普素材跟進(jìn),使得民眾可以在自己最關(guān)心的話題上得到解答。
復(fù)工復(fù)產(chǎn)階段,通過(guò)大數(shù)據(jù)對(duì)疫情所產(chǎn)生的產(chǎn)業(yè)影響關(guān)注分析,也可以看到在不同地區(qū),疫情對(duì)不同行業(yè)所造成的影響。不同地區(qū)的人們關(guān)注度是不一樣的,通過(guò)地域?qū)⑷巳簞澐种罂梢钥吹剑褐槿堑貐^(qū)疫情對(duì)制造業(yè)的影響關(guān)注度非常高;長(zhǎng)三角、京津冀地區(qū)疫情對(duì)房企的影響關(guān)注度很高;京津冀地區(qū)對(duì)在線教育的關(guān)注度都很高。這些地區(qū),大家普遍的反映是疫情對(duì)餐飲業(yè)的影響是非常
AI
AI可替代大規(guī)模、重復(fù)性、有接觸風(fēng)險(xiǎn)的篩查工作一致的。另外,對(duì)疫情期間復(fù)工的人們關(guān)注度分析也能看得到,返程復(fù)工,感染肺炎是否算工傷,以及疫情對(duì)失業(yè)的影響,其實(shí)都是民眾關(guān)注非常高的話題。在不同地區(qū)也有不同表現(xiàn)。所有的分析當(dāng)中發(fā)現(xiàn),蘇州對(duì)幾乎所有的復(fù)工復(fù)產(chǎn)相關(guān)話題關(guān)注度都非常高,所以在整個(gè)復(fù)工復(fù)產(chǎn)當(dāng)中,可以對(duì)蘇州給予更多的關(guān)注和支持。以上是大數(shù)據(jù)技術(shù)在疫情分析方面的應(yīng)用和作用。
在篩查管理方面,在很多人流密集的地方,比如說(shuō)像機(jī)場(chǎng)、地鐵、火車站等等,隨著返程復(fù)工高峰的到來(lái),相信有越來(lái)越多的人在公共場(chǎng)合不斷出現(xiàn)。在公共場(chǎng)合上,我們配備了一些測(cè)溫的措施,但是傳統(tǒng)額溫槍慢,特別容易造成人群密集的地方產(chǎn)生更多人的等待,容易產(chǎn)生更多交叉感染的可能性。百度推出的多人體溫快速檢測(cè)解決方案,是希望在這樣的場(chǎng)合,在一定的區(qū)域范圍類有一臺(tái)AI測(cè)溫儀,能夠通過(guò)遠(yuǎn)程識(shí)別對(duì)這個(gè)區(qū)域進(jìn)行監(jiān)控。它的工作方法是通過(guò)紅外測(cè)溫傳感器監(jiān)測(cè)一片區(qū)域,可以去識(shí)別出來(lái)有體溫可能超過(guò)了標(biāo)準(zhǔn)的人。下一步會(huì)經(jīng)過(guò)人臉檢測(cè)找到和跟蹤相應(yīng)人員,這時(shí)工作人員就可以去進(jìn)行下一步的確認(rèn)和識(shí)別。
在這套方案當(dāng)中,其實(shí)可以做到識(shí)別的精度,最佳精度是1至2米,可以達(dá)到免接觸的測(cè)試,識(shí)別準(zhǔn)確率整體有90%以上,每分鐘最大通行人數(shù)達(dá)到了200以上。看一看AI測(cè)溫背后的技術(shù),除了紅外的分析,還有人臉識(shí)別技術(shù)。這里需要對(duì)人臉的關(guān)鍵點(diǎn)進(jìn)行精準(zhǔn)定位,包括到臉頰、眉、眼、口、鼻等人體五官及輪廓的150個(gè)關(guān)鍵點(diǎn)。在這樣一個(gè)特殊時(shí)候,很多行人都是佩戴著口罩,我們也剛剛開(kāi)發(fā)了口罩識(shí)別的模型法,可以在佩戴口罩情況下,依然可以對(duì)人臉有非常精準(zhǔn)的檢測(cè)能力。同時(shí),通過(guò)的模型小型化的技術(shù),使得模型在離線環(huán)境下,能夠在嵌入式設(shè)備上有10倍以上的速度提升,并且是無(wú)損的。所以,整套方案在公共場(chǎng)合里能夠免接觸進(jìn)行快速地、準(zhǔn)確地測(cè)溫工作。這套方案已經(jīng)在北京地鐵站布下了19個(gè)檢測(cè)點(diǎn)。
除了人群密集環(huán)境下的篩查,在整個(gè)抗疫過(guò)程中,一線社區(qū)工作人員也投入大量精力在不斷進(jìn)行尋訪和隨訪。百度的應(yīng)用對(duì)話技術(shù)服務(wù),推出了智能外呼系統(tǒng),能夠支持社區(qū)疫情快速篩查和摸底。它包含有流動(dòng)人員的排查、本地居民的排查和回訪,以及特定人群通知三項(xiàng)功能。它可以像社區(qū)工作人員一樣,去不斷地給相應(yīng)人員通過(guò)電話方式,進(jìn)行排查和確認(rèn),并且可以把所有信息都能去智能地自動(dòng)化、結(jié)構(gòu)化下來(lái),快速進(jìn)行因襲的錄入。這樣一套系統(tǒng),在日撥打數(shù)量上是大幅超出了人工排查能力;工作狀態(tài)上可以無(wú)任何影響因素標(biāo)準(zhǔn)化地執(zhí)行任務(wù);能夠在信息收集上高效率、高質(zhì)量、直接地進(jìn)行自動(dòng)的記錄。這樣一套平臺(tái)已經(jīng)在北京海淀上地街道辦、陜西西安、延安、上海寶山、浙江撫州瑞安市等十幾個(gè)地區(qū)投入使用了。外呼的總量已經(jīng)超過(guò)百萬(wàn)次,這樣一套系統(tǒng)大幅地提升了隨訪效率。背后的人工智能技術(shù)是有語(yǔ)音識(shí)別能力,自然語(yǔ)音理解能力及構(gòu)建知識(shí)圖譜能力。
這樣的技術(shù)系統(tǒng),不單單是可以提供給社區(qū)作為外呼系統(tǒng)使用,在百度的語(yǔ)言與理解交互技術(shù)平臺(tái)UNIT上,上線了疫情小助手技能,既可以通過(guò)防疫知識(shí)的知識(shí)圖譜構(gòu)建,形成防疫知識(shí)的隨問(wèn)隨答,對(duì)疫情信息也進(jìn)行了官方權(quán)威數(shù)據(jù)的接入,還可以實(shí)時(shí)地查詢,通過(guò)口語(yǔ)化的問(wèn)詢能夠使普通的使用者也可以用非常方便的方式,快速獲取到疫情相關(guān)的信息。
在這個(gè)助手上,也可以幫助進(jìn)行大量人群的每日重復(fù)收集匯總。在疫情當(dāng)中,有很多每日重復(fù)不斷的信息匯總收集過(guò)程,通過(guò)人工智能技術(shù),可以使這樣的工作效率大幅提升減少重復(fù)工作。從核心技術(shù)角度看,我們需要知識(shí)的建設(shè)和管理,能夠把相應(yīng)的知識(shí)圖譜建設(shè)起來(lái),尤其是在疫情的特定場(chǎng)景話題下,關(guān)于疫情的所有知識(shí)體系要構(gòu)建起來(lái)。還要有形成對(duì)話管理的能力、自然語(yǔ)言的理解能力,以及智能問(wèn)答的能力。一套語(yǔ)音的交互系統(tǒng),還需要語(yǔ)音語(yǔ)義的一體化集成框架,在這樣一套技術(shù)平臺(tái)上,我們可以快速搭建并通過(guò)對(duì)話方式提升效率系統(tǒng)。
疫情期間,有溫度的智能機(jī)器人非常多。機(jī)器人本身的專注度非常高,它的工作狀態(tài)非常穩(wěn)定,更關(guān)鍵的是它不需要和病患進(jìn)行隔離,所以很多機(jī)器人在整個(gè)疫情期間,為大家提供服務(wù)和幫助。相信隨著人工智能技術(shù)的發(fā)展,機(jī)器人的技術(shù)也會(huì)越來(lái)越成熟,未來(lái)會(huì)有越來(lái)越多的機(jī)器人能在關(guān)鍵時(shí)刻提供給我們更多的幫助。
相信隨著人工智能技術(shù)的發(fā)展,機(jī)器人的技術(shù)也會(huì)越來(lái)越成熟,未來(lái)會(huì)有越來(lái)越多的機(jī)器人能在關(guān)鍵時(shí)刻提供給我們更多的幫助。
醫(yī)藥的研發(fā)、疫苗的研發(fā)等有沒(méi)有可能更快速地產(chǎn)生出來(lái),幫助我們渡過(guò)疫情?舉一個(gè)例子:這是百度推出的一個(gè)算法,應(yīng)用于醫(yī)學(xué)科研,加速疫苗和病毒分析的RNA的二級(jí)結(jié)構(gòu)分析算法。這一次引起肺炎疫情的冠狀病毒其實(shí)是和當(dāng)年的非典病毒一樣是RNA病毒。RNA是一個(gè)單鏈結(jié)構(gòu),單鏈結(jié)構(gòu)就會(huì)有更強(qiáng)的不穩(wěn)定性,更強(qiáng)的變異性,以及在疫苗研發(fā)上會(huì)有更多的困難。RNA序列結(jié)構(gòu)分析在病毒研究當(dāng)中非常重要,在2019年7月份百度提出并實(shí)現(xiàn)的Bioinfor的算法,可以將病毒的全基因組的RNA二級(jí)結(jié)構(gòu)分析從55分鐘縮短到半分鐘以內(nèi),是在這一次冠狀病毒數(shù)據(jù)上得到的速度。這意味著,全基因組結(jié)構(gòu)的分析會(huì)變得更快速實(shí)現(xiàn)出來(lái),能夠有助于病毒的一系列分析工作,也有助于新型疫苗的研制過(guò)程,希望能夠?qū)σ呙绲难兄茙?lái)快速的幫助。
AI測(cè)溫儀,就是有紅外的技術(shù)和AI的技術(shù)結(jié)合,而智能外呼系統(tǒng)本身就是語(yǔ)音理解及知識(shí)圖譜多個(gè)技術(shù)一系列的融合。
除了這些,其實(shí)還有很多AI技術(shù)在這次抗疫中起的作用,像機(jī)器翻譯技術(shù)。在這次抗疫中,我們需要有快速能夠獲取大量不同語(yǔ)種素材和不同語(yǔ)種的研究報(bào)告。有一些國(guó)家也不斷輸出新的研究成果,百度的機(jī)器翻譯快速開(kāi)發(fā)了面向醫(yī)療領(lǐng)域的定制能力,支持了抗疫支援者團(tuán)隊(duì)大量文獻(xiàn)翻譯工作。當(dāng)然這是一系列AI技術(shù)所帶來(lái)的幫助,對(duì)于AI技術(shù)來(lái)說(shuō),未來(lái)也依然存在著發(fā)展空間和挑戰(zhàn)。
從這次抗疫中也能夠看得到,在基礎(chǔ)數(shù)據(jù)平臺(tái)建設(shè)上還有很多工作需要開(kāi)展。大數(shù)據(jù)分析技術(shù)在整個(gè)疫情治理當(dāng)中起到了一系列關(guān)鍵性作用,未來(lái)基礎(chǔ)數(shù)據(jù)的平臺(tái)需要進(jìn)一步加強(qiáng)和夯實(shí),并且做到大量數(shù)據(jù)之間的融匯貫通及合理使用。可以看到一系列工作落地到真實(shí)應(yīng)用場(chǎng)景當(dāng)中,大型的工程系統(tǒng)支撐是非常重要的,以及人工智能技術(shù)之間跨技術(shù)融合解決場(chǎng)景問(wèn)題,都是非常關(guān)鍵。AI測(cè)溫儀,就是有紅外的技術(shù)和AI的技術(shù)結(jié)合,而智能外呼系統(tǒng)本身就是語(yǔ)音理解及知識(shí)圖譜多個(gè)技術(shù)一系列的融合。
在這個(gè)過(guò)程當(dāng)中,百度的技術(shù)落地了多處,產(chǎn)生了大量的產(chǎn)品和解決方案。百度的人工智能技術(shù)從基礎(chǔ)層到感知層到認(rèn)知層到平臺(tái)層,有一個(gè)全面的布局。它有多項(xiàng)AI技術(shù),同時(shí)有AI安全保駕護(hù)航。這一系列技術(shù),基礎(chǔ)是搭建在開(kāi)源深度學(xué)習(xí)平臺(tái)飛槳上的。飛槳平臺(tái)是在框架層支持了開(kāi)發(fā)、訓(xùn)練、預(yù)測(cè)全方位的能力,并且開(kāi)放有大量的多種模型庫(kù),還有支持多個(gè)工具組件以及服務(wù)平臺(tái)。整個(gè)能力可以支撐我們?cè)谏厦嫒ラ_(kāi)發(fā)很多的AI應(yīng)用,在飛槳平臺(tái)上已經(jīng)服務(wù)了有150多萬(wàn)位開(kāi)發(fā)者,超過(guò)了6.5萬(wàn)家企業(yè),在定制化訓(xùn)練平臺(tái)上已經(jīng)發(fā)布了16.9萬(wàn)個(gè)模型。在這一系列平臺(tái)開(kāi)放基礎(chǔ)上,過(guò)去一段時(shí)間,很多開(kāi)發(fā)者也在進(jìn)行著抗疫的產(chǎn)品和項(xiàng)目開(kāi)發(fā)。百度大腦也為此制定了“AI開(kāi)發(fā)者戰(zhàn)役守護(hù)計(jì)劃”,提供給開(kāi)發(fā)者免費(fèi)的資源配置,專項(xiàng)領(lǐng)域服務(wù)和深度技術(shù)支持,希望開(kāi)發(fā)者能基于百度大腦開(kāi)發(fā)平臺(tái)去開(kāi)發(fā)更多的產(chǎn)品、去支持疫情的治理。在飛槳平臺(tái)上也提供了一系列的算力和代碼功能升級(jí)的支持,以及專家定向幫助,并且配套了免費(fèi)的線上課程,從入門到實(shí)踐的全階段課程。
目前,通過(guò)一線醫(yī)護(hù)工作人員的努力、社區(qū)工作人員的努力,這次疫情已經(jīng)有非常好的控制狀態(tài)。從科技工作者角度來(lái)說(shuō),希望我們的工作能夠助力防控,能夠去為抗疫提供更多的幫助,同心共渡難關(guān)?!?/p>