張爍
人工智能審核尚處在探索和嘗試之中,有些功能還不完全智能。目前,人工智能對(duì)數(shù)字出版內(nèi)容的審核仍存在亟待解決的地方,是“文圖音視”形態(tài)領(lǐng)域內(nèi)的通病。2017年4月,美國(guó)《Nature》雜志發(fā)表的一項(xiàng)研究成果表明,智能算法的原理是對(duì)人類(lèi)所書(shū)寫(xiě)的文本內(nèi)容進(jìn)行分析處理和深度學(xué)習(xí),那自然就會(huì)帶有人類(lèi)的習(xí)慣,難免會(huì)像人類(lèi)那樣存在帶有偏見(jiàn)的刻板印象[1],因而算法就會(huì)產(chǎn)生一些歧視、錯(cuò)誤等問(wèn)題,比如“較高的誤報(bào)率和漏檢率”。由于一些詞語(yǔ)存在多語(yǔ)義的情況,一句話(huà)相鄰詞語(yǔ)之間的鏈接容易造成誤報(bào),以及不法分子還可以通過(guò)一些文字變異手段輕松繞開(kāi)關(guān)鍵詞匹配。
1.誤報(bào)誤傷現(xiàn)象時(shí)有發(fā)生,應(yīng)減少算法歧視
目前市場(chǎng)上有多種計(jì)算機(jī)校對(duì)軟件,其中包括模式較為簡(jiǎn)單的校對(duì)模塊,更有功能更加強(qiáng)大的專(zhuān)業(yè)校對(duì)軟件。由于計(jì)算機(jī)智能審核的算法是基于對(duì)數(shù)據(jù)庫(kù)的深度學(xué)習(xí),那么它的學(xué)習(xí)樣本必然是海量龐大的,為了盡最大程度用上所學(xué),智能審核的算法會(huì)萬(wàn)分“謹(jǐn)慎”,有著較高的靈敏度就會(huì)導(dǎo)致誤傷一些正確內(nèi)容。
案例一:除去文字誤傷,圖片內(nèi)容被誤傷更為頻繁。2015 年,谷歌研究并發(fā)布了一款自動(dòng)圖像標(biāo)記軟件,用以識(shí)別分類(lèi)和審核,在識(shí)別一對(duì)黑人夫婦的圖像時(shí),由于膚色與“黑猩猩”特征相似,將其標(biāo)記為“黑猩猩”,并將黑人照片自動(dòng)上傳[2],其實(shí),許多其他公司研發(fā)的自動(dòng)標(biāo)記系統(tǒng)也都存在諸如此類(lèi)的問(wèn)題。這些程序形成的“低級(jí)錯(cuò)誤”雖成為人們的玩笑談資,但也警醒著人們,在實(shí)際應(yīng)用中這種技術(shù)不成熟所導(dǎo)致的“低級(jí)錯(cuò)誤”可能會(huì)形成更為嚴(yán)重的歧視結(jié)果。[3]
案例二:YouTube用戶(hù)Jamison Go收到了一份平臺(tái)的違規(guī)處理通知,平臺(tái)方直接刪除了他發(fā)布的機(jī)器人比賽格斗視頻,算法檢測(cè)到該視頻涉及對(duì)虐待動(dòng)物或迫使動(dòng)物打斗。而視頻中的真實(shí)情況卻是機(jī)器人喬普正在和另一個(gè)機(jī)器人格斗。而實(shí)際上YouTube本身并沒(méi)有關(guān)于禁止上傳機(jī)器人格斗視頻的規(guī)定,此番操作或許是因?yàn)樗惴ㄕ`將該視頻標(biāo)注了虐待動(dòng)物的詞條,經(jīng)審核后系統(tǒng)自動(dòng)將其刪除。在接到投訴后,YouTube人工團(tuán)隊(duì)重新進(jìn)行了人工檢驗(yàn)并恢復(fù)了原先被誤刪的視頻。因此以后在類(lèi)似審核案件中,應(yīng)該由人工智能審核進(jìn)行初審,有必要的情況下由人工進(jìn)行再次篩查。
2.對(duì)于審核遺漏,改善算法技術(shù)
正所謂“道高一尺魔高一丈”,用戶(hù)在熟悉了平臺(tái)的智能審核原理后,有些圖謀不軌的用戶(hù)會(huì)借此打擦邊球,但是阿里云計(jì)算公司在世界杯期間利用自然語(yǔ)言處理技術(shù)能夠智能地分析出文字的語(yǔ)言情感,防止文本變異而產(chǎn)生的審核遺漏。
中華文化歷史悠久,漢語(yǔ)的發(fā)展歷程源遠(yuǎn)流長(zhǎng)、博大精深,但是對(duì)古籍文獻(xiàn)的審核是目前智能校對(duì)軟件需要一同努力攻克的難題,有時(shí)還是需要專(zhuān)業(yè)的人工審核介入。
3.智能審核應(yīng)注重社會(huì)效益,盡快建立人工智能算法審查機(jī)制
人工智能的飛速發(fā)展必然帶來(lái)大量法律法規(guī)的立、改、廢,甚至?xí)饌惱?、道德層面的一些價(jià)值沖突。[4]在美國(guó),17歲少女遭到殘忍殺害的血腥照片瘋傳網(wǎng)絡(luò),部分網(wǎng)友表示看后產(chǎn)生惡心、心理陰影等不良反應(yīng),F(xiàn)acebook平臺(tái)的人工智能審核力度遭到網(wǎng)友的強(qiáng)烈質(zhì)疑。此次不良影響究竟是人工智能審核系統(tǒng)的失靈遺漏還是為了熱度而故意保留,暫時(shí)無(wú)法考證,因而更加需要建立人工智能算法審查機(jī)制,在高質(zhì)量完成審核工作的同時(shí)也要注重社會(huì)影響保障社會(huì)效益。
正如尼爾·波茲曼在《娛樂(lè)至死》中評(píng)價(jià)電視時(shí)提出的“每一種思想的新工具的誕生都會(huì)達(dá)到某種平衡,有得必有失,雖然這種平衡并不是絕對(duì)的;我們?cè)诨驓Щ蜃u(yù)時(shí)要十分小心,因?yàn)槲磥?lái)的結(jié)果往往是出人意料的?!盵5]
也就是說(shuō)如果人工智能的審核過(guò)濾機(jī)制原本是為用戶(hù)屏蔽掉一些不良的極端信息,從而營(yíng)造清爽的網(wǎng)絡(luò)環(huán)境,但如果把自殺、他殺等殘暴行為的發(fā)布內(nèi)容或網(wǎng)絡(luò)求助信息通過(guò)算法屏蔽掉后,平臺(tái)方未作出后續(xù)行為從而掩蓋了事實(shí),妨礙案件的發(fā)現(xiàn)及辦案,就與審核的根本目的大相徑庭了。由于缺乏有效的自動(dòng)化技術(shù)來(lái)識(shí)別這些內(nèi)容,所有這些不可信和不恰當(dāng)?shù)膬?nèi)容都需要依賴(lài)于專(zhuān)業(yè)人員的知識(shí)儲(chǔ)備、個(gè)人評(píng)判來(lái)識(shí)別,并核對(duì)事件的關(guān)注度和可信度從而甄別定奪是否告知于警方。[6]因此在人工智能審核惡意內(nèi)容的技術(shù)尚不完善的前提下,建議人工介入處理。人工智能應(yīng)該做到互聯(lián)互通,當(dāng)標(biāo)記出有自殺等有危險(xiǎn)性的想法時(shí),應(yīng)該幫忙聯(lián)系急救人員。
2020年3月起《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》開(kāi)始實(shí)行,筆者認(rèn)為人工智能審核技術(shù)很適合對(duì)網(wǎng)絡(luò)暴力等網(wǎng)絡(luò)不良行為進(jìn)行追蹤監(jiān)測(cè),以及加強(qiáng)對(duì)可疑用戶(hù)的審核,從內(nèi)容生產(chǎn)者和傳播者的角度控制劣質(zhì)內(nèi)容的產(chǎn)生及傳播。盡快出臺(tái)算法的倫理道德規(guī)范,從而劃分算法倫理道德法律的界限。
4.建議將區(qū)塊鏈技術(shù)應(yīng)用到智能審核中
區(qū)塊鏈與人工智能的關(guān)系就好比計(jì)算機(jī)和互聯(lián)網(wǎng):前者是數(shù)據(jù)的存儲(chǔ)方式,后者則是由數(shù)據(jù)產(chǎn)生的應(yīng)用。區(qū)塊鏈的真實(shí)就意味著更多優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),在應(yīng)用人工智能技術(shù)的同時(shí),用區(qū)塊鏈保證流程的透明和靈活;人工智能在算法上的突破,也能幫助區(qū)塊鏈提升數(shù)據(jù)的傳輸效率。數(shù)字出版產(chǎn)品的版權(quán)審核,如果將區(qū)塊鏈技術(shù)與人工智能結(jié)合,將促進(jìn)“版權(quán)審核”更加智能化、規(guī)范化。
5.探尋機(jī)器和人的新關(guān)系
自從人工智能進(jìn)入大眾視野以來(lái),“機(jī)器是否會(huì)取代人類(lèi)?人工智能給人員就業(yè)帶來(lái)何種壓力”的言論甚囂塵上。但是在出版界,機(jī)器和人的關(guān)系一直都是人機(jī)協(xié)作、機(jī)器輔佐人工。在出版的審校工作中,編輯人員雖不如機(jī)器那般依托于龐大的數(shù)據(jù)庫(kù)而擁有海量的知識(shí)儲(chǔ)備,甚至工作效率遠(yuǎn)不及智能審核,但是在人工智能的協(xié)助下,編輯的功能正在逐步轉(zhuǎn)變——編輯的工作將會(huì)向掌控全局、調(diào)整軟件參數(shù)、最終審查等工作上發(fā)展。[7]同時(shí),編輯不能產(chǎn)生惰性而過(guò)于信賴(lài)機(jī)器,仍然要發(fā)揮好把關(guān)人的作用。編輯要緊密觀察機(jī)器的動(dòng)態(tài),及時(shí)對(duì)智能審核系統(tǒng)進(jìn)行查漏補(bǔ)缺,完善其深度學(xué)習(xí)的數(shù)據(jù)庫(kù),讓審核更加智能高效。
結(jié)語(yǔ)
在這個(gè)萬(wàn)物皆可AI的時(shí)代,人工智能的確對(duì)我們的工作起到了提質(zhì)增效的作用,無(wú)論它技術(shù)進(jìn)步得多么迅速和完善,人工智能審核都不能完全取代人工,智能和人工之間的關(guān)系永遠(yuǎn)都是智能服務(wù)于人工,機(jī)器輔佐人類(lèi),減輕人類(lèi)的工作量。我們不能過(guò)于依賴(lài)它,否則人們便成了傀儡,要做AI的主人而不是奴隸。善于將AI靈活運(yùn)用,使其成為我們的工具,探索出一條人機(jī)協(xié)作的高效之路。