李康躍
人工智能技術(shù)的發(fā)展拓寬了新聞傳播學(xué)的研究領(lǐng)域,用技術(shù)的思維去思考和建構(gòu)新的信息傳播方式是近年來學(xué)界和業(yè)界的研究熱點,自然語言處理等人工智能技術(shù)也是智能傳播發(fā)展和研究的動能所在。麥克盧漢指出“媒介是人的延伸”,計算機(jī)視覺模仿和延伸了人的眼睛和大腦,因此也可以被視為一種媒介。在萬物皆媒的當(dāng)下,計算機(jī)視覺的信息獲取、處理與傳播的特性則從新聞報道、輿情監(jiān)測、體育直播等方面對傳媒領(lǐng)域產(chǎn)生了重大影響。
中國科學(xué)院自動化研究所的胡占義研究員將計算機(jī)視覺定義為以圖像、視頻為輸入,以對環(huán)境的表達(dá)和理解為目標(biāo),研究圖像信息組織、物體和場景識別,進(jìn)而對事件給予解釋的學(xué)科。[1]計算機(jī)視覺也可以被看作是模擬人眼與人腦的過程,其通過攝像機(jī)等圖像獲取設(shè)備采集靜態(tài)或動態(tài)圖像素材,用計算機(jī)程序和算法對圖像素材中的特定對象進(jìn)行識別、跟蹤與測量。計算機(jī)視覺技術(shù)已大量應(yīng)用于傳媒領(lǐng)域的內(nèi)容生產(chǎn)、傳播與運營等階段,極大豐富了信息傳播樣態(tài)。
20 世紀(jì)50 年代,大衛(wèi)·休伯爾(David Hunter Hubel)和托斯坦·維厄瑟爾(Torsten Nils Wiesel)的視覺實驗掀開了計算機(jī)視覺研究的大幕。拉塞爾·科爾基(Russell Kirsch)和他的團(tuán)隊研制出了世界上第一臺數(shù)字圖像掃描儀,計算機(jī)獲取圖像信息開始成為可能。經(jīng)過幾十年的發(fā)展以及深度學(xué)習(xí)等理念的融入,計算機(jī)視覺不僅成為一門獨立學(xué)科,也延伸出了圖像分類、目標(biāo)監(jiān)測、圖像分割等研究領(lǐng)域。
人類可以識別出現(xiàn)實環(huán)境中的不同含義的事物,并通過已有認(rèn)知和記憶將事物進(jìn)行歸類,以獲取所需信息。計算機(jī)要完成這一過程,也必然需要具備識別、歸類能力。圖像分類是計算機(jī)視覺的一個基礎(chǔ)研究方向,具體可分為跨物種圖像分類、子類細(xì)粒度圖像分類以及實例級圖像分類。[2]例如,計算機(jī)不僅要分得清圖像是人而不是動物,也要分得清是哪個膚色的人種,甚至通過人臉的數(shù)據(jù)比對來判斷是皮特而不是詹姆斯,這就是不同級別的不同分類效果。隨著數(shù)據(jù)庫的豐富和算力的指數(shù)級提升,在某些方面計算機(jī)的分類能力甚至已經(jīng)超越了人類,人臉閘機(jī)、智能相機(jī)等都是圖像分類能力的應(yīng)用與延伸。
相較于圖像分類,目標(biāo)檢測不僅要確定主體的類別,更致力于辨明主體的位置?,F(xiàn)實場景中不只有一個主體,而是多種類、多主體并存的,這就對計算機(jī)的識別和定位能力有了更高的要求,計算機(jī)需要對圖像中的多個主體進(jìn)行類別和位置信息的描述。目標(biāo)檢測也是目標(biāo)跟蹤能力實現(xiàn)的前提,該能力也常被應(yīng)用于智能監(jiān)控、智能導(dǎo)航等領(lǐng)域中。
圖像分割是由圖像處理到圖像分析的關(guān)鍵步驟。計算機(jī)以畫面中不同顏色、光照等特征為依據(jù),對畫面中的前景與后景,或多個主體之間進(jìn)行分割,劃分成若干個互不相交的子區(qū)域,以達(dá)到圖像理解和分析的目的。例如,在遙感衛(wèi)星圖像中,可以應(yīng)用圖像分割能力區(qū)分城鎮(zhèn)、森林和耕地等不同區(qū)域,并測算出對應(yīng)區(qū)域的面積。此外,圖像分割也廣泛應(yīng)用于醫(yī)學(xué)影像診斷、在線產(chǎn)品檢驗等領(lǐng)域。
每一個智能應(yīng)用的實現(xiàn)都不是單一技術(shù)賦能,也不是多技術(shù)的簡單堆砌,圖像分類、目標(biāo)監(jiān)測和圖像分割只是計算機(jī)視覺中的三個基礎(chǔ)研究領(lǐng)域,在此基礎(chǔ)上還延伸出了圖像處理和三維理解等方向,隨著研究的深入,計算機(jī)視覺對人類社會的改變將愈加深刻,智能傳播領(lǐng)域亦因受到計算機(jī)視覺技術(shù)的推動而向前發(fā)展。
目前計算機(jī)視覺已經(jīng)滲透各行各業(yè),帶給不同領(lǐng)域新的研究方向和課題,對于智能傳播領(lǐng)域來說亦是如此。計算機(jī)視覺的發(fā)展和應(yīng)用使信息傳播過程更加智能和高效,AR(Augmented Reality)等新型傳播方式增強(qiáng)了人們的感官體驗,建構(gòu)了更加多元化的應(yīng)用場景。
在內(nèi)容生產(chǎn)方面,計算機(jī)視覺可應(yīng)用于圖像和視頻的采集及處理流程中,其通過復(fù)雜的集成算法對圖像和視頻進(jìn)行降噪、增強(qiáng)等處理,來滿足風(fēng)格化的信息傳播需求;亦可以通過解碼和編碼對視頻進(jìn)行格式轉(zhuǎn)換和畫面修復(fù);同時可以對綜藝節(jié)目和流媒體內(nèi)容進(jìn)行實時關(guān)鍵幀抽取等操作,以達(dá)到對視頻內(nèi)容的二次加工與實時傳播目的。
在內(nèi)容傳播方面,計算機(jī)視覺的內(nèi)容識別與跟蹤也是AR 效果呈現(xiàn)的關(guān)鍵技術(shù)。AR 是一種超越現(xiàn)實的視覺增強(qiáng)應(yīng)用,不僅可以通過虛實融合的方式來完成信息傳播,同時也能以智能互動的方式增強(qiáng)人們的體驗感和互動感。[3]智能手機(jī)、智能眼鏡等便攜設(shè)備通過計算機(jī)視覺技術(shù)來識別和跟蹤人臉、手勢、肢體等信息,從而對人的指令做出反饋,以達(dá)到智能互動效果。
在內(nèi)容運營方面,計算機(jī)視覺也被廣泛應(yīng)用于直播領(lǐng)域。智能傳播背景下,直播不僅僅只是網(wǎng)絡(luò)意義上的另一空間內(nèi)實時場景的同步再現(xiàn),也被賦予了多維信息跟蹤與堆疊的功能特性。在體育直播中,運動員的實時運動姿態(tài)識別與跟蹤是計算機(jī)視覺的應(yīng)用場景之一,運動員的運動軌跡和運動速度等數(shù)據(jù)可以被實時獲取、監(jiān)測和計算。在游戲直播和電商直播中,廣告也可以通過此方式實時疊加于鏡頭中,以完成畫面重建。
總之,計算機(jī)視覺作為一種模仿“看”的技術(shù),天然具有智能化信息傳播功能,其對傳媒領(lǐng)域的滲透是全方位的,不僅是對傳播效果的增強(qiáng),同時也使內(nèi)容生產(chǎn)、傳播和運營方式更加智能和多元。
以往理解和認(rèn)知的主體始終是人,但隨著技術(shù)的進(jìn)步,計算機(jī)開始“類人化”。 計算機(jī)視覺在獲取信息基礎(chǔ)上,可以更進(jìn)一步做到理解和認(rèn)知。有學(xué)者認(rèn)為,人工智能的出現(xiàn)不僅打破了人類獨有主體的幻想,更將主體性范疇擴(kuò)展到跨人際主體的全新領(lǐng)域。[4]但當(dāng)前的人工智能技術(shù)發(fā)展仍處于“弱人工智能階段”,雖然計算機(jī)視覺可被視為一種“數(shù)據(jù)化”的人,具備一定主體性,但要真正成為一個類人智能體,并在智能傳播領(lǐng)域中發(fā)揮效能還需更進(jìn)一步研發(fā)和訓(xùn)練。
人內(nèi)傳播是個人接受信息并在人體內(nèi)部進(jìn)行信息處理的活動。思考,即人內(nèi)傳播過程。[5]計算機(jī)視覺不僅僅模仿了人“看”的過程,同時也是一種進(jìn)行著的人內(nèi)傳播過程,數(shù)據(jù)庫即人腦的記憶,數(shù)據(jù)處理過程是人思考過程,思考又往往伴隨著理解與認(rèn)知。但計算機(jī)視覺的理解與認(rèn)知又與人內(nèi)傳播中的認(rèn)知存在差異。一是人的理解與認(rèn)知是有經(jīng)歷的。例如當(dāng)看到一條狗時,人不僅可以識別出其種類和顏色,也會聯(lián)想到自己曾經(jīng)被咬的經(jīng)歷,而計算機(jī)視覺輸出的內(nèi)容僅僅是一只在某一環(huán)境下的獨立個體,歸根結(jié)底還是缺少人的經(jīng)歷和感受,以至于無法完整理解場景中主體所隱含的意義。二是人的理解與認(rèn)知是有情感的。人可以由某一場景或畫面聯(lián)想到自己的人際交往關(guān)系,從而產(chǎn)生情緒變化。例如,當(dāng)人看到已故親人的照片時會產(chǎn)生悲傷之感,而計算機(jī)視覺即使能識別出這是與本體有關(guān)聯(lián)的人,也不會表達(dá)出任何情感,機(jī)器終究是機(jī)器。三是人的理解與認(rèn)知是有道德的。人的成長離不開教育,而不論任何國家的教育,都將道德觀念根植于本國國民心中,不同民族、不同信仰的人所遵循的道德標(biāo)準(zhǔn)也不盡相同,而計算機(jī)視覺無法收集和學(xué)習(xí)每個人的道德觀念數(shù)據(jù),也就無法判斷其所獲取的圖像數(shù)據(jù)是否違反以及違反哪一種道德標(biāo)準(zhǔn)。
因此,目前的計算機(jī)視覺作為一個傳播主體,它可以理解與認(rèn)知場景中的數(shù)據(jù)所表達(dá)的含義,但無論識別、處理和傳播多么復(fù)雜的信息,進(jìn)行多么龐大的運算,也終究無法具備人的經(jīng)歷、情感和道德。
人工智能技術(shù)的發(fā)展可分為“強(qiáng)人工智能階段”與“弱人工智能階段”,區(qū)分強(qiáng)弱人工智能的標(biāo)準(zhǔn)就是其是否可以模擬人腦思維和實現(xiàn)人類所有的認(rèn)知功能,是否是具有自我意識、自主學(xué)習(xí)、自主決策能力的自主性智能體。當(dāng)前,可實現(xiàn)的人工智能是“弱人工智能”。[6]計算機(jī)視覺同樣是處于模擬階段的弱人工智能,但若把計算機(jī)視覺看作是對人眼和人腦的模仿的話,那么其也可以被看作“數(shù)據(jù)化”的人。一方面受限于大腦的生理結(jié)構(gòu),人的信息接收和處理能力往往有一定限度,而計算機(jī)視覺卻可以處理遠(yuǎn)超人腦負(fù)荷的復(fù)雜信息,并通過深度學(xué)習(xí)等過程來完成自我訓(xùn)練,從而理解與認(rèn)知世界。從此角度來看,計算機(jī)視覺是對人視覺處理能力的增強(qiáng),正如工業(yè)革命使機(jī)器代替了人的重復(fù)性勞動,人借助計算機(jī)視覺可以免去諸多需要大量人工進(jìn)行識別、處理和傳播信息的過程。另一方面,正如人們用慣了電腦打字就容易提筆忘字,當(dāng)人們過分依賴于計算機(jī)視覺的識別、處理和傳播信息能力時,人的觀察力、想象力和記憶力同樣也會日漸弱化。機(jī)器代替的是人的重復(fù)性勞動,解放了人的身體,而計算機(jī)視覺則替代了人的理解與認(rèn)知能力,降低了人的主體性。長此以往,人將面臨成為計算機(jī)視覺“奴隸”的風(fēng)險,這也是所謂“數(shù)據(jù)化”的人對真正人理解與認(rèn)知能力的一種擠壓。
計算機(jī)視覺可以模仿人理解與認(rèn)知世界的過程,并向外界傳遞信息,逐漸為人塑造了一個“擬態(tài)環(huán)境”,具有人內(nèi)傳播與大眾傳播的雙重功能,是智能傳播發(fā)展的必備技術(shù),但人類不免也面臨著相應(yīng)的危機(jī)與挑戰(zhàn),要讓計算機(jī)視覺更好地為人類服務(wù),就應(yīng)在明晰其風(fēng)險的基礎(chǔ)上,進(jìn)行必要的倫理考量。
計算機(jī)視覺在內(nèi)容獲取、傳播和運營等方面給人們帶來了極大的便利,其作為機(jī)器,能進(jìn)行簡單的“擬人化”理解與認(rèn)知,因而可以作為一種“擬人化”的主體來看待,當(dāng)其主體行為應(yīng)用于信息傳播領(lǐng)域中時,隱私泄露、信息失范與價值觀偏移風(fēng)險就成為亟須探討的焦點。
英國哲學(xué)家杰里米·邊沁(Jeremy Bentham) 為了使囚犯更好地被管理和規(guī)訓(xùn)而設(shè)計了“圓形監(jiān)獄”,法國哲學(xué)家米歇爾·??拢∕ichel Foucault)在此基礎(chǔ)上提出的“全景式敞視”將“圓形監(jiān)獄”理論的適用范圍擴(kuò)散至整個社會,而隨著技術(shù)的發(fā)展,人的隱私也逐漸暴露于技術(shù)當(dāng)權(quán)者手中。一方面深度學(xué)習(xí)能進(jìn)一步提升計算機(jī)視覺的技術(shù)能力和精準(zhǔn)度,此時建立一個巨量的數(shù)據(jù)庫是技術(shù)能力躍升和開拓多元化智能傳播應(yīng)用場景的必然要求,收集大量的用戶圖像、地理位置等信息在所難免。而另一方面,時下人工智能時代隱私侵權(quán)行為層出不窮,人們“裸奔”于智能社會中,人的社交、出行等行為數(shù)據(jù)時刻被監(jiān)測,這使人們被一種“數(shù)碼圓形監(jiān)獄”所禁錮,個人隱私數(shù)據(jù)或存在濫用風(fēng)險,這也造成了技術(shù)應(yīng)用與隱私保護(hù)之間難以調(diào)和的矛盾,看似平靜的技術(shù)應(yīng)用過程,實則危機(jī)四伏。
人在創(chuàng)造人工智能的同時,賦予其相應(yīng)的自主決策權(quán),但在某種意義上,計算機(jī)視覺具有人的行為能力卻無法承擔(dān)人的行為責(zé)任。就目前的技術(shù)發(fā)展階段而言,其還不足以避免因程序失誤所帶來的問題。例如,在輿情監(jiān)測和引導(dǎo)過程中,當(dāng)計算機(jī)視覺去識別、處理和傳播重大輿情事件時,微小的失誤也可能會造成嚴(yán)重的社會危機(jī)。此外,計算機(jī)視覺獲取信息的渠道千差萬別,而目前社交媒體等網(wǎng)絡(luò)平臺中充斥著大量謠言和虛假信息,人尚且無法完全根據(jù)自己的理解與認(rèn)知去判斷,遑論是計算機(jī)視覺,若只憑機(jī)器的自主性去識別、判斷和傳播,無異于成為謠言和虛假信息的“放大鏡”和“助推器”,使信息辨別成本大大提升,甚至?xí)T導(dǎo)人們做出錯誤的行為判斷,造成難以估量的后果。
隨著技術(shù)能力的提升,計算機(jī)視覺也將成為比人眼和人腦更加敏感的視覺和感覺器官,其信息理解與認(rèn)知能力將進(jìn)一步增強(qiáng),為人營造了一個“擬態(tài)環(huán)境”,在此基礎(chǔ)上價值觀問題就日益凸顯。技術(shù)中立者認(rèn)為“技術(shù)沒有價值觀”,但“快播案”恰恰說明,沒有價值觀的技術(shù)極易成為非法信息滋生和傳播的平臺。現(xiàn)階段,計算機(jī)視覺的價值觀取決于其存在的環(huán)境和被給予的訓(xùn)練數(shù)據(jù)。美國麻省理工學(xué)院的研究人員創(chuàng)造了世界上第一個“精神變態(tài)人工智能”,并命名為“諾曼”,其在學(xué)習(xí)了大量的有關(guān)死亡、尸體的負(fù)面內(nèi)容后,識別的圖像往往帶有極端的消極傾向,若對計算機(jī)視覺的深度學(xué)習(xí)過程聽之任之,將會產(chǎn)生嚴(yán)重后果。這也說明,若缺乏有效的監(jiān)管,計算機(jī)視覺將有可能發(fā)生價值觀偏移,以至于生產(chǎn)和傳播諸多不良信息,進(jìn)而影響人的價值判斷。
明晰了計算機(jī)視覺于傳播領(lǐng)域的應(yīng)用中所面臨的倫理風(fēng)險后,人們必須積極探尋應(yīng)對之道。針對隱私泄露風(fēng)險,從社會角度而言,技術(shù)當(dāng)權(quán)者的自律和他律缺一不可,可以發(fā)揮社會化組織以及傳媒機(jī)構(gòu)的監(jiān)管作用,在保證用戶數(shù)據(jù)不做他用的基礎(chǔ)上適度開發(fā)。從技術(shù)角度而言,技術(shù)研發(fā)者應(yīng)于整個行業(yè)監(jiān)督下,運用技術(shù)手段構(gòu)筑一堵“隱私數(shù)據(jù)使用防火墻”,數(shù)據(jù)調(diào)用行為時刻被監(jiān)管部門獲取,同時確保用戶隱私數(shù)據(jù)被使用的知情權(quán),讓技術(shù)應(yīng)用與倫理規(guī)范在同一軌道下齊頭并進(jìn)。對于信息失范風(fēng)險,計算機(jī)視覺的應(yīng)用不能越過“把關(guān)人”而完全自主識別、判斷與傳播,對于風(fēng)險小、難度小的信息可給予技術(shù)更大的自主權(quán),而當(dāng)面臨重要的社會性信息時,專人的把關(guān)仍然不可或缺。在價值觀偏移風(fēng)險方面,人機(jī)協(xié)同共同建構(gòu)計算機(jī)視覺正確的價值觀對于技術(shù)應(yīng)用來說至關(guān)重要,研發(fā)人員應(yīng)將正確的技術(shù)邏輯寫入計算機(jī)視覺的程序中,并運用積極正面的數(shù)據(jù)去訓(xùn)練和提升技術(shù)能力,不斷監(jiān)測和糾偏。事實上,各國際組織和國家都密切關(guān)注人工智能的倫理問題,并成立了人工智能倫理委員會等組織,發(fā)布了人工智能倫理準(zhǔn)則,但就目前的技術(shù)發(fā)展階段而言,計算機(jī)視覺等人工智能技術(shù)的正確應(yīng)用仍需多方努力、共同參與。一句話,計算機(jī)視覺不能脫離人的控制而自由發(fā)展。
智能傳播時代,計算機(jī)視覺已經(jīng)成為重要的信息傳播方式,并在傳媒領(lǐng)域進(jìn)行了諸多嘗試和應(yīng)用,其作為“數(shù)據(jù)化”的人,具備了一定的主體性,但高度的自主性不免使計算機(jī)視覺應(yīng)用存在一定風(fēng)險?;艚鹪谌蛞苿踊ヂ?lián)網(wǎng)大會(GMIC)上預(yù)言“人工智能的崛起可能是人類文明的終結(jié)”。技術(shù)先行者們應(yīng)在明晰計算機(jī)視覺潛在威脅的基礎(chǔ)上引入人機(jī)協(xié)同理念,讓其在人類的控制中發(fā)展,傳媒從業(yè)者們也應(yīng)該在適度使用的基礎(chǔ)上發(fā)揮計算機(jī)視覺的信息獲取、處理和傳播優(yōu)勢,讓技術(shù)更好地服務(wù)于人類。
注釋:
[1]胡占義.計算機(jī)視覺簡介:歷史、現(xiàn)狀和發(fā)展趨勢[EB/OL].“專知”微信公眾號,[2017-11-21].https://mp.weixin.qq.com/s/FzCrOiFuutqSQSp4VcydoQ.
[2]龍鵬.你真的了解圖像分類嗎?[EB/OL].知乎網(wǎng),[2018-10-21].https://zhuanlan.zhihu.com/p/47281243.
[3]李康躍,果鳳春.5G 時代下AR 對傳媒內(nèi)容生產(chǎn)環(huán)節(jié)的影響[J].東南傳播,2020(5):46-48.
[4]程明,趙靜宜.論智能傳播時代的傳播主體與主體認(rèn)知[J].新聞與傳播評論,2020(1):11-18.
[5]陳力丹,陳俊妮.論人內(nèi)傳播[J].當(dāng)代傳播.2010(1):9-13.
[6]耿曉夢,喻國明.智能媒體倫理建構(gòu)的基點與行動路線圖——技術(shù)現(xiàn)實、倫理框架與價值調(diào)適[J].2020(1):12-16.