權(quán)國龍 顧小清 汪 靜
(1.江南大學(xué) 教育信息化研究中心,江蘇無錫 214122; 2.華東師范大學(xué) 教育學(xué)部教育信息技術(shù)學(xué)系,上海 200062)
人工智能教育應(yīng)用正努力實現(xiàn)為主體賦能、為教育教學(xué)賦能的價值目標(biāo)。在教育最優(yōu)化的發(fā)展路徑上,以計算為基礎(chǔ)的人工智能技術(shù),通過模式識別、機器學(xué)習(xí)、深度學(xué)習(xí)被應(yīng)用于教育教學(xué)管理產(chǎn)品、教學(xué)系統(tǒng)產(chǎn)品和學(xué)習(xí)系統(tǒng)產(chǎn)品的研發(fā)與實踐中。其在學(xué)習(xí)支持服務(wù)和教學(xué)以及行政管理服務(wù)方面的應(yīng)用主要集中于:特征分析和預(yù)測、考核和評價、自適應(yīng)系統(tǒng)與個性化和智能輔導(dǎo)系統(tǒng)四個方面(奧拉夫·扎瓦克奇-里克特等,2020)。人工智能技術(shù)的發(fā)展和創(chuàng)新不斷為社會生產(chǎn)提供動力,教育應(yīng)用也在不斷深化并接近其發(fā)展目標(biāo)——提高教育績效、實現(xiàn)教育最優(yōu)化(郭炯等,2020)。其中,人工智能與教育主體的“連接”是實現(xiàn)其應(yīng)用價值與目標(biāo)的關(guān)鍵之一。
人工智能教育應(yīng)用效能的發(fā)揮主要依靠互動和交流,即主體與人工智能應(yīng)用實體的“交互”。人工智能教育應(yīng)用的情境主要有“人”與“物”兩個方面,其在教育、教學(xué)和學(xué)習(xí)應(yīng)用中的角色表現(xiàn)為伙伴、師長、管理者,以及支持工具與服務(wù)環(huán)境等五種。不同的應(yīng)用形態(tài)都存在教育主體與人工智能應(yīng)用角色的互動與交流問題——它與反思一樣在人的學(xué)習(xí)與思考中具有重要意義。根據(jù)人在學(xué)習(xí)中感官參與的程度,視覺交流是人工智能應(yīng)用中“人-智”互動的重要部分,涉及視覺感知、視覺反應(yīng)及能被視覺感知的實體表達(dá)。人工智能能以多樣的實體形態(tài)在多種場景中為教育、教學(xué)、學(xué)習(xí)提供支持與服務(wù)。視覺化、可視化是主體感知信息、形成意義、準(zhǔn)確傳達(dá)、高效呈現(xiàn),乃至視覺分析與思考中不可或缺的方式,是人的學(xué)習(xí)中應(yīng)用最多的學(xué)習(xí)方式。所以,人工智能視覺互動在人工智能教育應(yīng)用中有重要意義。在科技界,華為與百度已發(fā)布了5G+人工智能工業(yè)視覺解決方案白皮書(百度智能云,2020),為智能工業(yè)發(fā)展提供技術(shù)支持,也反映了視覺智能是人工智能應(yīng)用的重點之一。
如何應(yīng)用人工智能技術(shù),如何創(chuàng)造、改進并運用人工智能視覺交互為主體賦能成為未來主體發(fā)展與教育發(fā)展的重要議題。本文重點關(guān)注人工智能教育應(yīng)用形態(tài)中視覺交互的不同方式、賦能法則以及其對教育主體的影響。研究問題包括:1)人工智能教育應(yīng)用有哪些主要應(yīng)用形態(tài),哪些主要交互形態(tài),其視覺交互方式有何特點?2)人工智能視覺交互需要具備何種“賦能”特性?3)視覺交互對教育主體有何賦能效應(yīng)?
將人工智能與其相關(guān)技術(shù)結(jié)合起來考慮其如何被用于教育,才能透徹觀察其教育應(yīng)用的研究與實踐。因為發(fā)展中的人工智能,形態(tài)不定、功能日增,其應(yīng)用涉及方方面面;而且,連接“硬件”與“軟件”的“潛件”更是其應(yīng)用的要點。如果把人工智能作為一種問題解決方法,那么其教育應(yīng)用就是要用人工智能技術(shù)解決現(xiàn)實教育問題,或用人工智能技術(shù)支持或滿足現(xiàn)實教育需求。在現(xiàn)實情況下,研究并判定人工智能應(yīng)用的真實教育場景與情景,厘清人工智能技術(shù)的本質(zhì)及其擅長應(yīng)對的問題,才能在實踐中恰當(dāng)?shù)卦O(shè)計并應(yīng)用它們。
考察人工智能教育應(yīng)用如何賦能主體,需要全面理解人工智能教育應(yīng)用形態(tài)。當(dāng)前應(yīng)用于教育領(lǐng)域的人工智能軟件系統(tǒng)主要有三類:私人導(dǎo)師、協(xié)作學(xué)習(xí)智能支持系統(tǒng)和智能虛擬現(xiàn)實(Luckin et al., 2016)。貝克等(Baker et al.,2019)把人工智能教育應(yīng)用工具按教育活動參與要素分為:面向?qū)W生的、教師的和系統(tǒng)的人工智能教育軟件。事實上,人工智能技術(shù)可嵌入的教育系統(tǒng)要素,是由其“智能”本質(zhì)和潛在需求決定的。兼具感知、計算、表征、存儲以及識別、推理、表達(dá)等功能的人工智能技術(shù)可與教育教學(xué)主要要素相結(jié)合,針對教育教學(xué)實際需要設(shè)計技術(shù)樣式,形成不同應(yīng)用方向和應(yīng)用層次的實踐形態(tài)。楊緒輝等(2019)指出,通過人工智能技術(shù)之所長補足教育活動中人之短板來完成“人-技”關(guān)系重構(gòu),是使人工智能教育應(yīng)用達(dá)到協(xié)同與融合狀態(tài)的實踐方向之一,是最終實現(xiàn)技術(shù)之教育價值的基本途徑。所以,結(jié)合實際應(yīng)用,人工智能教育應(yīng)用形態(tài)可以更完整地分為:智能環(huán)境、智能工具、智能學(xué)伴、智能教師和智能管理者。
人工智能環(huán)境主要通過環(huán)境感知和信息整合從環(huán)境適宜的角度智能地為主體提供主動的活動建議或被動的行動指導(dǎo),使主體擁有多元的場景感和深刻的現(xiàn)場體驗。智能環(huán)境的特性在于環(huán)境信息聯(lián)通,為學(xué)習(xí)者提供適時、準(zhǔn)確的環(huán)境信息,“溝通”主體所需要的環(huán)境信息并按需調(diào)節(jié),營造人性化的教育活動氛圍。例如,由人工智能支持的教室是典型的智能環(huán)境,它能智能地調(diào)節(jié)光線、溫度和空氣質(zhì)量。
人工智能工具主要利用判別、跟蹤、預(yù)測等智能,通過信息整理、模式識別、思維感應(yīng)等提供必要的認(rèn)識監(jiān)察和適宜的思維輔助,使主體擁有充分的認(rèn)知和思維發(fā)展。其教育應(yīng)用在于對“認(rèn)”和“思”的輔助,對主體認(rèn)知與思維的輔助是其釋放其教育效用的重要目標(biāo)。例如,智能軟件為主體提供及時的反饋或提示。
人工智能學(xué)伴主要利用感應(yīng)、識別、對話、思維、行動等智能通過不同層級與風(fēng)格的同伴身份或伴學(xué)角色為主體提供“學(xué)友”式的人際交流與心智交流,使主體擁有人性化的心智發(fā)展體驗。其教育應(yīng)用特性主要是情志陪伴與社交往來。嵌入人工智能的智能學(xué)伴,使學(xué)生不僅不會缺少心理交流和社會交往,而且會因交往自由而放大智能“學(xué)伴”的效用。在積極正向的情志作用下,交流中的認(rèn)知也會因靈活性和啟發(fā)性增強而額外增強。
人工智能教師能利用識別、監(jiān)察、決策、規(guī)劃等智能為主體診斷學(xué)情、疏導(dǎo)心理、適應(yīng)地推薦、檢測目標(biāo)等。人工智能教師可以輔助學(xué)生課業(yè)學(xué)習(xí)和個性成長,可以傳授科目內(nèi)容,耐心地為學(xué)生授業(yè)解惑?!叭斯ぶ悄?教師”的協(xié)同實踐模式是人工智能教師形態(tài)的特別形式(周琴等,2020),或可為教育教學(xué)帶來更好的效果。在強人工智能技術(shù)支持下,人工智能教師可如同師長一樣輔佐學(xué)生,幫助其成長為一位知識技能優(yōu)秀、心智能力健全、人格品性和倫理觀念兼具的“完人”。
作為人工智能管理者,其具體形態(tài)多樣,功能上與其他應(yīng)用形態(tài)的信息充分互聯(lián),擔(dān)負(fù)著組織決策、系統(tǒng)協(xié)調(diào)的角色,負(fù)責(zé)團體、學(xué)校、社區(qū)的活動規(guī)劃與資源調(diào)配(見圖1)。其教育應(yīng)用特性在于輔助決策與協(xié)同管理,使團體、學(xué)校、社區(qū)等活動井然有序、和諧發(fā)展。
圖1 人工智能教育應(yīng)用的管理者形態(tài)
在各應(yīng)用形態(tài)中,人工智能技術(shù)發(fā)揮的功用主要有四種,包括獨立或協(xié)同地知識建構(gòu)、問題解決、系統(tǒng)決策和協(xié)同行動。對教育主體來說,其應(yīng)用重點在于信息交換、引導(dǎo)思考、陪同交流和協(xié)助行動四個方面。正是基于上述支持,人工智能技術(shù)不同教育應(yīng)用形態(tài)的主體賦能才得以展開,其教育價值實現(xiàn)成為可能。
不過,對于人際型的智能學(xué)伴、智能教師和智能管理者形態(tài)來說,機器人的出現(xiàn)將成為人工智能教育應(yīng)用的拐點,其經(jīng)典的“擬人”化實體代理就是智能機器人。由于智能機器人更加具象化、實體化,在滿足主體即時的交流、溝通、指導(dǎo)、啟發(fā)等需要時更具優(yōu)勢。實際上,隨著數(shù)字智能的獨立性和集成性的發(fā)展,人工智能教育應(yīng)用形態(tài)也將更靈活多樣。例如,智能工具與智能“學(xué)伴”或智能“教師”可以合二為一。在“軟硬”技術(shù)成熟、應(yīng)用形態(tài)理想的情況下,機器人的應(yīng)用將成為人工智能教育應(yīng)用的一大亮點。所以,在現(xiàn)階段和未來很長一段時間內(nèi),幾種形態(tài)的應(yīng)用將獨立存在;而未來的應(yīng)用形態(tài)或?qū)⒀莼癁椋褐悄墉h(huán)境、智能“附件”、智能機器人(可代理多種教育角色)三種形式。
與教育主體的互動“連接”是人工智能教育應(yīng)用的重點。如果說互動“連接”是實現(xiàn)其賦能的關(guān)鍵,那么視覺交互智能就是打開教育主體賦能空間的鑰匙。視覺交互能擴展人的實踐活動范圍,在人工智能服務(wù)中扮演非凡的角色。事實上,以視覺交互智能為代表的人工智能交互(簡稱“人智交互”)與“人機交互”之間存在本質(zhì)的不同。
人工智能依附于物理實體而存在,“人工智能體”與教育主體間的交互存在多種形態(tài),即人智交互形態(tài),涉及多個維度:1)由于人的活動涉及情感、認(rèn)知、行為等層面,交互需要也涉及不同層面;2)交流動機不同,交互有主動與被動的差別;3)人工智能所屬關(guān)系或地理位置不同,交互也存在面對面或異地的差異;4)交互涉及感官不同,存在多種方式;5)依附的實體不同,交互所依賴的硬軟件樣式也多種多樣。對交互形態(tài)的多維度考慮,意味著對多樣人工智能交互需求的支持,以及多樣的人工智能交互形態(tài)的產(chǎn)生。
在實際應(yīng)用中,多樣需求與多維支持使人智交互呈現(xiàn)豐富的特點,其在人工智能技術(shù)的應(yīng)用特性上表現(xiàn)為:1)功能有強弱,即已被熟知的強人工智能和弱人工智能,如影片《機器人管家》中的安德魯和《機器人和富蘭克林》中的“強智”機器人;2)顯性或隱性的應(yīng)用,即有無可見形象,如智能代理和智能軟件工具;3)形象有虛有實,如車間的機器人、微軟計算機操作系統(tǒng)(Windows)里的小娜(Cortana);4)存在于人體內(nèi)或外,如嵌入人體的人工智能單元與可穿戴的人工智能設(shè)備。多樣的人工智能應(yīng)用使人智交流方式更豐富。
在人智交互形態(tài)中(見表一),多樣的人智交互需求與人工智能技術(shù)形態(tài)有對應(yīng)關(guān)系。 人智交互形態(tài)依賴視覺居多,聽覺次之,基于觸覺的交互正在發(fā)展。根據(jù)感官通道與媒介性質(zhì)的不同,人智交互方式可以歸為:1)文本交互;2)語音交互;3)圖形界面交互;4)虛擬代理交互,如與數(shù)字系統(tǒng)的智能代理或助手的交流;5)實體角色交互,如機器人與人之間的交流。這些交互方式有靜態(tài)的文本與畫面,也有動態(tài)的影像與圖形;有抽象的文字與符號,也有具體的景象與人物。將媒介的交互方式與指向內(nèi)容的交互形式適當(dāng)結(jié)合,能增強人智交互形態(tài)的“表現(xiàn)力”。
表一 人工智能教育應(yīng)用的交互形態(tài)
人工智能應(yīng)用形態(tài)、人智交互方式與交互形態(tài)之間存在“角色—擬態(tài)”的依存關(guān)系。人工智能教育應(yīng)用形態(tài)是把人工智能技術(shù)應(yīng)用于教育系統(tǒng)后形成的智能化實踐模式與狀態(tài),主要表現(xiàn)為人工智能的教育用途。人智交互方式是人工智能發(fā)揮功能的方式,是產(chǎn)生服務(wù)效用的技術(shù)手段。人智交互形態(tài)是實現(xiàn)人工智能應(yīng)用的技術(shù)性物化結(jié)果。人工智能應(yīng)用的目的及對人工智能需求的認(rèn)識影響人工智能應(yīng)用物化的結(jié)果。三者都依賴人工智能技術(shù)的成熟度,決定于設(shè)計者的思想與設(shè)計。人工智能的交互形態(tài)與交互功能直接影響,甚至決定其教育應(yīng)用形態(tài),如包括功能的集成性、模式的可轉(zhuǎn)換性等。人工智能教育應(yīng)用的技術(shù)化媒介與程式通過“擬態(tài)”與教育角色的應(yīng)用需求相結(jié)合,在彼此的互動關(guān)系中動態(tài)完成“人智”相依的系統(tǒng)樣態(tài)。“擬態(tài)”的出現(xiàn)需要先經(jīng)過“模擬”階段,其成熟需要仿真與模擬技術(shù)的高度發(fā)達(dá)與創(chuàng)新應(yīng)用。所以,技術(shù)形態(tài)與應(yīng)用形態(tài)息息相關(guān)。
人工智能體與教育主體的交互有兩個重要要素:交互方式和交互時機。人智交互主要是“近距離雙向”交互(見表一),交互方式直接影響人智交互的“溝通”表現(xiàn),涉及感官通道,內(nèi)容組織與解析形式。交互方式為交互內(nèi)容服務(wù),支持“人-智”間的信息交匯、知識交流、思維交融和創(chuàng)造協(xié)作等。交互時機取決于基于學(xué)習(xí)與教學(xué)原理的社會性行為設(shè)計,信賴于設(shè)計者的理解與設(shè)定。交互方式則與學(xué)習(xí)者的體驗與參與度緊密相關(guān),與人體感官關(guān)系密切,尤其是視覺交互方式。
典型的人智交互場景展示了人智交互的視覺方式與形態(tài)特點。例如,服務(wù)型“小胖”機器人(Fabo),廣泛應(yīng)用于家庭、教學(xué)、娛樂和服務(wù)等場景(柳晨晨等,2020)。它集成移動監(jiān)測、自主導(dǎo)航、空氣凈化、電器智控、應(yīng)急報警等功能,可多方位提供智能化環(huán)境服務(wù),如對封閉環(huán)境的空氣質(zhì)量監(jiān)控與調(diào)整,對室內(nèi)空調(diào)、熱水器等的操控,大型封閉空間中的導(dǎo)航等?!靶∨帧迸c人的交互方式主要有:人臉表情、圖像顯示、視頻投影、遠(yuǎn)程攝像及文本。其中,視頻、圖像是主要的視覺交互要素,通過播放、攝像與投影完成視覺交互功能;人臉表情是重要的交互方式,它關(guān)照主體情感,與語音一起集中體現(xiàn)社會性交互;屏顯和投影是其視覺交互方式;多種視覺交互配上語音交互,使“小胖”在多場景智能服務(wù)中表現(xiàn)出色。
再如,武漢泰樂奇信息科技有限公司研制的“治趣(CureFun)醫(yī)學(xué)虛擬診療云平臺①,能夠智能化地追蹤、虛擬真實場景(高婷婷等,2019),創(chuàng)建沉浸式學(xué)習(xí)環(huán)境。通過“仿真模型設(shè)備”“虛擬軟件”“希爾曼(SimMan 3G PLUS)”等高仿真模擬人以及“標(biāo)準(zhǔn)化病人”,為學(xué)生提供問診溝通、體格檢查、臨床思維、診療決策、團隊合作等臨床能力綜合訓(xùn)練。此平臺涉及的交互形式主要有仿真模型、虛擬模型、視窗界面,都是經(jīng)典的視覺交互載體。而且視覺影像、觸感與動作是其主要交互通道。屏幕、數(shù)字虛擬及仿真實體是其主要的交互形態(tài)。類似的智能技術(shù)應(yīng)用還有很多,如谷歌云深度學(xué)習(xí)(Cloud ML),百度的簡易深度學(xué)習(xí)(EasyDL)、開源的深度框架(AutoKeras)等(王萍等,2020)。這些自動化平臺應(yīng)用人工智能技術(shù)于文本分類、圖像分類、視覺分析和自然語言處理等,其交互形式大多是圖形與文本,交互形態(tài)主要基于屏幕顯示的數(shù)字系統(tǒng)。這也預(yù)示著,交互方式的視覺化選擇與實際應(yīng)用需求密切相關(guān)。
隨著增強現(xiàn)實、混合現(xiàn)實以及全息投影等技術(shù)的創(chuàng)新發(fā)展,人智交互可以發(fā)揮更多更強的效能。例如,地理空間的景象還原、歷史文化故事與人物復(fù)原呈現(xiàn)、想象空間模擬等,甚至支持人在其中與它們深入互動。而在自然語言處理、全息投影、視覺識別與追蹤等技術(shù)的支持下呈現(xiàn)特定時空的地理空間信息與社會行業(yè)場景,以根據(jù)主體的需求與應(yīng)答展現(xiàn)后續(xù)情景,提供虛擬歷史場景,嵌入沉浸式學(xué)習(xí)環(huán)境,或智能追蹤人的行為等,都為智能技術(shù)的深入應(yīng)用提供了可能。所以,視覺交互在眾多技術(shù)的支持下,將使人智交互更接近于“人—人”交互。教育機器人的發(fā)展與應(yīng)用預(yù)示了這一前景。服務(wù)于兒童的社交機器人(Rubi)和微軟的人工智能產(chǎn)品,與學(xué)生一起形成“同學(xué)”間的多元互動,在學(xué)習(xí)中充當(dāng)了智能學(xué)伴的角色。它可以扮演虛擬的或?qū)嶓w的同事角色,與教師互動、共同備課、一起聽評課等。擁有認(rèn)知與情感智能的“計算機導(dǎo)師(AutoTutor)”“北極星人工智能助教”及“人工智能好教師”,則作為設(shè)計者和指導(dǎo)者,可精準(zhǔn)分析學(xué)生的認(rèn)知和行為模式,并結(jié)合情境為學(xué)生提供個性化指導(dǎo)(周琴等,2020)。作為學(xué)伴或教師的機器人,多基于各種技術(shù)集成打造而成,尤其是情感識別與表達(dá)、自然語言處理、面部表情與肢體語言等技術(shù)。這些機器人的交互方式主要有語音、面部、手勢、肢體及虛擬與實體模型等,其交互形態(tài)逐漸從聽覺走向視覺與觸覺交互,從虛擬走向?qū)嶓w交互,從攜帶走向與穿戴和嵌入共存,而交互體驗也逐漸接近于人與人之間的交流。 因此,以實體機器人實現(xiàn)的人智交互將是人工智能教育應(yīng)用的轉(zhuǎn)折點,展現(xiàn)了人工智能在人性化教育中的美好愿景。其視覺交互是人智互動最直接、最常用的方式,在教與學(xué)中有重要意義。
在教育系統(tǒng)活動中,主體的知識技能增長與能力提高通常涉及學(xué)與教的活動及認(rèn)知思維兩個層面。人工智能應(yīng)用賦能主體、賦能教育,也需要從活動與認(rèn)知思維兩個層面考慮。作為人工智能應(yīng)用的“連接樞紐”,人智交互的形態(tài)與方式直接影響其應(yīng)用的結(jié)果和效能。設(shè)計與應(yīng)用更要重視視覺交互方式及交互形態(tài),聚焦視覺交互操作以提高“內(nèi)輔”效果,聚焦視覺互動活動以增強“外輔”效用。
人工智能視覺交互的重要任務(wù)之一就是幫助主體看見、看清、看準(zhǔn)認(rèn)知對象。學(xué)習(xí)中直接的感受和體驗主要來自視覺?!爸庇^地看到”是通過視覺形成感知、完成理解并產(chǎn)生視覺記憶的重要方式,但不是一切意向?qū)ο蠖肌翱梢姟?。因此,視覺賦能的首要任務(wù)在于讓對象“可見”:一是讓看不見的看得見,要顯微,即讓微小的看得清晰,又要能縮小讓龐大的看得完整;二是讓看得見的看得明了,即讓無形的看得明白,隱形的看得清楚;三是要讓不存在的看得了,即要能虛擬,讓不存在的看見其形;又要能增強,讓存在的看得準(zhǔn)確??傊?,增強對象“可見性”就是借助人工智能視覺交互技術(shù)為教育主體表征意向?qū)ο蟮囊曈X影像,展現(xiàn)一切可學(xué)、將學(xué)之物。
在理想狀態(tài)下,人工智能應(yīng)用的視覺交互可以完美勝任“可視性”要求。這得益于智能型視覺應(yīng)用的優(yōu)勢:1)交互中可即時網(wǎng)羅大量“可見”內(nèi)容,可接入海量資源;2)在識別、比對、過濾等視覺功能的支持下,可以根據(jù)交互需要處理并展現(xiàn)事物,豐富“材料”展現(xiàn)方式;3)可根據(jù)交互情境與內(nèi)容需要推理和計算,產(chǎn)生精準(zhǔn)應(yīng)需的“可視物”,即事物的準(zhǔn)確展現(xiàn)。以“視像”表征意向?qū)ο?,這是人工智能視覺應(yīng)用“內(nèi)輔”服務(wù)中的核心。
人工智能視覺交互的另一項重點,是幫助教育主體看“懂”意向?qū)ο蟆R曈X交互的直觀可見在多數(shù)情況下是對意向?qū)ο蟊砻嫘畔⒌挠^察,往往不得其要??础岸币庀?qū)ο蟛粌H要明白其內(nèi)在特征,更要將其置于本原環(huán)境中動態(tài)觀察其內(nèi)外部關(guān)系。所以,人工智能視覺交互支持下的“看懂”需要“轉(zhuǎn)換形義”:一是引導(dǎo)主體看到重點,使其注意正確聚焦,使其心智有效操作;二是引導(dǎo)主體看得全面,使其理解連續(xù)而完整;三是引導(dǎo)主體看得透徹,使其抓住本質(zhì)。在連續(xù)的交互中做到這些并不容易,需要交互理解和交互響應(yīng)的連續(xù)往復(fù)。而在視覺空間內(nèi)的可變展現(xiàn),以及依據(jù)外在互動的可變調(diào)整,是智能化視覺交流賦能主體的重要途徑。
人工智能應(yīng)用的視覺交互可支持主體“看懂”的需求,更能滿足其個性地看的需要。增強型人工智能視覺技術(shù)擁有強大的視覺處理能力,能結(jié)合語義處理等相關(guān)技術(shù)提供視覺空間的靈活抽取與呈現(xiàn)、“視像”對象的多元定制與多維處理、視覺交互語義的動態(tài)調(diào)整等支持服務(wù),實現(xiàn)視覺空間中對同一事物不同形態(tài)的展現(xiàn)需要、同一事物不同的場景識別、不同事物的比較分析,以及對主體的交互動態(tài)與內(nèi)在狀態(tài)識別等。
未來人工智能視覺交互的技術(shù)發(fā)展與實踐應(yīng)用面臨更多挑戰(zhàn)。它的應(yīng)用不僅能在交互進程中基于對主體理解狀態(tài)的感知和判斷,調(diào)整展現(xiàn)給主體的視覺交互內(nèi)容及形式(即交互方式),還能根據(jù)主體的完整交互狀態(tài)調(diào)整交互策略。在此基礎(chǔ)上,通過人工智能還原式或催化式的視覺轉(zhuǎn)化以及智能機器人近似或逼真的“人格化”表達(dá),視覺展現(xiàn)的意義改變和“肢體”語義表達(dá)的調(diào)整才能趨于完善、完美?!靶瘟x一致”的視覺空間“可變性”是高級智能化的表現(xiàn),是人工智能視覺交互技術(shù)“內(nèi)輔”心智與“外輔”互動的重要方式。
人工智能視覺交互應(yīng)用的更高層級是其視覺賦能的“智慧性”。就教而言,人工智能視覺交互技術(shù)的應(yīng)用讓主體“會看”,而不僅是機器“會看”。如果說“看見”是知道某物的存在,“看懂”是理解事物,那么“會看”就是能夠根據(jù)實際從適當(dāng)?shù)慕嵌?、用適當(dāng)?shù)姆椒?、從特定的立場看。不管如何,它的目?biāo)是要使學(xué)習(xí)者靈活地看、智慧地學(xué)(祝智庭等,2018;權(quán)國龍等,2018)。人工智能視覺交互技術(shù)的高階發(fā)展可以達(dá)到“可見性”和“可變性”,但對它的“智能性”要求,是強人工智能技術(shù)應(yīng)用面臨的考驗,就像機器認(rèn)知發(fā)展——不僅是人讓機器可以,而且通過人工智能使人可以。以教育目標(biāo)分類而言,視覺交互的“智慧性”涉及視覺化遷移和應(yīng)用,即對照和比較;涉及視覺化分析,即分解與解析;也涉及評價和創(chuàng)造,即多維與多元;而不僅僅是“看見”和“看懂”,即知道、理解。
人工智能應(yīng)用的視覺交互要能賦能主體,使其“會看”,就需要上位的智慧理論、高維的知識框架、多源信息數(shù)據(jù)的構(gòu)造與發(fā)明。智慧的要領(lǐng)在于靈活與巧妙,是價值取向、目的基準(zhǔn)、方法優(yōu)選下的靈活。人工智能視覺交互能力,要做到靈活地思考、智慧地思想,還需要依賴多模態(tài)高密集、即時更新數(shù)據(jù)與模型支持及時的運算切換,需要依賴已有的、未來創(chuàng)新的算法支持應(yīng)需的靈活思考,更需要依賴只會快而不會慢的算力支持即時運算。就實際應(yīng)用效力看,“智能性”要求是人工智能視覺交互技術(shù)“內(nèi)輔”心智與“外輔”互動的重要手段。
如果說人工智能視覺交互的“可見性”和“可變性”主要輔助認(rèn)知與學(xué)習(xí),那么其“智慧性”主要輔助思維與教學(xué)?!翱梢娦浴薄翱勺冃浴薄爸腔坌浴弊鳛槿斯ぶ悄芤曈X交互應(yīng)用通則,其發(fā)展與應(yīng)用需要學(xué)習(xí)科學(xué)與教學(xué)理論的參與。就主體賦能過程看,“三性”通則在人工智能視覺交互技術(shù)賦能主體中有重要意義。
本研究選用人工智能集成環(huán)境和人工智能機器人的經(jīng)典案例,分析人工智能視覺交互在設(shè)計上的可期效果,以及應(yīng)用過程與結(jié)果上的理性預(yù)期。這幾個案例包括電影作品中的“智能艦長”、機器人瓦力和伊娃②,人形機器人(Pepper)和小胖機器人(Fabo)以及可穿戴式機器人(Fitbot)(柳晨晨等,2020)。它們分別代表未來預(yù)期的人工智能應(yīng)用、當(dāng)前主流應(yīng)用和初期應(yīng)用的交互形態(tài)。與實用的小胖等智能機器人相比,瓦力和伊娃在形態(tài)與智能上更接近于人。雖然經(jīng)過了藝術(shù)加工,但他們是未來機器人發(fā)展的方向。我們可以從案例中比較不同視覺交互方式與形態(tài)的主體賦能潛力。
1.認(rèn)知“內(nèi)輔”的視覺方式差異明顯。由于視覺化表達(dá)的需要,機器人瓦力和伊娃需要借助外部器件展現(xiàn)認(rèn)知的事物,如屏顯。人形機器人和小胖具備屏顯功能,可以通過視像顯示事物;可穿戴機器人幾乎不具有視像顯示能力。實際上,二維和三維投影技術(shù)就可以擴充、增強智能機器人的“內(nèi)輔”展現(xiàn)能力——這也是機器人在視覺交互上完勝于人的地方。機器人只有充分具備呈現(xiàn)能力,才能以“可見性”與“可變性”輔助主體的認(rèn)知需要。
2.互動“外輔”的視覺表達(dá)與互動回應(yīng)以“表情”與動作為主。智能集成環(huán)境可以通過調(diào)用獨立智能體以多種視覺方式完成互動回應(yīng)。瓦力和伊娃具有靈活、逼真的肢體表現(xiàn)、面部表情及語言和語音系統(tǒng),可以自如回應(yīng)服務(wù)主體;人形機器人、小胖和可穿戴機器人有情感識別和情感交互功能,主要通過語音完成交互,表情和肢體表達(dá)偏弱;可穿戴式機器人主要依賴語音系統(tǒng)??梢钥吹?,有獨立行動能力的機器人往往具備兩種重要的表達(dá)與回應(yīng)方式:表情(包括眼神)和動作。這兩種方式模擬了真人交往的重要元素,而語音的參與使這種模擬走向完美?;印巴廨o”對維系個體情感和賦能關(guān)系有重要作用。劉革平等(2021)在虛擬實驗中的手勢交互說明,互動“外輔”可增強沉浸感,提高學(xué)習(xí)動機與學(xué)習(xí)體驗,進而通過積極的參與和行動提高學(xué)習(xí)效果。
3.視覺交互的方式與形態(tài)是人工智能賦能主體的兩個重要方面?!皟?nèi)輔”認(rèn)知可用視覺符號表征“視像”,“外輔”互動主要依賴表情與肢體動作回應(yīng)交流。屏幕與投影器是前者主要的視覺交互實體,具備表情與行動能力的機器人是后者的實體形態(tài)。人工智能視覺交互賦能主體,就是要輔助主體的內(nèi)在認(rèn)識,協(xié)同其外在行動。其中,“內(nèi)輔”的重點在于視覺符號運用和展現(xiàn)方式選擇;“外輔”的關(guān)鍵是實體形態(tài)與(交互)響應(yīng)方式設(shè)計。兩者都與人工智能視覺交互的設(shè)計目標(biāo)與服務(wù)目的有關(guān)。依據(jù)視覺化、可視化之設(shè)計與應(yīng)用研究(權(quán)國龍等,2016),人工智能視覺交互的設(shè)計與應(yīng)用要關(guān)注對象的表征、情境的還原和動態(tài)交互的展現(xiàn),以透過學(xué)與教的原理輔助人的識別、呈現(xiàn)、模擬、分析、思考、表達(dá),最終完成主體賦能。在機器視覺和計算機視覺發(fā)展成熟的情況下,人工智能視覺交互方式與形態(tài)將在教與學(xué)情境下大幅增強其主體賦能的能力,勝任情境還原、過程展現(xiàn)和空間對象表征等需要。例如,舞蹈機器人在教學(xué)中可通過豐富的視覺展現(xiàn)與演示“內(nèi)輔”認(rèn)知,而伺服機器人在服務(wù)中可通過靈活的參與“外輔”互動交流。而最后的重點依然回到人工智能視覺交互的設(shè)計思想和運用策略。 不過,以人工智能視覺交互“賦能”主體,除關(guān)注交互形態(tài)與方式外,不可忽視其智能性,需要正視人工視覺智能的實際效應(yīng)與理想效能。目前人工智能應(yīng)用視覺交互的智能性尚處于有限的水平。
如果說以計算智能(王亞飛等,2018)為根基的人工智能教育應(yīng)用是“內(nèi)驅(qū)”數(shù)據(jù)動力的智能應(yīng)用,那么以視覺交互智能為基礎(chǔ)的人工智能教育應(yīng)用就是“外展”實踐空間的智能應(yīng)用。人工智能視覺交互可以使教育實踐活動在人智交互中充分展開,機器和智能的技術(shù)潛能也可以在人智交互中充分發(fā)揮。人工智能視覺交互質(zhì)的變化將在各種應(yīng)用形態(tài)中為教育主體帶來深刻影響。
以視覺交互為主的人智交互應(yīng)用將全面支持主體學(xué)習(xí),深化其學(xué)習(xí)效用,滿足“三性”通則的視覺交互可以將主體置于逼真的知識生產(chǎn)與應(yīng)用場景,通過視覺變換最大限度地顯現(xiàn)學(xué)習(xí)對象與學(xué)習(xí)過程,做到“內(nèi)輔”認(rèn)知方式,外輔”互動與行動策略。在視覺感知、視覺表達(dá)與行為表現(xiàn)的交互性理解與設(shè)計中, “三性”通則可以在多種情景需求中提供支持。機器視覺與計算機視覺技術(shù)的發(fā)展與應(yīng)用,將進一步形成人工智能教育應(yīng)用的發(fā)展方向。
“可見性”使學(xué)習(xí)主體能看到一切可看之物,在現(xiàn)實與數(shù)字的視域中、在感性與理性的范疇內(nèi)、在邏輯與直覺維度上不再有“盲區(qū)”。“可見”使得一切變得容易接觸,而“可變”使理解與掌握它們只是時間問題——眾多可選的視覺樣式、動與靜的展開式使理解不再是無法想象的混沌思慮,而是可欲可求的知會過程與思想給養(yǎng)。“可見性”與“可變性”的輔助效用是在視覺交互中對主體“認(rèn)”與“思”的延展;在視覺、聽覺、觸覺等多種模態(tài)交互信息的共同作用下,“可見性”與“可變性”通過“多源”信息融合為主體的理性思維與設(shè)計創(chuàng)造帶來可能。對充滿好奇心與求知欲的學(xué)習(xí)主體來說,“可見”“可變”的人工智能視覺交互特性將直接促進主體感性認(rèn)識與理性思考的直觀展現(xiàn)。而“智慧性”是在延展認(rèn)知的基礎(chǔ)上幫助主體獨立思考和創(chuàng)新思維。人工智能視覺交互中的“智慧”傳遞過程本質(zhì)上是思維的模仿。這里需要把握兩點:一是智慧地傳遞,即視覺化展現(xiàn)的有效性和靈活性;二是智慧的實體,即視覺化呈現(xiàn)的事物及巧妙的呈現(xiàn)形式。智慧性應(yīng)用只要形成例子就可以觀察模仿?!爸腔邸薄翱勺儭钡娜斯ぶ悄芤曈X交互是輔助主體思維和情感的重要方向。通過穩(wěn)定主體情感狀態(tài),引導(dǎo)其動機與目標(biāo),人工智能視覺交互可以在情感交互和具象交流的基礎(chǔ)上(柳晨晨等,2020)以特定的角色陪伴學(xué)習(xí)主體深化學(xué)習(xí)。在人工智能技術(shù)發(fā)展及情感研究的相互支持下,人工智能視覺交互也將進一步涉及主體的情感和意志。屆時以視覺交互外展的人智交互對主體認(rèn)知與行動的影響將變得全面而精致,主體在視覺空間與意義空間中的深層次自我認(rèn)知與個性化外部反饋(郭炯等,2019)也將在人工智能的情感關(guān)照中變得豐富而人性化。
在現(xiàn)代科技的教育應(yīng)用市場中,人工智能視覺交互應(yīng)用的趨勢是明顯的。2020年教育技術(shù)行業(yè)的創(chuàng)收達(dá)到2520億美元,年增長率為17%。其中,代表視覺技術(shù)應(yīng)用的增強現(xiàn)實處于領(lǐng)先地位。這與其自身優(yōu)勢緊密相關(guān),如學(xué)生的興趣和注意力的抓取、無障礙學(xué)習(xí)材料、無需特殊設(shè)備、快且有效的學(xué)習(xí)過程、可改進協(xié)作能力、支持實踐學(xué)習(xí)、適用于各類教育和培訓(xùn)(如對危險性工作的培訓(xùn))等(Aleksandrova,2018)。
人工智能視覺交互賦能主體、賦能教育必然包含對教師和教育教學(xué)的支持與服務(wù)。就教學(xué)應(yīng)用而言,人工智能視覺交互的支持也是“有向”“準(zhǔn)確”而“及時”的?!坝邢颉敝讣饶茚槍€體差異,也能關(guān)照群體共性。教育教學(xué)有此需求,教師在“一對多”的情形下更需要這種支持服務(wù)。人工智能視覺交互的支持也將變得“準(zhǔn)確”,直指個體與群體的潛在需求與即時問題。人工智能應(yīng)用總能指向應(yīng)用場景的“問題所在”,明確可以調(diào)整、改變的部分,提供及時而有力的智能支持。在教學(xué)應(yīng)用中人工智能視覺交互可以:1)在視覺化模擬與分析的基礎(chǔ)上,準(zhǔn)確預(yù)測教學(xué)中的關(guān)鍵目標(biāo)、重點環(huán)節(jié)及實施策略以幫助教師做好充分準(zhǔn)備;2)在視覺化識別與運算的基礎(chǔ)上,把握學(xué)習(xí)者狀態(tài)并理解其學(xué)習(xí)過程輔助教師適時調(diào)整教學(xué);3)在視覺化分析與統(tǒng)計的基礎(chǔ)上,診斷教學(xué)過程中存在的問題并能及時找到教學(xué)設(shè)計與實施中的疏漏與弊端;4)在視覺化推理與決策的基礎(chǔ)上,提出新的教學(xué)革新方案,形成新的教學(xué)設(shè)計;5)基于對學(xué)和教過程的充分了解,及時發(fā)現(xiàn)“主體間”的問題,推薦或推行系統(tǒng)性的教學(xué)方案。
人工智能視覺交互的支持也將恰在其時,以智慧的方式與主體在實踐情景中互動。在視覺交互層面上,教育系統(tǒng)中的數(shù)據(jù)、信息與知識甚至智慧都牽涉其中;智能教學(xué)中的主體感知、思考與行動也值得人工智能視覺交互的參與。人工智能應(yīng)用,能以視覺化方式創(chuàng)建和管理學(xué)習(xí)內(nèi)容,可以對所學(xué)內(nèi)容及學(xué)習(xí)過程與結(jié)果做最大程度的可視化展現(xiàn)與分析;進而,在獲得對學(xué)習(xí)進度和理解過程的重要見解(Sudarshan,2018)后,通過視覺交互在知識、技能、思維等方面“賦能”學(xué)習(xí)主體,如智能仿真教學(xué)系統(tǒng)(李愛霞等,2019)。無論是嵌入“環(huán)境”的人工智能,還是陪伴主體的人工智能,都離不開對環(huán)境和主體的狀態(tài)與過程數(shù)據(jù)的收集,都需要信息識別,自動收集信息,快速分析,即時聚焦,合理推薦,以及支撐并完成視覺化的實踐應(yīng)用。也正是在合理科學(xué)地應(yīng)用教育數(shù)據(jù)的基礎(chǔ)上,人工智能視覺交互可以支持教育教學(xué)的價值選擇和主體的思想與實踐活動,如基于智能決策引擎的智能閱卷和智能推題(王亞飛等,2018)。
由智能視覺交互外展的人智交互有賦能主體于教育實踐場域的“智能理想”。以機器視覺和計算機視覺技術(shù)為代表,以問題求解、邏輯推理、自然語言理解、自動程序設(shè)計、機器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)、模式識別、智能檢索等為基礎(chǔ)(吳永和等,2017),人工智能視覺交互在未來智能技術(shù)支持下將為教育主體帶來全新的學(xué)與教模式、體驗與效果。例如,增強現(xiàn)實應(yīng)用帶來的體驗(汪存友等,2016;陳凱泉等,2017)。教育系統(tǒng)的人智交互使未來教育在認(rèn)知方式、資源供給、課堂教學(xué)、教育形態(tài)和道德框架等方面面臨變革(柳晨晨等,2020)。這是未來人工智能教育應(yīng)用發(fā)展的機遇,也是人工智能技術(shù)、人智交互應(yīng)用、未來教育協(xié)同發(fā)展的新起點。
與此同時,人工智能視覺交互的教育實踐應(yīng)用也存在諸多現(xiàn)實困境,涉及人工智能技術(shù)本身、主體的多元適應(yīng)以及社會經(jīng)濟、政策與倫理等。例如,從技術(shù)應(yīng)用看,先進技術(shù)的實踐應(yīng)用需要高昂的成本,教育所期望的人工智能技術(shù)發(fā)展不夠成熟,應(yīng)用缺乏師資隊伍和師資培訓(xùn),現(xiàn)有的教與學(xué)過程面臨來自“新型智能與意識”的挑戰(zhàn),教育場域的人與人工智能共處的倫理問題,人工智能應(yīng)用涉及教育的公平、主體和本體等哲學(xué)問題。從應(yīng)用形態(tài)看,人工智能教育環(huán)境、系統(tǒng)、學(xué)伴、教師和管理者越來越“聰明”“自由”,作為獨立的存在它們?nèi)绾巍昂椭C”地參與學(xué)與教的活動;人工智能實體與主體協(xié)作的過程與結(jié)果在教育評估中如何被認(rèn)定。人工智能技術(shù)與人工智能視覺交互充分應(yīng)用于教育活動時,現(xiàn)有的教育體制會成為“桎梏”還是“適配性容器”,現(xiàn)有的教育模式是否需要調(diào)整,如人工智能教育的“盲區(qū)”和“禁區(qū)”問題的解決(張坤穎等,2017),等等。不過,可以肯定的是,當(dāng)人工智能技術(shù)的教育參與已然使教育主體和諧,使教育格局均衡、實現(xiàn)生態(tài)化時,體制與模式所面臨的更新就是必然的。
辯證地看待人工智能教育應(yīng)用進程中的機遇和挑戰(zhàn)是人智交互賦能未來教育的應(yīng)有姿態(tài)。人工智能視覺交互作為人工智能教育應(yīng)用的重要方向,要在理論研究與實踐應(yīng)用中把握教育科學(xué)規(guī)律,揚長避短使其良性發(fā)展。智能學(xué)習(xí)地圖的設(shè)計與應(yīng)用(顧小清等,2018)就是智能教育背景下學(xué)習(xí)主體需求導(dǎo)向的智能化設(shè)計與應(yīng)用。正如奧拉夫·扎瓦克奇-里克特等(2020)的觀察,人工智能教育不能與教學(xué)理論若即若離,要逐步探索符合教育規(guī)律和倫理規(guī)范的人工智能應(yīng)用。人工智能視覺交互應(yīng)用依然需要從“現(xiàn)代”人工智能的三個特征、算法的客觀與公正、保護隱私與權(quán)利等方面檢驗人工智能對教與學(xué)的促進作用。而人工智能技術(shù)新進展所預(yù)示的教育應(yīng)用新愿景也當(dāng)成為當(dāng)下人工智能教育應(yīng)用的航標(biāo),畢竟人工智能的潛力是可期的,就像現(xiàn)在的人工智能發(fā)展讓人驚訝一般。
[注釋]
① 武漢泰樂奇信息科技有限公司網(wǎng)址:http://www.curefun.com。
② “智能艦長”、瓦力和伊娃出自影片《機器人瓦力》。