摘要:數(shù)字技術開啟了全新的數(shù)字影像時代,數(shù)字影像對傳統(tǒng)的影像產業(yè)和審美觀念的變革也輻射到經濟社會發(fā)展的各個方面。文章從數(shù)字影像時代生成式人工智能應用現(xiàn)狀入手,基于技術可行性和市場需求度兩個方面,對生成式人工智能技術嵌入宣傳片的可行性進行分析,發(fā)現(xiàn)生成式人工智能技術的應用可以有效提高影像清晰度,改善圖像細節(jié),甚至可以應用于虛擬現(xiàn)實和增強現(xiàn)實領域提升用戶的視覺觀感和體驗?;诖竽P桶l(fā)展現(xiàn)狀,文章探索出收集素材與模型訓練、模型反饋及優(yōu)化、多模態(tài)交互的生成式人工智能技術嵌入高職招生宣傳片的路徑,得出以下結論:生成式人工智能技術通過語義分析、圖像識別、自動剪輯等功能對招生宣傳片內容進行智能生成和處理,為高職招生宣傳視頻的制作提供了更豐富、更創(chuàng)新的方式,可以有效提升宣傳效率和效果。相比于傳統(tǒng)宣傳片的制作,生成式人工智能技術生成宣傳片的過程是通過數(shù)據模型訓練,且隨著大模型技術不斷發(fā)展和數(shù)據規(guī)模的增加,與文本、圖片、視音頻等有關的內容生成數(shù)據訓練和其應用所覆蓋的領域逐漸增多,其成本將進一步降低,宣傳片的調整會及時響應、適配不同受眾,宣傳片更新會更加快速,從而形成技術和宣傳片之間的正反饋循環(huán)。這對于高職院校吸引優(yōu)質生源、提升高職院校的知名度和形象、增強高職院校競爭力等至關重要。
關鍵詞:人工智能技術;AIGC;職業(yè)院校;招生宣傳片
中圖分類號:G717.32 文獻標志碼:A 文章編號:1674-8883(2024)08-0146-03
基金項目:本論文為2023年度北京市高等教育學會“首都產業(yè)升級轉型背景下職業(yè)教育產教融合路徑優(yōu)化策略 與典型案例研究”成果,項目編號:MS2023376
人工智能(AI)作為計算機科學的分支,主要應用聚焦于模擬、延伸、拓展人類智能相關方法、技術及應用系統(tǒng)。圖靈獎得主、人工智能之父約翰·麥卡錫將人工智能技術概括為要讓機器的行為看起來就像人所表現(xiàn)的智能行為一樣。AI技術自興起至今已經有60余年歷史,經歷過三次發(fā)展高潮,現(xiàn)已作為第四次產業(yè)革命的引擎[1]。自OpenAI公司推出新模型ChatGPT后,生成式人工智能AIGC(AI Generated Content)進入大眾視線[2]。作為專業(yè)生成內容(PGC)和用戶生成內容(UGC)之后新生成內容來源和生成方式的整合,被廣泛應用于媒體傳播領域。
AIGC應用于影像既可以改善其輸出影像的視覺質量和效果,也可以通過虛擬現(xiàn)實和增強現(xiàn)實技術實現(xiàn)新內容的生成,為數(shù)字影像的創(chuàng)作、處理增加創(chuàng)意。生成式人工智能技術通過人工智能算法從海量數(shù)據中學習提取相關要素生成全新內容,不僅具備人工智能的分析、判斷、決策功能,還具有內容創(chuàng)作功能[3]。隨著人工智能相關技術和工具的改進,實現(xiàn)了以人類水平能力生成內容的顛覆式技術創(chuàng)新,這也為其應用于數(shù)字影像產業(yè)注入了新活力[4]。
當前來看,生成式人工智能最常見的應用場景集中于機器輔助生成內容階段,在文本和代碼領域(例如文字續(xù)寫或糾錯、文字轉語音、文字生成語音等領域)的應用相對成熟,圖像和視頻領域還需進一步探索[5]。當前來看,生成式人工智能在圖像和視頻領域主要是通過圖像智能編輯、智能海報生成、視頻智能配音及剪輯、智能特效等方式提高或替代部分專業(yè)性機械勞動[6]。數(shù)字影像與人工智能及生成式人工智能技術的結合現(xiàn)階段主要應用于視覺大模型應用領域。
生成式人工智能技術歷經早期的符號主義(邏輯主義)、連接主義、行為主義,直到人工神經元網絡的提出及神經網絡的重新流行,再到深度學習的興起,到2020年后集成多模態(tài)生成模型運用不同維度數(shù)據,如圖像、文本、聲音等,在高維空間的不同分布進行多模態(tài)復合式生成,隨技術、算法、模型的不斷優(yōu)化迭代,其應用領域不斷擴展[7]。將生成式人工智能技術嵌入宣傳片制作中,可以在一定程度上提高制作效率和創(chuàng)意表達。
(一)技術可行性
從技術手段上來看,生成式人工智能可以應用于影像增強、影像生成和處理、影像修復和恢復、影像插值等領域。具體來說,通過生成式對抗網絡技術(GAN)的生成樣本與鑒別樣本,將模糊、不清晰的圖像和視頻轉換成視覺效果更優(yōu)質的圖像和視頻;通過人工智能生成技術提高并完善低照度圖像的亮度和細節(jié);通過生成式人工智能技術合成不同曝光度影像;通過生成式人工智能技術將損壞影像、低分辨率影像進行重構等等。
生成式人工智能技術可以有效提高影像清晰度,改善圖像細節(jié),甚至可以應用于虛擬現(xiàn)實和增強現(xiàn)實領域,增強用戶的視覺觀感和體驗。
(二)市場需求度
從市場需求來看,首先,將生成式人工智能技術嵌入宣傳片制作,可以滿足宣傳片個性化定制的創(chuàng)意性需求。通過錄入大量相關宣傳片數(shù)據,智能提取出所需要的關鍵詞和元素集,并指定宣傳片的特定風格、面向人群等,針對不同目標受眾達到多元化宣傳的目的。其次,將生成式人工智能技術嵌入宣傳片制作中,既可以提高宣傳片制作效率,又能降低制作成本。
此外,隨著生成式人工智能“類人”能力的不斷增強,內容生成大模型的推理能力也將不斷突破,與智能化的推薦系統(tǒng)、模型相互交互,將以低廉成本產生面向不同受眾的宣傳片版本,進一步提高宣傳效率[8]。值得注意的是,生成式人工智能技術的應用存在著敏感數(shù)據外泄、易生成錯誤信息等風險。面對此類新型技術風險,技術工程師正試圖從技術領域進行規(guī)避,如基于人類反饋的強化學習訓練(RLHF)將模型與人類價值觀對齊,已取得一定成效。
在工業(yè)化發(fā)展進程中,農業(yè)經濟、工業(yè)經濟到現(xiàn)階段的數(shù)字經濟社會發(fā)展對勞動力的需求在不斷變化,職業(yè)教育作為教育體系中的重要組成部分,能夠滿足勞動力需求變化,數(shù)字化轉型背景下我國職業(yè)教育已進入提質培優(yōu)、增值賦能新階段。但相比普通教育,職業(yè)教育始終面臨著“矮人半截”的窘境,一方面在于職業(yè)教育培養(yǎng)體系與企業(yè)實際要求的職業(yè)技能與素養(yǎng)存在“兩張皮”錯位時滯性問題;另一方面,大眾對職業(yè)教育存在認知錯位,面臨知曉度不高、信息鏈不完善等問題[9]。招生宣傳作為大眾了解職業(yè)教育、將招生宣傳透明化的重要途徑,把握好招生宣傳片的窗口抓手對于提高大眾對高職認知、為我國現(xiàn)代化道路建設注入職教力量、推進職業(yè)教育高質量發(fā)展至關重要,更是高職院校實現(xiàn)“陽光招生”、形成特色職業(yè)院校宣傳的關鍵舉措[10]。
相比于本科院校,職業(yè)教育更注重技能的傳授,將最新的生成式人工智能技術嵌入高職宣傳片一方面既符合職業(yè)教育發(fā)展初衷,技能培訓不僅僅局限于傳統(tǒng)技能更強調前沿技術的應用[11];另一方面又是對生成式人工技術應用的長尾效應場景擴展[12]。生成式人工智能技術作為現(xiàn)階段代表性顛覆性技術,遵循顛覆性技術“從邊緣力量到未來主流”的技術演進過程,在成為主導技術的過程中經過多輪技術跨領域匯聚—融合—試錯—收斂,需要在技術與愿景、實際需求之間進行適配[13]。將生成式人工智能技術嵌入高職宣傳片作為顛覆性技術的擴散拓軌過程,其路徑遵循著從初始場景到中間場景,再到目標場景、擴展場景的應用躍遷,符合從原始性創(chuàng)新到集成融合型創(chuàng)新模式。
(一)收集素材與模型訓練
將生成式人工智能技術嵌入高職宣傳片,需要收集目標高職院校的素材,包括與招生相關的視音頻資料,院校、專業(yè)介紹等文本信息,若素材不符要求將直接影響生成效果和宣傳片成品[14]。需要對收集的資料進行處理、修剪,調整大小和格式等,以滿足生成式人工智能模型的要求。在此過程中,還需要形成對應規(guī)則訓練模型,讓模型進行學習,熟悉素材的特征和規(guī)律,對模型進行監(jiān)督調優(yōu),并為下一步生成新內容提供依據[15]。
(二)模型反饋及優(yōu)化
首先,針對模型進行訓練和反饋,人類專家參與到內容生成過程中,通過輸入控制參數(shù)、高職招生宣傳關鍵字等,引導模型生成特定內容。其次,生成的內容需要持續(xù)進行調整改造,包括招生宣傳片的細節(jié)修正、微調等等,以確保生成的招生宣傳片更符合院校要求。最后,導出整合形成完整的宣傳片。值得注意的是,在生成式人工智能技術嵌入高職宣傳片的過程中,仍需要人類專家的參與、判斷和干預,如創(chuàng)意的方向、整體宣傳片的導向調整等,以確保最終成品的質量。同時,在技術應用宣傳片生成的過程中,仍需確保版權的合規(guī)性,防止出現(xiàn)侵權等問題。
(三)多模態(tài)交互
生成式人工智能技術還可以利用跨模態(tài)模型進行內容生成,通過圖像甚至文本即可生成視頻,隨著模型的不斷升級,不僅可以把握圖像、文本的具體含義,還可拆分出不同層次,將其轉化成更富創(chuàng)意的視頻生成內容,彌補生成式人工智能應用創(chuàng)意不足等問題?,F(xiàn)階段生成式人工智能技術已進入指數(shù)級進化階段,自文本生成圖像至文本生成視頻歷經了短時間的跨越,多模態(tài)大模型展現(xiàn)出強大性能,不同于以往人工智能視頻的塑料感,最新版生成式人工智能多模態(tài)模型對文本數(shù)據的處理使生成視頻的精良度和藝術感顯著提升,視頻細節(jié)的精細度幾乎已達到專業(yè)水準。
現(xiàn)階段是人工智能技術賦能各行業(yè)的關鍵期,將孕育催生無數(shù)新業(yè)態(tài)。將生成式人工智能技術嵌入高職宣傳片,為高職招生宣傳提供了新思路。通過生成式人工智能模型語義分析、圖像識別、自動剪輯等功能對影像內容進行智能生成和處理,為高職招生宣傳視頻的制作提供更豐富、創(chuàng)新的方式。作為改變游戲規(guī)則的技術,生成式人工智能技術的應用使高職招生宣傳片在視頻呈現(xiàn)的內容和方式上實現(xiàn)了顛覆式創(chuàng)新和升級,未來甚至可以實現(xiàn)針對需求不同的生源定制化生成宣傳片內容,更加清晰地宣傳和展現(xiàn)高職院校的實力和特色,提升宣傳效率和效果,與目標生源進行高效交互互動,增強宣傳片受眾的參與感,這對于提升高職院校競爭力至關重要。除了將生成式人工智能技術嵌入具體應用場景外,還應關注的是生成式人工智能技術嵌入對視頻領域邏輯的改變。隨著個人生成視頻門檻的降低,影像創(chuàng)作、傳播將更簡單、高效、多樣。其通過抽象文本生成、制作出類似電影的多鏡頭視頻功能,使普通用戶也可達到接近專業(yè)導演、攝影的鏡頭應用水準,降低視頻制作的門檻和難度,未來人人都可以成為視頻內容生成者將成為現(xiàn)實。
值得注意的是,隨著生成式人工智能技術的超速發(fā)展和模型單位不斷迭代,生成式人工智能技術應用下視頻影像的存儲和隱私、產權保護問題將迎來新的挑戰(zhàn),監(jiān)管問題日益凸顯,生成式人工智能技術賦能視頻領域如何有序、健康發(fā)展將成為未來的重要課題。
參考文獻:
[1] 張心悅.人工智能技術發(fā)展現(xiàn)狀與展望[J].電子技術與軟件工程,2021(2):199-200.
[2] 高含鈺.人工智能ChatGPT將為市場帶來什么[J].中國質量萬里行,2023(8):75-76.
[3] 支振鋒.生成式人工智能大模型的信息內容治理[J].政法論壇,2023,41(4):34-48.
[4] 閔嘉劍,于博柔,張昕.生成式人工智能時代的設計教學探索:以清華大學“AI生成式影像”課程為例[J].建筑學報,2023(10):42-49.
[5] 徐思彥.生成式人工智能:發(fā)展演進及產業(yè)機遇[J].人工智能,2023(4):43-50.
[6] 肖君,白慶春,陳沫,等.生成式人工智能賦能在線學習場景與實施路徑[J].電化教育研究,2023,44(9):57-63.
[7] 翟葵.視覺語法下人工智能宣傳片的多模態(tài)話語分析[J].海外英語,2022(15):56-58.
[8] 王哲,宋重陽.人工智能的應用對宣傳文化領域的風險挑戰(zhàn)及對策分析[J].信息系統(tǒng)工程,2021(3):58-60.
[9] 喬曉艷.職教高地建設背景下高職招生制度實施現(xiàn)狀,困囿與改革進路[J].教育與職業(yè),2023(2):47-53.
[10] 張楠.新媒體環(huán)境下高職院校新聞宣傳隊伍的重點任務與建設策略[J].現(xiàn)代職業(yè)教育,2023(6):113-116.
[11] 許嘉揚,郭福春.數(shù)字化時代高職教育教學改革的知識圖譜分析[J].高等工程教育研究,2023(4):138-144.
[12] 徐卓函.大數(shù)據時代人工智能的創(chuàng)新與發(fā)展研究[J].科技資訊,2015(13):2.
[13] 肖仰華.生成式語言模型與通用人工智能:內涵,路徑與啟示[J].學術前沿, 2023(14):49-57.
[14] 彭瑜.新輿論環(huán)境下典型宣傳要三個“兩手抓”[J].新聞研究導刊,2018,9(17):164.
[15] 曹曉明,張永和,潘萌,等.人工智能視域下的學習參與度識別方法研究 [J].遠程教育雜志,2019,37(1):13.
作者簡介 李穎,助理研究員,研究方向:技術經濟及管理。