近期,美國賓夕法尼亞州立大學博士生呂堯和合作者,開展了一項關(guān)于生成式人工智能(GenerativeAI)的研究。
其表示,這項研究的緣起可以追溯到近年來生成式人工智能技術(shù)的突飛猛進。
作為人工智能(AI)發(fā)展的一個全新賽道,生成式AI展現(xiàn)出令人驚艷的創(chuàng)造能力,能夠根據(jù)簡單的提示或指令,生成逼真的圖像、視頻、文本、音頻等豐富多媒體內(nèi)容。
其中,大型語言模型(如GPT-3)和文本到圖像、視頻的生成模型(如DALL-E、StableDiffusion)無疑是最耀眼的“明星”。
它們突破了人類認知的極限,讓AI系統(tǒng)也能擁有“想象力”,催生出超乎想象的創(chuàng)意作品。
與此同時,內(nèi)容創(chuàng)作者群體正在極力擁抱并駕馭這些生成式AI工具,將其融入到自身的創(chuàng)作實踐中。
借助AI的協(xié)助,人們可以極大提升創(chuàng)作效率,甚至超越自身的能力邊界,生成出高質(zhì)量且與眾不同的內(nèi)容作品。
詳細來說,本次研究始于2023年的一次同行交流。
當時,呂堯和本次論文的第二作者張和(音)、第三作者蔡杰(音)以及美國克拉克大學的牛碩博士參加了人機交互與普適計算大會(CSCW)。交流之中,牛碩提到了一個新興現(xiàn)象:內(nèi)容創(chuàng)作者們正在越來越多地嘗試將生成式AI工具融入創(chuàng)作實踐之中。
但是,具體是怎樣的嘗試?效果如何?存在什么機遇和挑戰(zhàn)?在這次交談中,他們都認為這是一個潛力很大的課題,并且表達了對這個課題的興趣。
基于這樣的疑問,他們開始查閱大量文獻,搜集各方觀點和一手素材。
通過幾個月的持續(xù)關(guān)注,他們逐步確立了本次研究的核心主題——對內(nèi)容創(chuàng)作中的生成式AI應(yīng)用進行系統(tǒng)性探索。
為全面了解內(nèi)容創(chuàng)作者運用生成式AI的實踐,他們設(shè)計了搜索策略,從視頻平臺YouTube上下載了大量相關(guān)視頻素材。
這其中也遇到了一些技術(shù)挑戰(zhàn),比如如何過濾無關(guān)視頻、如何獲取更多元化的示例等,通過多次調(diào)整策略之后他們才逐步攻克這些難題。
經(jīng)過初步篩選,他們最終鎖定68個高質(zhì)量分析樣本,覆蓋了多個不同創(chuàng)作領(lǐng)域。
這些視頻展示了創(chuàng)作者與生成式AI工具的實際互動過程,對于接下來的數(shù)據(jù)分析至關(guān)重要。
針對這批寶貴的一手素材,他們采用開放式編碼以及親和圖分組等經(jīng)典的定性研究方法,對視頻數(shù)據(jù)進行了細致分析。
其間,他們反復(fù)觀看理解每一個視頻,識別并標注出與研究問題相關(guān)的所有要素。
過程中最大的挑戰(zhàn)是如何準確理解和命名新名詞、新事物,因為生成式AI應(yīng)用是一個前沿領(lǐng)域,缺乏成熟理論框架和術(shù)語體系。
由于生成式AI的應(yīng)用實在太過新穎和前沿,他們在對視頻素材進行分類歸納時,常常會遇到概念界定的分歧和爭議。
有些AI工具比如Synthesia既可以生成圖像又可以生成視頻,那它到底應(yīng)該被歸為“圖像處理工具”還是“視頻處理工具”?
針對這一問題,小組成員在會議室里展開過激烈的辯論。
有人認為應(yīng)該根據(jù)工具的最終輸出形態(tài)來定義分類,但也有人提出這樣過于片面,忽視了工具在創(chuàng)作流程中所扮演的角色和貢獻。
最終,通過多輪討論碰撞,他們決定從工具在創(chuàng)作過程中的實際“行為”出發(fā),對每個視頻素材中呈現(xiàn)的AI用途進行編碼,再據(jù)此進行分類和命名。
這一看似簡單的方法論爭議,實則體現(xiàn)了他們對AI創(chuàng)作實踐本質(zhì)的深入思考。
另一個令呂堯印象深刻的討論焦點,則是關(guān)于“AI生成內(nèi)容”在當下是否真正屬于“創(chuàng)作”范疇的哲學命題。
由于AI只是根據(jù)提示和規(guī)則運算產(chǎn)生結(jié)果,那么是否可以用“創(chuàng)造”來形容?
這種質(zhì)疑不僅引發(fā)了他們對智人與智能界限的反思,也體現(xiàn)了生成式AI給傳統(tǒng)“創(chuàng)作”概念帶來的全新思考維度。
雖然未能給出一個終極定論,但他們每個人對于這一哲學命題都有了自己獨到的見解。
而在完成初步編碼之后,他們通過集中討論、歸納總結(jié),最終從海量原始數(shù)據(jù)中提煉出一系列有價值的發(fā)現(xiàn),并將它們逐一對應(yīng)到所設(shè)置的研究問題之中。
比如在“內(nèi)容創(chuàng)作者使用了哪些AI工具”這一問題上,他們總結(jié)出了語言模型、圖像處理器、視頻處理器等六大工具類型,并詳細列舉出每類型下的具體工具實例。
而在“AI工具在創(chuàng)作中扮演了何種角色”的問題上,他們則從視頻中總結(jié)歸納出了諸如“生成”“升級”“建議”等八種主要的AI貢獻行為。
最終,相關(guān)論文以《對YouTube用戶在內(nèi)容創(chuàng)作中使用生成式AI的初步探討》為題發(fā)在人機交互頂會上。
如果本次成果能夠得到業(yè)界的關(guān)注和認可,它可以為相關(guān)領(lǐng)域帶來一些積極的價值。
預(yù)計有望推動以下幾個方面的進展:
首先,優(yōu)化內(nèi)容創(chuàng)作工具。
根據(jù)課題組對創(chuàng)作實踐的細致分析,生成式AI工具的開發(fā)者可以更精準地把握用戶需求,開發(fā)出符合創(chuàng)作者習慣的一體化解決方案。例如,將視覺生成、音頻生成、視頻編輯等多種AI能力無縫集成到同一個創(chuàng)作平臺,從而簡化創(chuàng)作流程,提升工作效率。
此外,通過本次研究該團隊對生成式AI在創(chuàng)作中的具體角色和貢獻也有了更深入的認知。這可以為優(yōu)化工具的人機交互界面提供依據(jù),進一步提升人與AI的協(xié)作效能。
比如,可以在工具界面上增加更多反饋和修正的自由度,以及增加更智能的提示機制,幫助創(chuàng)作者高效地調(diào)整和控制AI輸出結(jié)果。
其次,推進人工智能教育。
生成式AI正在悄然改變內(nèi)容創(chuàng)作的游戲規(guī)則。相較于傳統(tǒng)的人力創(chuàng)作,AI輔助的創(chuàng)作模式無疑效率更高、門檻更低。
未來,如何高效利用這些新興工具,保證自身在激烈的人機競爭中不被邊緣化,將是內(nèi)容創(chuàng)作者亟待解決的現(xiàn)實課題。
而本次研究可以為設(shè)計AI教育培訓課程提供參考,幫助創(chuàng)作者獲得必要的AI素養(yǎng)。
包括高效調(diào)用和編排各種AI能力的技巧、評判AI輸出質(zhì)量的標準、創(chuàng)作中的人機分工模式等,從而順利融入人機協(xié)作的新常態(tài)。
再次,完善內(nèi)容審核和法律政策。
隨著生成式AI快速滲透內(nèi)容創(chuàng)作的各個環(huán)節(jié),審核AI生成內(nèi)容質(zhì)量的需求也將日益迫切。
本次針對當前內(nèi)容創(chuàng)作中生成式AI的具體使用場景和產(chǎn)出形態(tài)的研究,可以為制定相關(guān)審核標準、識別AI生成內(nèi)容的方法論提供依據(jù)。
從本次研究的結(jié)論來看,在視頻創(chuàng)作領(lǐng)域YouTube創(chuàng)作者普遍利用AI工具生成虛擬人物形象,進而用于錄制“人物”視頻。
那么在審核過程中,就可以基于人物動作、語音等細節(jié)特征,來鑒別視頻中的人物是否為真人。
另一方面,大規(guī)模AI生成內(nèi)容的涌入,也對現(xiàn)有的知識產(chǎn)權(quán)法律制度提出了新的挑戰(zhàn)。
誰擁有AI生成作品的版權(quán)?創(chuàng)作者的貢獻是否足夠獲得版權(quán)?算法本身能否享有某種權(quán)利?
諸如此類的法律爭議將暴露出越來越多的空白點,亟待通過司法判例和法律法規(guī)的補充來規(guī)范和明確。
而本次研究或可為厘清版權(quán)紛爭、探討相關(guān)法律責任提供一些實證支撐,為制定科學合理的AI內(nèi)容治理政策貢獻一份力量。
最后,催生新型商業(yè)模式。
生成式AI無疑是一種生產(chǎn)力,它在賦能內(nèi)容創(chuàng)作者的同時,也必將催生出新的商業(yè)模式。依托AI的力量,大批新生創(chuàng)作者將能更加便利地加入內(nèi)容創(chuàng)作的大潮,從而加劇這一領(lǐng)域的“去中心化”趨勢。
在這種趨勢下,創(chuàng)新的盈利模式或?qū)⒂楷F(xiàn)出來??梢灶A(yù)見,為了滿足AI輔d8c464ac35259f8f301844374e2800010e723c759c2bba64c98066c1956be5bc助創(chuàng)作過程的需求,將可能衍生出創(chuàng)作素材的交易市場、輔助創(chuàng)作服務(wù)的供應(yīng)鏈、為生成內(nèi)容“加成”并售賣的中間產(chǎn)品等新興商業(yè)形態(tài)。
例如,有一位YouTuber就曾展示如何基于AI素材模板,二次編輯生成出新穎有趣的視頻內(nèi)容,并通過售賣這些內(nèi)容產(chǎn)生收益。
而本次研究或許可以為這種“去中介”的新型創(chuàng)業(yè)累積理論基礎(chǔ),為尋找新的盈利模式指明方向。
此外,呂堯補充稱:“我想再次強調(diào)生成式AI對內(nèi)容創(chuàng)作領(lǐng)域帶來的深遠影響。這種影響不僅體現(xiàn)在創(chuàng)作工具和流程的變革之上,也將逐步滲透到內(nèi)容生態(tài)、商業(yè)模式、法律政策等多個層面?!?/p>
生成式AI為內(nèi)容創(chuàng)作者提供了全新的“智能助理”,有望解放創(chuàng)作者的生產(chǎn)力,催生出更多富有創(chuàng)意的作品。
與此同時,AI生成內(nèi)容的泛濫也可能對平臺的內(nèi)容質(zhì)量和知識產(chǎn)權(quán)造成一定沖擊。
如何在創(chuàng)新與管控之間尋求平衡,妥善利用AI優(yōu)勢,規(guī)避其潛在風險,是一個亟待解決的命題。
因此,呂堯希望本次研究能夠引發(fā)同行對這一話題的更多思考和討論。
與此同時,生成式AI及其在內(nèi)容創(chuàng)作領(lǐng)域的應(yīng)用正在日新月異地發(fā)展和演進,呂堯認為本次成果僅僅是勾勒出了一個萬里長征的起點。
未來,他們?nèi)詫⒕o密跟蹤這個前沿熱點,努力在以下方向取得新突破:
其一,擴展研究范圍。
目前,他們僅僅分析了YouTube視頻,但生成式AI的使用遠不止如此。
因此,其計劃將研究范圍擴展到其他主流內(nèi)容平臺,如TikTok、Instagram、X等,以便更全面地了解內(nèi)容創(chuàng)作者的實踐動向。
其二,追蹤技術(shù)發(fā)展。
第二代大型語言模型、視覺問答模型等AI創(chuàng)新層出不窮,必將進一步改變內(nèi)容創(chuàng)作的游戲規(guī)則。
所以,需要及時跟進這些發(fā)展動態(tài),分析其對創(chuàng)作實踐和內(nèi)容生態(tài)的影響。
其三,挖掘創(chuàng)作者體驗。
目前,他們主要關(guān)注的是創(chuàng)作產(chǎn)出的層面,但對內(nèi)容創(chuàng)作者的實際體驗和感受還缺乏深入了解。
未來,呂堯等人計劃開展定性研究,通過訪談等方式采集第一手數(shù)據(jù),全方位把握用戶在使用生成式AI時的切身感受。
其四,制定設(shè)計原則。
在理解創(chuàng)作實踐的基礎(chǔ)上,他們希望能總結(jié)出一些設(shè)計原則和最佳實踐,為工具開發(fā)者和內(nèi)容平臺提供指引,讓AI輔助創(chuàng)作工具更好地契合使用場景需求。
其五,探討倫理與政策。
生成式AI在推動內(nèi)容創(chuàng)新的同時,也可能帶來諸如版權(quán)糾紛、知識產(chǎn)權(quán)爭議等倫理法律問題。其也期望能夠就此開展相關(guān)研究,為應(yīng)對這些挑戰(zhàn)獻計獻策。(綜合整理報道)(策劃/克珂)