鐘以恒 鐘尚平
摘? 要:基于循環(huán)一致生成對抗網(wǎng)絡(luò)(CycleGAN)模型,生成了石材隨機紋理和蕾絲規(guī)則紋理兩大類型圖像。根據(jù)視覺效果技術(shù)指標計算、生成蕾絲紋理的視覺創(chuàng)作缺點分析,以及設(shè)計師主觀評價,揭示了兩類生成圖像具有的藝術(shù)價值和不同的應(yīng)用價值:可直接使用生成的石材紋理,而須經(jīng)過加工才能使用生成的蕾絲紋理,但可直接利用其多樣無窮的靈感和創(chuàng)意。面對類似蕾絲的規(guī)則紋理平面創(chuàng)意設(shè)計,“人-機”協(xié)同是時代發(fā)展的必然。
關(guān)鍵詞:CycleGAN模型;石材隨機紋理;蕾絲規(guī)則紋理;創(chuàng)意設(shè)計思考
無論是在現(xiàn)實世界還是在視覺藝術(shù)中,紋理都是重要的感知元素[1],紋理提供了豐富的細節(jié)和多樣性,這對計算機圖形而言是必不可少的。如圖1所示,圖像紋理可分為規(guī)則紋理和隨機紋理及其域變形和范圍變形[2]。來自大自然的石材紋理表現(xiàn)出耗散結(jié)構(gòu)[3],是典型的隨機紋理,主要包括大理石和花崗巖兩大紋理類型。如圖2所示:從左到右,前三幅為大理石圖像,后三幅為花崗巖圖像。蕾絲是鏤空織物,是人工或機器編織的網(wǎng)眼組織,其紋理具有一定的規(guī)則,在女裝特別是晚禮服和婚紗上用得很多,也經(jīng)常使用于服裝的袖口、領(lǐng)襟和襪沿。圖3為蕾絲紋理圖像示例。
行業(yè)調(diào)查表明,用于仿石材瓷磚的石材紋理圖案必須突破簡單拷貝天然石材紋理,而用于服裝設(shè)計的蕾絲紋理圖案必須突破人類設(shè)計師的創(chuàng)意枯竭,加入計算創(chuàng)意元素,才能滿足市場對產(chǎn)品的多樣化、藝術(shù)化和個性化等裝飾需求。傳統(tǒng)的紋理圖像計算機生成方法通過構(gòu)造紋理描述特征函數(shù),很難有效準確地反映真實圖像的分布,使得產(chǎn)生的紋理圖像在多樣性、清晰度等方面性能欠佳。
2014年GoodFellow等提出生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets, GANs)[4],就引起了學術(shù)界的廣泛關(guān)注,成為人工智能及深度學習領(lǐng)域的研究熱點。其最直接的應(yīng)用,就是用于圖像、視頻、自然語言和音樂等多種媒體的生成。目前GANs應(yīng)用于圖像紋理生成有兩類方式,即有監(jiān)督方式和無監(jiān)督域映射方式。作為典型的無監(jiān)督域映射GAN模型,循環(huán)一致生成對抗網(wǎng)絡(luò)[5](Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks, CycleGAN)引入了循環(huán)一致?lián)p失函數(shù),可以生成質(zhì)量較高的圖像,特別是針對目標輸出無法明確定義的圖像生成任務(wù)。
本文基于CycleGAN模型生成石材與蕾絲紋理圖像,從清晰度、多樣性、與訓(xùn)練集的近似程度等方面評估其視覺效果,分析其具有的創(chuàng)意設(shè)計美學藝術(shù)價值;在平面創(chuàng)意設(shè)計的應(yīng)用價值和應(yīng)用方法視角下,區(qū)分石材隨機紋理和蕾絲規(guī)則紋理,揭示了生成的石材隨機紋理具有直接應(yīng)用價值,而生成的蕾絲紋理圖像含有視覺創(chuàng)作缺點:不具有對稱與平衡的構(gòu)造,也不具有簡潔與留白的意境,需要經(jīng)過人類設(shè)計師的加工才能在平面創(chuàng)意設(shè)計中使用。但是人工智能對抗生成方法可無限生成多樣性的蕾絲圖像,理論上可以持續(xù)快速、無窮地給人類設(shè)計師提供輔助設(shè)計靈感和創(chuàng)意,節(jié)約設(shè)計師的時間和精力。因此,面對類似蕾絲的規(guī)則紋理圖像的平面創(chuàng)意設(shè)計,“人-機”協(xié)同,人工智能與人類設(shè)計師交叉融合和協(xié)同共進是時代發(fā)展的必然。
一、基于CycleGAN生成的石材與蕾絲紋理圖像及其視覺藝術(shù)價值
我們從福建南安石材交易市場自采集了197類、共8萬張石材紋理圖像,處理成256×256大小規(guī)格的石材圖像集。另外,我們從福建長樂某蕾絲貿(mào)易公司自采集了6大類、共5萬張蕾絲紋理圖像,處理成256×256大小規(guī)格的蕾絲圖像集。在Tensorflow深度學習框架下基于CycleGAN模型完成實驗,開發(fā)語言為python 3.5.2,使用4塊NVIDIA GTX 1080Ti GPU。實驗中,我們從石材圖像集中隨機選取大理石和花崗巖圖像各2萬張作為訓(xùn)練樣本,用近2×48小時分別訓(xùn)練成模型,并據(jù)此生成了大理石和花崗巖圖像各1萬張(可無限生成圖像),圖4和圖5為生成的大理石和花崗巖紋理圖像示例;另一方面,我們從蕾絲圖像集中隨機選取2萬張作為訓(xùn)練樣本,用近48小時訓(xùn)練成模型,并據(jù)此模型生成了蕾絲圖像1萬張(可無限生成圖像),圖6為生成的蕾絲紋理圖像示例;另外,我們還從蕾絲圖像集中隨機選取1萬張作為“紋理”訓(xùn)練樣本,以及從石材圖像集中隨機選取1萬張作為“風格”訓(xùn)練樣本,用近48小時訓(xùn)練成模型,并據(jù)此模型生成了帶石材風格轉(zhuǎn)換的蕾絲圖像1萬張(可無限生成圖像),圖7為生成的帶石材風格轉(zhuǎn)換的蕾絲紋理圖像示例。
目前,通過評價生成圖像的視覺效果來刻畫GAN模型的性能,具體方法如:通過計算Inception Score[6]、FID[7] (Frechet Inception Distance)等技術(shù)評價指標,來評估生成圖像的清晰度、多樣性以及與訓(xùn)練集的近似程度等視覺效果。另外,由于風格轉(zhuǎn)換圖像的清晰程度與“風格”訓(xùn)練樣本的紋理背景保持一致,清晰程度很難準確反映圖像風格轉(zhuǎn)換的效果;在多樣性和近似程度上,風格轉(zhuǎn)換圖像不同于“紋理”訓(xùn)練樣本和“風格”訓(xùn)練樣本,而是融合了兩者的特征,無法采用多樣性和近似程度指標去衡量。因此,在對圖像風格轉(zhuǎn)換圖像(如圖7)的視覺效果評價上,目前沒有合適的技術(shù)評價指標,主要根據(jù)人的主觀感受去衡量視覺效果的優(yōu)劣。
研究[8]及根據(jù)人的主觀感受去衡量圖4、圖5、圖6、圖7的視覺效果表明:基于CycleGAN生成的石材與蕾絲紋理圖像的清晰度、多樣性以及與訓(xùn)練集的近似程度等性能良好。
按視覺傳達設(shè)計原理[9],平面創(chuàng)意設(shè)計不僅通過分析美學產(chǎn)生的視覺刺激,從而進行心理層面的影響,以此達到有效的視覺傳達效果,體現(xiàn)藝術(shù)價值;同時,也要求達到視覺效果與使用功能的統(tǒng)一,將美學與應(yīng)用價值相結(jié)合,注重設(shè)計作品的交互性、功能性、人性化等方面。上述表明:基于CycleGAN生成的石材與蕾絲紋理圖像的視覺傳達效果良好,具有美學藝術(shù)價值。以下將從平面創(chuàng)意設(shè)計的角度,分析基于CycleGAN生成的石材與蕾絲紋理圖像的應(yīng)用價值及設(shè)計問題。
二、采用CycleGAN生成的石材與蕾絲紋理的創(chuàng)意設(shè)計應(yīng)用價值及應(yīng)用方法
在平面創(chuàng)意設(shè)計中,設(shè)計師會遇到“命題作文”的需求,即給定某個設(shè)計目的或某種藝術(shù)風格進行創(chuàng)作[10]。因此,在平面創(chuàng)意設(shè)計視角下,基于CycleGAN生成的石材、蕾絲紋理圖像要達成某個設(shè)計目的,就首先要回答如下基礎(chǔ)性問題:有應(yīng)用價值嗎?價值幾何?怎么用?
(一)基于CycleGAN生成的石材與蕾絲紋理圖像的應(yīng)用價值
石材與蕾絲行業(yè)調(diào)研結(jié)果表明:無論是具有自然隨機紋理特性的石材圖像,還是具有規(guī)則紋理特性的蕾絲圖像,目前都欠缺判斷其是否具有及具有多少應(yīng)用價值的技術(shù)評價指標,只能依據(jù)人類設(shè)計師的主觀評判。根據(jù)相關(guān)企業(yè)多名創(chuàng)意設(shè)計師對如圖4、圖5、圖6、圖7所示圖像的主觀評價可以得出:
1.從可用性角度看,目前以CycleGAN作為代表的人工智能對抗生成方法更適合生成隨機紋理圖像。也就是說,基于CycleGAN生成的石材圖像與自然產(chǎn)生石材圖像的異同已很難分辨,可直接用于生產(chǎn)如大理石瓷磚等產(chǎn)品;而生成的蕾絲紋理圖像只能給予人類設(shè)計師靈感和創(chuàng)意,需要經(jīng)過人類設(shè)計師的再加工才能應(yīng)用;
2.人類設(shè)計師做設(shè)計項目有了一定經(jīng)驗后,往往能摸索出套路或規(guī)律性的設(shè)計方法,這可以少走彎路,提高效率,但往往也失去了設(shè)計的新意。創(chuàng)新一直是設(shè)計界所追隨的目標。設(shè)計師是否具備創(chuàng)新思維與創(chuàng)新能力,往往決定著設(shè)計師的高度與作品呈現(xiàn)出的藝術(shù)價值。相比人類設(shè)計師,人工智能對抗生成方法可無限生成多樣性的石材與蕾絲圖像,可以持續(xù)快速(理論上)無窮地給人類設(shè)計師提供(輔助)設(shè)計靈感和創(chuàng)意,從而滿足新時代產(chǎn)品設(shè)計的個性化需求,結(jié)合現(xiàn)代設(shè)計理念,有效提升設(shè)計高度。
(二)基于CycleGAN生成的蕾絲紋理圖像的視覺創(chuàng)作缺點
按蕾絲行業(yè)設(shè)計師和視覺創(chuàng)作常用的美學原理:蕾絲紋理一般需要具有對稱與平衡的構(gòu)造。對稱的設(shè)計,可以使人產(chǎn)生平和、莊重、嚴謹?shù)男睦砀惺?,而平衡的擺放可以給人心理上帶來穩(wěn)定的感受。在視覺的形式美中,平衡性是形式美的核心。從陰陽太極圖案到傳統(tǒng)年畫、剪紙、工藝品上的圖案等,多數(shù)都采用了平衡的設(shè)計語言,使畫面在輕重上體現(xiàn)出和諧的視覺效果,而不平衡則用來表現(xiàn)自然的特性(如:石材圖像等)。如圖6、圖7所示,基于CycleGAN生成的蕾絲紋理圖像目前并不具有平衡性。
另外,按視覺創(chuàng)作常用的美學原理,人類設(shè)計師常常使用“簡潔與留白的意境”設(shè)計?!傲舭住敝干倭康膱D像為主體,具有一定章法和節(jié)奏地在畫面上留出空間,給受眾留有想象的余地,給畫面一種正在呼吸的感覺。這一手法也是極具中國美學特征的。在樸素的設(shè)計作品中美學不在于設(shè)計形式上的復(fù)雜性,而在于對至微細節(jié)的掌控,這種掌控其實也源自對所要表達的主題的深入研究。也就是說,人類設(shè)計師往往會主觀地控制畫面的構(gòu)圖,虛實相生,而使我們想要表達的設(shè)計變得主旨更突出、核心更概括、圖像也因此而更加具有意境美。一味堆積設(shè)計元素有時反而會使得畫面顯得擁擠,化繁為簡既是設(shè)計的美學,也是生活的哲學。如圖7所示,基于CycleGAN模型生成的帶石材風格轉(zhuǎn)換的蕾絲紋理圖像,畫面擁擠,整體視覺效果不夠簡潔、大氣,目前的人工智能顯然還不具備人的情感和想象力。
(三)如何用好基于CycleGAN生成的石材與蕾絲紋理圖像
如上述,基于CycleGAN生成的石材圖像的可用性好,可以直接用于生產(chǎn)如大理石瓷磚等產(chǎn)品。我們討論:怎么才能用好基于CycleGAN生成的蕾絲紋理圖像?
由上所述,基于CycleGAN生成的蕾絲紋理圖像目前只能作為人類靈感和創(chuàng)意的來源,需要經(jīng)過人類設(shè)計師的再加工才能使用。因此,要用好它,首先人類設(shè)計師需提煉出設(shè)計目標和設(shè)計需求,待CycleGAN模型產(chǎn)出多種創(chuàng)意設(shè)計圖像后,設(shè)計師去挑選他們喜歡的創(chuàng)意方案,或者進行不斷地重新組合,直至產(chǎn)生最滿意的結(jié)果。實際上,通過以上工作,機器能夠快速設(shè)計出符合特定內(nèi)容和風格的圖像,輔助設(shè)計師完成草稿;針對上節(jié)所述的生成圖像的創(chuàng)作缺點,由人類設(shè)計師進行創(chuàng)意修改和細節(jié)深入??偟膩碚f,人工智能不僅給人類設(shè)計師提供(輔助)設(shè)計靈感和創(chuàng)意,同時也節(jié)約了設(shè)計師的時間和精力[11]。
在基于CycleGAN生成石材與蕾絲紋理圖像的設(shè)計實踐中,人工智能系統(tǒng)作為輔助創(chuàng)意設(shè)計的工具,已經(jīng)達到了創(chuàng)作或輔助創(chuàng)作的標準,具有較好的應(yīng)用前景。
三、石材與蕾絲圖像的人工智能對抗生成與人類創(chuàng)意設(shè)計的協(xié)同共進
在石材與蕾絲圖像的基于CycleGAN的人工智能對抗生成實際中,我們再一次看到:機器適合生成隨機紋理,如石材圖像;而對類似蕾絲的規(guī)則紋理圖像的生成,機器僅僅可以承擔部分創(chuàng)造性工作,但是最具創(chuàng)新意義的轉(zhuǎn)換創(chuàng)造,目前只能通過“人-機”協(xié)同的方式完成[12]。也就是說,基于目前的技術(shù)和算法能力,人工智能生成的蕾絲紋理設(shè)計結(jié)果相比人類設(shè)計師的作品還是非常初級的,甚至存在基本的視覺創(chuàng)作缺點。這正說明了人類設(shè)計師的不可取代性,人的情感和想象無可替代[13]。
另外,綜上所述可知:在美學藝術(shù)和應(yīng)用價值評估方面,無論是針對具有自然隨機紋理特性的石材圖像,還是針對具有規(guī)則紋理特性的蕾絲圖像,目前都缺少較為準確的技術(shù)評價指標,只能依據(jù)人類設(shè)計師的主觀評判。
但是在這個融合協(xié)同的時代,人工智能已經(jīng)可以輔助設(shè)計師完成重復(fù)性的勞動,提高人類設(shè)計師的工作效率,因此,設(shè)計師更需要了解人工智能技術(shù),懂得將它作為一個強大的輔助設(shè)計工具來使用。另一方面,目前的人工智能是沒有理解能力的,更談不上具備人的情感和想象,人工智能永遠在路上[14]。社會和時代的發(fā)展為人工智能提供了學習、理解和輔助人類創(chuàng)意設(shè)計的機會。
四、結(jié)語
針對基于CycleGAN模型生成的石材隨機紋理和蕾絲規(guī)則紋理兩大類型圖像,技術(shù)指標及主觀評價表明:基于CycleGAN模型可生成具有美學藝術(shù)價值的石材與蕾絲紋理圖像。另外,行業(yè)設(shè)計師認為:生成的石材隨機紋理圖像可用性好,而生成的蕾絲規(guī)則紋理圖像不具有對稱與平衡的構(gòu)造,也不具有簡潔與留白的意境,需要經(jīng)過人類設(shè)計師的加工才能使用。但鑒于人工智能對抗生成方法可無限生成多樣性的蕾絲圖像,可以持續(xù)快速、無窮地給人類設(shè)計師提供輔助設(shè)計靈感和創(chuàng)意。因此,只要通過“人-機”協(xié)同的方式,我們相信,人和未來的機器將共同創(chuàng)造出更好的創(chuàng)意設(shè)計,促進設(shè)計行業(yè)變革,滿足新時代產(chǎn)品設(shè)計的個性化需求。
參考文獻:
[1]Bergmann U, Jetchev N, Vollgraf R. Learning Texture Manifolds with the Periodic Spatial GAN[C]// Proceedings of the 34th International Conference on Machine Learning, Sydney, Australia: ACM, 2017:469-477.
[2]Georgiadis G, Chiuso A, and Soatto S. Texture Compression[C]//Proceedings of the IEEE Data Compression Conference, Snowbird, Utah, USA: IEEE, 2013:221-230.
[3]申維.耗散結(jié)構(gòu)、自組織、突變理論與地球科學[M].北京:地質(zhì)出版社,2008.
[4]Goodfellow I J, Pouget-Abadie J, Mirza M, et al. Generative Adversarial Nets[C]//Proceedings of the International Conference on Advances in Neural Information Processing Systems, Montreal, QC, Canada: MIT Press, 2014:2672-2680.
[5]Zhu J Y, Park T, Isola P, et al. Unpaired Image-to-Image Translation Using Cycle-Consistent Adversarial Networks[C]// Proceedings of the International Conference on Computer Vision, Piscataway, NJ,USA:IEEE, 2017: 2242-2251.
[6]Salimans T, Goodfellow I, Zaremba W, Cheung V, Radford A, Chen X. Improved Techniques for Training Gans[C]// Proceedings of the International Conference on Advances in Neural Information Processing Systems, Barcelona, SPAIN: MIT Press, 2016: 2234–2242.
[7]Heusel M, Ramsauer H, Unterthiner T, Nessler B, and Hochreiter S. GANs Trained by a Two Time-scale Update Rule Converge to a Local Nash Equilibrium[C]// Proceedings of the International Conference on Advances in Neural Information Processing Systems, Long Beach, USA: MIT Press, 2017:6629–6640.
[8]徐強,鐘尚平,陳開志,張春陽.不同紋理復(fù)雜度圖像生成中CycleGAN循環(huán)一致?lián)p失系數(shù)優(yōu)化選擇方法[J].計算機科學,2019(1):100-106.
[9]曹方.視覺傳達設(shè)計原理[M].南京:江蘇美術(shù)出版社,2014.
[10]杜宇慧.美學思想在視覺設(shè)計中的體現(xiàn)[J].數(shù)碼設(shè)計,2019(9):20.
[11]高峰,焦陽.基于人工智能的輔助創(chuàng)意設(shè)計[J].裝飾,2019(11):34-37.
[12]范向民,范俊君,田豐,戴國忠.人機交互與人工智能:從交替浮沉到協(xié)同共進[J].中國科學:信息科學,2019(3):361-368.
[13]范迪安.一堂好課——范迪安談未來的人工智能[EB/OL].[2020-03-16].http://tv.cctv.com/2019/12/08/ VIDEQtsm9rjpn9Q3l0ZDSVjA191208.shtml.
[14]張鈸.走向真正的人工智能[EB/OL].[2020-03-16].https://baijiahao.baidu.com/s?id=1604667011248503461&wfr=spider&for=pc.
作者簡介:鐘以恒,東南大學藝術(shù)學院。
鐘尚平,博士,福州大學數(shù)字與計算機科學學院教授。研究方向:機器學習。