亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Imagen AI,從自然文本中生成逼真的圖像

        2022-06-23 05:31:22曹欣
        電腦報(bào) 2022年23期
        關(guān)鍵詞:圖庫壽司人工智能

        曹欣

        說起DALL-E2的大名,很多關(guān)注人工智能科技行業(yè)的讀者都了解??梢哉f,文本生成圖像這個(gè)堪比考驗(yàn)人工智能想象力的技術(shù)制高點(diǎn),被DALL-E2發(fā)揮得淋漓盡致。在OpenAI宣布DALL-E2(其最新的從文本創(chuàng)建圖像的 AI 系統(tǒng))大約一個(gè)月后,Google 的“文本到圖像擴(kuò)散模型Imagen”加入到了這場AI競賽中。

        使用標(biāo)準(zhǔn)度量FID(Frechet Inception Distance score,計(jì)算真實(shí)圖像和生成圖像的特征向量之間距離的一種度量),Google Imagen 在COCO(Common Objects in Context,是微軟團(tuán)隊(duì)提供的一個(gè)可以用來進(jìn)行圖像識別的數(shù)據(jù)集)數(shù)據(jù)集上以 7.27 的得分超過了Open AI 的 DALL-E2。盡管沒有使用COCO進(jìn)行“培訓(xùn)”,但I(xiàn)magen的表現(xiàn)仍然很好。Imagen 在人工評分者中也優(yōu)于 DALL-E2 和其他競爭的文本到圖像方法。

        Imagen的工作原理是采用自然語言文本輸入,例如“一只戴著藍(lán)色格子貝雷帽和紅色圓點(diǎn)高領(lǐng)毛衣的金毛獵犬”,然后使用T5-XXL 編碼器將該輸入文本轉(zhuǎn)換為嵌入。接下來“條件擴(kuò)散模型”將文本嵌入映射到一個(gè)小的64×64 圖像中,Imagen使用文本條件超分辨率擴(kuò)散模型將64×64圖像采樣為256×256和1024×1024。

        與去年秋天NVIDIA的GauGAN2方法相比,Imagen 在靈活性和結(jié)果方面都有了顯著的提升,意味著影像基礎(chǔ)的人工智能正在迅速發(fā)展。比如右面這張“一只柯基犬住在用壽司做的房子里”的圖片,看起來真實(shí)度很高,就像有人真的用壽司建造了一個(gè)狗屋,而且柯基犬很喜歡它,其實(shí)這一切都是虛構(gòu)的。

        一些用戶在訪問Imagen后會立即開始輸入各種短語,比如:“一對機(jī)器人夫婦在埃菲爾鐵塔的背景下享用美食?!比绻麤]有特定的關(guān)鍵詞,有可能生成的人種、膚色會不同。我們不知道Imagen如何處理這些文本字符串,文本到圖像的研究還存在倫理挑戰(zhàn)。

        多倫多的天際線,上面寫著用煙花寫的大腦標(biāo)志

        一只可愛的柯基犬住在用壽司做的房子里,想想要真正拍攝會多不容易

        如果文字中沒有“機(jī)器人”這個(gè)詞,這對夫婦的照片會是什么樣子?

        從技術(shù)上說,此次谷歌的Imagen拋棄了從文本特征映射到圖像特征再用GAN或擴(kuò)散模型生成圖像的常規(guī)思路,而是使用純語言模型只負(fù)責(zé)編碼文本特征,把文本到圖像轉(zhuǎn)換的工作丟給了圖像生成模型。

        當(dāng)然,這里的圖像生成模型,依然是擴(kuò)散模型。這就意味著其純文本數(shù)據(jù)獲取方面比獲取圖文數(shù)據(jù)容易,其文本理解能力比圖文對數(shù)據(jù)的理解能力強(qiáng)。我們想象一下,一個(gè)模型可以從文本中創(chuàng)建幾乎任何圖像,像Imagen這樣的AI模型主要是使用從網(wǎng)絡(luò)上抓取的數(shù)據(jù)集進(jìn)行訓(xùn)練的,互聯(lián)網(wǎng)上的內(nèi)容可能存在偏差和偏見,有些還具有負(fù)面的社會影響,人工智能如何能鑒別?

        所以,Google為Imagen使用了 LAION-400M 數(shù)據(jù)集,眾所周知,該數(shù)據(jù)集“包含大量不當(dāng)內(nèi)容,包括色情圖像、種族主義誹謗和有害的社會刻板印象”,訓(xùn)練組的子集可以用來過濾這些“不受歡迎的”訊息。

        而且Google Imagen此次優(yōu)秀的表現(xiàn)還是在并不大(相對而言)的訓(xùn)練數(shù)據(jù)規(guī)模上,實(shí)驗(yàn)中發(fā)現(xiàn),擴(kuò)大語言模型的規(guī)模對最后效果影響更大。盡管Imagen表現(xiàn)卓越,在理解方面很多情況下表現(xiàn)都強(qiáng)于DALL-E2,不過它還是有缺點(diǎn),正常情況下,如果文字比較“繞口”,AI也能畫出來,但如果劍走偏鋒,提一個(gè)反常識的畫,比如正常情況下是人騎馬,而我們偏偏讓AI畫馬騎人,這樣這兩個(gè)AI就熄火,無法運(yùn)行了。

        由此看來,目前的人工智能再強(qiáng),它們還是不理解實(shí)質(zhì)的含義。即便如此,這款新出的AI也已經(jīng)夠驚世駭俗的了。不用說,大家剛從OpenAI的DALL-E2的震驚中走出來,又遭遇更震撼“暴擊”。看得一眾讀者目瞪口呆,一時(shí)間驚呼不斷,感嘆科技進(jìn)步之快,難怪有人表示,以后的圖庫是不是就會被人工智能取代了?先取代設(shè)計(jì)師的圖庫素材庫,再取代設(shè)計(jì)師,如果AI按這個(gè)步驟來,那么我們豈不是更不敢放心用AI的圖庫素材?

        猜你喜歡
        圖庫壽司人工智能
        金山農(nóng)民畫矢量圖庫的建設(shè)與應(yīng)用
        做壽司
        快樂語文(2021年36期)2022-01-18 05:48:44
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        視圖庫在AI浪潮里的發(fā)展應(yīng)用
        Photoshop CC圖庫面板的正確打開方法
        旋轉(zhuǎn)壽司
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        趣味壽司
        亚洲欧美日韩国产综合一区二区 | 久久99精品久久久久久9蜜桃| 亚洲人成网网址在线看| 国产一区二区三区影院| 国产日韩欧美911在线观看| 成人综合激情自拍视频在线观看 | 精品一区二区三区在线观看| 午夜短视频日韩免费| 99日本亚洲黄色三级高清网站| 激情在线视频一区二区三区| 中文字幕女同系列在线看一| 蜜桃视频无码区在线观看| 国产精品国产三级国av| 国产精品久久久久影视不卡| 亚洲国产精品亚洲高清| 精品不卡视频在线网址| 极品尤物一区二区三区| 国产成人vr精品a视频| 国产永久免费高清在线观看视频| 狼人狠狠干首页综合网| 日出白浆视频在线播放| 东京无码熟妇人妻av在线网址| 国产一级三级三级在线视| 日本女优禁断视频中文字幕| 精品人妻一区二区三区四区在线| 国产精品亚洲综合色区韩国| 国内精品久久久久影院蜜芽| 五月激情在线视频观看| 精品av熟女一区二区偷窥海滩 | 乱子伦一区二区三区| 国产综合激情在线亚洲第一页| 人妻少妇久久精品一区二区| 亚洲一区二区三区四区地址| 99久久国产综合精品五月天| 国产普通话对白视频二区| 亚洲av色香蕉一区二区三区蜜桃 | 色哟哟亚洲色精一区二区| 国产成人精品一区二区三区免费| 99综合精品久久| 精品一区二区三区久久| 成人区人妻精品一区二区不卡网站|