亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        谷歌再次發(fā)布文字生成圖像模型 新系統(tǒng)帕蒂根據(jù)文本輸出各種風(fēng)格、更高質(zhì)量圖像

        2022-09-22 09:45:42
        海外星云 2022年17期
        關(guān)鍵詞:帕蒂偏差文本

        近日,谷歌介紹了一種自回歸文本到圖像生成模型Pavti(帕蒂),可實(shí)現(xiàn)高保真照片級圖像輸出,并支持涉及復(fù)雜構(gòu)圖和豐富知識內(nèi)容的合成。

        比如,用文字描述“一只浣熊穿著正裝,拿著拐杖和垃圾袋”和“老虎戴著火車售票員的帽子,拿著一塊滑板”,就能分別生成類似圖片。

        除了細(xì)節(jié)栩栩如生外,對于各種風(fēng)格,帕蒂也是駕輕就熟,能夠根據(jù)描述生成梵高、抽象立體主義、埃及墓象形文字、插圖、雕像、木刻、兒童蠟筆畫、中國水墨畫等多種多樣風(fēng)格的畫作。

        2022年6月22日,相關(guān)研究論文以《縮放自回歸模型以實(shí)現(xiàn)內(nèi)容豐富的文本到圖像生成》提交在arXiv上(編者注:一個專門收錄科學(xué)文獻(xiàn)預(yù)印本的在線數(shù)據(jù)庫)。

        研究人員在谷歌官方博文表示:“用帕蒂輸出圖像是一個序列到序列的建模問題,與機(jī)器翻譯相似。因此可受益于大語言模型的進(jìn)步,特別是通過擴(kuò)展數(shù)據(jù)和模型大小來解鎖的功能。此外,目標(biāo)輸出是圖像標(biāo)記序列,而不是其他語言中的文本標(biāo)記。并利用圖像分詞器ViT-VQGAN將圖像編碼為離散標(biāo)記序列,以重建成高質(zhì)量、風(fēng)格多樣化的圖像?!?/p>

        值得一提的是,谷歌在一個多月前推出的另一個文本到圖像生成模型Imagen,在研究基準(zhǔn)上也表現(xiàn)得十分亮眼。帕蒂和Imagen分別是自回歸模型和擴(kuò)散模型,兩者不同但互補(bǔ),代表了谷歌的不同探索方向。

        此外,研究人員還探索并突出了帕蒂模型的局限性,給出了進(jìn)一步改進(jìn)的關(guān)鍵示例重點(diǎn)領(lǐng)域。

        然后,他們還訓(xùn)練了3.5億、7.5億、30億和200億參數(shù)四個版本的帕蒂,并將它們進(jìn)行了詳細(xì)比較,參數(shù)越大的模型在功能和輸出圖像質(zhì)量方面有著實(shí)質(zhì)性改進(jìn)。在比較30億和200億參數(shù)的帕蒂時,發(fā)現(xiàn)后者更擅長抽象的提示。

        下面是四個模型對“一個綠色的標(biāo)志,上面寫著‘非常深度學(xué)習(xí)’,位于大峽谷的邊緣,天空中有浮起的白云”的圖片生成效果。

        帕蒂要想識別冗長而復(fù)雜的提示,需要它準(zhǔn)確反映世界知識、遵守特定的圖像格式和樣式,并通過細(xì)粒度的細(xì)節(jié)和交互組成眾多參與者和對象,進(jìn)而輸出高質(zhì)量的圖像。但該模型存在的一定局限性,仍會讓其生成一些故障示例。

        比如說按照如下文字生成圖像:“一幅阿努比斯雕像的肖像,穿著一件黃色的 T恤,上面畫著一架航天飛機(jī),背景中有一面白色的磚墻?!陛敵龅膱D像中航天飛機(jī)在墻上,而不是T恤,顏色也有所滲出。

        故障圖像

        值得一提的是,本次研究人員還采用一種新的測試基準(zhǔn)帕蒂2(簡稱P2),該基準(zhǔn)可從各種類別和挑戰(zhàn)方面來衡量模型的能力。

        然后,研究人員表示,用文本生成圖像非常有趣,它允許我們創(chuàng)建從未見過甚至不存在的場景。但這帶來許多益處的同時,也存在一定風(fēng)險(xiǎn),并對偏見和安全、視覺傳達(dá)、虛假信息以及創(chuàng)造力和藝術(shù)產(chǎn)生潛在影響。

        此外,一些潛在的風(fēng)險(xiǎn)與模型本身的開發(fā)方式有關(guān),對于訓(xùn)練數(shù)據(jù)尤其如此。像帕蒂這樣的模型,通常是在嘈雜的圖像文本數(shù)據(jù)集上進(jìn)行訓(xùn)練的。這些數(shù)據(jù)集已知包含對不同背景的人的偏見,從而導(dǎo)致帕蒂等模型產(chǎn)生刻板印象。比如,在將模型應(yīng)用于視覺傳達(dá)(例如幫助低識字率的社會群體輸出圖片)等用途時,會帶來額外的風(fēng)險(xiǎn)和擔(dān)憂。

        文本到圖像模型為人們創(chuàng)造了許多新的可能性,本質(zhì)上是充當(dāng)畫筆創(chuàng)造獨(dú)特且美觀的圖像,可助力提高人類的創(chuàng)造力和生產(chǎn)力。但模型的輸出范圍取決于訓(xùn)練數(shù)據(jù),這可能會偏向西方圖像,并進(jìn)一步阻止模型表現(xiàn)出全新的藝術(shù)風(fēng)格。

        出于以上原因,研究人員在沒有進(jìn)一步保護(hù)措施的情況下,暫時不會發(fā)布帕蒂模型的代碼或數(shù)據(jù)供公眾使用。并在已生成的所有圖像上添加了“帕蒂”水印。

        接下來,研究團(tuán)隊(duì)將專注于進(jìn)一步研究模型偏差測量和緩解策略,例如提示濾波、輸出濾波和模型重新校準(zhǔn)。

        他們還認(rèn)為,有望使用文本到圖像生成模型來大規(guī)模理解大型圖像文本數(shù)據(jù)集中的偏差,方法是明確探測它們是否存在一套已知的偏差類型,并可能揭示其他形式的隱藏偏差。另外,研究人員還計(jì)劃與藝術(shù)家合作,使高性能文本到圖像生成模型的功能適應(yīng)其作品。

        最后,相比前段時間Open AI發(fā)布的DALL-E2和谷歌自家的Imagen(兩者都是擴(kuò)散模型),研究人員提到,帕蒂表明自回歸模型功能強(qiáng)大且普遍適用。

        猜你喜歡
        帕蒂偏差文本
        atty Potential1 有潛力的帕蒂
        如何走出文章立意偏差的誤區(qū)
        兩矩形上的全偏差
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        關(guān)于均數(shù)與偏差
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        在美國保護(hù)野鴨反遭指控
        如何快速走進(jìn)文本
        語文知識(2014年1期)2014-02-28 21:59:13
        尋找上帝的小女孩
        夜夜爽夜夜叫夜夜高潮| 国产精品亚洲综合天堂夜夜 | 黄色录像成人播放免费99网| 人妻精品久久久一区二区| 天堂av网手机线上天堂| 美女扒开屁股让男人桶| 国产高清在线精品一区二区三区 | 国产情侣自拍一区视频| 国产人妻熟女高跟丝袜图片| 国产在线精品欧美日韩电影| 精品久久久久中文字幕APP| 国产精品毛片大尺度激情| 亚洲男人免费视频网站| 久久精品国产99久久无毒不卡| 四虎国产精品免费久久| 国产精品18久久久久久不卡中国| 免费美女黄网站久久久| 亚洲熟女乱一区二区三区| 欧美肥妇毛多水多bbxx水蜜桃| 2021久久精品国产99国产精品 | 免费人成网站在线观看欧美| 无码精品a∨在线观看十八禁| 国产精品反差婊在线观看| 精品人妻一区二区三区不卡毛片| 人妖一区二区三区四区| 久久久精品国产sm调教网站| 国品精品一区二区在线观看| 情色视频在线观看一区二区三区| 国产成人av三级在线观看韩国| 欧美国产亚洲日韩在线二区| 中文成人无字幕乱码精品区| 成人亚洲欧美久久久久| 国产黄色一级到三级视频| 无遮挡很爽很污很黄的女同| 午夜毛片不卡免费观看视频| 无码人妻视频一区二区三区99久久| 亚洲成av在线免费不卡| 一区二区三区国产黄色| 99精品人妻无码专区在线视频区 | 日本系列有码字幕中文字幕| 无遮挡18禁啪啪羞羞漫画|