一鍵換裝神器爆火，老黃穿抱抱臉T恤，CEO本人：和他爭CEO爭不過

2024年04月30日09:51:36 搞笑 2242

西風發自凹非寺

量子位 | 公眾號 qbitai

笑不活，最新虛擬試穿神器被網友們玩壞了。

黃院士、馬斯克、奧特曼、史密斯等一眾大佬衣服集體被扒。

前有老黃卸下皮衣套上糖果包裝袋：

後有奧特曼大秀花臂穿cucci：

再有老馬變成了蛛蛛俠：

好萊塢巨星史密斯也風格大變：

但說回研究本身，確實正兒八經的研究。

名為idm–vton，由來自韓國科學技術院和omnious.ai公司的研究團隊基於擴散模型打造。

目前官方放出了demo，大伙兒可以試玩，推理代碼已開源。

除了開頭所展示的，抱抱臉研究員也玩的不亦樂乎，給老黃換上了專屬戰袍。其ceo連忙轉發打趣：

我被替代了，沒法和他爭ceo。

看熱鬧的網友也是感慨，經過這麼多年，終於不用再擔心自己「手殘」了（ai幫你搞定）。

來玩啊～

我們也趕緊上手體驗了一把。demo整個頁面是這樣嬸兒的：

操作起來也是非常簡單。

首先上傳人物圖，可以手動或者自動選擇要修改的區域。然後，上傳要換的衣服。

直接點擊try-on，會自動生成掩模圖和換裝後的圖：

上面這張自動生成的掩模把手也選進去了，所以最後生成的左手效果不好。

我們手動選取塗抹一下，同時人和衣服全部都用我們自己的圖。

這次效果大伙兒覺得如何？

再來展示一波網友的試玩成品圖。

deepmind聯合創始人蘇萊曼穿上了微笑面具修格斯聯名款t恤：

甚至不少網友真想要這件衣服。

奧特曼再次被網友當成模特：

當然也有翻車的時候，比如馬斯克穿的就是山寨cucci。

看完效果後，接著來看idm–vton在技術上是如何實現的。

基於擴散模型

技術方面，idm–vton基於擴散模型，通過設計精細的注意力模塊來提高服裝圖像的一致性，並生成真實的虛擬試穿圖像。

模型架構大概包含三部分：

tryonnet：主unet，處理人物圖像。

ip-adapter：圖像提示適配器，編碼服裝圖像的高級語義。

garmentnet：並行unet，提取服裝的低級特徵。

在為unet提供輸入時，研究人員將人物圖片的含雜訊潛在特徵、分割掩模、帶掩蔽的圖片和densepose數據整合在一起。

他們還會為服裝添加詳細描述，例如[v]表示「短袖圓領t恤」。這個描述隨後用作garmentnet（例如，「一張[v]的照片」）和tryonnet（例如，「模特正在穿[v]」）的輸入提示。

tryonnet和garmentnet產生的中間特徵進行了合併，隨後傳遞至自我注意力層。研究人員只使用了來自tryonnet的輸出的前半部分。這些輸出與文本編碼器和ip-adapter的特徵一起，通過交叉注意力層進行融合。

最終，研究人員對tryonnet和ip-adapter模塊進行了精細調整，並鎖定了模型的其它部分。

實驗階段，他們使用viton-hd數據集訓練模型，並在viton-hd、dresscode和內部收集的in-the-wild數據集上進行評估。

idm–vton在定性和定量上都優於先前的方法。

idm-vton可以生成真實的圖像並保留服裝的細粒度細節。

更多細節，感興趣的家人們可以查看原論文。

項目鏈接：

[1]https://idm-vton.github.io/?continueflag=589fb545dbbb123446456b65a635d849

[2]https://arxiv.org/abs/2403.05139

[3]https://huggingface.co/spaces/yisol/idm-vton?continueflag=589fb545dbbb123446456b65a635d849

參考鏈接：

[1]https://twitter.com/multimodalart/status/1782508538213933192

[2]https://twitter.com/fffiloni/status/1783158082849108434

[3]https://twitter.com/clementdelangue/status/1783179067803533577

搞笑

美圖秀秀老闆，抓住了每一陣風 - 天天要聞

美圖秀秀老闆，抓住了每一陣風

最近，著名天使投資人、美圖公司創始人兼單一最大股東蔡文勝，獲香港特區政府委任為「推動Web3 發展專責小組」成員。作為Web3 領域的積極倡導者，蔡文勝近期以 6.5 億港元打造 CAI 大廈這一「AI-Web3 創業中心。不僅如此，蔡文勝家族也頻頻出手香港樓市。除了上述他以6.5億港元購入位於天后的整棟商廈，其家族也有成員在港...

07月02日 4539

英媒：導致希思羅機場附近變電站起火的問題早在七年前就被發現，卻一直沒修 - 天天要聞

英媒：導致希思羅機場附近變電站起火的問題早在七年前就被發現，卻一直沒修

【文/觀察者網陳思佳】今年3月，英國倫敦希思羅機場因附近變電站發生火災而陷入癱瘓，超過27萬名旅客的行程受到影響。據英國天空新聞網7月2日報道，一份新的調查報告顯示，工作人員早在2018年的一次檢修中就發現了安全隱患，但問題始終沒有被修復，最終引發火災。英國國家能源系統運營商（NESO）在報告中指出，為機場供電...

07月02日 5530

當代漢奸郭萬鈞：多次泄露東風導彈機密，因妻子去市場買菜暴露 - 天天要聞

當代漢奸郭萬鈞：多次泄露東風導彈機密，因妻子去市場買菜暴露

郭萬鈞從來沒有想到，自己有一天會真的面臨這個問題。在學校學習的時候，他倒是看過漢奸的例子。在那個時候，他也對漢奸產生了厭惡之情，認為每一個漢奸都該死。

07月02日 2029

曹操把貂蟬送給關羽，為何貂蟬次日就自盡了？關羽對她做了什麼？ - 天天要聞

曹操把貂蟬送給關羽，為何貂蟬次日就自盡了？關羽對她做了什麼？

三國演義之中，最出名的美人是誰，就不用多說了吧？貂蟬雖然是個虛構人物，但是成功做到了，在網路榜單里常年在四大美人之中，也可以說是一種神奇的現象了。

07月02日 1200

年羹堯從大將軍被貶為杭州將軍，這是屬於什麼級別？有多大權力 - 天天要聞

年羹堯從大將軍被貶為杭州將軍，這是屬於什麼級別？有多大權力

從很多分析來看，華妃不是不喜歡雍正，相反，她可以說是雍正所有的妃嬪中，對他感情最深的人之一。但是，在雍正眼中，華妃不過是一個政治工具罷了。

07月02日 5392

曹操為什麼喜好寡婦？許多人不明白，不得不感嘆曹操的智慧 - 天天要聞

曹操為什麼喜好寡婦？許多人不明白，不得不感嘆曹操的智慧

儘管沒有看見兒子是怎麼死的，但是在這彌留之際，他看見了兒子一個人擋在亂軍之前，然後被人一刀一刀砍成肉醬，曹操不禁流出了眼淚。

07月02日 8000

朱棣造反成功後，意外發現一道聖旨，哭著喊：父親你害得我好苦 - 天天要聞

朱棣造反成功後，意外發現一道聖旨，哭著喊：父親你害得我好苦

公元1402年6月，42歲的朱棣重新回到了他熟悉的南京城。多年以前，他離開南京的時候是作為藩王身份。而這次，他回來的時候，依然是以藩王身份回來的，不過，這只是暫時的身份。

07月02日 7084

朱棣登基後，除了朱允炆外，朱標的妻子和其他的子女結局如何？ - 天天要聞

朱棣登基後，除了朱允炆外，朱標的妻子和其他的子女結局如何？

年輕的時候，朱元璋想要當皇帝，因為只要當上了皇帝，富貴可以隨便享受，建立一個政治清明的王朝也完全不是問題。但是當上了皇帝，朱元璋才知道，這更是個讓人心累的活。

07月02日 9045

張學良被軟禁54年，90歲被釋放後，直言一生最佩服三個人 - 天天要聞

張學良被軟禁54年，90歲被釋放後，直言一生最佩服三個人

1928年，張學良接替張作霖成為奉系軍閥之主，以迅雷不及掩耳之勢改旗易幟，促成了中國表面上的統一；1931年九一八事變後，張學良實行不抵抗政策，使東三省完全落入日本人手中；1936年，張學良與楊虎城發動「西安事變」，促成了國共第二次合作。

07月02日 5189

朱棣油炸鐵鉉，將景清剝皮，這是真實歷史？還是後人黑他？ - 天天要聞

朱棣油炸鐵鉉，將景清剝皮，這是真實歷史？還是後人黑他？

公元1402年，偌大的濟南城已經沒有之前的繁榮，在這之前，濟南城是抵抗叛軍的前線，是皇帝建文帝心中的朝廷的堅城要塞。只要有此城，朝廷還能調集軍隊，還有最後的一戰之力。

07月02日 6530