當前位置: 妍妍網 > 碼農

IDM-VTON:剛開源就有1.8K星星,最新的照片AI換裝計畫,可用於虛擬試穿,附試用連結

2024-05-06碼農

計畫簡介

IDM-VTON是一個開源計畫,旨在透過改進擴散模型,實作更自然的虛擬試穿體驗。該計畫基於最新的深度學習技術,開發出能夠處理復雜場景中的虛擬試穿的演算法。其主要特點包括對野外真實環境下的衣物試穿進行最佳化,以及提供高品質的影像生成。此外,IDM-VTON還支持兩個數據集:VITON-HD和DressCode,用於進一步提升模型的效果和實用性。

掃碼加入交流群

獲得更多技術支持和交流

(請註明自己的職業)

DEMO

數據準備

· VITON-HD

你可以從VITON-HD下載VITON-HD數據集。

https://github.com/shadow2496/VITON-HD

下載VITON-HD數據集後,請將 vitonhd_test_tagged.json 檔移動到測試資料夾中。

數據集目錄的結構應如下所示。

train|-- ...test|-- image|-- image-densepose|-- agnostic-mask|-- cloth|-- vitonhd_test_tagged.json

·DressCode

你可以從DressCode下載DressCode數據集。

https://github.com/aimagelab/dress-code

在這裏提供了預計算的服裝密集姿態影像和說明。

使用了detectron2來獲取密集姿態影像

下載DressCode數據集後,請按照以下方式放置影像-密集姿態目錄和說明文字檔。

DressCode|-- dresses |-- images |-- image-densepose |-- dc_caption.txt |-- ...|-- lower_body |-- images |-- image-densepose |-- dc_caption.txt |-- ...|-- upper_body |-- images |-- image-densepose |-- dc_caption.txt |-- ...

推理

·VITON-HD

使用帶有參數的Python檔進行推理

accelerate launch inference.py \ --width 768 --height 1024 --num_inference_steps 30 \ --output_dir "result" \ --unpaired \ --data_dir "DATA_DIR" \ --seed 42 \ --test_batch_size 2 \ --guidance_scale 2.0

或者,可以直接使用指令碼檔執行。

sh inference.sh

·DressCode

對於DressCode數據集,透過類別參數設定你想要生成影像的類別

accelerate launch inference_dc.py \ --width 768 --height 1024 --num_inference_steps 30 \ --output_dir "result" \ --unpaired \ --data_dir "DATA_DIR" \ --seed 42 --test_batch_size 2 --guidance_scale 2.0 --category "upper_body"

或者,你可以直接使用指令碼檔執行。

sh inference.sh

啟動一個本地 Gradio 演示

在下面連結下載人體解析的checkpoint。

https://huggingface.co/spaces/yisol/IDM-VTON-local/tree/main/ckpt

將checkpoint放置在 ckpt 資料夾下。

ckpt|-- densepose |-- model_final_162be9.pkl|-- humanparsing |-- parsing_atr.onnx |-- parsing_lip.onnx|-- openpose |-- ckpts |-- body_pose_model.pth

執行以下命令:

python gradio_demo/app.py

計畫連結

https://github.com/yisol/IDM-VTON

試用連結

https://huggingface.co/spaces/yisol/IDM-VTON

關註「 開源AI計畫落地 」公眾號

與AI時代更靠近一點