當前位置: 妍妍網 > 碼農

AIGC文生圖最新技術!GAN殺回來了!

2024-02-22碼農

2023年, AIGC 文生圖技術 迎來復興之年,繼輝達的 styleGAN-T模型升級, 來自Adobe研究院, 被CVPR收錄 的GigaGAN論文, 對於傳統GAN的規模限制等問題,實作了重大突破,尤其是推理速度的顯著提高,甚至超過了擴散模型,影像生成效果也不容小覷。

為了讓大家快速掌握最新技術, 研夢非凡 特請來了該領域的科研大牛研發 GigaGAN:擴充套件GAN的規模用於文本到影像合成】 前沿直播課, 帶你從GAN掌握影像生成模型!

▼ 掃碼 免費 約直播課!

免費領! 180余篇 AIGC,擴散模型,GAN改進 論文資料 +50小時 3080 GPU算力

🎁 免費課程福利至 文末

▎直播課主題

【前沿論文解析系列— GigaGAN: 擴充套件GAN的規模用於文本到影像合成

▎直播課時間

2月28日、29日 (周三、四),連播兩天!

▎直播課內容

1️⃣ 論文摘要

2️⃣ 研究背景

styleGAN2 Attention、CLIP 、MSG-GAN 、Vision-Aided GAN、LAION-5B

3️⃣ 模型結構

模型框架( 基於 styleGAN2的條件版本進行改進 生成器、樣本自適應的摺積核選擇、Attention與摺積的結合、判別器、超分辨率

4️⃣ 損失函式

Matching-aware loss CLIP contrastive loss、Vision-aided adversarial loss

5️⃣ 文本到影像

🔘 消融實驗 > 基於Studio GAN PyTorch庫實作GigaGAN,遵循標準FID評估方法和抗鋸齒bicubic resize函式,使用 LAION2B-en和COYO-700M 據集聯合訓練

🔘 模型比較 > 與最近的文本到影像模型進行了比較,在訓練數據集、叠代次數、批次大小和模型大小方面存在 相當大差異

6️⃣ 超分辨率和影像編輯

◽️ 超分辨率 > GigaGAN上采樣器在真實感得分(FID和patch-FID)、文本對齊(CLIP得分)和接近GT(LPIPS)方面 顯著優於 他上采樣器

◽️ 影像編輯 > GigaGAN繼承了 styleGAN的latent編輯能力, 擁有解纏的隱空間

7️⃣ 結論和展望

新架構讓GAN擴充套件到可實作較高品質文本到影像合成的模型尺寸,為大規模生成模型開辟了一個全新的設計空間,並帶回了非常重要的影像編輯功能

8️⃣ 論文總結

關鍵點 啟發點

▼ 掃碼 免費 約直播課!

免費領! 180余篇 AIGC,擴散模型,GAN改進 論文資料 +50小時 3080 GPU算力

🎁 免費課程福利至 文末

▎導師簡介

導師

百度演算法專家, 主要 研究方向為 AIGC影像 合成、影像視訊增強與品質評價。

主導過影像/視訊增強、影像/視訊品質評價和AIGC數據合成等計畫, 對GAN、擴散模型等有著豐富的實踐經驗。 多媒體領域 頂會論文 一作。

▎適合人群

AIGC或文生圖技術研究者(本碩博等); AIGC或文生圖技術 相關從業者;對於 AIGC或文生圖技術 感興趣,或有意向轉行的小夥伴。

▎直播課報名方式

掃碼 免費 約直播

免費領! 180余篇 AIGC,擴散模型,GAN改進 論文資料 +50小時 3080 GPU算力

🎁 免費課程福利至 文末

不僅限於機器學習、深度學習、CV、NLP等人工智慧方向的同學,還包括本碩博畢業、升學、評職稱所需的SCI各區位期刊、CCF各類會議、EI期刊/會議等 1V1論文客製化指導(不代寫!) 客製化指導介紹如下▼

- 第一階段/選題規劃階段

👉part1:制定學習規劃(基礎)

  • 導師1v1meeting,判斷學員基礎,客製學員專屬學習規劃

  • 明確論文需求和指導服務需求,客製合作細節

  • 👉part2:了解領域前沿動態、發展趨勢

  • 梳理領域經典&前沿演算法模型

  • 掌握領域發展概況,學習領域經典網路,了解最新發展

  • 👉part3:溝通討論確定選題方向

  • 根據學員研究方向、研究基礎,給予論文研究方向建議:推薦目前較火熱的領域及方向

  • 評估該領域出論文的可行性

  • 👉part4:1v1客製指導idea

    導師學生語音溝通討論,頭腦風暴雙方的想法、創新點的技術支撐以及其可行性,最終定版。

    - 第二階段/實驗階段

    👉part5:主流演算法講解

  • 具體拆解分析經典

  • 前沿演算法模型,幫助理解演算法重難點

  • 👉part6:跑通基礎baseline程式碼

  • 輸出經驗總結

  • 專業程式碼老師針對性指導

  • 👉part7:跑通子分支baseline

  • 最佳化改善程式碼、輸出實驗數據

  • 導師在專屬學員群個人化解決疑難雜癥

  • - 第三階段/論文寫作階段

    👉part8:論文寫作實踐操作、案例分析

  • 列舉1~2份經典/優秀論文案例

  • 深度剖析,提煉框架/模版

  • 👉part9:搭建論文框架

  • 針對實驗結果呈現、論文各模組寫作技巧,給予個人化方案

  • 👉part10:論文初稿評估與反饋

  • 論文初稿針對性潤色

  • - 第四階段/投稿階段

    👉part11:選刊建議

  • 推薦合適期刊,精準投稿

  • 👉part12:投稿流程指導

  • 導師全流程跟進學員投稿

  • 👉part13:中稿後復盤

  • 討論該研究方向是否可延申新論文

  • 本次論文投稿經驗總結

  • 掃碼預約直播+約相關方精靈師meeting

    🎁 現享 導師meeting 新春優惠價

    免費領! 180余篇 AIGC,擴散模型,GAN改進 論文資料 +50小時 3080 GPU算力

    🎁 免費課程福利至 文末

    ▎導師團隊

    研夢擁有一支實力強大的 高學歷導師團隊 ,在電腦科學、機器學習、深度學習等領域, 積累了豐富的科研經歷, 研究成果也發表在國際各大頂級會議和期刊上,在指導學員的過程中,全程秉持初心,堅持手把手個人化帶教。


    <

    滑動檢視下一張圖片

    >

    掃碼預約直播+了解更多導師資訊

    🎁 現享 導師meeting 新春優惠價

    免費領! 180余篇 文生圖必讀論文資料 +50小時 3080 GPU算力

    免費課程科研福利 如下👇

    💡 人工智慧零基礎入門課免費領

    AI形成和未來 | Python速通 | Pytorch速通

    💡 7小時科研論文寫作系列課免費領

    科研基礎知識 | 投稿經驗攻略 | LLaMA論文實操 | 投稿後註意事項 | 論文寫作理論篇 | 論文寫作實踐篇 | 會議如何rebuttal?

    💡14節前沿論文直播課程免費領

    CV方向 | NLP/大模型方向 | 推薦系統方向

    💡GPU算力免費領

    50小時 3080 GPU算力

    💡論文資料免費領

    百篇大語言模型/分割大模型前沿&180余篇文生圖科研必讀論文(GAN/擴散模型) | 頂會頂刊論文

    ▼ 掃碼 免費 領取以上5重科研福利!

    ▎公司介紹

    研夢非凡 隸屬於蘇州 研途教育 科技有限公司, 研途深耕教育 輔導行業13年 ,具備豐富行業從業經驗和教學資源, 擁有科學系統的專業院校分析與規劃服務, 專業 師資團隊也深受學生信賴和喜愛。 2023年,蘇州研途教育獲批工業和資訊化人才培養工程培訓基地(工業和資訊化部直批)