当前位置: 欣欣网 > 码农

AIGC文生图最新技术!GAN杀回来了!

2024-02-22码农

2023年, AIGC 文生图技术 迎来复兴之年,继英伟达的 styleGAN-T模型升级, 来自Adobe研究院, 被CVPR收录 的GigaGAN论文, 对于传统GAN的规模限制等问题,实现了重大突破,尤其是推理速度的显著提高,甚至超过了扩散模型,图像生成效果也不容小觑。

为了让大家快速掌握最新技术, 研梦非凡 特请来了该领域的科研大牛研发 GigaGAN:扩展GAN的规模用于文本到图像合成】 前沿直播课, 带你从GAN掌握图像生成模型!

▼ 扫码 免费 约直播课!

免费领! 180余篇 AIGC,扩散模型,GAN改进 论文资料 +50小时 3080 GPU算力

🎁 免费课程福利至 文末

▎直播课主题

【前沿论文解析系列— GigaGAN: 扩展GAN的规模用于文本到图像合成

▎直播课时间

2月28日、29日 (周三、四),连播两天!

▎直播课内容

1️⃣ 论文摘要

2️⃣ 研究背景

styleGAN2 Attention、CLIP 、MSG-GAN 、Vision-Aided GAN、LAION-5B

3️⃣ 模型结构

模型框架( 基于 styleGAN2的条件版本进行改进 生成器、样本自适应的卷积核选择、Attention与卷积的结合、判别器、超分辨率

4️⃣ 损失函数

Matching-aware loss CLIP contrastive loss、Vision-aided adversarial loss

5️⃣ 文本到图像

🔘 消融实验 > 基于Studio GAN PyTorch库实现GigaGAN,遵循标准FID评估方法和抗锯齿bicubic resize函数,使用 LAION2B-en和COYO-700M 据集联合训练

🔘 模型比较 > 与最近的文本到图像模型进行了比较,在训练数据集、迭代次数、批量大小和模型大小方面存在 相当大差异

6️⃣ 超分辨率和图像编辑

◽️ 超分辨率 > GigaGAN上采样器在真实感得分(FID和patch-FID)、文本对齐(CLIP得分)和接近GT(LPIPS)方面 显著优于 他上采样器

◽️ 图像编辑 > GigaGAN继承了 styleGAN的latent编辑能力, 拥有解缠的隐空间

7️⃣ 结论和展望

新架构让GAN扩展到可实现较高质量文本到图像合成的模型尺寸,为大规模生成模型开辟了一个全新的设计空间,并带回了非常重要的图像编辑功能

8️⃣ 论文总结

关键点 启发点

▼ 扫码 免费 约直播课!

免费领! 180余篇 AIGC,扩散模型,GAN改进 论文资料 +50小时 3080 GPU算力

🎁 免费课程福利至 文末

▎导师简介

导师

百度算法专家, 主要 研究方向为 AIGC图像 合成、图像视频增强与质量评价。

主导过图像/视频增强、图像/视频质量评价和AIGC数据合成等项目, 对GAN、扩散模型等有着丰富的实践经验。 多媒体领域 顶会论文 一作。

▎适合人群

AIGC或文生图技术研究者(本硕博等); AIGC或文生图技术 相关从业者;对于 AIGC或文生图技术 感兴趣,或有意向转行的小伙伴。

▎直播课报名方式

扫码 免费 约直播

免费领! 180余篇 AIGC,扩散模型,GAN改进 论文资料 +50小时 3080 GPU算力

🎁 免费课程福利至 文末

不仅限于机器学习、深度学习、CV、NLP等人工智能方向的同学,还包括本硕博毕业、升学、评职称所需的SCI各区位期刊、CCF各类会议、EI期刊/会议等 1V1论文定制化指导(不代写!) 定制化指导介绍如下▼

- 第一阶段/选题规划阶段

👉part1:制定学习规划(基础)

  • 导师1v1meeting,判断学员基础,定制学员专属学习规划

  • 明确论文需求和指导服务需求,定制合作细节

  • 👉part2:了解领域前沿动态、发展趋势

  • 梳理领域经典&前沿算法模型

  • 掌握领域发展概况,学习领域经典网络,了解最新发展

  • 👉part3:沟通讨论确定选题方向

  • 根据学员研究方向、研究基础,给予论文研究方向建议:推荐目前较火热的领域及方向

  • 评估该领域出论文的可行性

  • 👉part4:1v1定制指导idea

    导师学生语音沟通讨论,头脑风暴双方的想法、创新点的技术支撑以及其可行性,最终定版。

    - 第二阶段/实验阶段

    👉part5:主流算法讲解

  • 具体拆解分析经典

  • 前沿算法模型,帮助理解算法重难点

  • 👉part6:跑通基础baseline代码

  • 输出经验总结

  • 专业代码老师针对性指导

  • 👉part7:跑通子分支baseline

  • 优化改善代码、输出实验数据

  • 导师在专属学员群个性化解决疑难杂症

  • - 第三阶段/论文写作阶段

    👉part8:论文写作实践操作、案例分析

  • 列举1~2份经典/优秀论文案例

  • 深度剖析,提炼框架/模版

  • 👉part9:搭建论文框架

  • 针对实验结果呈现、论文各模块写作技巧,给予个性化方案

  • 👉part10:论文初稿评估与反馈

  • 论文初稿针对性润色

  • - 第四阶段/投稿阶段

    👉part11:选刊建议

  • 推荐合适期刊,精准投稿

  • 👉part12:投稿流程指导

  • 导师全流程跟进学员投稿

  • 👉part13:中稿后复盘

  • 讨论该研究方向是否可延申新论文

  • 本次论文投稿经验总结

  • 扫码预约直播+约相关方向导师meeting

    🎁 现享 导师meeting 新春优惠价

    免费领! 180余篇 AIGC,扩散模型,GAN改进 论文资料 +50小时 3080 GPU算力

    🎁 免费课程福利至 文末

    ▎导师团队

    研梦拥有一支实力强大的 高学历导师团队 ,在计算机科学、机器学习、深度学习等领域, 积累了丰富的科研经历, 研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。


    <

    滑动查看下一张图片

    >

    扫码预约直播+了解更多导师信息

    🎁 现享 导师meeting 新春优惠价

    免费领! 180余篇 文生图必读论文资料 +50小时 3080 GPU算力

    免费课程科研福利 如下👇

    💡 人工智能零基础入门课免费领

    AI形成和未来 | Python速通 | Pytorch速通

    💡 7小时科研论文写作系列课免费领

    科研基础知识 | 投稿经验攻略 | LLaMA论文实操 | 投稿后注意事项 | 论文写作理论篇 | 论文写作实践篇 | 会议如何rebuttal?

    💡14节前沿论文直播课程免费领

    CV方向 | NLP/大模型方向 | 推荐系统方向

    💡GPU算力免费领

    50小时 3080 GPU算力

    💡论文资料免费领

    百篇大语言模型/分割大模型前沿&180余篇文生图科研必读论文(GAN/扩散模型) | 顶会顶刊论文

    ▼ 扫码 免费 领取以上5重科研福利!

    ▎公司介绍

    研梦非凡 隶属于苏州 研途教育 科技有限公司, 研途深耕教育 辅导行业13年 ,具备丰富行业从业经验和教学资源, 拥有科学系统的专业院校分析与规划服务, 专业 师资团队也深受学生信赖和喜爱。 2023年,苏州研途教育获批工业和信息化人才培养工程培训基地(工业和信息化部直批)