谷歌最新AI照片运镜工具，让AI控制大自然里的风吹草动，视频剪辑爱好者的福音

2024-07-09码农

「让图片里的物体动起来！」这种天马行空的想法放在十年前或许是难以实现的。

但放在现在，可以轻松实现！😌

谷歌研究的 Generative Image Dynamics 方法能够将静止图片转换为动态视频。

在很久之前就已经有研究团队做出了静止转动态的方法，但实际应用效果并不理想， Generative Image Dynamics 的发布再次令我们眼前一亮。

并且可以实现指定不同的方向，让图片中物体沿指定的方向轨迹进行运动！

小编直呼「amazing！！」🤩

扫码加入AI交流群

获得更多技术支持和交流

项目简介

Generative Image Dynamics 方法可用于将单个图像转换为无缝循环视频或交互式动态场景。

并且可以通过调整运动纹理的幅度来缩小（顶部）或放大（底部）动画运动。

同时还可以通过插入预测运动纹理来生成慢动作视频。

这对于很多的应用场景都具有十分大的价值，例如模拟捕捉画面的运动效果；生成电影中背景的动态场景；在VR游戏中创建更加真实的环境动态；动态化艺术作品等等。🧐

为了更好地凸显出该方法的价值和效果的惊艳，小编还拿来了当年火爆全网的app,这个软件能够让图片流动的功能让人印象深刻。

小编拿来两张图片分别在该方法上进行测试，让其中的花朵动起来，并将效果与介绍的方法进行比对。

之前方法

Generative Image Dynamics

这样对比一看之前的方法处理的效果简直一言难尽...看起来像是强行将图片的像素进行了拉伸处理😅，无法像此文介绍的方法一样让花真正的动起来。下面来欣赏一下 Generative Image Dynamics 生成的更多效果吧。

Demo

项目原理

该技术核心在于构建一个图像空间的从自然界中抽取的运动轨迹中学习而来运动先验。

通过分析和训练，模型能够从单一的静态图片中预测出频谱体积，这一预测结果之后可以转换成运动纹理，用于生成实时动画。

获得运动纹理后，通过基于图像的渲染技术来实现动画效果。使用基于深度图像的渲染模块填充缺失内容并细化扭曲的输入图像。

使用神经网络进行图片渲染后通过预测的运动场来变形原始图片，生成连续的视频帧。

下面是来自地面实况视频的视频片段由基线生成的时空切片，最后是 Generative Image Dynamics 方法生成的时空切片。

Generative Image Dynamics 已经能够处理自然动态中的多种场景，如树木摇摆、花朵随风摆动等，谷歌研究团队正进一步优化模型非周期性和高频动态的模拟。

🔗 项目链接：

https://generative-dynamics.github.io

关注「向量光年」公众号

加速全行业向AI的改变

关注「开源AI项目落地」公众号

与AI时代更靠近一点

关注「 AGI光年」公众号

获取每日最新咨询