当前位置: 欣欣网 > 码农

谷歌发布史诗级Gemini2.0,「Agent时代」最强大的AI模型,使用TPU训练。

2024-12-12码农

Gemini2.0是「Agent时代」最强大的AI模型, 这是Gemini2.0自己给自己做的定义。

起初我是有点质疑,但是!!当我看了一上午,慢慢的去了解它、与它接触,我又想起来Gemini2.0给自己下的定义, 它就是目前「Agent时代」最强大的AI模型!

从去年12月份,Google陆续推出了Gemini1.0和1.5 ,这两个版本已经在多模态方向做出了很大的成就,可以理解文本、视频、图像、音频和代码。

今天详细给大家详细介绍下这个史诗级的模型。

官网能免费用,链接可以保存下。

gemini.google.com

选2.0Flash模型。

那么相比较1.0和1.5版本,2.0版本有什么进步呢?

1.速度更快 Gemini 2.0 的速度是上一代的 2倍 ,这意味着它可以更快地生成文本、翻译语言或执行其他任务。

看完文章自己去体验下,用过的都说快。

2.性能更强: 在各种基准测试中,Gemini 2.0 都表现出了更强的性能,例如在代码生成和事实性回答方面。

3.多模态能力更强: 除了文本,Gemini 2.0 还可以处理图像、视频和音频等 多模态数据 ,这意味着它可以更好地理解和生成各种形式的内容。

4.更强的原生工具调用能力: Gemini 2.0 可以直接调用 Google 搜索、代码执行等工具,从而提供更全面的信息和更强大的功能。

给大家看个更直观的1.5和2.0版本比较。

这是我随便找了个象棋残局的图,让Gemini1.5和2.0分别分析下局势。

Gemini1.5只能分析大局,也就是一眼看上去怎么样,它并没有真的看懂棋盘。

而Gemini2.0可以精确到每一颗棋子的位置。

官方演示

本部分将使用视频和文本的方式来给大家讲述 视频已使用SubCat为大家添加双语字幕,如果更习惯文本的话,可以忽略视频。

1、Flash 超强Agent新体验

·处理实时信息

测试人员用Gemini2.0来分析画面中的物体,Gemini以非常快的速度回答了这是什么,以及这是谁创作的,包括位置等信息都讲出来了。

精准,速度,专业。

·多语言

在使用过程中,可以随时无缝切换各种语言,哪怕你中英日法韩一种语言说一句也OK。

对于小语种的适配度也很高。

·Agent

可以帮我们做一个多步骤的事情,官方示例是让Gemini2.0去找一幅画,并且找到相关的商品加到购物车。

·跨域应用

官方演示了在玩策略类游戏的时候,Gemini2.0提供操作建议。

这有点牛啊,物理外挂。

·推理物理世界

理解3D空间环境和物体,应用于有Agent的机器人技术,可以给机器人在日常的物理环境中提供帮助。

2、Astra计划

·更好的对话:

现在能够用多种语言和混合语言进行对话,对方言和不常见的词汇有了更好的理解。

·新工具用途:

有了Gemini 2.0,Project Astra可以使用谷歌搜索、镜头和地图,使其作为日常生活中的助手。

·更好的记忆:

提高了Project Astra的记忆能力,它现在有长达10分钟的会话记忆能力,并且能够记住过去与它进行的更多对话,个性化适配变得更好了。

·改善延迟:

有了新的流媒体功能和原生音频理解能力,Agent可以理解语言,延迟和人类对话差不多。

3、Project Mariner

Project Mariner 是一个早期的研究原型,基于 Gemini 2.0 构建,它能够理解并推理浏览器屏幕上的信息,包括文本、代码、图片、表单等 web 元素。通过一个实验性的 Chrome 插件,Mariner 能够根据这些信息执行任务。

第六代 Trillium TPU

Gemini2.0并不是用英伟达的GPU训练的。

是用了谷歌开发的Trillium TPU训练的。

伴随着Gemini2.0的发布,Google Cloud 也推出了第六代TPU Trillium 正式上市。

特点给大家简单总结了一下

·Trillium TPU 是 AI Hypercomputer 的关键组成部分:

AI Hypercomputer 是一种突破性的超级计算机架构,它整合了优化的硬件、开放的软件、领先的机器学习框架和灵活的消费模式。Trillium TPU 是其硬件核心。

·AI Hypercomputer 提升了开放软件层:

为了配合 Trillium TPU 的全面上市,AI Hypercomputer 对其开放软件层进行了重要增强,包括优化 XLA 编译器以及 JAX、PyTorch 和 TensorFlow 等流行框架,以在大规模 AI 训练、调优和服务中实现领先的性价比。

·AI Hypercomputer 提高了效率:

通过使用海量的主机 DRAM(补充高带宽内存 HBM),实现了主机卸载等功能,从而提高了效率。

·AI Hypercomputer 具有强大的扩展能力:

AI Hypercomputer 在 Jupiter 网络结构中部署了超过 10 万个 Trillium 芯片,拥有每秒 13 Petabits 的对分带宽,能够将单个分布式训练作业扩展到数十万个加速器。

我有点更期待Gemini的下一次迭代了,一定会是另一个划时代的产品。当然也会有很多Gemini的衍生产品,会让我们更好的感知这个世界,让我们有更加智能的生活。

好啦~今天的文章就到这里了,如果感觉还不错的话别忘了点个关注、点个赞、转发一下再走哦~

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

关注「 开源AI项目落地 」公众号

与AI时代更靠近一点

关注「 AGI光年 」公众号

获取每日最新资讯

关注「 向量光年 」公众号

加速全行业向AI转变