當前位置: 妍妍網 > 碼農

谷歌釋出史詩級Gemini2.0,「Agent時代」最強大的AI模型,使用TPU訓練。

2024-12-12碼農

Gemini2.0是「Agent時代」最強大的AI模型, 這是Gemini2.0自己給自己做的定義。

起初我是有點質疑,但是!!當我看了一上午,慢慢的去了解它、與它接觸,我又想起來Gemini2.0給自己下的定義, 它就是目前「Agent時代」最強大的AI模型!

從去年12月份,Google陸續推出了Gemini1.0和1.5 ,這兩個版本已經在多模態方向做出了很大的成就,可以理解文本、視訊、影像、音訊和程式碼。

今天詳細給大家詳細介紹下這個史詩級的模型。

官網能免費用,連結可以保存下。

gemini.google.com

選2.0Flash模型。

那麽相比較1.0和1.5版本,2.0版本有什麽進步呢?

1.速度更快 Gemini 2.0 的速度是上一代的 2倍 ,這意味著它可以更快地生成文本、轉譯語言或執行其他任務。

看完文章自己去體驗下,用過的都說快。

2.效能更強: 在各種基準測試中,Gemini 2.0 都表現出了更強的效能,例如在程式碼生成和事實性回答方面。

3.多模態能力更強: 除了文本,Gemini 2.0 還可以處理影像、視訊和音訊等 多模態數據 ,這意味著它可以更好地理解和生成各種形式的內容。

4.更強的原生工具呼叫能力: Gemini 2.0 可以直接呼叫 Google 搜尋、程式碼執行等工具,從而提供更全面的資訊和更強大的功能。

給大家看個更直觀的1.5和2.0版本比較。

這是我隨便找了個象棋殘局的圖,讓Gemini1.5和2.0分別分析下局勢。

Gemini1.5只能分析大局,也就是一眼看上去怎麽樣,它並沒有真的看懂棋盤。

而Gemini2.0可以精確到每一顆棋子的位置。

官方演示

本部份將使用視訊和文本的方式來給大家講述 視訊已使用SubCat為大家添加雙語字幕,如果更習慣文本的話,可以忽略視訊。

1、Flash 超強Agent新體驗

·處理即時資訊

測試人員用Gemini2.0來分析畫面中的物體,Gemini以非常快的速度回答了這是什麽,以及這是誰創作的,包括位置等資訊都講出來了。

精準,速度,專業。

·多語言

在使用過程中,可以隨時無縫切換各種語言,哪怕你中英日法韓一種語言說一句也OK。

對於小語種的適配度也很高。

·Agent

可以幫我們做一個多步驟的事情,官方範例是讓Gemini2.0去找一幅畫,並且找到相關的商品加到購物車。

·跨域套用

官方演示了在玩策略類遊戲的時候,Gemini2.0提供操作建議。

這有點牛啊,物理外掛。

·推理物理世界

理解3D空間環境和物體,套用於有Agent的機器人技術,可以給機器人在日常的物理環境中提供幫助。

2、Astra計劃

·更好的對話:

現在能夠用多種語言和混合語言進行對話,對方言和不常見的詞匯有了更好的理解。

·新工具用途:

有了Gemini 2.0,Project Astra可以使用谷歌搜尋、鏡頭和地圖,使其作為日常生活中的助手。

·更好的記憶:

提高了Project Astra的記憶能力,它現在有長達10分鐘的會話記憶能力,並且能夠記住過去與它進行的更多對話,個人化適配變得更好了。

·改善延遲:

有了新的串流媒體功能和原生音訊理解能力,Agent可以理解語言,延遲和人類對話差不多。

3、Project Mariner

Project Mariner 是一個早期的研究原型,基於 Gemini 2.0 構建,它能夠理解並推理瀏覽器螢幕上的資訊,包括文本、程式碼、圖片、表單等 web 元素。透過一個實驗性的 Chrome 外掛程式,Mariner 能夠根據這些資訊執行任務。

第六代 Trillium TPU

Gemini2.0並不是用輝達的GPU訓練的。

是用了谷歌開發的Trillium TPU訓練的。

伴隨著Gemini2.0的釋出,Google Cloud 也推出了第六代TPU Trillium 正式上市。

特點給大家簡單總結了一下

·Trillium TPU 是 AI Hypercomputer 的關鍵組成部份:

AI Hypercomputer 是一種突破性的超級電腦架構,它整合了最佳化的硬體、開放的軟體、領先的機器學習框架和靈活的消費模式。Trillium TPU 是其硬體核心。

·AI Hypercomputer 提升了開放軟體層:

為了配合 Trillium TPU 的全面上市,AI Hypercomputer 對其開放軟體層進行了重要增強,包括最佳化 XLA 編譯器以及 JAX、PyTorch 和 TensorFlow 等流行框架,以在大規模 AI 訓練、調優和服務中實作領先的價效比。

·AI Hypercomputer 提高了效率:

透過使用海量的主機 DRAM(補充高頻寬記憶體 HBM),實作了主機解除安裝等功能,從而提高了效率。

·AI Hypercomputer 具有強大的擴充套件能力:

AI Hypercomputer 在 Jupiter 網路結構中部署了超過 10 萬個 Trillium 芯片,擁有每秒 13 Petabits 的對分頻寬,能夠將單個分布式訓練作業擴充套件到數十萬個加速器。

我有點更期待Gemini的下一次叠代了,一定會是另一個劃時代的產品。當然也會有很多Gemini的衍生產品,會讓我們更好的感知這個世界,讓我們有更加智慧的生活。

好啦~今天的文章就到這裏了,如果感覺還不錯的話別忘了點個關註、點個贊、轉發一下再走哦~

掃碼加入AI交流群

獲得更多技術支持和交流

(請註明自己的職業)

關註「 開源AI計畫落地 」公眾號

與AI時代更靠近一點

關註「 AGI光年 」公眾號

獲取每日最新資訊

關註「 向量光年 」公眾號

加速全行業向AI轉變