眾神聽令，王者歸位！Meta重磅釋出最強開源大模型 Llama 3

2024-04-19資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營（ID：rgznai100）

4月19日淩晨，Meta重磅釋出了全球最大開源大模型Llama 3，一夜間重新坐穩王者之位。

模型下載連結： https://llama.meta.com/llama-downloa ds/

GitHub計畫地址： https://github.com/meta-llama/llama3

當地時間4月18日，Meta 釋出兩款開源Llama 3 8B與Llama 3 70B模型，供外部開發者免費使用。 Meta表示，Llama 3 8B和Llama 3 70B是目前同體量下，效能最好的開源模型。

Meta 官方部落格寫道：「得益於預訓練和後訓練的改進，我們的預訓練和指令微調模型是目前 8B 和 70B 參數尺度下最好的模型。」測試結果顯示，Llama 3 8B在某些測試集上效能比 Llama 2 70B 還要強。

在Llama 3釋出後，小紮向外媒表示，「我們的目標不是與開源模型競爭，而是要超過所有人，打造最領先的人工智慧。」

圈內大佬齊喝彩！

Llama 3的釋出，開啟了一波夢幻聯動。傳奇研究員、AI開源倡導者吳恩達發帖表示，Meta在自己生日當天釋出了Llama 3，這是最棒的生日禮物！謝謝Meta！

Meta 的首席AI科學家楊立昆也擊鼓慶祝：

Meta生成式AI團隊主管、蘋果前高管艾哈邁德·艾爾·達勒（Ahmad Al-Dahle）發帖介紹：

此外，此前憑借1000行C語言程式碼、一台Mac就訓練出GPT-2的AI大牛Karpathy也發帖祝賀：

昨夜，重磅釋出的 Llama 3，讓開源大模型圈內如此熱鬧，可謂一個不眠之夜。

被大佬們熱捧的Llama 3的實力究竟如何？

最強開源大模型Llama 3

Llama 3的亮點和特性如下：

基於超過15T token訓練，大小相當於Llama 2數據集的7倍還多；

訓練效率比Llama 2高3倍；

支持8K長文本，改進的tokenizer具有128K token的詞匯量，可實作更好的效能；

在大量重要基準測試中均具有最先進效能；

增強推理和程式碼能力；

安全性有重大突破，帶有Llama Guard 2、Code Shield 和 CyberSec Eval 2的新版信任和安全工具，還能比Llama 2有更好「錯誤拒絕表現」。

根據Meta AI的工程師Aston Zhang透露，Llama 3的誕生始於去年夏天，團隊攻克了數據集，預訓練等方面的一系列難題。他還進一步透露，Llama 3之後還會解鎖新的能力——更長的上下文，支持多模態，效能更強的400B版本。

Meta展示的基準測試結果包括MMLU、ARC、DROP、GPQA（生物、物理、化學相關的問題集）、HumanEval（程式碼生成測試）、GSM-8K（數學套用測試）、MATH（同為數學相關基準測試）、AGIEval（問題解決的測試集）以及BIG-Bench Hard（常識推理測試）。

如下圖所示，Llama 3 8B的成績在九項測試中領先同行。但Mistral 7B（2023年9月釋出）和Gemma 7B已經不算最前沿的開源模型。並且在參照的一些基準測試裏，Llama 3 8B的得分最高。

在MMLU、HumanEval和GSM-8K上，Llama 3 70B擊敗了Gemini 1.5 Pro。盡管無法與Anthropic效能最強的模型 Claude 3 Opus媲美，但 Llama 3 70B的效能，已經優於Claude 3系列的中等模型Sonnet。

Meta 還測試了 Llama 3 在真實世界場景中的效能，專門開發了一個新的高品質人類評估集，該評估集包含 1800 個提示，涵蓋 12 種關鍵用例（征求建議、頭腦風暴、分類、封閉式問題解答、編碼、創意寫作、提取、角色/人物角色、開放式問題解答、推理、覆寫和總結）。

在Meta組織的人類反饋評分中，Llama 3 70B打敗了Mistral、OpenAI、Claude釋出的對應產品。

小紮專門發了個視訊介紹 Meta AI 和 Llama 3，他表示：

我們的目標是打造世界領先的人工智慧。我們正在用最先進的新 Llama 3 Al 模型升級 Meta Al，該模型已開源。憑借這個新模型，我們相信 Meta Al 現在是最智慧的人工智慧助手。你可以自由使用。

我們將 Meta Al 整合到頂部的搜尋框中，使其更易於使用WhatsApp、Instagram、Facebook 和 Messenger。我們還建立了一個網站，meta.ai，供你在網路上使用。

我們還構建了一些獨特的創作功能，例如將照片制作成動畫的功能。現在AI生成高品質影像的速度非常快，可以根據你的需要即時建立和更新它們，它還將生成你的創作過程的回放視訊。

享受 Meta Al，讓我知道你的想法！

Meta AI 計畫地址： https://ai.meta.com/blog/meta-llama-3/

目前，HuggingChat也已開放體驗，需要手動切換至Llama 3。

Hugging Face 地址： https://huggingface.co/chat/

不止如此，還有王炸

不僅如此，在未來幾個月內，Meta還會推出更多的版本。

Meta 官方表示，Llama 3 8B 和 70B 模型只是 Llama 3 系列模型的一部份，他們後續還將推出更多版本，包括模型參數超過 400B 的 Llama 3 版本（目前仍在訓練中）。

輝達高級科學家Jim Fan發帖表示：之後可能會釋出的Llama 3-400B以上的版本其將成為某種「分水嶺」，開源社群將能用上GPT-4級別的模型。

Meta 官方表示，在接下來的幾個月中，他們預計將推出新功能（如多模態）、更長的上下文視窗、更多不同大小版本的模型和更強的效能，以及 Llama 3 研究論文。

另外，Llama 3 模型將很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上提供，並得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 硬體平台的支持。

此外，基於 Llama 3，Meta 也釋出了他們的全新 AI 助手 Meta AI。

Meta今天發表一篇論文【Imagine Flash：利用逆向蒸餾加速Emu擴散模型】。Imagine Flash 是一個創新的加速擴散模型框架，透過 Imagine Flash 技術可以將50步的生成步驟精簡至僅1至3步，達到了即時生圖的效果，同時還能提升影像的品質和保真度。該技術已經套用到了Meta AI聊天機器人當中。

Meta 表示，「得益於我們在 Llama 3 上取得的最新進展，Meta AI 比以往任何時候都更智慧、更快速、更有趣。」

眾神聽令，王者回歸！

Llama 2 釋出後，僅在幾個月內就帶動了開源社群冒出了眾多效能強大的開源模型。開源社群的競爭格局，發生巨變。當有人懷疑，Meta還能否繼續在激烈地競爭中保持領先時，Meta 用 Llama 3，讓自己重回開源社群的王座。

後續更多版本的釋出，是否能讓Meta長期坐穩王座？我們拭目以待。

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行，特邀近 50 位技術領袖和行業套用專家，與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾，共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。