當前位置: 妍妍網 > 資訊

眾神聽令,王者歸位!Meta重磅釋出最強開源大模型 Llama 3

2024-04-19資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營(ID:rgznai100)

4月19日淩晨,Meta重磅釋出了全球最大開源大模型Llama 3,一夜間重新坐穩王者之位。

模型下載連結: https://llama.meta.com/llama-downloa ds/

GitHub計畫地址: https://github.com/meta-llama/llama3

當地時間4月18日,Meta 釋出兩款開源Llama 3 8B與Llama 3 70B模型,供外部開發者免費使用。 Meta表示,Llama 3 8B和Llama 3 70B是目前同體量下,效能最好的開源模型。

Meta 官方部落格寫道:「得益於預訓練和後訓練的改進,我們的預訓練和指令微調模型是目前 8B 和 70B 參數尺度下最好的模型。」測試結果顯示,Llama 3 8B在某些測試集上效能比 Llama 2 70B 還要強。

在Llama 3釋出後,小紮向外媒表示,「我們的目標不是與開源模型競爭,而是要超過所有人,打造最領先的人工智慧。」

圈內大佬齊喝彩!

Llama 3的釋出,開啟了一波夢幻聯動。傳奇研究員、AI開源倡導者吳恩達發帖表示,Meta在自己生日當天釋出了Llama 3,這是最棒的生日禮物!謝謝Meta!

Meta 的首席AI科學家楊立昆也擊鼓慶祝:

Meta生成式AI團隊主管、蘋果前高管艾哈邁德·艾爾·達勒(Ahmad Al-Dahle)發帖介紹:

此外,此前憑借1000行C語言程式碼、一台Mac就訓練出GPT-2的AI大牛Karpathy也發帖祝賀:

昨夜,重磅釋出的 Llama 3,讓開源大模型圈內如此熱鬧,可謂一個不眠之夜。

被大佬們熱捧的Llama 3的實力究竟如何?

最強開源大模型Llama 3

Llama 3的亮點和特性如下:

  • 基於超過15T token訓練,大小相當於Llama 2數據集的7倍還多;

  • 訓練效率比Llama 2高3倍;

  • 支持8K長文本,改進的tokenizer具有128K token的詞匯量,可實作更好的效能;

  • 在大量重要基準測試中均具有最先進效能;

  • 增強推理和程式碼能力;

  • 安全性有重大突破,帶有Llama Guard 2、Code Shield 和 CyberSec Eval 2的新版信任和安全工具,還能比Llama 2有更好「錯誤拒絕表現」。

  • 根據Meta AI的工程師Aston Zhang透露,Llama 3的誕生始於去年夏天,團隊攻克了數據集,預訓練等方面的一系列難題。他還進一步透露,Llama 3之後還會解鎖新的能力——更長的上下文,支持多模態,效能更強的400B版本。

    Meta展示的基準測試結果包括MMLU、ARC、DROP、GPQA(生物、物理、化學相關的問題集)、HumanEval(程式碼生成測試)、GSM-8K(數學套用測試)、MATH(同為數學相關基準測試)、AGIEval(問題解決的測試集)以及BIG-Bench Hard(常識推理測試)。

    如下圖所示,Llama 3 8B的成績在九項測試中領先同行。但Mistral 7B(2023年9月釋出)和Gemma 7B已經不算最前沿的開源模型。並且在參照的一些基準測試裏,Llama 3 8B的得分最高。

    在MMLU、HumanEval和GSM-8K上,Llama 3 70B擊敗了Gemini 1.5 Pro。盡管無法與Anthropic效能最強的模型 Claude 3 Opus媲美,但 Llama 3 70B的效能,已經優於Claude 3系列的中等模型Sonnet。

    Meta 還測試了 Llama 3 在真實世界場景中的效能,專門開發了一個新的高品質人類評估集,該評估集包含 1800 個提示,涵蓋 12 種關鍵用例(征求建議、頭腦風暴、分類、封閉式問題解答、編碼、創意寫作、提取、角色/人物角色、開放式問題解答、推理、覆寫和總結)。

    在Meta組織的人類反饋評分中,Llama 3 70B打敗了Mistral、OpenAI、Claude釋出的對應產品。

    小紮專門發了個視訊介紹 Meta AI 和 Llama 3,他表示:

    我們的目標是打造世界領先的人工智慧。我們正在用最先進的新 Llama 3 Al 模型升級 Meta Al,該模型已開源。憑借這個新模型,我們相信 Meta Al 現在是最智慧的人工智慧助手。你可以自由使用。

    我們將 Meta Al 整合到頂部的搜尋框中,使其更易於使用WhatsApp、Instagram、Facebook 和 Messenger。我們還建立了一個網站,meta.ai,供你在網路上使用。

    我們還構建了一些獨特的創作功能,例如將照片制作成動畫的功能。現在AI生成高品質影像的速度非常快,可以根據你的需要即時建立和更新它們,它還將生成你的創作過程的回放視訊。

    享受 Meta Al,讓我知道你的想法!

    Meta AI 計畫地址: https://ai.meta.com/blog/meta-llama-3/

    目前,HuggingChat也已開放體驗,需要手動切換至Llama 3。

    Hugging Face 地址: https://huggingface.co/chat/

    不止如此,還有王炸

    不僅如此,在未來幾個月內,Meta還會推出更多的版本。

    Meta 官方表示,Llama 3 8B 和 70B 模型只是 Llama 3 系列模型的一部份,他們後續還將推出更多版本,包括模型參數超過 400B 的 Llama 3 版本(目前仍在訓練中)。

    輝達高級科學家Jim Fan發帖表示:之後可能會釋出的Llama 3-400B以上的版本其將成為某種「分水嶺」,開源社群將能用上GPT-4級別的模型。

    Meta 官方表示,在接下來的幾個月中,他們預計將推出新功能(如多模態)、更長的上下文視窗、更多不同大小版本的模型和更強的效能,以及 Llama 3 研究論文。

    另外,Llama 3 模型將很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上提供,並得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 硬體平台的支持。

    此外,基於 Llama 3,Meta 也釋出了他們的全新 AI 助手 Meta AI。

    Meta今天發表一篇論文【Imagine Flash:利用逆向蒸餾加速Emu擴散模型】。Imagine Flash 是一個創新的加速擴散模型框架,透過 Imagine Flash 技術可以將50步的生成步驟精簡至僅1至3步,達到了即時生圖的效果,同時還能提升影像的品質和保真度。該技術已經套用到了Meta AI聊天機器人當中。

    Meta 表示,「得益於我們在 Llama 3 上取得的最新進展,Meta AI 比以往任何時候都更智慧、更快速、更有趣。」

    眾神聽令,王者回歸!

    Llama 2 釋出後,僅在幾個月內就帶動了開源社群冒出了眾多效能強大的開源模型。開源社群的競爭格局,發生巨變。 當有人懷疑,Meta還能否繼續在激烈地競爭中保持領先時,Meta 用 Llama 3,讓自己重回開源社群的王座。

    後續更多版本的釋出,是否能讓Meta長期坐穩王座? 我們拭目以待。

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。