李飛飛團隊年度AI大模型報告：閉源模型優於開源模型、谷歌成模型大贏家、中國套用遙遙領先

2024-04-17資訊

整理 | 王軼群

責編 | 唐小引

出品丨AI 科技大本營（ID：rgznai100）

2023年的人工智慧發展現狀如何？華裔「AI教母」李飛飛所在的史丹佛以人為中心的人工智慧研究所（HAI），帶來了第七個年度的 AI Index 報告，追蹤了 2023 年全球人工智慧趨勢，這份長達 300 多頁的報告是關於人工智慧行業現狀的最全面的報告之一。

完整報告連結：

https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

開源模型持續增加，但閉源模型效能仍優於開源

報告統計了2023年各組織釋出的基礎模型數量，共計 149 個，是 2022 年釋出數量的兩倍多。

在這些新釋出的模型中，65.7% 是開源的，而 2022 年這一比例在2022年和2021年僅為 44.4%及 33.3%。

報告指出，在效能測試上，閉源模型仍然優於開源模型。在 10 個選定的基準測試中，閉源模型實作了 24.2% 的中值效能優勢，差異範圍從 GSM8K 等數學任務上的差異小至 4.0%，到 AgentBench 等代理任務上的差異高達 317.7%。 在所有選定的基準上，閉源模型的表現均優於開源模型。

谷歌是最大玩家

2023年，谷歌擊敗了其他行業參與者，釋出了最多的模型，包括 Gemini 和 RT-2。事實上，自 2019 年以來，谷歌一直是釋出基礎模型數量最多的，總共有 40 個，其次是 OpenAI，釋出了 20 個模型。報告還指出，在模型釋出上，學術界落後於產業界： 2023年，釋出基礎模型最多的學術機構是加州大學柏克萊分校，釋出了3個模型，而史丹佛大學釋出了2個模型。

自 2019 年以來，Google 釋出的基礎模型數量最多，共有 40 個，其次是 OpenAI，有 20 個（圖 1.3.17）。清華大學也脫穎而出，釋出了 7 個基礎模型，而史丹佛大學是美國領先的學術機構，釋出了 5 個模型。

學術界和政府在人工智慧競賽中被淘汰的原因之一是：訓練這些巨型模型的成本呈指數級增長。2023 年， OpenAI 的 GPT-4 和 Google 的 Gemini Ultra 的訓練成本預計分別約為 7800 萬美元和 1.91 億美元，後者是前者的2.5倍之多 。相比之下，2017 年最初的 Transformer 模型的成本約為 900 美元，該模型引入了幾乎所有現代 LLM 的基礎架構。

在機器學習模型方面，美國在 2023 年遠遠超過其他國家，在 2023 年總共開發了 61 個模型。自 2019 年以來，美國在大多數著名模型的發明方面一直處於領先地位，其次是中國和英國。

2023 年，全球大部份基礎模型源自美國（109 個），其次是中國（20 個）和英國。自 2019 年以來，美國在大多數基礎模型的研發方面一直處於領先地位。

報告還統計了2023年最受歡迎的AI工具，其中 最受歡迎的AI開發工具是GitHub Copilot，最受歡迎的AI搜尋工具是ChatGPT 。

中國產業機器人數量遙遙領先

報告指出，2022年中國產業機器人安裝量領先世界，達29.03萬台，是日本5.04萬台的5.8倍、美國3.95萬台的7.4倍，南韓和德國緊隨其後，分別為 3.12萬台和2.56萬台的安裝量。

過去三年，中國各行業機器人安裝數量超過世界其他地區。

2022年，中國產業機器人安裝量的主導行業是電氣/電子（10萬台）、汽車（73,000）、金屬和機械（31,000）。

相比之下，美國2022年汽車行業產業機器人安裝量領先，達14,500台，大幅超過 2021 年的數位。除電子行業外，其他行業的機器人安裝量均少於2021 年。

IFR報告顯示，從2021年起，大多數國家產業機器人安裝量逐年增加。到 2022 年。增長率最高的國家包括新加坡（68%）、土耳其（22%）和墨西哥（13%）。相較於2021年，加拿大 (-24%)、台灣 (-21%)、泰國 (-18%) 和德國 (-1%) 在2022年機器人安裝量減少。

AI在許多基準測試中皆已達人類水平

截至2023年， 人工智慧在許多重要的人工智慧基準測試中（從測試閱讀理解到視覺推理的測試）都達到了人類水平的表現 。盡管如此，它在某些基準測試（例如競賽級別的數學）上仍存在不足。由於人工智慧已經突破了如此多的標準基準，人工智慧學者不得不創造新的、更困難的挑戰。今年的指數還跟蹤了其中幾個新基準，包括編碼、高級推理和代理行為任務的基準。

誰在為此憂慮？

答案是年輕人、高收入人群，以及全球範圍內機構對數據安全的關心。

在全球範圍內，大多數人預計人工智慧會改變他們的工作，超過三分之一的人預計人工智慧會取代他們。與 X 世代和嬰兒潮一代等老一代人相比，年輕一代（Z 世代和千禧一代）預計人工智慧會帶來更實質性的影響。具體來說，66% 的 Z 世代受訪者和 46% 的嬰兒潮一代受訪者認為人工智慧將顯著影響他們目前的工作。與此同時，收入較高、受教育程度較高、擔任決策職務的個人預計人工智慧會對他們的就業產生巨大影響。

多倫多大學的一項國際調查顯示，63% 的受訪者知道 ChatGPT。在那些知道的人中，大約有一半的人每周至少使用 ChatGPT 一次。

但公眾對人工智慧的經濟影響持悲觀態度。在 lpsos 的一項調查中，只有 37% 的受訪者認為人工智慧將改善他們的工作。只有 34% 的人認為人工智慧將促進經濟，32% 的人認為它將促進就業市場。這一指數的民意數據來自一項關於對人工智慧態度的全球調查，31 個國家的 22816 名成年人（年齡在 16 歲至 74 歲之間）參與了調查。超過半數的受訪者表示，人工智慧讓他們感到緊張，而前一年這一比例為 39%。 三分之二的人現在預計人工智慧將在未來幾年內深刻改變他們的日常生活。

該指數中的其他圖表顯示，不同人群的觀點存在顯著差異， 年輕人更傾向於樂觀地看待人工智慧將如何改變他們的生活。

2022年與2023年全球采用人工智慧的情況對比

在人工智慧相關的工作招聘方面，報告統計顯示，2023 年同比人工智慧招聘率相對最高的國家和地區是中國香港（28.8%），其次是新加坡（18.9%）和盧森堡（18.9%）。這些數據意味著，以中國香港為例，2023年中國香港人工智慧的比例人才招聘相對於整體招聘增長了 28.8%。

當一項調查被問及人工智慧產品和服務是否會讓你感到緊張時，69% 的澳洲人和 65% 的英國人回答是。日本對人工智慧產品的擔憂程度最低，為 23%。

與埃森哲合作的一項全球調查顯示，1000多個全球組織的受訪者被問對人工智慧的擔憂與哪些風險相關，其中 未經所有者同意使用數據或數據泄密是全球最關註的問題 。值得註意的是，這些擔憂來自亞洲和歐洲的比例明顯高於北美。

人工智慧發展的車輪滾滾向前，消耗資源的同時也帶來了效率與收益。人工智慧是一把雙刃劍，它的好壞與否始終取決於握住這把劍的人類。

透過史丹佛HAI的報告，我們得以較全面地觀察2023年的AI行業發展。

2023如上。2024年，讓我們一起共同繪制人工智慧行業發展的斑斕圖表。

參考連結：

https://hai.stanford.edu/news/ai-index-state-ai-13-charts

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行，特邀近 50 位技術領袖和行業套用專家，與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾，共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。