李飞飞团队年度AI大模型报告：闭源模型优于开源模型、谷歌成模型大赢家、中国应用遥遥领先

2024-04-17资讯

整理 | 王轶群

责编 | 唐小引

出品丨AI 科技大本营（ID：rgznai100）

2023年的人工智能发展现状如何？华裔「AI教母」李飞飞所在的斯坦福以人为中心的人工智能研究所（HAI），带来了第七个年度的 AI Index 报告，追踪了 2023 年全球人工智能趋势，这份长达 300 多页的报告是关于人工智能行业现状的最全面的报告之一。

完整报告链接：

https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

开源模型持续增加，但闭源模型性能仍优于开源

报告统计了2023年各组织发布的基础模型数量，共计 149 个，是 2022 年发布数量的两倍多。

在这些新发布的模型中，65.7% 是开源的，而 2022 年这一比例在2022年和2021年仅为 44.4%及 33.3%。

报告指出，在性能测试上，闭源模型仍然优于开源模型。在 10 个选定的基准测试中，闭源模型实现了 24.2% 的中值性能优势，差异范围从 GSM8K 等数学任务上的差异小至 4.0%，到 AgentBench 等代理任务上的差异高达 317.7%。 在所有选定的基准上，闭源模型的表现均优于开源模型。

谷歌是最大玩家

2023年，谷歌击败了其他行业参与者，发布了最多的模型，包括 Gemini 和 RT-2。事实上，自 2019 年以来，谷歌一直是发布基础模型数量最多的，总共有 40 个，其次是 OpenAI，发布了 20 个模型。报告还指出，在模型发布上，学术界落后于产业界： 2023年，发布基础模型最多的学术机构是加州大学伯克利分校，发布了3个模型，而斯坦福大学发布了2个模型。

自 2019 年以来，Google 发布的基础模型数量最多，共有 40 个，其次是 OpenAI，有 20 个（图 1.3.17）。清华大学也脱颖而出，发布了 7 个基础模型，而斯坦福大学是美国领先的学术机构，发布了 5 个模型。

学术界和政府在人工智能竞赛中被淘汰的原因之一是：训练这些巨型模型的成本呈指数级增长。2023 年， OpenAI 的 GPT-4 和 Google 的 Gemini Ultra 的训练成本预计分别约为 7800 万美元和 1.91 亿美元，后者是前者的2.5倍之多 。相比之下，2017 年最初的 Transformer 模型的成本约为 900 美元，该模型引入了几乎所有现代 LLM 的基础架构。

在机器学习模型方面，美国在 2023 年远远超过其他国家，在 2023 年总共开发了 61 个模型。自 2019 年以来，美国在大多数著名模型的发明方面一直处于领先地位，其次是中国和英国。

2023 年，全球大部分基础模型源自美国（109 个），其次是中国（20 个）和英国。自 2019 年以来，美国在大多数基础模型的研发方面一直处于领先地位。

报告还统计了2023年最受欢迎的AI工具，其中 最受欢迎的AI开发工具是GitHub Copilot，最受欢迎的AI搜索工具是ChatGPT 。

中国产业机器人数量遥遥领先

报告指出，2022年中国产业机器人安装量领先世界，达29.03万台，是日本5.04万台的5.8倍、美国3.95万台的7.4倍，韩国和德国紧随其后，分别为 3.12万台和2.56万台的安装量。

过去三年，中国各行业机器人安装数量超过世界其他地区。

2022年，中国产业机器人安装量的主导行业是电气/电子（10万台）、汽车（73,000）、金属和机械（31,000）。

相比之下，美国2022年汽车行业产业机器人安装量领先，达14,500台，大幅超过 2021 年的数字。除电子行业外，其他行业的机器人安装量均少于2021 年。

IFR报告显示，从2021年起，大多数国家产业机器人安装量逐年增加。到 2022 年。增长率最高的国家包括新加坡（68%）、土耳其（22%）和墨西哥（13%）。相较于2021年，加拿大 (-24%)、台湾 (-21%)、泰国 (-18%) 和德国 (-1%) 在2022年机器人安装量减少。

AI在许多基准测试中皆已达人类水平

截至2023年， 人工智能在许多重要的人工智能基准测试中（从测试阅读理解到视觉推理的测试）都达到了人类水平的表现 。尽管如此，它在某些基准测试（例如竞赛级别的数学）上仍存在不足。由于人工智能已经突破了如此多的标准基准，人工智能学者不得不创造新的、更困难的挑战。今年的指数还跟踪了其中几个新基准，包括编码、高级推理和代理行为任务的基准。

谁在为此忧虑？

答案是年轻人、高收入人群，以及全球范围内机构对数据安全的关心。

在全球范围内，大多数人预计人工智能会改变他们的工作，超过三分之一的人预计人工智能会取代他们。与 X 世代和婴儿潮一代等老一代人相比，年轻一代（Z 世代和千禧一代）预计人工智能会带来更实质性的影响。具体来说，66% 的 Z 世代受访者和 46% 的婴儿潮一代受访者认为人工智能将显著影响他们目前的工作。与此同时，收入较高、受教育程度较高、担任决策职务的个人预计人工智能会对他们的就业产生巨大影响。

多伦多大学的一项国际调查显示，63% 的受访者知道 ChatGPT。在那些知道的人中，大约有一半的人每周至少使用 ChatGPT 一次。

但公众对人工智能的经济影响持悲观态度。在 lpsos 的一项调查中，只有 37% 的受访者认为人工智能将改善他们的工作。只有 34% 的人认为人工智能将促进经济，32% 的人认为它将促进就业市场。这一指数的民意数据来自一项关于对人工智能态度的全球调查，31 个国家的 22816 名成年人（年龄在 16 岁至 74 岁之间）参与了调查。超过半数的受访者表示，人工智能让他们感到紧张，而前一年这一比例为 39%。 三分之二的人现在预计人工智能将在未来几年内深刻改变他们的日常生活。

该指数中的其他图表显示，不同人群的观点存在显著差异， 年轻人更倾向于乐观地看待人工智能将如何改变他们的生活。

2022年与2023年全球采用人工智能的情况对比

在人工智能相关的工作招聘方面，报告统计显示，2023 年同比人工智能招聘率相对最高的国家和地区是中国香港（28.8%），其次是新加坡（18.9%）和卢森堡（18.9%）。这些数据意味着，以中国香港为例，2023年中国香港人工智能的比例人才招聘相对于整体招聘增长了 28.8%。

当一项调查被问及人工智能产品和服务是否会让你感到紧张时，69% 的澳大利亚人和 65% 的英国人回答是。日本对人工智能产品的担忧程度最低，为 23%。

与埃森哲合作的一项全球调查显示，1000多个全球组织的受访者被问对人工智能的担忧与哪些风险相关，其中 未经所有者同意使用数据或数据泄密是全球最关注的问题 。值得注意的是，这些担忧来自亚洲和欧洲的比例明显高于北美。

人工智能发展的车轮滚滚向前，消耗资源的同时也带来了效率与收益。人工智能是一把双刃剑，它的好坏与否始终取决于握住这把剑的人类。

通过斯坦福HAI的报告，我们得以较全面地观察2023年的AI行业发展。

2023如上。2024年，让我们一起共同绘制人工智能行业发展的斑斓图表。

参考链接：

https://hai.stanford.edu/news/ai-index-state-ai-13-charts

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「 全球机器学习技术大会 」将在上海环球港凯悦酒店举行，特邀近 50 位技术领袖和行业应用专家，与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众，共同探讨人工智能领域的前沿发展和行业最佳实践。 欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。