高考作文热议人工智能；Qwen 2 登顶 Hugging Face

2024-06-07资讯

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

高考作文聚焦人工智能，引发教育与科技融合新思考

阿里云 Qwen2 正式开源，登顶 Hugging Face 榜首！

快手 AI 视频生成模型「可灵」震撼发布

Chrome 要更卡了？谷歌在 Chrome 浏览器内置 Gemini Nano 大模型

微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查

「创意避风港」 Cara 应用爆红，50 万艺术家为防 AI 抓取原创内容集体出走

OpenAI 已解散的「超级对齐团队」论文揭示 AI 模型内部运作机制

OpenAI 官方回应【对人工智能提出警告的权利】联名公开信

Meta 计划推出 WhatsApp功能

专家团队揭示 MMLU 基准测试错误，推出 MMLU-Redux 提升 AI 评估准确性

「AI 程序员」 Devin CEO 最新访谈：估值 20 亿美元，赋能部分企业完成了数千小时项目

谷歌新论文揭示：开放性是实现超级人工智能的关键

全球 AI 要闻

高考作文聚焦人工智能，引发教育与科技融合新思考

今日，2024 年全国高考语文科目落下帷幕，其中新课标 I 卷的作文题目迅速成为社会关注的热点。作文材料指出，随着互联网技术的飞速发展与人工智能的广泛应用，人们能够以前所未有的速度获取知识、找到问题的答案。这一现象引发了对于未来学习方式、问题解决机制乃至人类智慧发展路径的深刻思考。作文要求考生在体验了信息时代便捷的同时，探讨在这一背景下，人类面临的问题是否真的会越来越少。

阿里云 Qwen2 正式开源，登顶 Hugging Face 榜首！

阿里云在 AI 领域投下震撼弹，正式宣布 Qwen2 系列大型语言模型的面世，并同步在 Hugging Face 及 ModelScope 平台上开源共享。此次升级包含了从 Qwen2-0.5B 至 Qwen2-72B 在内的五个不同规模的预训练与指令微调模型，展示了阿里云在自然语言处理技术的最新突破。 Qwen2 的上下文处理能力最大支持扩展至 128K tokens，还引入了对 27 种新语言的高质量数据训练，极大地拓宽了其应用范围和国际化视野。

尤为引人注目的是，Qwen2-72B 模型发布仅两小时后，Hugging Face 首席执行官 Clément Delangue 即刻发推宣告，该模型已荣登其平台开源大模型性能榜单首位，超越了先前的领头羊，包括性能卓越的 Llama3-70B。这标志着 Qwen2 系列不仅在多语言支持、代码及数学能力上显著增强，更在综合评测中展现出了前所未有的优越性能。

GitHub： https://github.com/QwenLM/Qwen2

Hugging Face： https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

快手 AI 视频生成模型「可灵」震撼发布

近日，国内互联网巨头快手正式推出其自主研发的视频生成大模型——「可灵」。作为对国际顶尖水平的对标之作，该模型在技术实现采用 OpenAI Sora 的 DiT 架构，彰显了快手在 AI 技术创新的强劲实力。

「可灵」不仅能够创造出长达 2 分钟、高分辨率的流畅视频内容，还独有模拟现实物理特性的高级功能，使得生成视频中的运动表现更为自然合理。目前，用户可通过快影 APP 抢先体验 720P 视频生成，未来竖版视频生成也将开放，为内容创作者提供更多可能。

此外，快手同步上线了「AI 舞王」等创新应用，让「可灵」技术快速触达广大用户群体，标志着这一前沿技术从实验室走向市场的飞跃。

Chrome 要更卡了？谷歌在 Chrome 浏览器内置 Gemini Nano 大模型

近日，Google Chrome 浏览器迎来重大更新，宣布内置 Gemini Nano 大模型。Gemini Nano 作为 Gemini 系列中最高效的模型版本，专为现代桌面和笔记本电脑设计，可在本地运行，无需服务器支持，为网站和网络应用提供无缝的 AI 驱动体验。以往，大型 AI 模型的应用受限于模型体积庞大及需单独下载的不便，但 Chrome 的新举措通过浏览器内置 API，直接集成包括大语言模型（LLMs）在内的 AI 模型，解决了这一难题。这意味着，开发者无需部署或管理自己的 AI 模型，即可享受 AI 带来的便利。

官方表示："我们正开发的 Web 平台 API 和浏览器特性旨在将 AI 模型直接融入浏览器，使内置 AI 成为可能。Gemini Nano 让您的网站或应用在不承担大型模型部署与管理的情况下，实现 AI 功能。"

OpenAI 已解散的「超级对齐团队」论文揭示 AI 模型内部运作机制

近日，OpenAI 发布了一篇备受关注的研究论文，揭示了其大语言模型 ChatGPT 背后的运作机制。据悉，这项研究由已解散的「超级对齐」团队完成，旨在解决人工智能带来的潜在风险。论文中，研究人员提出一种逆向工程 AI 模型的方法，通过识别模型中代表特定概念的模式，来揭示其内部运作原理。

论文链接： https://cdn.openai.com/papers/sparse-autoencoders.pdf

微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查

联邦贸易委员会（FTC）和 DOJ 目前正在讨论由谁来以反垄断为由调查微软、OpenAI 和 NVIDIA 之间的合作关系。今年 1 月， FTC 开始调查科技公司对小型 AI 公司投资的潜在反垄断问题。该机构向 Alphabet、亚马逊、Anthropic、微软和 OpenAI 发出了信函。谷歌母公司 Alphabet 和亚马逊都是 Anthropic 的投资者。微软向 OpenAI 投资了数十亿美元，并将其技术深度整合到自己的服务中，这引起了人们对潜在反竞争行为的担忧。两家机构都在努力确定管辖权，这使得正式调查程序被推迟。目前，三家公司对此事都未予置评。

「创意避风港」 Cara 应用爆红，50 万艺术家为防 AI 抓取原创内容集体出走

在 Meta 旗下 Instagram 平台宣布利用用户内容训练 AI 模型后，艺术家群体中掀起了一股向新兴社交应用 Cara 迁移的浪潮。Cara 承诺打造一个尊重创作者权益的平台，通过自动附加 "NoAI" 标签保护艺术家作品，防止被人工智能抓取用于训练，即便这一措施更多在于表达立场而非法律约束。这一创新举措迅速吸引了大量用户，短短数日内用户量激增三倍，突破 30 万大关，跃居美国 App Store 社交网络类榜首，超越了 Twitter、Discord 等知名应用。随后，该应用在今天正式突破了 50 万用户大关。

尽管面临服务器崩溃的技术挑战和高昂的运维成本——每月需支付 13,500 美元以维持数据库运行，创始人 Jingna Zhang 表示，她已自掏腰包支持该项目超过一年，将其视为尊重创意者权利的热情项目。为应对突发流量和确保服务稳定，团队紧急升级服务器七次，并在社交媒体上发起众筹。

OpenAI 官方回应【对人工智能提出警告的权利】联名公开信

6 月 4 日发布的【对人工智能提出警告的权利】的公开信，是人工智能行业员工就人工智能的危险的一次公开发声，11 名现任与前 OpenAI 员工、两名谷歌 DeepMind 员工在这封信上签了名。

对此，OpenAI 公司官方声明内容如下：

我们为自己能提供能力最强、最安全的人工智能系统而感到自豪，并坚信我们能以科学的方法应对风险。鉴于 AI 技术的重要性，我们认同公开信中的内容，如何通过严肃的讨论，对于更好推进 AI 技术发展至关重要。

我们将继续接触各国政府、民间社会和世界各地的其他社区，共同营造和谐的 AI 环境。包括匿名诚信热线、由董事会成员和公司安全领导者参与的安全与安保委员会（ Safety and Security Committee）在内，都是监管 AI 的有效手段。OpenAI 指出在必要的保障措施到位之前，公司不会发布新的 AI 技术。公司重申支持政府监管，并参与人工智能安全自愿承诺。

对于报复行为的担忧，发言人证实，公司已解除了所有前员工的非贬损协议，并从标准离职文件中删除了此类条款。

Meta 计划推出 WhatsApp功能

近日，科技巨头 Meta 计划推出 WhatsApp 功能，包括为印度和新加坡的企业提供人工智能助手，以及在英语市场制作广告的人工智能工具。6 月 6 日，Meta 表示，正在为巴西、印度、印度尼西亚和哥伦比亚的 WhatsApp 企业用户推出 Meta Verified 计划，并最终将扩展到更多国家。这项服务的订阅计划起价为每月 14 美元。该公司还在其面向企业的消息服务中添加更多功能，并允许企业使用其 API 通过应用程序内的电话为客户提供服务。（TechCrunch）

专家团队揭示 MMLU 基准测试错误，推出 MMLU-Redux 提升 AI 评估准确性

在 6 月 6 日发布的一篇名为【Are We Done with MMLU?】的论文中，来自爱丁堡大学、罗马一大、巴里理工大学等多所高校及机构的国际研究团队，对广受欢迎的 Massive Multitask Language Understanding (MMLU) 基准测试中存在的错误进行了深入分析与揭露。该团队指出，尽管 MMLU 被广泛采用以评估大语言模型（LLMs）的能力，但其包含的诸多基准真实错误（ground truth errors）却模糊了模型的真实性能。

研究中一个显著例子是病毒学子集中的问题，其中 57% 被发现存在错误。为解决这一问题，团队提出了一种全面的错误识别框架，并引入新颖的错误分类法。基于此，他们创建了 MMLU-Redux——一个包含 30 个 MMLU 学科领域内 3,000 个经过人工重新注释问题的子集。使用 MMLU-Redux 进行的实验结果显示，与最初报告的模型性能指标存在显著差异，强调了修订 MMLU 错误问题的必要性，以增强其作为未来评估基准的实用性和可靠性。因此，为了进一步提升数据质量与精确度，团队开放 MMLU-Redux 接受更多注解贡献，呼吁学术界和工业界共同参与，推动人工智能评估标准的精确化与透明化。

论文链接： https://arxiv.org/pdf/2406.04127

数据集： https://huggingface.co/datasets/edinburgh-dawg/mmlu-redux

「AI 程序员」 Devin CEO 最新访谈： 估值 20 亿美元，赋能 部分企业完成了数千小时项目

Devin CEO Scott Wu 在接受彭博社采访时透露了一系列振奋人心的消息，揭示了其公司背后的科技创新与市场潜力。Wu 表示，通过使用 Devin 平台，部分企业已成功完成了数千小时的项目，实现了工作效率 5 倍速的飞跃。他强调软件工程的本质在于攻克深层逻辑难题，而 Devin 正致力于成为这一挑战的解决方案。

投资界对此反响热烈，Peter Thiel 的知名风投基金大手笔注资 2100 万美元，显示了对 Devin 技术前景的高度认可。令人惊讶的是，这家估值约达 20 亿美元的初创公司，团队规模仅 10 人，成员横跨纽约与硅谷，展现了极高的效率与创新能力。

Wu 在访谈中未明确透露其核心技术是否为自主研发或是基于某个大语言模型。此外，公司已从 Founders Fund、COSLA 及多个债券方筹集了 1.75 亿美元资金，进一步巩固了其在 AI 技术领域的领先地位。

谷歌新论文揭示：开放性是实现超级人工智能的关键

在 6 月 6 日发布的最新论文【Open-Endedness is Essential for Artificial Superhuman Intelligence】中，谷歌提出了一项重要论断，即当前技术要素已齐备，可使人工智能系统实现开放性（open-endedness），并认为这一特性对于任何人工超级智能（ASI）而言至关重要。

论文指出，近年来 AI 系统的通用能力经历了巨大飞跃，这主要得益于在互联网规模数据上训练基础模型。尽管如此，创建能够自我持续改进、具有开放性的 AI 仍然是一个挑战。研究团队首先通过新颖性和可学习性的视角，给出了开放性的一个具体形式化定义。接着，他们描绘了一条通往 ASI 的道路，该路径基于构建于基础模型之上的开放性系统，这些系统能够做出对人类具有重要意义的新发现。

论文最后探讨了普遍能力开放性 AI 的安全影响，预测开放性基础模型将成为未来研究中一个日益重要且关乎安全的领域，预示着在不久的将来，这一领域的研究将取得突破性进展。

论文链接： https://arxiv.org/pdf/2406.04268

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料（案例）的内容原则，将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题：大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉： http://sdcon.com.cn/

高考作文热议人工智能；Qwen 2 登顶 Hugging Face | AI 头条