整理 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)
一分钟速览新闻点!
苹果 M4 芯片驱动 iPad Pro 革新,AI 性能飞跃
OpenAI 紧急刹车规避苹果热搜,神秘 GPT 搜索产品发布暂搁浅
从视频到互动:UniSim 与 Genie 引领仿真环境新突破
OpenAI 计划 2025 年重塑 AI 训练数据伦理边界
马斯克预警:AI 将大幅超越生物智能
Red Hat 以 RHEL AI 和 InstructLab 推动企业 AI 民主化
Meta 通过在 Advantage+ 中应用自动化图像与文本的 AI 功能,提升广告创意
OpenAI 强化 AI 内容真伪标识,联手 C2PA 推进 Sora 视频 AI 溯源
全球 AI 要闻
苹果 M4 芯片驱动 iPad Pro 革新,AI 性能飞跃
苹果于 5 月 7 日夜间简短发布会中,以 M4 芯片为核心,推出新一代 iPad Pro,树立 iPad 性能与设计新标杆。M4 芯片集 38 万亿次/秒运算能力的神经引擎,实现 AI 性能巨大飞跃,同时能耗减半,奠定 iPad Pro 为 AI 领域的最强移动平台。
OpenAI 紧急刹车规避苹果热搜,神秘 GPT 搜索产品发布暂搁浅
OpenAI 今日宣布了一项重要决定,考虑将其原定于 5 月 9 日(周四)的技术成果展示会暂时推迟。此次大会原计划在 OpenAI 位于硅谷的核心园区内拉开帷幕,旨在向全球展示其在人工智能领域的最新突破,特别是传闻中的 GPT 驱动的搜索技术革新及其他核心产品的重大更新。据内部消息人士透露,推迟决定背后的具体原因尚未公开,引发业界诸多猜测。
从视频到互动:UniSim 与 Genie 引领仿真环境新突破
在人工智能领域,模拟真实世界的交互式环境构建取得了显著进展。昨日 NVIDIA 研究科学家 Jim Fan 在其推特上祝贺 UniSim 项目荣获 ICLR 杰出论文奖,这标志着如今在无需动作指令的情况下,仅凭海量视频数据学习物理模拟器的技术迈出了重要一步。UniSim 的独特之处在于能够通过主动干预影响未来视频帧,展示了在具身 AI 领域内的巨大潜力,尽管视觉质量和动力学准确性有待提升,其创新性仍赢得广泛赞誉。
UniSim 问世数月之后,DeepMind 的 Genie 项目在此基础上进一步拓展,从野外视频中无监督学习潜在动作,为大规模扩展无需明确动作注释的仿真系统铺平道路。Genie 作为一个基础世界模型,包含时空视频编码器、自回归动态模型及简洁的潜动作模型,用户得以在无任何地面真实动作标签的训练下,在生成环境中逐帧操作。
UniSim 和 Genie的出现,不仅促进了从高阶视觉语言规划到低阶强化学习策略的广泛训练应用,还揭示了视频字幕、检测模型等其他智能应用受益于模拟体验的可能性,预示着未来通用智能体训练的新途径。
OpenAI 计划 2025 年重塑 AI 训练数据伦理边界
OpenAI 在其官网最新博客透露即将于 2025 年推出一款革命性工具「Media Manager」,旨在为创作者们提供前所未有的版权控制权,决定其作品是否被纳入机器学习模型的训练资料库。通过先进 AI 技术识别版权内容,Media Manager应对网络复杂性,确保多平台上创作权益,允许创作者声明所有权,并细致设定作品参与AI研究与训练的具体条件,未来还将增加更多定制选项。目前虽未公布价格详情,但鉴于其定位,业界推测很可能免费提供。
博客链接: https://openai.com/index/approach-to-data-and-ai
马斯克预警:AI 将大幅超越生物智能
科技领军人物埃隆·马斯克预警,人工智能的发展速度将使生物智能占比骤降至 1% 以下,突显数字智能时代的到来。鉴于此,马斯克强调 AI 系统需增强环境适应力,并提倡将生物智能作为 AI 的辅助和缓冲,以提升整体稳定性。
针对人机共存问题,马斯克虽对未来人类角色持开放态度,但他明确指出,构建 AI 应遵循核心原则: 确保 AI 的真实性与诚信,拒绝谎言。
Red Hat 以 RHEL AI 和 InstructLab 推动企业 AI 民主化
Red Hat Summit 2024 上,Red Hat 宣布 RHEL AI 平台及 InstructLab 项目,标志着企业级 AI 民主化新纪元。RHEL AI 为开源语言模型提供企业级运行环境,结合 InstructLab,允许领域专家无须数据科学技能即可通过共享知识优化模型。通过 RHEL AI 和 InstructLab,Red Hat 正如同此前对 Linux 和 Kubernetes 所做的那样,借助开源力量,使前沿 AI 技术触手可及,加速企业生成式 AI 采纳进程。
Meta 通过在 Advantage+ 中应用自动化图像与文本的 AI 功能,提升广告创意
Meta 在 Advantage+平台上推出了 AI 驱动的图像与文本生成功能,为全球广告商简化广告开发流程。这一计划于 2023 年推出的更新利用 AI 技术,将初步广告构思转化为多样化的视觉和文本变体,旨在提高广告效果及创作效率。
借助即将推出的 Llama 3 语言模型,Meta 确保了高质量的输出,能够体现广告商的品牌特色。AI 并非取代人类创造力,而是基于提供的素材进行扩展,生成多个版本以利于最佳投资回报率(ROI)评估。在应对 AI 内容带来的法律复杂性时,Meta 重申了其在 Advantage+ Creative——一套 AI 辅助的广告系列设计工具集中提供全面解决方案的承诺。这一集成标志着 AI 在数字广告领域增强而非替代人类创造力方面迈出了重要一步。
OpenAI 强化 AI 内容真伪标识,联手 C2PA 推进 Sora 视频 AI 溯源
生成式 AI 领头羊 OpenAI 新近宣布,将作为指导成员加入 C2PA,共谋内容来源验证技术未来。此举意在助力识别 AI 生成内容,确保用户能追溯创作源头,避免与实拍混淆。C2PA,一个由微软、Adobe 等科技龙头组建的联盟,正推进开源标准,让 AI 内容的出处一目了然。
OpenAI 透露,其旗舰模型 DALL-E 3 及待发布的 Sora 视频技术,均采用 C2PA 元数据标签,实现 AI 创作的透明度。Sora 视频虽未公测,但已确定将集成此元数据,确保视频作品的 AI 来源可追溯。