当前位置: 欣欣网 > 资讯

Sora官方MV首曝;搭载GPT-4的AI程序员开源出世;OpenAI开发者关系主管加入Google | AI头条

2024-04-03资讯

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • OpenAI 发布 Sora 首支官方 MV

  • AI 程序员 SWE-agent 开源登场,全面超越 Devin

  • 前 OpenAI 开发者关系主管加入 Google

  • 百度文心联手优必选打造 AI 大模型赋能人形机器人创新应用

  • Hugging Face 联手英特尔推出 SPRIGHT 项目,革新文生图空间一致性技术

  • OpenAI 联手 Harvey 推出高精度案例法模型,融资 8000 万美元助推法律 AI 创新

  • Stability AI 因 GPU 成本过高导致现金流危机

  • Cloudflare 联手 Hugging Face 推出 Workers AI 公共版,简化 AI 应用部署

  • Google 发布 Google VLOGGER,号称永远改变视频未来

  • 全球 AI 要闻

    OpenAI 发布 Sora 首支官方 MV

    今早八点,OpenAI 在 Youtube 发布了 Sora 的第一部官方 MV,该 MV 由艺术家 August Kamp 与 Sora 一同制作,风格迷幻迥异,犹如梦境。

    视频链接: https://www.youtube.com/watch?v=f75eoFyo9ns

    AI 程序员 SWE-agent 开源登场,全面超越 Devin

    普林斯顿大学 NLP 组近日开源了名为 SWE-agent 的 AI 程序员,该系统能在 GitHub 存储库中自主解决问题,在 SWE-bench 测试中表现接近于闭源的 AI 程序员 Devin,平均解决时间仅为 93 秒,实现 SOTA 性能。SWE-agent 借助 GPT-4 等大模型技术,可修复实际 GitHub 项目中的错误和问题,具备与专用终端交互、进行文件操作、语法检查、编写与执行测试等功能。通过精心设计的智能体-计算机接口(ACI),优化大模型浏览和编辑代码的能力,显著提升了 AI 编程效率。发布当天即收获超 1.4k Star,引发广泛关注。

    项目链接: https://swe-agent.com/

    GitHub: https://github.com/princeton-nlp/SWE-agent

    前 OpenAI 开发者关系主管加入 Google

    前 OpenAI 开发者关系主管 Logan Kilpatrick 昨日宣布已加入 Google,他在 X 上透露,自己将在 Google 担任 AI Studio 产品负责人,并致力于支持 Gemini API 项目。Kilpatrick 表达了对新角色的热情,强调未来有大量的工作要完成,目标是将 Google 打造成 AI 开发者们的最佳归属地,并誓言不会接受任何低于这一目标的结果。此举预示着 Google 将继续强化其在人工智能开发工具及平台领域的投入。

    百度文心 X 优必选打造 AI 大模型赋能人形机器人创新应用

    百度与优必选合作,以 OpenAI 和 Figure 的理念为灵感,成功将百度文心大模型与优必选人形机器人 Walker S 深度融合。借助千帆 AppBuilder 平台,Walker S 在任务调度应用中展现出强大的自然语言理解、任务规划与执行能力,如通过文心一言模型完成折叠衣物和分类物品等复杂任务。在柔性物体操作及物体干扰分拣挑战中,Walker S 结合端侧多模态感知与百度大模型的理解规划能力,实现精准动作协同,处于国际人形机器人研发前沿。

    Hugging Face X 英特尔推出 SPRIGHT 项目,革新文生图空间一致性技术

    Hugging Face 与英特尔共同发布了针对文生图模型空间一致性的解决方案,新方案结合了首个专注空间关系注释的庞大数据集 SPRIGHT,该数据集包含了从四个知名图像数据集中精心挑选并重新标注的 600 万张图片。研究揭示,SPRIGHT 在表达空间关系方面的表现远超现有数据集,仅使用极小部分数据即提升了 22% 的空间准确性,并在 FID 和 CMMD 评价指标上取得进步。同时,团队通过在包含多个物体的少量图像上进行微调,使模型在 T2I-CompBench 平台上创下了 0.2133 的空间得分纪录。

    GitHub: https://github.com/SPRIGHT-T2I/SPRIGHT

    OpenAI X Harvey 推出高精度案例法模型,融资 8000 万美元助推法律 AI 创新

    OpenAI 联手 Harvey 开发出一款专门针对法律领域的案例法模型,结合了 GPT-4 技术,实现高质量法律文件起草、复杂问题深度解析及合同差异精准定位。在与顶尖律所合作的测试中,97% 情况下律师更青睐该模型的输出结果,因其提供全面详细的法律解答并严格依据实际案例引用。

    由经验丰富的律师 Winston Weinberg 与前谷歌大脑、Meta AI 研究员 Gabe Pereyra 共同创立的 Harvey,在最新一轮融资中获 OpenAI 和红杉等投资 8000 万美元,公司估值达到 7.5 亿美元。

    Stability AI 因 GPU 成本过高导致现金流危机

    曾经备受瞩目的 AIGC 公司 Stability AI 由于其流行的文本转图像模型 Stable Diffusion 背后的 GPU 集群产生的高昂基础设施成本而陷入财务困境。据报道,公司 2023 年租用云 GPU 的开销高达 9900 万美元,而预计年度收入仅为 1100 万美元。巨额的云服务费用(包括从 AWS、Google Cloud 和CoreWeave 租赁)加上工资和运营支出导致公司资金储备锐减至 400 万美元。最终,公司前 CEO Emad Mostaque 于今年三月辞职,公司转向订阅模式并考虑转售其 GPU 资源以增加收入,同时面临员工流失和技术版权诉讼等问题。

    Cloudflare X Hugging Face 推出 Workers AI 公共版,简化 AI 应用部署

    Cloudflare 推出了一项新功能,允许开发者简单地将来自 Hugging Face 的人工智能应用部署到其平台上,并正式发布了面向公众的服务器端 GPU 驱动推理服务——Workers AI。这一整合使得只需一键操作,开发者就能迅速部署 14 种精选的 Hugging Face 模型,涵盖文本生成、嵌入及句子相似性等多个领域。此外,Workers AI 已在全球超过 150 个城市部署了 GPU,支持更多地区开发者使用,并新增对微调模型权重的支持,便于开发定制化的专业应用。

    入口: https://huggingface.co/collections/Cloudflare/hf-curated-models-available-on-workers-ai-66036e7ad5064318b3e45db6

    Google 发 布 Google VLOGGER,号称永远改变视 频未来

    昨日,Google 学者 Enric Corona 及其团队推出了 VLOGGER 工具,用于控制AI生成的逼真视频,尤其能基于一张照片生成说话者的高清视频,并根据语音样本进行动画制作,实现对人物的高保真模拟。Corona 团队基于 MENTOR 数据集训练模型,该数据集包含 800,000 个说话者视频片段,是迄今为止规模最大、最详尽的数据集。

    项目链接: https://enriccorona.github.io/vlogger/

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「 全球机器学习技术大会 」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。 欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。