当前位置: 欣欣网 > 资讯

Claude 登录 iOS;南开携字节打造连贯叙事 AI 模型;OpenAI 断网波及 Rabbit R1 功能 | AI 头条

2024-05-03资讯

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • Claude 登录 iOS

  • 南开 x 字节 StoryDiffusion 重塑连贯视觉叙事

  • 微软公布首份 AI 责任透明报告

  • NVIDIA ChatRTX 融合 Gemma 与 CLIP 模型,新增语音查询功能

  • OpenAI 服务中断致 Rabbit R1 语音功能暂停

  • Prometheus 2 模型革新语言模型质量评估标准

  • IBM 软件登录 AWS Marketplace,92 国加速拥抱混合云 AI

  • 全球 AI 要闻

    Claude 登录 iOS

    Anthropic 近期发布了其先进的 AI 模型 Claude 的专属 iOS 应用程序,标志着该公司正式涉足移动平台。该应用程序不仅集成基础聊天功能,还整合了图像上传与分析能力。本次发布还伴随着「Claude Team」订阅计划的登场,专为团队设计,5 人起订,每人月费 30 美元,解锁无限制对话与即将推出的长文档分析等功能。

    南开 x 字节 StoryDiffusion 重塑连贯视觉叙事

    近日,南开大学和字节跳动联合开发的 StoryDiffusion 模型解决了扩散模型生成连贯图像与视频的难题。其核心在于「一致自注意力」机制,强化图像间一致性,无需额外训练即可提升现有文本到图像模型的表现。加之「语义运动预测器」,利用语义空间预测图像序列间的流畅变换,尤其在长视频生成中展现了前所未有的稳定性与主体一致性。 此框架使基于文本的复杂故事视觉化成为可能,不仅在角色与场景细节一致性上超越 IP-Adapter 等工具,还能精准匹配文本描述。

    GitHub 链接: https://github.com/HVision-NKU/StoryDiffusion

    论文链接: https://arxiv.org/abs/2405.01434

    项目链接: https://storydiffusion.github.io/

    微软公布首份 AI 责任透明报告

    微软发布【2023年负责任AI透明度报告】,报告中总结微软共开发 30 款 AI 责任工具,扩编专业团队,实施 AI 产品全周期风险管理;引入 Content Credentials 技术为 AI 生成图像加水印,提升透明度;为 Azure 客户提供高级内容过滤及新型安全风险评估工具,包括升级版模型入侵检测功能。公司强化红蓝对抗测试体系,自查与第三方测评并举,应对 AI 安全挑战。尽管遭遇产品争议,微软重申 AI 责任无终点,将继续在技术革新中深化责任实践,推进AI安全健康发展。

    NVIDIA ChatRTX 融合 Gemma 与 CLIP 模型,新增语音查询功能

    NIVIDIA 升级 ChatRTX,面向 RTX GPU 用户扩展 AI 模型支持,集成 Google Gemma、ChatGLM3 和 OpenAI CLIP。CLIP 模型的加入使照片搜索能力增强,而 Gemma 模型的本地运行优化了高性能设备上的交互体验。ChatRTX 作为一个本地聊天服务器应用,允许用户通过浏览器便捷查询个人文档及媒体内容,现更支持语音查询,采用 Whisper AI 系统,提升了用户交互的自然性和便利性。此更新降低了复杂 AI 模型本地部署门槛,推动了个性化数据管理与分析的边界。

    OpenAI 服务中断致 Rabbit R1 语音功能暂停

    昨日傍晚,全球知名 AI 研究实验室 OpenAI 遭遇短暂服务中断,导致所有 Rabbit R1 智能设备的语音推送请求功能失效。该问题首先由 Twitter 用户 @zebulon.vance 在 Threads 上指出,并在约 45 分钟后得到 OpenAI 官方解决。

    尽管服务已恢复,此次事件暴露了一个潜在的技术依赖性问题:即使消费者支付高达 200 美元购买了 Rabbit R1 人工智能硬件,其能否正常获取 AI 反馈仍受制于第三方 AI 公司的运营稳定性。具体而言,在安装了当天的软件更新后,所有 R1 设备几乎立即集体离线,尽管 Discord 平台表示此次故障与更新无关,但广泛用户的受影响情况表明问题普遍存在。

    Prometheus 2 模型革新语言模型质量评估标准

    针对现有开源语言模型评估工具的局限,如评分偏离人评与评估形式单一,「Prometheus 2」应运而生,作为一款专为评估大语言模型质量设计的开源模型,它实现了评估技术的显著飞跃。Prometheus 2 的两大核心特性尤为突出:一是其评分与人类评判高度一致,二是集成了直接评分与成对比较两种评估模式,打破了传统模型的单一评估局限。更令人瞩目的是,该模型能够依据用户自定义的评价标准进行评分,极大地拓宽了应用场景和评估维度。

    Prometheus 2 的创新之处在于,研发团队通过合并两个独立训练的模型参数——一个基于直接评分数据,另一个聚焦于文本比较数据,成功构建出一个兼备高准确度与灵活性的评估工具。在四项直接评估基准和四项成对排名基准测试中,Prometheus 2 展现出了与人类及专有 LM 评委最高的一致性和相关性,确立了其在开源评估模型领域的领先地位。

    GitHub 链接: https://github.com/prometheus-eval/prometheus-eval

    论文链接: https://huggingface.co/papers/2405.01535

    IBM 软件登录 AWS Marketplace,92 国加速拥抱混合云 AI

    IBM 近日宣布了一项重大举措,将其人工智能、数据分析及自动化软件产品线大规模扩展至亚马逊云服务(AWS)Marketplace,覆盖国家从 5 个跃升至 92 个。此战略联手意在提速企业混合云与 AI 应用全球化。IBM 高管 Nick Otto 透露,混合式与多模态生成 AI 正引领潮流,见证两者在过去一年的深度融合,技术前景令人振奋。