Claude 登录 iOS

Anthropic 近期发布了其先进的 AI 模型 Claude 的专属 iOS 应用程序，标志着该公司正式涉足移动平台。该应用程序不仅集成基础聊天功能，还整合了图像上传与分析能力。本次发布还伴随着「Claude Team」订阅计划的登场，专为团队设计，5 人起订，每人月费 30 美元，解锁无限制对话与即将推出的长文档分析等功能。

南开 x 字节 StoryDiffusion 重塑连贯视觉叙事

近日，南开大学和字节跳动联合开发的 StoryDiffusion 模型解决了扩散模型生成连贯图像与视频的难题。其核心在于「一致自注意力」机制，强化图像间一致性，无需额外训练即可提升现有文本到图像模型的表现。加之「语义运动预测器」，利用语义空间预测图像序列间的流畅变换，尤其在长视频生成中展现了前所未有的稳定性与主体一致性。此框架使基于文本的复杂故事视觉化成为可能，不仅在角色与场景细节一致性上超越 IP-Adapter 等工具，还能精准匹配文本描述。

GitHub 链接： https://github.com/HVision-NKU/StoryDiffusion

论文链接： https://arxiv.org/abs/2405.01434

项目链接： https://storydiffusion.github.io/

微软公布首份 AI 责任透明报告

微软发布【2023年负责任AI透明度报告】，报告中总结微软共开发 30 款 AI 责任工具，扩编专业团队，实施 AI 产品全周期风险管理；引入 Content Credentials 技术为 AI 生成图像加水印，提升透明度；为 Azure 客户提供高级内容过滤及新型安全风险评估工具，包括升级版模型入侵检测功能。公司强化红蓝对抗测试体系，自查与第三方测评并举，应对 AI 安全挑战。尽管遭遇产品争议，微软重申 AI 责任无终点，将继续在技术革新中深化责任实践，推进AI安全健康发展。

NVIDIA ChatRTX 融合 Gemma 与 CLIP 模型，新增语音查询功能

NIVIDIA 升级 ChatRTX，面向 RTX GPU 用户扩展 AI 模型支持，集成 Google Gemma、ChatGLM3 和 OpenAI CLIP。CLIP 模型的加入使照片搜索能力增强，而 Gemma 模型的本地运行优化了高性能设备上的交互体验。ChatRTX 作为一个本地聊天服务器应用，允许用户通过浏览器便捷查询个人文档及媒体内容，现更支持语音查询，采用 Whisper AI 系统，提升了用户交互的自然性和便利性。此更新降低了复杂 AI 模型本地部署门槛，推动了个性化数据管理与分析的边界。

OpenAI 服务中断致 Rabbit R1 语音功能暂停

昨日傍晚，全球知名 AI 研究实验室 OpenAI 遭遇短暂服务中断，导致所有 Rabbit R1 智能设备的语音推送请求功能失效。该问题首先由 Twitter 用户 @zebulon.vance 在 Threads 上指出，并在约 45 分钟后得到 OpenAI 官方解决。

尽管服务已恢复，此次事件暴露了一个潜在的技术依赖性问题：即使消费者支付高达 200 美元购买了 Rabbit R1 人工智能硬件，其能否正常获取 AI 反馈仍受制于第三方 AI 公司的运营稳定性。具体而言，在安装了当天的软件更新后，所有 R1 设备几乎立即集体离线，尽管 Discord 平台表示此次故障与更新无关，但广泛用户的受影响情况表明问题普遍存在。

Prometheus 2 模型革新语言模型质量评估标准

针对现有开源语言模型评估工具的局限，如评分偏离人评与评估形式单一，「Prometheus 2」应运而生，作为一款专为评估大语言模型质量设计的开源模型，它实现了评估技术的显著飞跃。Prometheus 2 的两大核心特性尤为突出：一是其评分与人类评判高度一致，二是集成了直接评分与成对比较两种评估模式，打破了传统模型的单一评估局限。更令人瞩目的是，该模型能够依据用户自定义的评价标准进行评分，极大地拓宽了应用场景和评估维度。

Prometheus 2 的创新之处在于，研发团队通过合并两个独立训练的模型参数——一个基于直接评分数据，另一个聚焦于文本比较数据，成功构建出一个兼备高准确度与灵活性的评估工具。在四项直接评估基准和四项成对排名基准测试中，Prometheus 2 展现出了与人类及专有 LM 评委最高的一致性和相关性，确立了其在开源评估模型领域的领先地位。

GitHub 链接： https://github.com/prometheus-eval/prometheus-eval

论文链接： https://huggingface.co/papers/2405.01535

IBM 软件登录 AWS Marketplace，92 国加速拥抱混合云 AI

IBM 近日宣布了一项重大举措，将其人工智能、数据分析及自动化软件产品线大规模扩展至亚马逊云服务（AWS）Marketplace，覆盖国家从 5 个跃升至 92 个。此战略联手意在提速企业混合云与 AI 应用全球化。IBM 高管 Nick Otto 透露，混合式与多模态生成 AI 正引领潮流，见证两者在过去一年的深度融合，技术前景令人振奋。

Claude 登录 iOS；南开携字节打造连贯叙事 AI 模型；OpenAI 断网波及 Rabbit R1 功能 | AI 头条

Claude 登录 iOS

南开 x 字节 StoryDiffusion 重塑连贯视觉叙事