Claude 登入 iOS

Anthropic 近期釋出了其先進的 AI 模型 Claude 的專屬 iOS 應用程式，標誌著該公司正式涉足行動平台。該應用程式不僅整合基礎聊天功能，還整合了影像上傳與分析能力。本次釋出還伴隨著「Claude Team」訂閱計劃的登場，專為團隊設計，5 人起訂，每人月費 30 美元，解鎖無限制對話與即將推出的長文件分析等功能。

南開 x 字節 StoryDiffusion 重塑連貫視覺敘事

近日，南開大學和字節跳動聯合開發的 StoryDiffusion 模型解決了擴散模型生成連貫影像與視訊的難題。其核心在於「一致自註意力」機制，強化影像間一致性，無需額外訓練即可提升現有文本到影像模型的表現。加之「語意運動預測器」，利用語意空間預測影像序列間的流暢變換，尤其在長視訊生成中展現了前所未有的穩定性與主體一致性。此框架使基於文本的復雜故事視覺化成為可能，不僅在角色與場景細節一致性上超越 IP-Adapter 等工具，還能精準匹配文本描述。

GitHub 連結： https://github.com/HVision-NKU/StoryDiffusion

論文連結： https://arxiv.org/abs/2405.01434

計畫連結： https://storydiffusion.github.io/

微軟公布首份 AI 責任透明報告

微軟釋出【2023年負責任AI透明度報告】，報告中總結微軟共開發 30 款 AI 責任工具，擴編專業團隊，實施 AI 產品全周期風險管理；引入 Content Credentials 技術為 AI 生成影像加浮水印，提升透明度；為 Azure 客戶提供高級內容過濾及新型安全風險評估工具，包括升級版模型入侵檢測功能。公司強化紅藍對抗測試體系，自查與第三方測評並舉，應對 AI 安全挑戰。盡管遭遇產品爭議，微軟重申 AI 責任無終點，將繼續在技術革新中深化責任實踐，推進AI安全健康發展。

NVIDIA ChatRTX 融合 Gemma 與 CLIP 模型，新增語音查詢功能

NIVIDIA 升級 ChatRTX，面向 RTX GPU 使用者擴充套件 AI 模型支持，整合 Google Gemma、ChatGLM3 和 OpenAI CLIP。CLIP 模型的加入使照片搜尋能力增強，而 Gemma 模型的本地執行最佳化了高效能裝置上的互動體驗。ChatRTX 作為一個本地聊天伺服器套用，允許使用者透過瀏覽器便捷查詢個人文件及媒體內容，現更支持語音查詢，采用 Whisper AI 系統，提升了使用者互動的自然性和便利性。此更新降低了復雜 AI 模型本地部署門檻，推動了個人化數據管理與分析的邊界。

OpenAI 服務中斷致 Rabbit R1 語音功能暫停

昨日傍晚，全球知名 AI 研究實驗室 OpenAI 遭遇短暫服務中斷，導致所有 Rabbit R1 智慧裝置的語音推播請求功能失效。該問題首先由 Twitter 使用者 @zebulon.vance 在 Threads 上指出，並在約 45 分鐘後得到 OpenAI 官方解決。

盡管服務已恢復，此次事件暴露了一個潛在的技術依賴性問題：即使消費者支付高達 200 美元購買了 Rabbit R1 人工智慧硬體，其能否正常獲取 AI 反饋仍受制於第三方 AI 公司的營運穩定性。具體而言，在安裝了當天的軟體更新後，所有 R1 裝置幾乎立即集體離線，盡管 Discord 平台表示此次故障與更新無關，但廣泛使用者的受影響情況表明問題普遍存在。

Prometheus 2 模型革新語言模型品質評估標準

針對現有開源語言模型評估工具的局限，如評分偏離人評與評估形式單一，「Prometheus 2」應運而生，作為一款專為評估大語言模型品質設計的開源模型，它實作了評估技術的顯著飛躍。Prometheus 2 的兩大核心特性尤為突出：一是其評分與人類評判高度一致，二是整合了直接評分與成對比較兩種評估模式，打破了傳統模型的單一評估局限。更令人矚目的是，該模型能夠依據使用者自訂的評價標準進行評分，極大地拓寬了套用場景和評估維度。

Prometheus 2 的創新之處在於，研發團隊透過合並兩個獨立訓練的模型參數——一個基於直接評分數據，另一個聚焦於文本比較數據，成功構建出一個兼備高準確度與靈活性的評估工具。在四項直接評估基準和四項成對排名基準測試中，Prometheus 2 展現出了與人類及專有 LM 評委最高的一致性和相關性，確立了其在開源評估模型領域的領先地位。

GitHub 連結： https://github.com/prometheus-eval/prometheus-eval

論文連結： https://huggingface.co/papers/2405.01535

IBM 軟體登入 AWS Marketplace，92 國加速擁抱混合雲 AI

IBM 近日宣布了一項重大舉措，將其人工智慧、數據分析及自動化軟體產品線大規模擴充套件至亞馬遜雲服務（AWS）Marketplace，覆蓋國家從 5 個躍升至 92 個。此戰略聯手意在提速企業混合雲與 AI 套用全球化。IBM 高管 Nick Otto 透露，混合式與多模態生成 AI 正引領潮流，見證兩者在過去一年的深度融合，技術前景令人振奮。

Claude 登入 iOS；南開攜字節打造連貫敘事 AI 模型；OpenAI 斷網波及 Rabbit R1 功能 | AI 頭條

Claude 登入 iOS

南開 x 字節 StoryDiffusion 重塑連貫視覺敘事