當前位置: 妍妍網 > 資訊

Claude 登入 iOS;南開攜字節打造連貫敘事 AI 模型;OpenAI 斷網波及 Rabbit R1 功能 | AI 頭條

2024-05-03資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • Claude 登入 iOS

  • 南開 x 字節 StoryDiffusion 重塑連貫視覺敘事

  • 微軟公布首份 AI 責任透明報告

  • NVIDIA ChatRTX 融合 Gemma 與 CLIP 模型,新增語音查詢功能

  • OpenAI 服務中斷致 Rabbit R1 語音功能暫停

  • Prometheus 2 模型革新語言模型品質評估標準

  • IBM 軟體登入 AWS Marketplace,92 國加速擁抱混合雲 AI

  • 全球 AI 要聞

    Claude 登入 iOS

    Anthropic 近期釋出了其先進的 AI 模型 Claude 的專屬 iOS 應用程式,標誌著該公司正式涉足行動平台。該應用程式不僅整合基礎聊天功能,還整合了影像上傳與分析能力。本次釋出還伴隨著「Claude Team」訂閱計劃的登場,專為團隊設計,5 人起訂,每人月費 30 美元,解鎖無限制對話與即將推出的長文件分析等功能。

    南開 x 字節 StoryDiffusion 重塑連貫視覺敘事

    近日,南開大學和字節跳動聯合開發的 StoryDiffusion 模型解決了擴散模型生成連貫影像與視訊的難題。其核心在於「一致自註意力」機制,強化影像間一致性,無需額外訓練即可提升現有文本到影像模型的表現。加之「語意運動預測器」,利用語意空間預測影像序列間的流暢變換,尤其在長視訊生成中展現了前所未有的穩定性與主體一致性。 此框架使基於文本的復雜故事視覺化成為可能,不僅在角色與場景細節一致性上超越 IP-Adapter 等工具,還能精準匹配文本描述。

    GitHub 連結: https://github.com/HVision-NKU/StoryDiffusion

    論文連結: https://arxiv.org/abs/2405.01434

    計畫連結: https://storydiffusion.github.io/

    微軟公布首份 AI 責任透明報告

    微軟釋出【2023年負責任AI透明度報告】,報告中總結微軟共開發 30 款 AI 責任工具,擴編專業團隊,實施 AI 產品全周期風險管理;引入 Content Credentials 技術為 AI 生成影像加浮水印,提升透明度;為 Azure 客戶提供高級內容過濾及新型安全風險評估工具,包括升級版模型入侵檢測功能。公司強化紅藍對抗測試體系,自查與第三方測評並舉,應對 AI 安全挑戰。盡管遭遇產品爭議,微軟重申 AI 責任無終點,將繼續在技術革新中深化責任實踐,推進AI安全健康發展。

    NVIDIA ChatRTX 融合 Gemma 與 CLIP 模型,新增語音查詢功能

    NIVIDIA 升級 ChatRTX,面向 RTX GPU 使用者擴充套件 AI 模型支持,整合 Google Gemma、ChatGLM3 和 OpenAI CLIP。CLIP 模型的加入使照片搜尋能力增強,而 Gemma 模型的本地執行最佳化了高效能裝置上的互動體驗。ChatRTX 作為一個本地聊天伺服器套用,允許使用者透過瀏覽器便捷查詢個人文件及媒體內容,現更支持語音查詢,采用 Whisper AI 系統,提升了使用者互動的自然性和便利性。此更新降低了復雜 AI 模型本地部署門檻,推動了個人化數據管理與分析的邊界。

    OpenAI 服務中斷致 Rabbit R1 語音功能暫停

    昨日傍晚,全球知名 AI 研究實驗室 OpenAI 遭遇短暫服務中斷,導致所有 Rabbit R1 智慧裝置的語音推播請求功能失效。該問題首先由 Twitter 使用者 @zebulon.vance 在 Threads 上指出,並在約 45 分鐘後得到 OpenAI 官方解決。

    盡管服務已恢復,此次事件暴露了一個潛在的技術依賴性問題:即使消費者支付高達 200 美元購買了 Rabbit R1 人工智慧硬體,其能否正常獲取 AI 反饋仍受制於第三方 AI 公司的營運穩定性。具體而言,在安裝了當天的軟體更新後,所有 R1 裝置幾乎立即集體離線,盡管 Discord 平台表示此次故障與更新無關,但廣泛使用者的受影響情況表明問題普遍存在。

    Prometheus 2 模型革新語言模型品質評估標準

    針對現有開源語言模型評估工具的局限,如評分偏離人評與評估形式單一,「Prometheus 2」應運而生,作為一款專為評估大語言模型品質設計的開源模型,它實作了評估技術的顯著飛躍。Prometheus 2 的兩大核心特性尤為突出:一是其評分與人類評判高度一致,二是整合了直接評分與成對比較兩種評估模式,打破了傳統模型的單一評估局限。更令人矚目的是,該模型能夠依據使用者自訂的評價標準進行評分,極大地拓寬了套用場景和評估維度。

    Prometheus 2 的創新之處在於,研發團隊透過合並兩個獨立訓練的模型參數——一個基於直接評分數據,另一個聚焦於文本比較數據,成功構建出一個兼備高準確度與靈活性的評估工具。在四項直接評估基準和四項成對排名基準測試中,Prometheus 2 展現出了與人類及專有 LM 評委最高的一致性和相關性,確立了其在開源評估模型領域的領先地位。

    GitHub 連結: https://github.com/prometheus-eval/prometheus-eval

    論文連結: https://huggingface.co/papers/2405.01535

    IBM 軟體登入 AWS Marketplace,92 國加速擁抱混合雲 AI

    IBM 近日宣布了一項重大舉措,將其人工智慧、數據分析及自動化軟體產品線大規模擴充套件至亞馬遜雲服務(AWS)Marketplace,覆蓋國家從 5 個躍升至 92 個。此戰略聯手意在提速企業混合雲與 AI 套用全球化。IBM 高管 Nick Otto 透露,混合式與多模態生成 AI 正引領潮流,見證兩者在過去一年的深度融合,技術前景令人振奮。