當前位置: 妍妍網 > 資訊

Sora官方MV首曝;搭載GPT-4的AI程式設計師開源出世;OpenAI開發者關系主管加入Google | AI頭條

2024-04-03資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • OpenAI 釋出 Sora 首支官方 MV

  • AI 程式設計師 SWE-agent 開源登場,全面超越 Devin

  • 前 OpenAI 開發者關系主管加入 Google

  • 百度文心聯手優必選打造 AI 大模型賦能人形機器人創新套用

  • Hugging Face 聯手英特爾推出 SPRIGHT 計畫,革新文生圖空間一致性技術

  • OpenAI 聯手 Harvey 推出高精度案例法模型,融資 8000 萬美元助推法律 AI 創新

  • Stability AI 因 GPU 成本過高導致現金流危機

  • Cloudflare 聯手 Hugging Face 推出 Workers AI 公共版,簡化 AI 套用部署

  • Google 釋出 Google VLOGGER,號稱永遠改變視訊未來

  • 全球 AI 要聞

    OpenAI 釋出 Sora 首支官方 MV

    今早八點,OpenAI 在 Youtube 釋出了 Sora 的第一部官方 MV,該 MV 由藝術家 August Kamp 與 Sora 一同制作,風格迷幻迥異,猶如夢境。

    視訊連結: https://www.youtube.com/watch?v=f75eoFyo9ns

    AI 程式設計師 SWE-agent 開源登場,全面超越 Devin

    普林斯頓大學 NLP 組近日開源了名為 SWE-agent 的 AI 程式設計師,該系統能在 GitHub 儲存庫中自主解決問題,在 SWE-bench 測試中表現接近於閉源的 AI 程式設計師 Devin,平均解決時間僅為 93 秒,實作 SOTA 效能。SWE-agent 借助 GPT-4 等大模型技術,可修復實際 GitHub 計畫中的錯誤和問題,具備與專用終端互動、進行檔操作、語法檢查、編寫與執行測試等功能。透過精心設計的智慧體-電腦介面(ACI),最佳化大模型瀏覽和編輯程式碼的能力,顯著提升了 AI 編程效率。釋出當天即收獲超 1.4k Star,引發廣泛關註。

    計畫連結: https://swe-agent.com/

    GitHub: https://github.com/princeton-nlp/SWE-agent

    前 OpenAI 開發者關系主管加入 Google

    前 OpenAI 開發者關系主管 Logan Kilpatrick 昨日宣布已加入 Google,他在 X 上透露,自己將在 Google 擔任 AI Studio 產品負責人,並致力於支持 Gemini API 計畫。Kilpatrick 表達了對新角色的熱情,強調未來有大量的工作要完成,目標是將 Google 打造成 AI 開發者們的最佳歸屬地,並誓言不會接受任何低於這一目標的結果。此舉預示著 Google 將繼續強化其在人工智慧開發工具及平台領域的投入。

    百度文心 X 優必選打造 AI 大模型賦能人形機器人創新套用

    百度與優必選合作,以 OpenAI 和 Figure 的理念為靈感,成功將百度文心大模型與優必選人形機器人 Walker S 深度融合。借助千帆 AppBuilder 平台,Walker S 在任務排程套用中展現出強大的自然語言理解、任務規劃與執行能力,如透過文心一言模型完成折疊衣物和分類物品等復雜任務。在柔性物體操作及物體幹擾分揀挑戰中,Walker S 結合端側多模態感知與百度大模型的理解規劃能力,實作精準動作協同,處於國際人形機器人研發前沿。

    Hugging Face X 英特爾推出 SPRIGHT 計畫,革新文生圖空間一致性技術

    Hugging Face 與英特爾共同釋出了針對文生圖模型空間一致性的解決方案,新方案結合了第一個專註空間關系註釋的龐大數據集 SPRIGHT,該數據集包含了從四個知名影像數據集中精心挑選並重新標註的 600 萬張圖片。研究揭示,SPRIGHT 在表達空間關系方面的表現遠超現有數據集,僅使用極小部份數據即提升了 22% 的空間準確性,並在 FID 和 CMMD 評價指標上取得進步。同時,團隊透過在包含多個物體的少量影像上進行微調,使模型在 T2I-CompBench 平台上創下了 0.2133 的空間得分紀錄。

    GitHub: https://github.com/SPRIGHT-T2I/SPRIGHT

    OpenAI X Harvey 推出高精度案例法模型,融資 8000 萬美元助推法律 AI 創新

    OpenAI 聯手 Harvey 開發出一款專門針對法律領域的案例法模型,結合了 GPT-4 技術,實作高品質法律檔起草、復雜問題深度解析及合約差異精準定位。在與頂尖律所合作的測試中,97% 情況下律師更青睞該模型的輸出結果,因其提供全面詳細的法律解答並嚴格依據實際案例參照。

    由經驗豐富的律師 Winston Weinberg 與前谷歌大腦、Meta AI 研究員 Gabe Pereyra 共同創立的 Harvey,在最新一輪融資中獲 OpenAI 和紅杉等投資 8000 萬美元,公司估值達到 7.5 億美元。

    Stability AI 因 GPU 成本過高導致現金流危機

    曾經備受矚目的 AIGC 公司 Stability AI 由於其流行的文本轉影像模型 Stable Diffusion 背後的 GPU 集群產生的高昂基礎設施成本而陷入財務困境。據報道,公司 2023 年租用雲 GPU 的開銷高達 9900 萬美元,而預計年度收入僅為 1100 萬美元。巨額的雲服務費用(包括從 AWS、Google Cloud 和CoreWeave 租賃)加上薪資和營運支出導致公司資金儲備銳減至 400 萬美元。最終,公司前 CEO Emad Mostaque 於今年三月辭職,公司轉向訂閱模式並考慮轉售其 GPU 資源以增加收入,同時面臨員工流失和技術版權訴訟等問題。

    Cloudflare X Hugging Face 推出 Workers AI 公共版,簡化 AI 套用部署

    Cloudflare 推出了一項新功能,允許開發者簡單地將來自 Hugging Face 的人工智慧套用部署到其平台上,並正式釋出了面向公眾的伺服器端 GPU 驅動推理服務——Workers AI。這一整合使得只需一鍵操作,開發者就能迅速部署 14 種精選的 Hugging Face 模型,涵蓋文本生成、嵌入及句子相似性等多個領域。此外,Workers AI 已在全球超過 150 個城市部署了 GPU,支持更多地區開發者使用,並新增對微調模型權重的支持,便於開發客製化的專業套用。

    入口: https://huggingface.co/collections/Cloudflare/hf-curated-models-available-on-workers-ai-66036e7ad5064318b3e45db6

    Google 發 布 Google VLOGGER,號稱永遠改變視 頻未來

    昨日,Google 學者 Enric Corona 及其團隊推出了 VLOGGER 工具,用於控制AI生成的逼真視訊,尤其能基於一張照片生成說話者的高畫質視訊,並根據語音樣本進行動畫制作,實作對人物的高保真模擬。Corona 團隊基於 MENTOR 數據集訓練模型,該數據集包含 800,000 個說話者視訊片段,是迄今為止規模最大、最詳盡的數據集。

    計畫連結: https://enriccorona.github.io/vlogger/

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。