當前位置: 妍妍網 > 資訊

OpenAI 或將進軍搜尋,沖擊谷歌/Perplexity;國產具身智慧初現,宣稱靈活度媲美成年人 | AI 頭條

2024-04-26資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • 蘋果開源 Corenet,賦能深度神經網路訓練

  • Synthesia 升級 AI 數位人平台,引入「智慧情感頭像」

  • Dropzone AI 獲 1685 萬美元融資,推進自主網路安全 AI 代理以大幅降低人工幹預

  • Interactive3D:國產互動式精細調控與高效三維模型生成

  • OpenAI 或研發「Sonic-SNC(SearchGPT)」,打造 Perplexity 競品

  • Meta 推出 LayerSkip 技術,大幅提升大語言模型推理效率

  • 國產星塵智慧 AI 機器人 S1:仿人操作、高效學習

  • 全球 AI 要聞

    蘋果開源 Corenet,賦能深度神經網路訓練

    蘋果公司日前宣布開源 CoreNet,一個專為訓練深度神經網路設計的綜合性庫。該庫旨在支持研究人員與工程師高效構建並訓練包括基礎模型(如 CLIP、LLM)在內的多種大小模型,覆蓋物件分類、檢測、語意分割等多種任務。CoreNet 基於已開源的 CVNets 演進,拓展至電腦視覺以外的廣泛套用場景,尤其強調對基礎模型訓練的促進作用。

    目前,蘋果已運用 CoreNet 推進多項前沿研究,如 OpenELM 的開源語言模型框架、CatLIP 的高速視覺辨識、Reinforce Data 計畫提升模型準確性和魯棒性、以及 FastVit、MobileOne 等高效模型結構的研發。此外,CoreNet 0.1.0 版本已整合 OpenELM、CatLIP 及 MLX 範例,展示其在實際套用中的快速落 地能力。

    開源連結: https://github.com/apple/corenet

    Synthesia 升級 AI 數位人平台,引入「智慧情感頭像」

    倫敦科技初創公司 Synthesia 推出「智慧情感頭像」功能,顯著提升其企業級 AI 視訊制作平台的表現力。此創新使 AI 頭像能依據內容情境,即時調整語音語調、面部表情及身體語言,實作對傳統數位頭像的重大超越。

    與微軟近期展示的實驗性 VASA 框架不同,「智慧情感頭像」技術已實際套用,助力使用者生成高度逼真的 AI 視訊。CTO Jon Starck 指出,新技術不僅創造了生動的數位形象,更引入了具有高保真度的「數位演員」,極大地模糊了虛擬與現實邊界。

    Dropzone AI 獲 1685 萬美元融資,推進自主網路安全 AI 代理以大幅降低人工幹預

    網路安全 AI 開發商 Dropzone AI 宣布完成 1685 萬美元的 A 輪融資,由 Theory Ventures 領投,Decibel Partners、Pioneer Square Ventures 和 In-Q-Tel 等現有機構投資者參投。該公司由 Edward Wu 於 2023 年創立,專註於研發預訓練的自主 AI 安全代理,旨在輔助人類辨識網路威脅,應對全球網路安全人才短缺問題。

    Interactive3D:國產互動式精細調控與高效三維模型生成

    Interactive3D 是一項由港科大、港中大、商湯研究與上海AI實驗室合作研發的互動式三維生成技術,於 CVPR 2024 上釋出。該技術采用兩階段架構,首階段借助 Gaussian Splatting 實作使用者對模型構建的直接介入,包括元件增刪、剛柔拖拽、幾何變換和語意編輯,確保生成過程的精準引導與動態調整。隨後, 透過 InstantNGP 轉換並引入「互動式哈希細化」模組,在第二階段深化細節與幾何提取。

    技術演示覆蓋剛性拖拽調控恐龍嘴部開合、部件拼接組裝高達、哈希細化提升模型精度、語意編輯變更高達武器與翅膀材質、可變形拖拽塑造香蕉形柯吉拉及幾何變換開啟寶可夢球釋放幼龍等場景。Interactive3D 憑借強大的互動性和即時反饋,結合文本指令支持,為使用者提供了如玩轉三維積木般的靈活創作體驗,顯著提升了個人化三維內容構建的效率與精度。

    論文連結: https://arxiv.org/abs/2404.16510

    開源連結: https://github.com/interactive-3d/interactive3d

    OpenAI 或研發「Sonic-SNC(SearchGPT)」,打造 Perplexity 競品

    在 ChatGPT 近日的更新中,OpenAI 建立的 http://search.chatgpt.com 新網域名稱引起了廣泛討論。目前 OpenAI 推出了名為「Chat Sonic-SNC (SearchGPT)」的更新,該平台整合影像搜尋、多樣小工具(如天氣、小算盤、體育、財經及時間差計算)及後續提問功能,提升使用者體驗。核心技術融合 GPT-4 Lite(Scallion)、GPT-4 及 GPT3.5 模型,結合 Bing、Sydney、Fortis 及內部搜尋引擎 Labrador,實作多源資訊深度整合與精準檢索,以先進 NLP 技術革新搜尋互動。

    Meta 推出 LayerSkip 技術,大幅提升大語言模型推理效率

    Meta 推出 LayerSkip,旨在顯著加快大語言模型(LLM)推理速度。該技術采用訓練階段的層級遞增 dropout 策略與早期結束損失函式,最佳化模型在早期層的提前結束準確性,無需附加輔助層。推理階段引入自推測解碼機制,模型可在早期結束並利用剩余層校驗修正,實作更低記憶體占用與計算資源共享。

    實驗覆蓋多種 Llama 模型尺寸與訓練方式,結果顯示 LayerSkip 在 CNN/DM 文件摘要、編程及 TOPv2 語意解析任務中分別實作 2.16 倍、1.82 倍與 2.0 倍的推理速度提升,證實其在提升 LLM 推理效能方面的顯著成效。

    開源連結: https://huggingface.co/papers/2404.16710

    國產星塵智慧 AI 機器人 S1:仿人操作、高效學習

    國產機器人新秀——星塵智慧 AI 機器人 S1,以其人類動作模仿學習能力與靈活性引發關註。演示視訊中,S1 以與人近乎同步甚至慢放的速度,展現超高速疊杯、倒酒、削菜、操作器械、家居維修、電子裝置使用及書法等復雜技能。公司官網強調其使命為推動智慧通用機器人走入尋常百姓家。

    星塵智慧 S1 於 2024 年 4 月歷時一年自主研發成功,被譽為「最接近人類操作效能」的 AI 機器人,透過模仿學習,以成人級別速度與靈活度執行各類實用任務。S1 已接入大模型測試,預計年內實作商業化。公司創始人來傑曾任騰訊機器人實驗室一號員工、百度「小度機器人」團隊負責人等職,帶領團隊研發出包括騰訊 Ollie 在內的多款機器人產品。公司成立於 2022 年 12 月,總部位於深圳南山區科技生態園。

    官網連結: https://astribot.com/

    演示視訊(Bilibili): https://www.bilibili.com/video/BV1yJ4m1H7V2/