當前位置: 妍妍網 > 資訊

Hugging Face 開源 8B 視覺大模型;OpenAI 推出批次 API | AI 頭條

2024-04-16資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • 史丹佛大學人工智慧研究院釋出【2024 年人工智慧指數報告】

  • OpenAI Sora 賦能 Adobe Premiere Pro 重大更新

  • Hugging Face 推出 8B 視覺大模型 Idefics2

  • 前 PayPal CEO Dan Schulman:80% 的工作崗位將在職責範圍上縮減至原來的 20%

  • OpenAI 推出批次 API:最佳化成本與提升異步任務處理能力

  • Rewind 公司釋出可穿戴 AI 裝置 Limitless 系列,全天候記錄對話

  • Poe 平台推出多模互動,布局企業級市場引領 AI 聊天機器人潮流

  • WizardLM-2 系列模型推出,創新訓練法與合成數據系統

  • Pile-T5:EleutherAI 針對程式碼任務最佳化的新一代 T5 模型

  • 全球 AI 要聞

    史丹佛大學人工智慧研究院釋出【2024 年人工智慧指數報告】

    史丹佛大學今日釋出的【2024 年人工智慧指數報告】顯示,2023 年 ChatGPT 日、周、月使用率分別為全球使用者的 17%、36%和 16%,其中印度、巴基史坦和肯亞等地使用率最高。行業在 AI 研究上占據主導,貢獻 51 個關鍵模型,遠超學術界的 15 個。全年共釋出 149 個基礎模型,同比增長顯著,且大部份開源。訓練成本劇增,如 GPT-4 耗資 7800 萬美元,Gemini Ultra 達 1.91 億美元。生成式 AI 投資逆勢增長至 252 億美元,美國投資總額 672 億美元領先全球,是同期中國的近 9 倍。盡管 AI 職位需求下滑,但 AI 提高了工作效率和品質,80% 財富 500 強企業在財報中提及 AI。美國 AI 法規增至 25 項,歐美推動相關政策,全球關註度翻倍。公眾對 AI 影響的認知加深,66%受訪者預計 AI 將極大影響未來生活,但僅 37%認為 AI 將改善工作。ChatGPT 廣為人知,63%受訪者知曉,半數每周至少使用一次。AI 在科學和醫學領域成果顯著,但負責任 AI 評估缺乏統一標準,深度偽造和碳排放問題引起廣泛關註。

    OpenAI Sora 賦能 Adobe Premiere Pro 重大更新

    Adobe 宣布將為 Premiere Pro 添加 OpenAI 的 Sora、Runway ML 的 Gen-2 及 Pika 1.0 等第三方 AI 視訊生成外掛程式,實作重大升級。此舉有望將 AI 工具帶給更廣泛的使用者群體,並可能引發視訊制作行業的深刻變革。今後,使用者可在同一編輯界面下融合實拍視訊與 AI 生成畫面,如輕松借助 AI 生成影片中角色的動作、背景等元素,甚至擴充套件鏡頭、最佳化過渡效果。此外,Firefly for Video 功能將支持智慧物件檢測與移除,使用者可快速更改或刪除視訊中的物體,同時還具備文本轉視訊影像生成能力,與 Sora、Runway 等頂尖 AI 視訊生成工具一較高下。Adobe 堅信 AI 生成內容的價值在於融入日常工作流程,助力使用者開啟創新之旅。

    Hugging Face 推出 8B 視覺大模型 Idefics2

    繼 2023 年推出基於 DeepMind 技術的 Idefics 視覺語言模型後,Hugging Face 近日釋出了其升級版——Idefics2,這款 80 億參數量、完全開源的新模型在OCR辨識和影像處理方面實作了顯著提升。Idefics2 精簡至 80 億參數規模,與 DeepSeek-VL 和 LLaVA-NeXT-Mistral-7B 相當,能夠靈活處理最高 980 x 980 像素原生分辨率與任意比例的影像,無需傳統 CV 中常見的方形尺寸調整。

    開源連結: https://huggingface.co/HuggingFaceM4/idefics2-8b

    前 PayPal CEO Dan Schulman:80% 的工作崗位將在職責範圍上縮減至原來的 20%

    近日,前 PayPal CEO Dan Schulman 在 LTF 2024(紐約證券交易所在 Riverwood Capital 組織的拉丁美洲科技論壇)上發表言論,表示「GPT-5 的釋出將會是一場令人驚慌失措的時刻」「80% 的工作崗位將在職責範圍上縮減至原來的 20%」。

    OpenAI 推出批次 API:最佳化成本與提升異步任務處理能力

    OpenAI 開發者平台釋出 Batch API,專為異步任務(如摘要、轉譯、影像分類)設計,以節省成本、提高處理速率。使用者僅需上傳批次請求檔,24 小時內獲取結果,且享 API 價格半價優惠。此服務簡化大規模數據處理流程,兼顧成本與效率,凸顯 OpenAI 對高價效比解決方案的承諾,提升 AI 技術在各領域套用的經濟可行性。

    Rewind 公司釋出可穿戴 AI 裝置 Limitless 系列,全天候記錄對話

    Rewind 公司正式推出可穿戴 AI 新品 Limitless,包含會議助手 Limitless Meeti ngs 和可穿戴吊墜 Pendant 兩款產品。Limitless Meetings 以自動化會議管理、智慧記錄與總結為核心,相容各類會議平台。Pendant 作為全球最小的 AI 穿戴裝置,可全天候記錄對話並儲存個人見解,配備 Wi-Fi 與藍芽功能,電池壽命達 100 小時,使用者只需簡單觸摸或長按,即可喚醒個人化 AI 與其互動,回顧檢索相關資訊。

    Poe 平台推出多模互動,布局企業級市場引領 AI 聊天機器人潮流

    問答社群 Quora 旗下 AI 聊天機器人平台 Poe 獲得 7500 萬美元投資後,持續拓展功能,力圖成為匯聚多種對話 AI 模型的一站式服務中心。其創新功能「多機器 人聊天」使得使用者可在單個會話中同時與多個 AI 模型互動,如在 Slack 上透過@提及方式調動 GPT-4 進行分析、Claude 輔助創作和 DALL-E 3 生成影像等。Poe 瞄準日益豐富的 AI 模型生態,力求最佳化使用者體驗,整合最優資源,借助該功能及即將推出的企服版本,強勢進軍並主導 AI 聊天機器人市場。

    WizardLM-2 系列模型推出,創新訓練法與合成數據系統

    WizardLM 公司新推 WizardLM-2 系列模型(8x22B、70B、7B),應對自然數據不足,采用 AI 合成數據訓練體系。其核心策略包含兩大部份:

    1. 數據預處理精細調控,從數據分析到加權抽樣,確保模型接觸全面且優質的訓練素材。

    2. 漸進式學習創新實踐,Evol Lab 技術讓模型自動生成高品質指令和改進回應,並透過「AI 互校 AI」(AAA)框架,多模型交叉教學提升效能。同時,WizardLM-2 結合監督學習、Stage-DPO 階段強化學習最佳化及 RLEIF 獎勵機制,有效提高模型精度和適應力。

    開源連結: https://huggingface.co/collections/microsoft/wizardlm-661d403f71e6c8257dbd598a(Hugging Face)https://wizardlm.github.io/WizardLM2(GitHub)

    Pile-T5:EleutherAI 針對程式碼任務最佳化的新一代T5模型

    EleutherAI 釋出的 Pile-T5 模型針對原始 T5 在處理程式碼任務時的不足進行了專門最佳化,采用了更精準處理程式碼標記的 LLaMA 分詞器,並加倍訓練數據至 2 萬億 token。盡管沿用了 T5 的超參數設定,但透過結合 T5x 技術,Pile-T5 在微調後的效能顯著提升。在 SuperGLUE 基準測試及 CodeXGLUE 的「程式碼到文本」子任務中,Pile-T5 均展現出超越 T5-v1.1 的出色表現,特別是在程式碼相關領域,其改進效果尤為明顯。

    開源連結: https://huggingface.co/EleutherAI/pile-t5-xxl

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。