整理 | 王軼群 王啟隆
出品 | AI 科技大本營(ID:rgznai100)
一分鐘速覽新聞點!
世界第一個 Mamba 生產級模型 Jamba 釋出, 整合 Transformer 和 Mamba 兩種架構
史丹佛大學和 DataBricks 團隊合作開發 27B 生物醫學語言模型 BioMedLM
OpenAI 推出語音引擎,可從 15 秒的樣本中生成語音合成副本
微軟推出 Azure AI 安全工具
微軟和 OpenAI 斥資 1000億 美元打造 Stargate AI 超級電腦
DeepMind:足夠成本下,大語言模型幻覺不再是問題
訊息稱 Accel 領投的數據標註獨角獸 Scale AI 估值接近 130 億美元
AI 語音複制公司 ElevenLabs 與 Rabbit AI 達成合作
開源套用 Podgenai:利用 GPT-4 AI 生成互動式資訊播客
亞馬遜雲科技:AI 人才薪資增幅或超 33%
創新奇智發新模型 AInno-75B
百度升級 7 款大模型套用 已全面 SaaS 化
Keep 線上 5000 節運動課程 15% 為 AIGC 生產
全球 AI 要聞
世界第一個 Mamba 生產級模型 Jamba 釋出,整合 Transformer 和 Mamba 兩種架構
AI21 釋出了世界第一個 Mamba 的生產級模型:Jamba。這個模型采用了開創性的 SSM-Transformer 架構,具有 52B(520 億)參數,其中 12B 在生成時處於活動狀態。Jamba 結合了 Joint Attention 和 Mamba 技術,支持 256K 上下文長度。單個 A100 80GB 最多可容納 140K 上下文。與 Mixtral 8x7B 相比,長上下文的吞吐量提高了 3 倍。
官網: https://top.aibase.com/tool/jamba
模型地址: https://huggingface.co/ai21labs/Jamba-v0.1
史丹佛大學和 DataBricks 團隊合作開發 27B 生物醫學語言模型 BioMedLM
史丹佛大學和 DataBricks 團隊合作開發基於 GPT 風格的生物醫學語言模型 BioMedLM ,具有 27B 參數。該模型透過在生物醫學領域的專業知識上訓練,可以有效地回答有關醫學和生物學的復雜問題。BioMedLM 已在 Hugging Face Hub 上公開釋出,允許任何人下載並微調模型。
模型地址: https://huggingface.co/stanford-crfm/BioMedLM
OpenAI 推出語音引擎,可從 15 秒的樣本中生成語音合成副本
據傳,OpenAI 即將推出語音引擎,可以讓使用者從 15 秒的樣本中生成語音的合成副本。該模型支持 OpenAI 的人工智慧聊天機器人 ChatGPT 中的語音和「朗讀」功能,以及 OpenAI 文本轉語音 API 中提供的預設語音。這或許就是 Sam Altman 在 中透露的「今年即將釋出的 GPT-5 以外的模型」。
OpenAI 的產品人員傑夫·哈裏斯 (Jeff Harris) 表示:「該模型同分時析從中提取的語音數據和要大聲朗讀的文本數據,生成匹配的語音,而無需為每個說話者構建自訂模型。」
該模型可供包括 HeyGen 在內的約 100 個合作夥伴使用,Spotify 自 2023 年 9 月初以來一直在使用它為 Lex Fridman 等知名主持人用不同的語言配音播客。(TechCrunch)
微軟推出 Azure AI 安全工具應對提示隱碼攻擊
微軟為 Azure AI 推出了一系列安全工具,旨在提高 AI 模型的安全性。 這些工具包括 Prompt Shields 以防禦提示隱碼攻擊,Groundedness Detection 檢測 AI 模型的虛構內容,AI 輔助安全評估以及風險和安全監控功能。 專家表示,AI 模型的安全性問題仍未完全解決,需要警惕潛在的漏洞。
訊息稱微軟和 OpenAI 正斥資 1000 億美元打造 Stargate AI 超級電腦
據知情人士透露,微軟和 OpenAI 的高管一直在制定一項數據中心計畫計劃,該計畫將包含一台名為「Stargate」的美國超級電腦,配備數百萬個專用伺服器芯片,為 OpenAI 的人工智慧提供動力。據一位曾與 OpenAI 執行長 Sam Altman 交談過的人士以及一位看過微軟部份初始成本估算的人士透露,該計畫的成本可能高達 1000 億美元。(The Information )
DeepMind:足夠成本下,大語言模型幻覺不再是問題
谷歌 DeepMind 發表【大語言模型的長篇事實性】( Long-form factuality in large language models) 論文,得出 結論: 只要付出足夠成本,大語言模型幻覺將不再是問題。
大語言模型在響應開放式主題的 fact-seeking(事實尋求)提示時,通常會生成包含事實錯誤的內容,DeepMind 針對這一現象進行了一些探索性研究。
實證結果表明,LLM 智慧體可以實作超越人類的評級效能。在一組約 16K 個單獨的事實上,SAFE 在 72% 的情況下與人類註釋者一致,且在 100 個分歧案例的隨機子集上,SAFE 的贏率為 76%。同時,SAFE 的成本比人類註釋者便宜 20 倍以上。研究者還使用 LongFact,對四個大模型系列(Gemini、GPT、Claude 和 PaLM-2)的 13 種流行的語言模型進行了基準測試,結果發現較大的語言模型通常可以實作更好的長篇事實性。
論文作者之一、谷歌研究科學家 Quoc V. Le 表示,這篇對長篇事實性進行評估和基準測試的新工作提出了一個新數據集、 一種新評估方法以及一種兼顧精度和召回率的聚合指標。同時所有數據和程式碼將開源以供未來工作使用。
論文 : https://arxiv.org/pdf/2403.18802.pdf
GitHub : https://github.com/google-deepmind/long-form-factuality
訊息稱 Accel 領投的數據標註獨角獸 Scale AI 估值接近130億美元
據直接知情人士透露,風險投資公司 Accel 是數據標簽初創公司 Scale AI 的早期投資者,該公司正在就領投新一輪融資進行談判,這將使該初創公司的估值提高近 80%,達到約 130 億美元。
這項投資將使 Accel 能夠維持這家有價值的初創公司的大部份股份,該初創公司對 OpenAI 和其他對話式 AI 初創公司銷售服務的能力得到了提升。其中一位知情人士表示,為人工智慧模型 示記影像 或文本的 Scale 正在洽談本輪融資數億美元。(The Information)
AI 語音複制公司 ElevenLabs 與 Rabbit AI 達成合作
AI 語音複制創企 ElevenLabs 宣布與 AI 硬體創企 Rabbit AI 達成合作。ElevenLabs 執行長 Mati Staniszewski 說:「我們的合作是為了讓 R1 成為真正充滿活力的副駕駛。」當 R1 使用者透過語音執行高級命令時,ElevenLab 支持的語音將以真實的聲音並保持低延遲進行回復。
開源套用 Podgenai:利用 GPT-4 AI 生成互動式資訊播客
HackerNews 目前討論一款開源軟體 Podgenai,其利用先進的 GPT-4 大模型技術,可自動生成一小時長的資訊音訊播客。使用者只需輸入主題,程式將選擇語音風格、列出相關子話題,並使用 LLM 生成對應文本及語音內容,再透過 ffmpeg 合並成完整的 mp3 檔。生成樣例包括多種話題,如 PyTorch 教程、紐約城市介紹、位元幣解析等。使用者需提供 OpenAI API 金鑰並承擔生成費用(預計 2024 年每生成一次成本低於 2 美元)。
GitHub : https://github.com/impredicative/podgenai
亞馬遜雲科技:AI 人才薪資增幅或超 33%
亞馬遜雲科技釋出最新研究表明,預計到 2028 年,AI 技術將在中國企業得到普遍套用。並且中國企業對 AI 人才非常重視,願意為具備相關技能的人才提供平均高出 33% 的薪資。但目前具備 AI 技能的人才缺口巨大,企業在相關人才的招聘和培訓方面都面臨挑戰。針對此,亞馬遜雲科技將在中國推出一系列 AI 知識培訓課程,幫助企業和員工強化 AI 技術套用並有效提升生產力。
創新奇智發新模型 AInno-75B
創新奇智釋出智孔明工業大模型 2.0 版本(AInno-75B)及多款大模型原生套用,奇智孔明工業大模型參數量達到 750 億以上,增強了海量知識管理、復雜邏輯推理、長流程任務編排、Agent 智慧體以及更多工業模態的生成能力。創新奇智在釋出會上提到,在中國信通院可信 AI 工業大模型評測中,AInno-75B 於業內首家透過評測,且達到當前最高評級(4+級);在 SuperCLUE 工業大模型基準評測中,奇智孔明工業大模型位列國內第 1 和卓越領導者象限。
百度升級 7 款大模型套用已全面 SaaS 化
百度智慧雲在「AICloud Day:大模型套用產品釋出會」上,面向企業行銷、對客服務、知識管理、數據洞察、程式碼編程等多個企業通用場景,升級數位人平台百度智慧雲曦靈、智慧客服平台百度智慧雲客悅、內容創作平台「一念」、知識管理平台「甄知」、超級辦公入口「超級助理」、生成式 BI 產品「百度 GBI」,以及程式碼助手「Baidu Comate」 7 大產品。本次百度智慧雲升級的 7 大 產品已實作全面 SaaS 化,企業在網頁端即可使用。
Keep 線上 5000 節運動課程 15% 為 AIGC 生產
據 Keep 聯合創始人彭唯透露,Keep 線上有 5000 節官方運動課程,其中 15% 為 AIGC 生產。他表示今年 Keep 將會繼續投入 AI 資源,提升這一比例,包括在專業課程方向和運動數據方向同時發力,引入演算法能力以提升專業度,並上線運動評估體系,基於運動科學、運動數據和演算法來幫助使用者感知身體狀態和運動能力的變化。運動評估體系還可以在無心率裝置下,每天為 100 萬運動使用者預估運動負荷、最大攝氧量、FTP 等數據。目前,該體系已服務 1500 萬使用者。(第一財經)
4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。