整理 | 王啟隆
出品 | AI 科技大本營(ID:rgznai100)
一分鐘速覽新聞點!
輝達市值超過蘋果,躍居世界第二
高考監考都用上 AI
智譜 AI Open Day:升級清言 App、釋出 GLM-4 開源模型、新一代 MaaS 平台
騰訊混元釋出開源加速庫,生圖時間縮短 75%
社交媒體熱議:Adobe 使用者協定更新引發私密爭議
字節釋出「幾乎完美接近人類」的文本到語音(TTS)模型
台積電正式換帥,新董事長銳評 OpenAI 芯片計劃
Stability AI 開源 Stable Audio Open 音樂生成模型
開源 AI 程式設計師智慧體 SWE-agent 新版本效能翻倍
Arm 宣稱 2025 年或將有超 1000 億台 Arm 裝置驅動智慧未來
Google AI 概覽功能使用率驟減,醫療保健領域亦受波及
Mistral 推出高效模型微調工具,助力企業客製 AI 套用
全球 AI 要聞
輝達市值超過蘋果,躍居世界第二
科技巨頭輝達(NVIDIA)市值再創新高,超越蘋果,躍居全球價值第二大的公司。截至最近交易日,這家圖形處理單元(GPU)和人工智慧(AI)計算領域的領頭羊企業,其市值已飆升至 3.01 萬億美元,緊隨市值 3.15 萬億美元的微軟之後。此次市值飛躍標誌著輝達在過去一年多的時間裏實作了驚人的增長,從 2023 年 5 月首次突破 1 萬億美元市值大關,再到今年 2 月跨過 2 萬億美元門檻,接連超越了亞馬遜和 Alphabet 等科技巨擘。
輝達的股票在周三交易中上漲 5%,收於每股 1224.4 美元的歷史新高,市值一夜之間增長了約 1480 億美元。公司計劃於 6 月 7 日進行股票分割,比例為 1 拆 10,這一舉措預計將提高股票的流動性和對散戶投資者的吸重力。
輝達在 AI 領域的主導地位進一步鞏固了其市場價值,據 CNBC 報道,輝達的人工智慧加速器占據了 70% 至 95% 的人工智慧芯片市場份額,凸顯出其在推動全球 AI 革命中的核心作用。
高考監考都用上 AI
今年廣東高考將引入 AI 監考,新增智慧巡查分析系統,即時監控考試情況。提前作答,左右偏頭,向後偏頭,站立,傳遞可疑物品,攜帶可疑物品,手放桌下都能被監控出來。AI 篩選並保存關鍵片段,然後對於考場登記的考場記錄會進行人工回放,回放工作量降低。
智譜 AI Open Day:升級清言 App、釋出 GLM-4 開源模型、新一代 MaaS 平台
6 月 5 日,智譜 AI Open Day 在北京 UCCA Lab 藝術空間舉行,以 「Through GLM, to the NEXT-Gen」 為主題,全面展示了智譜在大模型技術上的最新進展及套用。活動釋出了清言 App 的多智慧體協作系統「 清流 」,以及 MaaS 大模型開放平台 bigmodel.cn 的最新更新。新一代 GLM-4-9B 模型能力提升 40%,支持 26 種語言及百萬 tokens 長文本處理,並首次開源視覺模型 GLM-4V-9B。智譜 AI CEO 張鵬表示,2024 年是 AGI 元年,AI 技術進入新階段。清言 App 已有 30 萬個智慧體活躍,提供多種生產力工具。MaaS 平台支持 LoRA 和 FPFT 微調,降低大模型使用成本,賦能多個行業。
騰訊混元釋出開源加速庫,生圖時間縮短 75%
6 月 6 日,騰訊釋出針對騰訊混元文生圖開源大模型(以下簡稱為混元 DiT 模型)的加速庫,讓推理效率大幅提升,生圖時間縮短 75%。混元 DiT 模型的使用門檻也大幅降低。使用者可以基於 ComfyUI 的圖形化界面,使用騰訊混元文生圖模型能力。同時,混元 DiT 模型已經部署至 Hugging Face Diffusers 通用模型庫中,使用者僅用三行程式碼即可呼叫混元 DiT 模型,無需下載原始程式碼庫。
程式碼: https://github.com/Tencent/HunyuanDiT
模型: https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
社交媒體熱議:Adobe 使用者協定更新引發私密爭議
昨日,Adobe 對其使用者協定進行了修訂,其中一項條款尤為引人註目:「明確我們有權透過自動及人工方式存取您的內容,用於例如內容稽核等目的。」此番改動迅速在使用者社群中激起千層浪,特別是因為不同意該條款的使用者將無法繼續使用 Adobe 軟體,此舉遭遇了廣泛的批評與反對。
一條相關 推文的轉發量逼近 400 萬,揭示了公眾對此的強烈反應。使用者和私密倡導者擔憂,該條款背後的含義可能遠不止於內容稽核,暗示 Adobe 可能意圖利用使用者建立的設計、圖片等數據來訓練其 AI 模型,而使用者在未明確同意的情況下,實質上失去了對自己作品使用的控制權。
字節釋出「幾乎完美接近人類」的文本到語音(TTS)模型
字節跳動釋出了 Seed-TTS,一款革命性的文本到語音(TTS)模型,其生成的語音品質之高,幾可亂真,徹底模糊了人聲與合成語音之間的界限。不同於傳統技術,Seed-TTS 無需繁復的訓練流程,僅需少量語音樣本,即可複制出既自然又充滿表現力的聲音,為讀小說、影視配音等行業帶來革新。
Seed-TTS 的核心優勢在於其對語音特征的精細控制,涵蓋情感、語調及多種說話風格,讓使用者能夠按需客製理想中的語音效果。更令人振奮的是,透過直接編輯文本內容,系統就能即時調整生成的語音,實作前所未有的靈活性和創造性。
研究團隊還介紹了 Seed-TTS 的自蒸餾方法,用於語音因子分解,以及透過強化學習增強模型的穩健性、模仿真實度與可控性。此外,他們推出了非自回歸變體 Seed-TTS DiT,采用全擴散架構,無需依賴預估的音素時長,實作了端到端的語音生成,不僅在客觀評價上表現優異,在主觀聆聽測試中也贏得了高度贊譽,尤其是在語音編輯方面展現了巨大潛力。
演示連結: https://bytedancespeech.github.io/seedtts_tech_report/
台積電正式換帥,新董事長銳評 OpenAI 芯片計劃
據 6 月 5 日的報道,台積電新上任的董事長魏哲家在年度股東大會後評論了 OpenAI 執行長 Sam Altman 想要進軍芯片制造領域的計劃,稱之為「過於激進」。魏哲家的這一評價是在業界持續流傳 OpenAI 計劃不僅涉足芯片設計,還要參與芯片制造的背景之下做出的。OpenAI 的這一雄心勃勃的計劃還包括與包括阿聯政府在內的投資者進行談判,意圖籌集 5 萬億至 7 萬億美元的資金來重塑全球半導體行業,這一數額巨大,甚至超過了某些國家的 GDP。
Stability AI 開源 Stable Audio Open 音樂生成模型
全球領先的 AI 創新企業 Stability AI 今日震撼釋出了一項開源壯舉—— Stable Audio Open 音樂生成模型,該模型以其獨特的 text2audio 擴散技術,正重塑音樂與聲音設計的未來。這一開創性模型不僅能夠單次生成長達 47 秒的音訊片段,還涵蓋了從激昂鼓點、悠揚樂器旋律到細膩環境聲音及專業配音的全方位創作能力,為使用者開辟了一條前所未有的音樂創意路徑。
開源連結: https://huggingface.co/stabilityai/stable-audio-open-1.0
開源 AI 程式設計師智慧體 SWE-agent 新版本效能翻倍
「開源版 Devin」 SWE-agent 的最新版本 0.6.0 釋出,效能實作了重大飛躍,整體執行速度提升至原來的 2 倍,並已在與 GPT4o 的計時測試中證實。這版本最佳化了 Docker 內通訊與環境配置,如快速通訊預設設定與稀疏複制技術。更新還包括 Web UI 體驗升級,如 Markdown 支持與捲動最佳化,同時修復了多項問題,確保跨平台穩定性,特別是解決了 MacOS 下的代理錯誤。此版本還賦予使用者更多控制選項,如配置日誌匯出的開關,標誌著 SWE-agent 在效率與使用者體驗方面邁出了重要一步。
Arm 宣稱 2025 年或將有超 1000 億台 Arm 裝置驅動智慧未來
在 COMPUTEX 2024 展前,Arm 執行長 Rene Haas 揭示了公司的宏偉願景,預計到 2025 年底,超過 1000 億台基於 Arm 架構的裝置將全面支持從雲端到邊緣的人工智慧(AI)套用,這得益於 Arm CSS 和新推出的 KleidiAI 等技術創新。Haas 在演講中直面關鍵挑戰,探討全球能源是否足以支撐 AI 計算需求的激增,同時強調 Arm 的節能 DNA 及其對軟體生態系的重視是應對這一挑戰的關鍵。
Google AI 概覽功能使用率驟減,醫療保健領域亦受波及
近期,Google 的 AI 概覽功能頻發的「幻覺」問題,其觸發頻率顯著下滑,目前該功能僅在 15% 的搜尋查詢中呈現,與實驗室階段高達 84% 的展示率形成鮮明對比。此變動反映出 Google 針對 AI 生成內容準確性的嚴格把控措施。
從行業套用層面觀察,AI 概覽在醫療保健這一關鍵領域的套用從 1 月份的 76% 高位滑落至 63%,標誌著該功能在需高度精確資訊的健康咨詢上遭受信任考驗。同時,餐飲與旅遊業受到的影響更為劇烈,AI 概覽的露出機會均低於 1%,分別經歷了 36% 和 30% 的大幅下跌。
此外,Google 最佳化了搜尋體驗,刻意減少了 AI 概覽與傳統搜尋結果的重復展示,旨在提升資訊多樣性與使用者滿意度,避免提供冗余答案。這一系列調整凸顯出在追求技術創新的同時,確保資訊準確性與使用者體驗的重要性。
Mistral 推出高效模型微調工具,助力企業客製 AI 套用
Mistral,這家僅成立 14 個月便即將達到 60 億美元估值的開源 AI 模型供應商,正在其 AI 開發者平台 La Plateforme 上推出新的客製化功能,使大型語言模型(LLM)的微調變得更加簡單快捷。Mistral 強調,新工具透過高度高效的微調過程,能夠降低訓練成本並減少進入壁壘,讓企業更容易享受微調帶來的好處。
在一篇部落格文章中,Mistral 指出:「針對特定領域或套用場景調整較小模型,可以使其效能匹敵更大模型,同時減少部署成本並提升套用速度。」除了現有的模型服務外,客戶現在可以透過 La Plateforme、GitHub 上的開原始碼或客製訓練服務來調整 Mistral 模型。此外,Mistral 還釋出了基於 LoRA 範式的輕量級程式碼庫 mistral-finetune,以保持效能和記憶體效率的同時減少訓練參數數量。
開發者正在迎接新一輪的技術浪潮變革。由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的 2024 年度「全球軟體研發技術大會」秉承幹貨實料(案例)的內容原則,將於 7 月 4 日-5 日在北京正式舉辦。大會共設定了 12 個大會主題:大模型智慧套用開發、軟體開發智慧化、AI 與 ML 智慧運維、雲原生架構……詳情👉: http://sdcon.com.cn/