國產大模型「考上」一本；ChatGPT語音助手推遲釋出

2024-06-26資訊

整理 | 王軼群

出品 | AI 科技大本營（ID：rgznai100）

一分鐘速覽新聞點！

OpenAI 宣布首款適用於 Mac 的 ChatGPT 套用開放下載

為確保安全性，OpenAI 官宣推遲 ChatGPT 語音助手釋出時間至下月

OpenAI 斷供中國大陸市場，零一萬物 Yi API 二折平替 GPT-4o

Meta FAIR 釋出 Meta Chameleon 新混合模態研究模型

昆侖萬維釋出 Q* 演算法，百倍提升7B模型推理能力

字節跳動釋出「豆包MarsCode」智慧開發工具，面國內開發者免費開放

釘釘宣布對所有大模型開放，6家大模型接入釘釘生態

牛津大學新研究提出「語意熵」方法助力人工智慧減少「胡謅」

大模型「高考成績」公布：豆包、文心一言等國產大模型沖上一本線

出門問問與騰訊雲戰略合作升級，共推 AIGC 套用落地

「多語種智慧語音關鍵技術及產業化」計畫獲國家科技進步獎一等獎，由科大訊飛、中科大、清華、華為等聯合完成

AI 將帶動今年全球伺服器 GPU 產值破千億美元

2024全球人工智慧技術大會在杭召開，20位院士齊聚杭州未來科技城

全球 AI 要聞

OpenAI 宣布首款適用於 Mac 的 ChatGPT 套用開放下載

OpenAI 宣布，其首款適用於蘋果Mac電腦的 ChatGPT 聊天機器人套用正式面向所有使用者開放下載。此前一個月，該套用一直處於測試階段，僅Plus付費訂閱使用者可以使用。OpenAI 稱，ChatGPT 的 Mac 套用旨在與使用者日常操作無縫整合，其原生支持Mac系統，並提供方便的快捷鍵（Command + 空格鍵）允許使用者隨時隨地啟動套用。使用者可以輕松與聊天機器人進行互動，並可選擇將檔、照片和螢幕截圖等附加到您的資訊中，供 ChatGPT 使用這些素材進行理解和創作。該套用還支持「語音模式」，使用者可以使用語音與 ChatGPT 進行交流。OpenAI 表示，將在未來幾周內為Mac使用者提供支持GPT-4o功能的新「語音模式」版本。（金融界）

為確保安全性，OpenAI 官宣推遲 ChatGPT 語音助手釋出時間至下月

OpenAI 發表推文宣布，將推遲其備受矚目的 ChatGPT 語音助手功能的釋出，以確保其在面對數百萬使用者請求時的安全性和有效性。這一決定是在該公司5月份的 GPT-4o 產品釋出會上首次公開語音功能之後作出的。GPT-4o 是 GPT-4 模型的升級版，它能夠更高效地即時處理文本、音訊和影像數據。

原本，OpenAI 計劃在6月底向一部份付費的 ChatGPT Plus 使用者推出這項語音功能，但為了滿足更高的釋出標準，公司決定將釋出時間推遲一個月。OpenAI 此次在官方推文中表示，正在加強模型對某些內容的檢測和拒絕的能力，並致力於改善使用者體驗，同時準備擴充套件基礎設施以支持數百萬使用者，以及保持即時響應的能力。「作為叠代部署策略的一部份，我們將從一小群使用者開始Alpha，以收集反饋並根據所學內容進行擴充套件。我們正計劃讓所有Plus使用者在今年秋天都能使用。準確的時間表取決於滿足我們的高安全性和可靠性標準。」

盡管這一推遲可能會對 OpenAI 在競爭激烈的 AI 領域中的領先地位造成一定的影響，但公司表示，他們正在不斷努力，以確保新功能的品質和可靠性。

OpenAI 斷供中國大陸市場，零一萬物 Yi API 二折平替 GPT-4o

由李開復博士創立的AI大模型獨角獸公司零一萬物公司，發起「Yi API 二折平替計劃」，面向 OpenAI 使用者推出了平滑遷移至 Yi 系列大模型的服務。針對接入 OpenAI 的不同模型的使用者，零一萬物一一對應地提供了替換方案。

據零一萬物介紹，目前註冊使用 Yi API 的新客戶，零一萬物立即贈送 100 元額度；平台充值還將贈送 50% 到賬額度，上不封頂；充值可獲 RPM/TPM 限速直升 Tier3；此外，零一萬物 API 還將提供 Prompt 相容調優服務支持。

柏克萊大學公開盲測 LMSYS 綜合排名中，Yi-Large 在中國大模型中排名第一，在中文榜單上 Yi-Large 超過 GPT-4，與 GPT4o 並列排名世界第一（2024.6.25）；史丹佛評測機構 AlpacaEval 2.0 經官方認證的模型排行榜上，Yi-Large 的 LC Win Rate 高於 GPT-4（2024.6.25）；在 GPQA、HumanEval、MT-Bench、AlignBench 等權威評測集上，Yi-Large 得分高於 GPT-4（2024.5.12）。

Meta FAIR 釋出 Meta Chameleon 新混合模態研究模型

Meta 官方宣布，Meta FAIR團隊已釋出了一個名為Meta Chameleon的新混合模態研究模型。

Meta Chameleon 具備 7B 和 34B 兩個參數量版本，可以接受文本和影像的任意組合作為輸入，並生成文本輸出。該模型使用了一種新的早期融合方法，采用單一統一架構，而非傳統的分離影像和文本編碼器或解碼器。該模型以研究授權的形式釋出，旨在幫助民主化基礎混合模態模型的存取，並進一步推動早期融合的研究。

Meta官方表示：「我們釋出的7B和34B安全調整模型可以將任何文本和影像組合作為輸入，並使用新的早期融合方法產生文本輸出。雖然一些LLM有獨立的影像和文本編碼器或解碼器，但Chameleon是使用單一統一架構的第一個公開釋出的方法之一。」

模型下載連結：

http://go.fb.me/4m87kk

研究論文連結：

http://go.fb.me/u75dq8

昆侖萬維釋出 Q* 演算法，百倍提升7B模型推理能力

昆侖萬維攜手新加坡南洋理工大學成功開發了名為 Q * 的演算法，能夠顯著提升現有大模型的推理能力。Q * 在不同數據集上幫助小模型達到參數量比其大數十倍甚至上百倍模型的推理能力。

Q * 框架通過將大語言模型的推理軌跡分解為若幹個狀態，並利用 A * 搜尋演算法實作全盤規劃，提升了開源模型在推理任務上的效能。目前，Q * 演算法的研究仍處於初級階段，但已經證明了其能夠幫助參數量僅為 7B 的小模型達到與參數量大數十倍甚至上百倍模型相當的推理能力，大幅提升了模型的效能，並顯著降低了計算資源的需求。

研究人員在論文【Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning】中提出了 Q * 框架，透過將大語言模型的推理軌跡分解為若幹個狀態，並利用 A * 搜尋演算法實作全盤規劃，提升了開源模型在推理任務上的效能。

論文連結：

https://arxiv.org/abs/2406.14283

字節跳動釋出「豆包MarsCode」智慧開發工具，面國內開發者免費開放

6 月 26 日，字節跳動在北京釋出了基於豆包大模型打造的智慧開發工具 - 豆包MarsCode ，面向國內開發者免費開放。

豆包MarsCode 產品負責人王海建介紹了豆包MarsCode 產品的兩種形態——編程助手和 Cloud IDE，同時透過需求開發、修復Bug、開源計畫學習三個實際場景，詳細演示了豆包MarsCode 的計畫問答、程式碼補全、單測生成、Bug Fix等功能。

豆包MarsCode 市場營運負責人趙旭東介紹了豆包MarsCode 開發者與社群共創計劃。後續豆包MarsCode 會透過成立使用者組、各類系列開發者活動等方式，助力開發者探索 AI 編程新範式。

據介紹，豆包MarsCode 使用者組將由開發者自組織自營運，豆包MarsCode 團隊不會參與到使用者組的管理，但是會為使用者組提供豐富的各類資源支持，支持各地使用者組發展，例如場地資源、產品資源、活動物料、專家講師支持等，幫助促進各地開發者更有效的探索AI編程新範式，助力開發者學習成長。在開發者活動方面，豆包MarsCode 將陸續在北、上、深、杭等的城市舉辦 Meetup。

豆包MarsCode 還計劃協同各開發者社群，將 AI 能力融入到社群使用場景中，將豆包MarsCode 的能力更便捷的提供給開發者。目前，豆包MarsCode 已與金塊社群在 AI 助手、帳號打通、專屬沸點專區等層面合作。

使用連結： www.marscode.cn

釘釘宣布對所有大模型開放，6家大模型接入釘釘生態

6月26日，「Make 2024釘釘生態大會」在北京舉辦。會上，釘釘宣布對所有大模型廠商開放，構建中國最開放AI生態。除了通義大模型外，MiniMax、月之暗面、智譜AI、獵戶星空、零一萬物、百川智慧六家大模型廠商已經與釘釘達成合作。目前，釘釘生態夥伴總數超過5600家，其中AI 生態夥伴已經超過100家；釘釘AI每天呼叫量超1000萬次。

釘釘總裁葉軍表示：「模型開放是釘釘生態開放戰略的再進一步。隨著行業從模型創新走向套用創新，探索大模型的套用場景是釘釘的責任所在。釘釘擁有大量企業客戶，數據優勢與場景優勢疊加，和大模型之間彼此需要。另一方面，釘釘上的大企業客戶也對模型開放提出要求。」目前，釘釘生態夥伴總數超過5600家；其中AI 生態夥伴已經超過100家，除了AI大模型生態夥伴外，還有AI Agent產品、AI解決方案、AI外掛程式等不同領域的夥伴。

此次大會上，釘釘還宣布升級全域搜尋能力，開啟全新「釘釘 AI 搜尋」的邀測。

牛津大學新研究提出「語意熵」方法助力人工智慧減少「胡謅」

英國牛津大學研究團隊開發出一種名為「語意熵」的新方法,有望大幅提升AI回答的可靠性。牛津大學電腦科學系的研究人員提出「語意熵」方法試圖解決大語言模型「幻覺」這一問題。

該研究成果已發表在近期出版的英國【自然】雜誌上。研究人員利用「語意熵」方法，讓大語言模型對同一問題生成多個答案，然後將語意相近的答案聚類，最後根據聚類結果計算熵值。熵值越高，表示大語言模型的回答越不確定。這一方法不僅考慮了大語言模型回答的字面差異，更關註語意層面的一致性。這使得「語意熵」能夠更準確地辨識AI的「胡謅」，而不會被表達方式的多樣性所迷惑。

研究結果表明，「語意熵」方法在多個數據集和任務中都表現出色，能有效檢測大語言模型的錯誤回答，並透過拒絕回答不確定的問題來提高整體準確率。該方法無需修改AI模型本身，可直接套用於現有的大語言模型。

研究人員表示,「語意熵」技術有望在問答系統、文本生成、機器轉譯等多個領域發揮重要作用，幫助AI生成更可靠、更有價值的內容。（新華社）

大模型「高考成績」公布：豆包、文心一言等國產大模型沖上一本線

高考新課標Ⅰ卷全科目大模型評測報告數據顯示，GPT-4o以562分排名文科總分第一，字節跳動旗下的豆包成績是542.5分，其後依次是百度文心一言4.0的537.5分，以及百川智慧「百小應」的521分。

本次大模型高考評測與河南省考卷完全相同。根據當天公布的河南高考錄取分數線，文科本科一批錄取分數線為521分，GPT-4o超出41分，豆包等三款國產AI也成功沖上一本線。而根據最新河南高考分數段統計數據，GPT-4o的562分在文科考生中排名8811名，相當於人類考生的前2.45%，豆包則處於前4.27%的位置。

百小應、字節豆包和騰訊元寶占據了文科前三的位置。豆包更是以平均分52分的成績，拿下作文寫作最高分。負責本次閱卷的北京市級骨幹教師、懷柔區語文學科帶頭人夏老師指出，Al寫出的文章大多有清晰完整的結構，有邏輯性，語言通順流暢，但「其理性有余，感性不足，缺乏感情色彩，自然就缺乏感染力」，這成為大模型在語文科目中進一步提升的關鍵所在。

英語考試中，GPT-4o、百小應、通義千問等甚至獲得了80分的滿分，豆包和文心4.0也接近滿分。但在40分的寫作考試中，最高分僅為29分，由 GPT-4o 和百小應獲得。大模型的英語寫作主要在表達的豐富度和細節處理上有所欠缺。

在由歷史、地理、政治組成的文綜考試中，GPT-4o 以237分的總成績展現出了較強的綜合能力，平均得分達到79分，超越了多數人類考生。在政治考試中，GPT-4o憑借88分的高分令人意外地奪魁。而地理考卷由於存在大量圖片問題，最終影像理解能力較強的 GPT-4o 獲得了最高分，但也僅有68分。

在數學考試中，9款大模型產品中僅有GPT-4o、文心一言 4.0 和豆包獲得60分以上的成績（滿分150分）。據測試機構透露，豆包等大模型能準確運用求導公式和三角函式定理，但在面對較為復雜的推導和證明問題時，往往難以得分。在回答數學題目時，大模型的主觀題出現回答相對淩亂的情況，甚至出現過程錯誤但得到正確答案的情況。大模型的公式記憶能力較強，但無法在解題過程中靈活套用。

在化學和物理考試中，平均分數分別只有34分和39分。化學單項最高分49.5分由豆包獲得，而GPT-4o僅有42分。在物理考試中，一道基於常識「時間不會倒流」就能輕易排除錯誤選項的送分題，大模型卻幾乎全軍覆沒，凸顯了大模型在應對考試靈活性方面的不足。（極客公園）

出門問問與騰訊雲戰略合作升級，共推 AIGC 套用落地

6月25日，出門問問與騰訊雲宣布戰略合作升級，雙方將充分發揮騰訊雲在雲端運算、人工智慧等領域的技術優勢，以及出門問問在大模型、生成式AI與語音互動等領域的技術積累，在人工智慧領域內就雲服務、生態、品牌行銷等方面持續深化合作，共同探索生成式AI與語音互動技術的創新發展，深入探索AIGC的多樣化套用場景，推進大模型在垂直行業的套用落地。

目前，出門問問 AIGC 產品累計服務的使用者數量已超 1500 萬，註冊使用者數量超 1000萬，其中付費的使用者數量約 86.5 萬。

「多語種智慧語音關鍵技術及產業化」計畫獲國家科技進步獎一等獎，由科大訊飛、中科大、清華、華為等聯合完成

6月24日，2023年度國家科學技術獎在京揭曉。由科大訊飛股份有限公司牽頭，聯合中國科學技術大學、清華大學、華為終端有限公司、中移（杭州）資訊科技有限公司等高校及行業企業聯合完成的「多語種智慧語音關鍵技術及產業化」計畫榮獲2023年度國家科技進步獎一等獎。

據了解，多語種智慧語音技術對於支撐人機互動、人類語言互通等需求具有重大戰略意義，具有十分廣闊的產業前景。科大訊飛提出了多通道語音訊號時空分離建模方法和多維度語音內容解耦表征方法，實作語音訊號中內容、雜訊等高度耦合的多維內容特征解耦，使得復雜場景下語音辨識準確率得到提升。

為解決復雜套用場景下語音互動、語音轉譯面臨著深層次語意理解困難、專業性不足等問題，科大訊飛提出語音語意互增強的魯棒口語理解技術,提升語音互動、語音轉譯等復雜場景的語意理解準確率；提出多源知識增強的可信文本生成技術，提升專有詞匯及領域知識參照的準確率。（經濟日報）

AI 將帶動今年全球伺服器 GPU 產值破千億美元

DIGITIMES 研究中心6月25日釋出報告指出，2024年全球伺服器用 GPU（包括儲存芯片在內的板卡與子系統）產值將首次突破1000億美元，達1219億美元。其中，高端伺服器GPU產值比重將超過80%，達1022億美元，出貨量可達482萬顆，輝達將占比92.5%，AMD 占比可達7.3%。

2024全球人工智慧技術大會在杭召開，20位院士齊聚杭州未來科技城

6月22日至23日，2024全球人工智慧技術大會在杭州未來科技城舉行。這是中國人工智慧學會三大品牌活動之一，是中國人工智慧技術和產業領域規模最大、影響力最強的千人級專業會議之一。今年是大會連續第5年落戶杭州未來科技城，包括20余位中外院士在內的200多位專家學者齊聚一堂，交流最新科研突破與進展，深化產學研用一體化合作，加快發展新一代人工智慧。

會上，中國人工智慧學會科技成果轉移轉化杭州基地揭牌儀式、第二屆涿溪實驗室科技成果轉化計畫落地簽約儀式、全球人工智慧技術創新大賽演算法挑戰賽一等獎頒獎儀式、中國人工智慧學會-昇思 MindSpore 學術基金優秀計畫頒獎儀式等在大會開幕式上相繼舉行。

由 CSDN 和 Boolan 聯合主辦的「2024 全球軟體研發技術大會（SDCon）」將於 7 月 4 - 5 日在北京威斯汀酒店舉行。

由世界著名軟體架構大師、雲原生和微服務領域技術先驅 Chris Richardson 和 MIT 電腦與 AI 實驗室(CSAIL)副主任，ACM Fellow Daniel Jackson 領銜，BAT、微軟、字節跳動、小米等技術專家將齊聚一堂，共同探討軟體開發的最前沿趨勢與技術實踐。

大會官網： http://sdcon.com.cn/ （可點選 閱讀原文 直達）

國產大模型「考上」一本；ChatGPT語音助手推遲釋出 | AI頭條