蘋果或將在AI領域與Meta合作；OpenAI收購Rockset；Anthropic最新模型已達專業博士水平

2024-06-24資訊

整理 | 王軼群

出品 | AI 科技大本營（ID：rgznai100）

一分鐘速覽新聞點！

蘋果或將在 AI 領域與 Meta 合作，Anthropic 和 Perplexity 參與了討論

因歐盟規定，蘋果推遲在歐洲推出 Apple Intelligence

OpenAI 以換股方式收購 Rockset，估值最高36億

OpenAI 技術長 Mira Murati：預計幾年內「博士級智慧」的 AI 就會出現

Anthropic 最新釋出的 Claude 3.5 Sonnet 模型達到了專業博士水平

Microsoft 開源公布新的針對視覺分析套用 AI 模型 Florence-2

Stability AI 獲超 1 億美元投資並任命新的 CEO

楊立昆建議學生和學術研究人員不要將 LLM 作為通往人類級 AI 的道路

月之暗面回應進軍美國市場：目前沒有開發和釋出任何海外產品的計劃

華為雲盤古大模型 5.0 釋出，「誇父」人形機器人現身

鴻蒙 NEXT 首次將 AI 能力融入系統，小藝升級為智慧體

快手可靈大模型開放圖生視訊，視訊續寫最長可達3分鐘

阿裏雲推出第一個 AI 程式設計師，「分鐘級」完成套用開發

環球音樂集團與 AI 音樂技術公司 SoundLabs 合作

全球 AI 要聞

蘋果或將在 AI 領域與 Meta 合作，Anthropic 和 Perplexity 參與了討論

訊息稱 Meta 已與 Apple 進行了討論，將其 AI 模型與 Apple Intelligence 進行整合。這兩家長期競爭對手已就將 Meta 的生成式 AI 模型整合到 Apple Intelligence 中進行的可能性進行了談判。蘋果並沒有把生成式 AI 當作一個全面重塑或顛覆的機會，而是從在現有產品中添加人工智慧功能（如寫作建議和自訂表情符號）開始。不過有媒體認為，強調實用性可能才是人工智慧被采用的關鍵。然後，蘋果可以利用合作關系來超越自身人工智慧模型的能力。因此，與 Meta 達成協定可以讓蘋果減少對單一合作夥伴的依賴，同時也為 Meta 的生成式人工智慧技術提供了驗證。目前蘋果和 Meta 的談判尚未敲定，存在失敗的可能。雙方均未對此事發表評論。此外，Anthropic 和 Perplexity 也討論了與 Apple 的整合。（華爾街日報）

因歐盟規定，蘋果推遲在歐洲推出 Apple Intelligence

6月23日訊息，受歐盟規定影響，蘋果表示，iOS 18 和 macOS Sequoia 中的三大功能今年秋季將不會向歐洲使用者開放。它們包括 Mac 上的 iPhone 螢幕映像、SharePlay 螢幕共享以及整個 Apple Intelligence 生成式 AI 功能套件。

蘋果表示，這一決定與歐盟的【數位市場法案】（DMA）有關。蘋果發言人 Fred Sainz 的完整聲明：「兩周前，Apple 釋出了數百項新功能，我們很高興能將這些功能帶給世界各地的使用者。我們非常希望讓所有使用者都能使用這些技術。然而，由於【數位市場法案】（DMA）帶來的監管不確定性，我們認為今年無法向歐盟使用者推出其中三項功能——iPhone Mirroring、SharePlay 螢幕共享增強功能和 Apple Intelligence。具體而言，我們擔心 DMA 的互操作性要求可能會迫使我們以危及使用者私密和數據安全的方式損害我們產品的完整性。我們致力於與歐盟委員會合作，試圖找到一種解決方案，使我們能夠在不損害歐盟客戶安全的情況下向他們提供這些功能。」

從蘋果的聲明中尚不清楚 DMA 的哪些方面可能導致了這一決定。（The Verge）

OpenAI 以換股方式收購 Rockset，估值最高36億

OpenAI公司在社交平台上宣布，其收購了領先實分時析資料庫公司Rockset，但OpenAI沒有透露交易金額。OpenAI強調，基於Rockset提供的世界一流的數據索引和查詢功能，OpenAI將在其產品中整合Rockset技術，使公司能夠將其數據轉化為可操作的情報。截至去年8月29日，Rockset公司共獲得的融資總額在1億美金左右，投後估值1億-5億美元。

OpenAI 技術長 Mira Murati：預計幾年內「博士級智慧」的 AI 就會出現

OpenAI 技術長公尺拉·穆拉蒂（Mira Murati）預測了人工智慧能力的快速發展，預計在未來「幾年」裏，用於特定任務的「博士級智慧」就會出現。

在母校達特茅斯工程學院程學院的訪談中，穆拉蒂討論了 ChatGPT 和 DALL-E 背後的人工智慧，以及正在進行的安全和道德考慮。

當被問及 ChatGPT 的智慧進展時，穆拉蒂表示：「這些系統在特定任務中已經達到了人類的水平，當然在很多工中，它們還沒有達到。」她接著說，像 GPT-3 這樣的模型表現出與蹣跚學步的孩子相似的智力。相比之下，像 GPT-4 這樣的系統所展示的智力堪比聰明的高中生。「然後在接下來的幾年裏，我們將著眼於特定任務的博士級智慧。所以情況正在迅速改變和提高。」（和訊網）

Anthropic 最新釋出的 Claude 3.5 Sonnet 模型達到了專業博士水平

在最新的Claude 3.5 Sonnet 的技術評測報告中，Claude 3.5 Sonnet在GPQA測試中的得分為67.2%，超過了領域內專業博士的水平。這是第一次有大語言模型在GPQA測試中突破了65%的得分。GPQA（Graduate-Level Question Answering）是一個旨在評估語言模型在研究生水平科學知識上的問答能力的基準測試。它通常涉及復雜和深奧的問題，需要模型具有較高的推理和知識整合能力。普通博士在GPQA測試中的平均得分為34%；專門領域的博士在GPQA測試中的得分為65%。

Microsoft 開源公布新的針對視覺分析套用 AI 模型 Florence-2

Microsoft的 Azure AI 團隊最近在 Hugging Face 上釋出了新的基礎AI模型Florence-2，支持各種視覺分析套用，可以配合大量使用場景，使企業無需針對單一套用開發各自的模型。

Hugging Face 地址：

https://huggingface.co/microsoft/Florence-2-large

Florence-2有兩個版本（232M和771M參數），可以處理制作字幕、物件偵測、視覺分析和分割等套用，Microsoft表示，其效能與許多較大規模的視覺模型相當或更好。這個模型的特別之處在於可以同時支持各種視覺相關的功能，類似於大型語言模型，企業可以用它來一站式解決各種需要。

為了發展 Florence-2，Microsoft 建立了一個名為 FLD-5B 的視覺數據集，其中包含1.26億張影像的54億個註釋，並使用序列到序列架構訓練 Florence-2。這個設計整合了影像編碼器和多模態編碼解碼器，使模型能夠管理各種視覺套用，而無需針對特定套用進行修改。

Florence-2 的表現也相當理想，在 COCO 數據集上的零鏡頭字幕測試中，優於 Deepmind 的80B參數 Flamingo 模型和 Microsoft 的 Kosmos-2。Florence-2 的預訓練和微調版本現已在 Hugging Face 上提供，而且采用寬松 MIT 授權，也就是可以不受限制地用於一般或商用用途。（VentureBeat）

Stability AI 獲超 1 億美元投資並任命新的 CEO

6月21日訊息，知情人士稱，Stability AI 已任命 Prem Akkaraju 為新任執行長。視覺特效公司維塔 Wētā FX 前執行長 Prem Akkaraju 是包括前 Facebook 總裁 Sean Parker 在內的投資者中的一員。報道稱，這些投資者總共出資超過 1 億美元，新的資金可能會縮減一些現有投資者的股份。目前，Stability AI 公司拒絕發表評論。（The Information）

楊立昆建議學生和學術研究人員不要將 LLM 作為通往人類級 AI 的道路

Yann LeCun（楊立昆），紐約大學教授、Meta 首席 AI 科學家，在推特上發表了對大型語言模型（LLM）的看法。他建議學生和學術研究人員不要將 LLM 作為通往人類級 AI 的道路。LeCun 認為，LLM 只是一個「下坡路」，因為已經有大量工程師和資源投入到 LLM 的開發中。學生和研究人員很難在 LLM 領域做出有意義的貢獻。他建議，與其在 LLM 上投入時間，不如專註於探索新的 AI 架構和想法，即使是針對小問題的研究，也可能比分析現有 LLM 更有趣且更有影響力。

月之暗面回應進軍美國市場：目前沒有開發和釋出任何海外產品的計劃

月之暗面否認了其員工正在開發並準備進入美國市場的產品，包括 AI 角色扮演聊天應用程式 Ohai 和音樂視訊生成器 Noisee 的傳聞。同時，該公司確認正在經歷新一輪融資，且騰訊可能成為新的投資者，但未提及融資的具體細節或估值。

華為雲盤古大模型 5.0 釋出，「誇父」人形機器人現身

在6月21日舉行的華為開發者大會（HDC 2024）上，華為雲正式推出盤古具身智慧大模型，搭載盤古能力的人形機器人（誇父）也同步亮相。該機器人系華為雲與樂聚公司人形機器人戰略合作以來取得的階段性成果。透過盤古具身智慧大模型的接入，人形機器人在智慧化、泛化能力上得到了顯著提升，「誇父」人形機器人可流暢完成辨識物品、問答互動、擊掌、遞水等互動演示。

盤古大模型 5.0 提供了從十億級到萬億級不同參數規格的模型；能夠理解和生成包括文本、圖片、視訊、雷達、紅外、遙感等多種模態的內容，並且支持 10K 超高分辨率影像理解；復雜邏輯推理和數學能力的增強。盤古大模型采用 STCG 技術，專註於自動駕駛、工業制造等行業場景。

鴻蒙 NEXT 首次將 AI 能力融入系統，小藝升級為智慧體

鴻蒙NEXT首次將AI能力融入系統，帶來AIGC影像生成、AIGC聲音修復、AI影像辨識等體驗。在盤古大模型5.0加持下，小藝智慧體目前有23類Top場景記憶感知能力，任務成功率達90%，擁有萬億tokens的知識量，可進行處理文字、辨識影像、分析文件等工作。

基於盤古大模型 5.0 加持，小藝將以「小藝超級智慧體」的新形式出現在系統中，使用者可以隨時召喚華為智慧助手「小藝」，將文字、圖片、文件「投餵」小藝，即可高效處理文字、辨識影像、分析文件。

快手可靈大模型開放圖生視訊，視訊續寫最長可達3分鐘

快手旗下大模型可靈正式推出圖生視訊功能，支持將任意靜態影像轉化為生動的5秒視訊，支持添加提示詞控制影像運動。可靈還同步釋出視訊續寫功能，支持對已生成的視訊一鍵續寫和連續多次續寫，單次可讓視訊延續約5秒，最長可生成約3分鐘視訊，可透過微調提示詞進行續寫視訊創作。此外，快手可靈支持文生視訊多比例選擇：新增9:16和1:1視訊尺寸選擇。

阿裏雲推出第一個 AI 程式設計師，「分鐘級」完成套用開發

在阿裏雲上海 AI 峰會上，阿裏雲推出第一個「AI 程式設計師」，具備架構師、開發工程師、測試工程師等崗位技能，能完成任務分解、程式碼編寫、測試、問題修復、程式碼送出整個過程，最快分鐘級完成套用開發。據介紹，該AI程式設計師是基於通義大模型構建的多智慧體。（科創板日報）

環球音樂集團與 AI 音樂技術公司 SoundLabs 合作

環球音樂集團(UMG)與 AI 音樂技術公司 SoundLabs 合作，將為歌手和藝術家提供建立自己語音複制模型的技術。

歌手和藝術家們可以使用 SoundLabs 的 MicDrop 功能，透過提供數據來生成他們自己的語音模型，並可以自由控制這些模型的使用權。為尊重藝術家私密和版權，這些語音複制不會向公眾開放。MicDrop 的功能包括語音模型建立、復制歌手的歌唱聲音等。MicDrop 還提供了一種語音轉樂器功能，類似於能夠讓鍵盤聽起來像吉他或鼓的功能。MicDrop 還提供語言轉移功能，幫助藝術家在全球範圍內發行任何語言的歌曲，而不會有語言障礙。

SoundLabs 由格萊美提名的制作人、作曲家和軟體開發者BT創立，他曾與多位知名藝術家合作。SoundLabs 的團隊還包括獲獎的軟體開發者Joshua Dickinson和Dr. Michael Hetrick，他們擴充套件了AI在音樂創作中的套用。UMG 和 SoundLabs 還共同釋出了【AI音樂創作原則】，呼籲在音樂創作中負責任地使用AI技術。

由 CSDN 和 Boolan 聯合主辦的「2024 全球軟體研發技術大會（SDCon）」將於 7 月 4 - 5 日在北京威斯汀酒店舉行。

由世界著名軟體架構大師、雲原生和微服務領域技術先驅 Chris Richardson 和 MIT 電腦與 AI 實驗室(CSAIL)副主任，ACM Fellow Daniel Jackson 領銜，BAT、微軟、字節跳動、小米等技術專家將齊聚一堂，共同探討軟體開發的最前沿趨勢與技術實踐。

大會官網： http://sdcon.com.cn/ （可點選 閱讀原文 直達）

蘋果或將在AI領域與Meta合作；OpenAI收購Rockset；Anthropic最新模型已達專業博士水平 | AI頭條