當前位置: 妍妍網 > 資訊

國產開源模型編程能力躍居全球第二;GPT-4已透過圖靈測試 | AI頭條

2024-06-18資訊

整理 | 王軼群

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • AI 視訊生成初創公司 Runway 宣布將推出新的視訊生成模型 Gen-3 Alpha

  • DeepMind 正在開發 AI 技術,利用視訊的原始像素生成同步音軌

  • DeepSeek-Coder-V2 正式上線並開源

  • Google 在印度推出適用於 Android 的 Gemini 套用,支持英語及九種本地語言

  • 人工智慧教父 Geoffrey Hinton 加入英國綠色材料初創公司 CuspAI 顧問委員會

  • 研究人員表示 GPT-4 已經透過了圖靈測試

  • ChatGPT 時隔兩周再次出現重大故障

  • Constructor 以 5.5 億美元的估值籌集了 2500 萬美元的 B 輪融資

  • Adobe 升級 Acrobat AI 聊天機器人,添加多文件分析、影像生成功能

  • 微軟率先向Copilot+裝置推播 Win11 24H2 更新

  • 全球 AI 要聞

    AI 視訊生成初創公司 Runway 宣布將推出新的視訊生成模型 Gen-3 Alpha

    當地時間6月17日,AI視訊生成初創公司Runway在官網宣布,即將推出新的視訊生成模型Gen-3 Alpha,該模型可以建立具有復雜場景變化、多種電影風格和詳細藝術指導的高精細視訊。

    目前Gen-3還未開放給公眾試用,但在官網的部落格中,Runway秀出了數十個精彩的生成視訊,無論是光線、色彩、運動軌跡、人物細節都非常逼真,有行業人士表示一些視訊是Sora級別的品質。

    Runway表示,Gen-3 Alpha是即將推出的一系列模型中的第一個,這一系列模型是在為大規模多模態訓練而構建的新基礎設施上訓練的。Gen-3 Alpha 經過視訊和影像聯合訓練,將為 Runway 的文本轉視訊、影像轉視訊和文本轉影像工具、現有控制模式(如運動畫筆、高級相機控制、導演模式)以及即將推出的工具提供支持,以更精細地控制結構、風格和運動。

    DeepMind 正在開發 AI 技術,利用視訊的原始像素生成同步音軌

    谷歌人工智慧研究實驗室 DeepMind 表示正在開發用於為視訊生成配樂的人工智慧技術。DeepMind 在其官方部落格上發表的一篇文章中表示,它認為 V2A(「視訊轉音訊」的縮寫)技術是 AI 生成媒體拼圖的重要組成部份。雖然包括 DeepMind 在內的許多組織都開發了視訊生成 AI 模型,但這些模型無法建立與其生成的視訊同步的音效。DeepMind 寫道:「視訊生成模型正在以驚人的速度發展,但許多當前系統只能生成無聲輸出。V2A 技術 [可能] 成為一種讓生成的電影栩栩如生的有前途的方法。」

    DeepMind 的 V2A 技術將背景音樂的描述(例如「水下脈動的水母、海洋生物、海洋」)與視訊配對,以建立與視訊中的人物和語調相匹配的音樂、音效甚至對話,並透過 DeepMind 的反深度偽造 SynthID 技術進行浮水印處理。DeepMind 表示,驅動 V2A 的 AI 模型(一種擴散模型)是在聲音和對話記錄以及視訊片段的組合上進行訓練的。DeepMind 表示:「透過對視訊、音訊和附加註釋進行訓練,我們的技術學會將特定的音訊事件與各種視覺場景聯系起來,同時對註釋或記錄中提供的資訊做出響應。」訓練數據是否受版權保護以及數據建立者是否知曉 DeepMind 的工作,目前還不得而知。(TechCrunch)

    DeepSeek-Coder-V2 正式上線並開源

    6月17日晚,DeepSeek-Coder-V2,正式上線和開源。 據官方介紹,DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型結構,總參數 236B,啟用 21B,在編碼、數學的多個榜單上位居全球第二,介於 GPT-4o 和 GPT-4-Turbo 之間。

    (圖片來源:DeepSeek 官方)

    官方表示,DeepSeek-Coder-V2 還具有良好的通用效能,在中英通用能力上位列國內第一梯隊。

    據介紹,開源模型包含236B和16B兩種參數規模:

  • DeepSeek-Coder-V2:總參 236B(即官網和 API 版模型),單機 8*80G 可部署,單機 8*80G 可微調(需要技巧)

  • DeepSeek-Coder-V2-Lite:總參 16B,啟用 2.4B,支持 FIM,程式碼能力接近 DeepSeek-Coder-33B(V1),單卡 40G 可部署,單機 8*80G 可訓練。

  • 模型下載:

    https://huggingface.co/deepseek-ai

    程式碼倉庫:

    https://github.com/deepseek-ai/DeepSeek-Coder-V2

    技術報告:

    https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf

    Google 在印度推出適用於 Android 的 Gemini 套用,支持英語及九種本地語言

    6月18日,谷歌宣布在印度推出適用於 Android 的 Gemini 套用,支持英語和其他九種語言:印地語、孟加拉語、古吉拉特語、卡納達語、馬拉雅拉姆語、馬拉地語、坦米爾語、泰盧固語和烏爾都語。

    Gemini 套用和Gemini Advanced均支持 9 種印度語言,讓使用者可以存取 Google 最強大的 AI 模型,幫助更多人以自己喜歡的語言獲取資訊和完成任務。此外,谷歌表示還將解鎖 Gemini Advanced 中的新功能,例如新的數據分析功能和檔上傳,並推出在 Google Messages 中與 Gemini 聊天的功能,首先支持英語。

    谷歌表示,使用者要在 Android 上存取 Gemini,需下載Gemini 套用或透過 Google Assistant 選擇加入。在 iOS 上,Gemini 存取將在未來幾周內直接從Google 套用推出。

    谷歌表示將 Gemini 1.5 Pro 的功能引入到 Gemini Advanced。擴充套件的容量為 Gemini Advanced 解鎖了新功能:

  • 文件上傳:上傳多個大型文件(總計最多 1,500 頁)或匯總 100 封電子信件。然後,Gemini Advanced 可以提供快速摘要、個人化反饋和可操作的見解,從而節省使用者的時間並提高使用者的工作效率。

  • 數據分析:透過上傳電子試算表(Google 表格、CSV、Excel)處理復雜的數據分析任務。Gemini Advanced 現在可以清理、探索、分析和視覺化使用者的數據,將其轉換為互動式圖表和圖形。

  • 谷歌還強調:「與往常一樣,私密是重中之重。Gemini 會將使用者的檔保密,並且不會使用它們來訓練我們的模型。」

    人工智慧教父 Geoffrey Hinton 加入英國綠色材料初創公司 CuspAI 顧問委員會

    總部位於劍橋的 CuspAI 正在開發用於設計新材料的人工智慧技術,該公司籌集了 3000 萬美元的種子資金,並已將 Geoffrey Hinton 納入其顧問委員會

    前谷歌人工智慧研究員將與 CuspAI 合作,該公司已籌集 3000 萬美元,用於利用人工智慧設計的材料應對氣候變遷。CuspAI 是一家開發新材料設計演算法的英國初創公司,在其首輪融資中籌集了 3000 萬美元,並招募了人工智慧先驅 Geoffrey Hinton 加入其顧問委員會。

    CuspAI 在6月18日的一份聲明中表示,該公司利用生成式人工智慧和分子模擬作為材料「搜尋引擎」。Hinton 是一位電腦科學家,經常被稱為「人工智慧教父」之一,自去年離開 Alphabet Inc. 旗下的谷歌以來,他一直在精挑細選自己的顧問。(彭博社)

    研究人員表示 GPT-4 已經透過了圖靈測試

    據報道,OpenAI 去年 3 月份推出的大語言模型 GPT-4,在研究人員所進行的實驗中的表現雖然還不及人類參與者的平均水平,但已達到了圖靈測試的透過標準。而最終的結果表明,GPT-4 在 54% 的時間裏被誤認為是人類,此前推出的GPT-3.5 則是在 50% 的時間裏被誤認為是人類,沒有大語言模型或神經網路支持的 ELIZA,則是在 22% 的時間裏被誤認為是人類。當時並未釋出 GPT-4o,如果參與測試,被誤認為人類的結果可能更高。

    圖靈測試 "由電腦科學家阿蘭·圖靈於 1950 年首次提出,被稱為 "模仿遊戲",用於判斷機器顯示智慧的能力是否與人類無異。要想透過圖靈測試,機器必須能夠與人交談,並騙得對方以為它是人類。(Live Science)

    ChatGPT 時隔兩周再次出現重大故障

    6 月 17 日,OpenAI 的 ChatGPT 出現故障,使用者報告無法應答問題,展示錯誤答案。OpenAI 確認問題並調查故障率偏高。至 17:00,所有系統恢復運轉,使用者報錯頻率下降。ChatGPT 3.5 和 ChatGPT 4 能生成包括影像的答案。

    Constructor 以 5.5 億美元的估值籌集了 2500 萬美元的 B 輪融資

    總部位於舊金山的 Constructor 是一家面向企業電子商務公司的人工智慧產品發現和搜尋平台,該公司已完成 2500 萬美元的 B 輪融資。Sapphire Ventures(投資了 Alation 和 FloQast)領投了此輪融資,現有投資者 Silversmith Capital Partners 也參與其中。此輪融資使該公司的估值達到 5.5 億美元,該公司籌集的總資金為 8500 萬美元。(Tech Funding News)

    Adobe 升級 Acrobat AI 聊天機器人,添加多文件分析、影像生成功能

    Adobe 的 Acrobat PDF 編輯器將從明天開始推出新的 AI 功能,包括影像生成器。AI助手將支持同分時析多個文件,並擴充套件對PDF以外檔型別的支持。該公司堅稱,它永遠不會存取使用者數據來訓練任何 AI 模型。

    Adobe 宣布對其 PDF 編輯軟體 Acrobat 中的 AI Assistant 功能進行重大升級。此次更新是繼 2 月份推出的 Assistant 之後進行的,當時 Assistant 推出了 AI 生成的摘要和可以回答有關大量文件內容問題的聊天機器人。從6月18日開始,Adobe 將增強這個聊天機器人的功能,增加同分時析和查詢多個文件的能力。

    Acrobat 還獲得了由該公司 Firefly 模型驅動的AI 影像生成器。Adobe 已經在 Photoshop 和 Illustrator 中擁有一套由 AI 驅動的生成式編輯功能,並且還將這些功能引入 Acrobat。使用者將能夠從影像中刪除背景或直接在現有 PDF 文件中進行細微更改。Adobe 表示,其生成式 AI 模型「對工作來說是安全的」,這意味著它們不會侵犯使用者的私密或建立可能影響品牌形象的影像。(Android Authority)

    微軟率先向Copilot+裝置推播 Win11 24H2 更新

    微軟表示,Windows 11 的 24H2 版本目前位於釋出預覽頻道,且「僅適用於 Copilot+ PC 裝置」。微軟將 Windows 的未來劃分為兩個使用者群體:擁有 AI 驅動的 Copilot+ PC 的使用者和沒有該 PC 的使用者。微軟現在表示,最新版本的 Windows 11(即 Windows 11 版本 24H2)將僅提供給擁有 Copilot+ PC 的使用者。微軟於當地時間6月15日表示,該公司現已恢復向釋出預覽頻道推出 Windows 11 版本 24H2,版本號為 26100.863。但在一份支持說明中,微軟補充道:「重要提示:Windows 11 版本 24H2 僅適用於 Copilot+ PC 裝置。」

    除了遊戲方面的修復,微軟還將 Copilot 功能從工作列分離,使其變為一個可單獨添加或移除的套用圖示。人工智慧功能仍然深度整合於系統之中,例如 Copilot+ 裝置內建的神經網路處理單元 (NPU) 可以幫助使用者在「畫圖」和「照片」等套用中添加或移除影像背景。

    訊息人士透露,微軟仍計劃在 9 月底或 10 月初向使用英特爾和 AMD 處理器的電腦推播 Windows 11 24H2 的正式更新。目前該更新也可以在內部測試計劃頻道中獲取,但仍存在一些潛在效能問題,例如畫面卡頓和幀率下降,建議使用者謹慎更新。(PCWorld、IT 之家)

    由 CSDN 和 Boolan 聯合主辦的「2024 全球軟體研發技術大會(SDCon)」將於 7 月 4 - 5 日在北京威斯汀酒店舉行。

    由世界著名軟體架構大師、雲原生和微服務領域技術先驅 Chris Richardson 和 MIT 電腦與 AI 實驗室(CSAIL)副主任,ACM Fellow Daniel Jackson 領銜,BAT、微軟、字節跳動、小米等技術專家將齊聚一堂,共同探討軟體開發的最前沿趨勢與技術實踐。

    大會官網: http://sdcon.com.cn/ (可 點選 閱讀原文 直達