高考作文熱議人工智慧；Qwen 2 登頂 Hugging Face

2024-06-07資訊

整理 | 王啟隆

出品 | AI 科技大本營（ID：rgznai100）

一分鐘速覽新聞點！

高考作文聚焦人工智慧，引發教育與科技融合新思考

阿裏雲 Qwen2 正式開源，登頂 Hugging Face 榜首！

快手 AI 視訊生成模型「可靈」震撼釋出

Chrome 要更卡了？谷歌在 Chrome 瀏覽器內建 Gemini Nano 大模型

微軟、OpenAI 和 NVIDIA 將被同時進行反壟斷調查

「創意避風港」 Cara 套用爆紅，50 萬藝術家為防 AI 抓取原創內容集體出走

OpenAI 已解散的「超級對齊團隊」論文揭示 AI 模型內部運作機制

OpenAI 官方回應【對人工智慧提出警告的權利】聯名公開信

Meta 計劃推出 WhatsApp功能

專家團隊揭示 MMLU 基準測試錯誤，推出 MMLU-Redux 提升 AI 評估準確性

「AI 程式設計師」 Devin CEO 最新訪談：估值 20 億美元，賦能部份企業完成了數千小時計畫

谷歌新論文揭示：開放性是實作超級人工智慧的關鍵

全球 AI 要聞

高考作文聚焦人工智慧，引發教育與科技融合新思考

今日，2024 年全國高考語文科目落下帷幕，其中新課標 I 卷的作文題目迅速成為社會關註的熱點。作文材料指出，隨著互聯網技術的飛速發展與人工智慧的廣泛套用，人們能夠以前所未有的速度獲取知識、找到問題的答案。這一現象引發了對於未來學習方式、問題解決機制乃至人類智慧發展路徑的深刻思考。作文要求考生在體驗了資訊時代便捷的同時，探討在這一背景下，人類面臨的問題是否真的會越來越少。

阿裏雲 Qwen2 正式開源，登頂 Hugging Face 榜首！

阿裏雲在 AI 領域投下震撼彈，正式宣布 Qwen2 系列大型語言模型的面世，並同步在 Hugging Face 及 ModelScope 平台上開源共享。此次升級包含了從 Qwen2-0.5B 至 Qwen2-72B 在內的五個不同規模的預訓練與指令微調模型，展示了阿裏雲在自然語言處理技術的最新突破。 Qwen2 的上下文處理能力最大支持擴充套件至 128K tokens，還引入了對 27 種新語言的高品質數據訓練，極大地拓寬了其套用範圍和國際化視野。

尤為引人註目的是，Qwen2-72B 模型釋出僅兩小時後，Hugging Face 執行長 Clément Delangue 即刻發推宣告，該模型已榮登其平台開源大模型效能榜單首位，超越了先前的領頭羊，包括效能卓越的 Llama3-70B。這標誌著 Qwen2 系列不僅在多語言支持、程式碼及數學能力上顯著增強，更在綜合評測中展現出了前所未有的優越效能。

GitHub： https://github.com/QwenLM/Qwen2

Hugging Face： https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

快手 AI 視訊生成模型「可靈」震撼釋出

近日，國內互聯網巨頭快手正式推出其自主研發的視訊生成大模型——「可靈」。作為對國際頂尖水平的對標之作，該模型在技術實作采用 OpenAI Sora 的 DiT 架構，彰顯了快手在 AI 技術創新的強勁實力。

「可靈」不僅能夠創造出長達 2 分鐘、高分辨率的流暢視訊內容，還獨有模擬現實物理特性的高級功能，使得生成視訊中的運動表現更為自然合理。目前，使用者可透過快影 APP 搶先體驗 720P 視訊生成，未來豎版視訊生成也將開放，為內容創作者提供更多可能。

此外，快手同步上線了「AI 舞王」等創新套用，讓「可靈」技術快速觸達廣大使用者群體，標誌著這一前沿技術從實驗室走向市場的飛躍。

Chrome 要更卡了？谷歌在 Chrome 瀏覽器內建 Gemini Nano 大模型

近日，Google Chrome 瀏覽器迎來重大更新，宣布內建 Gemini Nano 大模型。Gemini Nano 作為 Gemini 系列中最高效的模型版本，專為現代桌面和膝上型電腦設計，可在本地執行，無需伺服器支持，為網站和網路套用提供無縫的 AI 驅動體驗。以往，大型 AI 模型的套用受限於模型體積龐大及需單獨下載的不便，但 Chrome 的新舉措透過瀏覽器內建 API，直接整合包括大語言模型（LLMs）在內的 AI 模型，解決了這一難題。這意味著，開發者無需部署或管理自己的 AI 模型，即可享受 AI 帶來的便利。

官方表示："我們正開發的 Web 平台 API 和瀏覽器特性旨在將 AI 模型直接融入瀏覽器，使內建 AI 成為可能。Gemini Nano 讓您的網站或套用在不承擔大型模型部署與管理的情況下，實作 AI 功能。"

OpenAI 已解散的「超級對齊團隊」論文揭示 AI 模型內部運作機制

近日，OpenAI 釋出了一篇備受關註的研究論文，揭示了其大語言模型 ChatGPT 背後的運作機制。據悉，這項研究由已解散的「超級對齊」團隊完成，旨在解決人工智慧帶來的潛在風險。論文中，研究人員提出一種逆向工程 AI 模型的方法，透過辨識模型中代表特定概念的模式，來揭示其內部運作原理。

論文連結： https://cdn.openai.com/papers/sparse-autoencoders.pdf

微軟、OpenAI 和 NVIDIA 將被同時進行反壟斷調查

聯邦貿易委員會（FTC）和 DOJ 目前正在討論由誰來以反壟斷為由調查微軟、OpenAI 和 NVIDIA 之間的合作關系。今年 1 月， FTC 開始調查科技公司對小型 AI 公司投資的潛在反壟斷問題。該機構向 Alphabet、亞馬遜、Anthropic、微軟和 OpenAI 發出了信函。谷歌母公司 Alphabet 和亞馬遜都是 Anthropic 的投資者。微軟向 OpenAI 投資了數十億美元，並將其技術深度整合到自己的服務中，這引起了人們對潛在反競爭行為的擔憂。兩家機構都在努力確定管轄權，這使得正式調查程式被推遲。目前，三家公司對此事都未予置評。

「創意避風港」 Cara 套用爆紅，50 萬藝術家為防 AI 抓取原創內容集體出走

在 Meta 旗下 Instagram 平台宣布利用使用者內容訓練 AI 模型後，藝術家群體中掀起了一股向新興社交套用 Cara 遷移的浪潮。Cara 承諾打造一個尊重創作者權益的平台，透過自動附加 "NoAI" 標簽保護藝術家作品，防止被人工智慧抓取用於訓練，即便這一措施更多在於表達立場而非法律約束。這一創新舉措迅速吸引了大量使用者，短短數日內使用者量激增三倍，突破 30 萬大關，躍居美國 App Store 社群網路類榜首，超越了 Twitter、Discord 等知名套用。隨後，該套用在今天正式突破了 50 萬使用者大關。

盡管面臨伺服器崩潰的技術挑戰和高昂的運維成本——每月需支付 13,500 美元以維持資料庫執行，創始人 Jingna Zhang 表示，她已自掏腰包支持該計畫超過一年，將其視為尊重創意者權利的熱情計畫。為應對突發流量和確保服務穩定，團隊緊急升級伺服器七次，並在社交媒體上發起眾籌。

OpenAI 官方回應【對人工智慧提出警告的權利】聯名公開信

6 月 4 日釋出的【對人工智慧提出警告的權利】的公開信，是人工智慧行業員工就人工智慧的危險的一次公開發聲，11 名現任與前 OpenAI 員工、兩名谷歌 DeepMind 員工在這封信上簽了名。

對此，OpenAI 公司官方聲明內容如下：

我們為自己能提供能力最強、最安全的人工智慧系統而感到自豪，並堅信我們能以科學的方法應對風險。鑒於 AI 技術的重要性，我們認同公開信中的內容，如何透過嚴肅的討論，對於更好推進 AI 技術發展至關重要。

我們將繼續接觸各國政府、民間社會和世界各地的其他社群，共同營造和諧的 AI 環境。包括匿名誠信熱線、由董事會成員和公司安全領導者參與的安全與安保委員會（ Safety and Security Committee）在內，都是監管 AI 的有效手段。OpenAI 指出在必要的保障措施到位之前，公司不會釋出新的 AI 技術。公司重申支持政府監管，並參與人工智慧安全自願承諾。

對於報復行為的擔憂，發言人證實，公司已解除了所有前員工的非貶損協定，並從標準離職檔中刪除了此類條款。

Meta 計劃推出 WhatsApp功能

近日，科技巨頭 Meta 計劃推出 WhatsApp 功能，包括為印度和新加坡的企業提供人工智慧助手，以及在英語市場制作廣告的人工智慧工具。6 月 6 日，Meta 表示，正在為巴西、印度、印度尼西亞和哥倫比亞的 WhatsApp 企業使用者推出 Meta Verified 計劃，並最終將擴充套件到更多國家。這項服務的訂閱計劃起價為每月 14 美元。該公司還在其面向企業的訊息服務中添加更多功能，並允許企業使用其 API 透過應用程式內的電話為客戶提供服務。（TechCrunch）

專家團隊揭示 MMLU 基準測試錯誤，推出 MMLU-Redux 提升 AI 評估準確性

在 6 月 6 日釋出的一篇名為【Are We Done with MMLU?】的論文中，來自愛丁堡大學、羅馬一大、貝瑞理工大學等多所高校及機構的國際研究團隊，對廣受歡迎的 Massive Multitask Language Understanding (MMLU) 基準測試中存在的錯誤進行了深入分析與揭露。該團隊指出，盡管 MMLU 被廣泛采用以評估大語言模型（LLMs）的能力，但其包含的諸多基準真實錯誤（ground truth errors）卻模糊了模型的真實效能。

研究中一個顯著例子是病毒學子集中的問題，其中 57% 被發現存在錯誤。為解決這一問題，團隊提出了一種全面的錯誤辨識框架，並引入新穎的錯誤分類法。基於此，他們建立了 MMLU-Redux——一個包含 30 個 MMLU 學科領域內 3,000 個經過人工重新註釋問題的子集。使用 MMLU-Redux 進行的實驗結果顯示，與最初報告的模型效能指標存在顯著差異，強調了修訂 MMLU 錯誤問題的必要性，以增強其作為未來評估基準的實用性和可靠性。因此，為了進一步提升數據品質與精確度，團隊開放 MMLU-Redux 接受更多註解貢獻，呼籲學術界和工業界共同參與，推動人工智慧評估標準的精確化與透明化。

論文連結： https://arxiv.org/pdf/2406.04127

數據集： https://huggingface.co/datasets/edinburgh-dawg/mmlu-redux

「AI 程式設計師」 Devin CEO 最新訪談： 估值 20 億美元，賦能 部份企業完成了數千小時計畫

Devin CEO Scott Wu 在接受彭博社采訪時透露了一系列振奮人心的訊息，揭示了其公司背後的科技創新與市場潛力。Wu 表示，透過使用 Devin 平台，部份企業已成功完成了數千小時的計畫，實作了工作效率 5 倍速的飛躍。他強調軟體工程的本質在於攻克深層邏輯難題，而 Devin 正致力於成為這一挑戰的解決方案。

投資界對此反響熱烈，Peter Thiel 的知名風投基金大手筆註資 2100 萬美元，顯示了對 Devin 技術前景的高度認可。令人驚訝的是，這家估值約達 20 億美元的初創公司，團隊規模僅 10 人，成員橫跨紐約與矽谷，展現了極高的效率與創新能力。

Wu 在訪談中未明確透露其核心技術是否為自主研發或是基於某個大語言模型。此外，公司已從 Founders Fund、COSLA 及多個債券方籌集了 1.75 億美元資金，進一步鞏固了其在 AI 技術領域的領先地位。

谷歌新論文揭示：開放性是實作超級人工智慧的關鍵

在 6 月 6 日釋出的最新論文【Open-Endedness is Essential for Artificial Superhuman Intelligence】中，谷歌提出了一項重要論斷，即當前技術要素已齊備，可使人工智慧系統實作開放性（open-endedness），並認為這一特性對於任何人工超級智慧（ASI）而言至關重要。

論文指出，近年來 AI 系統的通用能力經歷了巨大飛躍，這主要得益於在互聯網規模數據上訓練基礎模型。盡管如此，建立能夠自我持續改進、具有開放性的 AI 仍然是一個挑戰。研究團隊首先透過新穎性和可學習性的視角，給出了開放性的一個具體形式化定義。接著，他們描繪了一條通往 ASI 的道路，該路徑基於構建於基礎模型之上的開放性系統，這些系統能夠做出對人類具有重要意義的新發現。

論文最後探討了普遍能力開放性 AI 的安全影響，預測開放性基礎模型將成為未來研究中一個日益重要且關乎安全的領域，預示著在不久的將來，這一領域的研究將取得突破性進展。

論文連結： https://arxiv.org/pdf/2406.04268

開發者正在迎接新一輪的技術浪潮變革。由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的 2024 年度「全球軟體研發技術大會」秉承幹貨實料（案例）的內容原則，將於 7 月 4 日-5 日在北京正式舉辦。大會共設定了 12 個大會主題：大模型智慧套用開發、軟體開發智慧化、AI 與 ML 智慧運維、雲原生架構……詳情👉： http://sdcon.com.cn/

高考作文熱議人工智慧；Qwen 2 登頂 Hugging Face | AI 頭條