當前位置: 妍妍網 > 資訊

瞬間寫完整個網頁!Claude 3.5 把 OpenAI 藏藏掖掖的 GPT-4o 功能免費公開了出來

2024-06-21資訊

文 | 王啟隆

出品丨AI 科技大本營(ID:rgznai100)

四十天過去了,OpenAI 還是沒把 GPT-4o 演示中的那一系列功能釋出出來。

這四十天,OpenAI 經歷了 Ilya 的離職風波( ),經歷了「 寡姐 」斯嘉麗的聲音糾紛,期間 OpenAI 還特意在歐洲大會上 ,但使用者手中的永遠是 5 月 13 日的那個版本,Sam Altman 就是遲遲未上線完整版的 GPT-4o。

於是乎,OpenAI 的「 一生之 」 Anthropic 再次站了出來,這家生而為打擊 OpenAI 安全問題的公司,昨晚正式釋出了 Claude 3.5 的「大杯」模型 —— Claude 3.5 Sonnet

Claude 3 系列模型的命名向來遵循了一種富有詩意的規則,反映了模型的效能層次和用途,同時也借用了文學形式的名稱來賦予每種型號獨特的含義,比如 Haiku 代表著日本俳句,短小精悍;這次釋出的 Sonnet 代表義大利的「十四行詩」,結構復雜,在智慧水平、功能多樣性和處理能力上都有所提升,能夠應對更復雜的認知任務,提供更高品質的輸出;「超大杯」的 Opus 則是指義大利語的「作品」,最為全面,可以用一個「強」字來形容。

Claude 3.5 Sonnet 作為 Claude 3.5 系列的第一個模型版本 行業智慧水平上取得了顯著提升 它不僅 超越了競爭對手的效能,還超越了自家 的上一代「超大杯」 Claude 3 Opus ,同時保持了與中端模型 Claude 3 Sonnet 相同的速度和成本優勢

3.5 對比 3,相當的等級森嚴。

效能漲了,但價格方面還是之前 Sonnet 的「大杯」水平。

和藏藏掖掖的 GPT-4o 完整版不同, 海外使用者現在就 可以在 claude.ai 官網和 Claude iOS 套用上使用 Claude 3.5 Sonnet,目前開放了 5 天免費試用 —— 這點相當值得一提,因為 Claude 3 釋出的時候 Anthropic 還沒開發完 iOS 套用,而這一次則是直接同步上線了,蘋果使用者狂喜。

此外,訂閱了 Claude Pro 和 Team 計劃的使用者還可以在更高的速率限制下存取。Claude 3.5 Sonnet 還透過 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 提供,其成本為 每百萬輸入 tokens / 3 美元 每百萬輸出 tokens / 15 美元 ,並支持 200K tokens 的上下文視窗。

我把前端和程式設計師一起塞到了這款 AI 裏面

首先,直接進入標題的重點。 Claude.ai 這次最勁爆的釋出當屬全新的 Artifacts 功能,它擴充套件了使用者與 Claude 互動的方式。

記得手動開啟

當使用者請求 Claude 生成程式碼片段、文本文件或網站設計等內容時,這些 Artifacts 會出現在對話旁的專用視窗中。

Source:Twitter user @op7418

這相當於建立了一個動態工作空間,使用者可以即時檢視、編輯和構建 Claude 的創作過程,將 AI 生成的內容無縫整合到他們的計畫和工作流程中。

官方演示視訊:

這個預覽功能標誌著 Claude 從「 對話式 AI 」向「 協作工作環 」的轉變。這只是 Claude.ai 更廣闊願景的開始,很快將擴充套件到支持 團隊協作 。未來,整個團隊甚至整個組織都能在一個共享空間中安全地集中他們的知識、文件和正在進行的工作,而 Claude 也將成為一個按需的團隊成員。

如果你還沒看過癮,以下還有更直觀的視訊,體現了 Claude 瞬間寫完網頁的速度:

Source: Twitter user @genie0309

從敲程式碼到渲染網頁只需要 30 秒,我們人類只需要看著就行了。

另外不得不提的是,這個功能其實也是 OpenAI 曾在巴黎大會的時候演示過的,詳情可以看我們先前整理的【 】。現在,Anthropic 的 Artifacts 實作了同樣的效果,並且免費可用

OpenAI 的 Romain Huet 在演示中只用一張嘴指揮 4o 寫完程式碼

OpenAI 不敢放的多模態能力,我來放!

下面來了解一下 Claude 3.5 Sonnet 的一些基礎能力。 Sonnet 在 研究生級推理 (GPQA)、 本科級知識 (MMLU)和 編程能力 (HumanEval)方面都設立了全新的行業標準。它在理解細微差別、幽默和復雜指令方面有顯著提高,並能以自然、易於理解的語調撰寫高品質內容。其執行速度是 Claude 3 Opus 的兩倍,效能提升與成本效益相結合,使 Claude 3.5 Sonnet 成為復雜任務的理想選擇,例如上下文敏感的客戶支持和多步驟工作流程的管理。

既然 Sonnet 沒能趕上中國高考,我們不妨給它補測一下:

一共 933 字,符合要求,你打幾分?

在內部的編程評估中,Claude 3.5 Sonnet 解決了 64% 的問題,優於 Claude 3 Opus 的 38%。 評估測試了模型在給定自然語言描述的情況下修復錯誤或添加功能到開原始碼庫的能力。 提供相關工具和指令時,Claude 3.5 Sonnet 能獨立編寫、編輯和執行程式碼,具有復雜的推理和故障排除能力,能輕松處理程式碼轉譯,使其在更新遺留應用程式和遷移程式碼庫方面特別有效。

再來看看 GPT-4o 最讓人印象深刻的點,同時也是 Claude 3.5 系列的重頭戲—— 多模態 。Claude 3.5 Sonnet 號稱 Claude 系列 目前最強大的視覺模型 ,在標準視覺基準測試中超越了 Claude 3 Opus。

官方視訊如下:

這一代顯著的改進在需要視覺推理的任務中尤為明顯,例如解釋圖表和圖形。Claude 3.5 Sonnet 還能準確地從不完美的影像中轉錄文本,這在零售、物流和金融服務領域尤為重要,因為 AI 能從影像、圖表或插圖中獲取比單純文本更多的見解。

Claude 團隊還在開發新的功能和模式,以支持更多商業用例,包括 與企業套用的整合 。團隊還在探索記憶功能,這將使 Claude 能夠記住使用者的偏好和互動歷史,從而使體驗更加個人化和高效。

為了不斷改善智慧、速度和成本之間的權衡, Claude 3.5 系列的最後兩款模型 Claude 3.5 Haiku 和 Claude 3.5 Opus 將在今年晚些時候釋出

【開發者福利】

這麽強的模型,使用入口在哪呢?前文已經提到,除了直接透過官網 claude.ai 存取,國內開發者還可以選擇透過 Amazon Bedrock 立即試用 Claude 3.5 Sonnet,無需註冊帳號。

Amazon Bedrock 支持的模型

據亞馬遜雲科技 官方 表示, Amazon Bedrock 和第三方模型僅在亞馬遜雲科技海外區域可用,亞馬遜雲科技中國僅為幫助開發者 解行業前沿技術和發展海外業務選擇推介該服務。但亞馬遜雲科技也為開發者申請到了測試資源,短期開放、立即可用, 歡迎大家 透過下面的連結存取使用:

https://portal.cloudassist-beta.sign-up.china.aws.a2z.com/demo/qrcode?trk=asdfghjkl12345

由 CSDN 和 Boolan 聯合主辦的「2024 全球軟體研發技術大會(SDCon)」將於 7 月 4 - 5 日在北京威斯汀酒店舉行。

由世界著名軟體架構大師、雲原生和微服務領域技術先驅 Chris Richardson 和 MIT 電腦與 AI 實驗室(CSAIL)副主任,ACM Fellow Daniel Jackson 領銜,BAT、微軟、字節跳動、小米等技術專家將齊聚一堂,共同探討軟體開發的最前沿趨勢與技術實踐。

大會官網: http://sdcon.com.cn/ (可點選 閱讀原文 直達)