整理 | 王啟隆
出品 | AI 科技大本營(ID:rgznai100)
最近,Anthropic 的 Claude 在全球的 AI 社群聲勢浩大。
一方面是 OpenAI 放了太久的鴿子,在年初釋出 Sora 和 GPT-4o 之後一直藏著捏著,而 CEO Sam Altman 則減少了發言量,各類活動都推 CTO Mira Murati 到台前受訪。Murati 也不是省油的燈,一直不透露 Sora 的釋出日期,更是在近期的一場活動中圍繞下一代 GPT 的問題連續回復了三次「我不知道」:
主持人:連你都不知道?(詳見 )
而另一方面,就單純是因為最新的 Claude 3.5 Sonnet 太好用了,許多國外開發者對其贊不絕口。在這段時間,Anthropic 趕著這個勢頭,更新頻率異常之快,除了前段時間更新了 Artifacts 的分享 功能,還在今天正式放出了最大輸出為 8K Token 的模型:「 max-tokens-3-5-sonnet-2024-07-15 」。這意味著可以使用 Claude 3.5 Sonnet 輸出更長的文章或者編寫更復雜的 Artifacts。
目前只需要在 Claude API 中更換 header 和 max_tokens 即可,或者是在 Anthropic Console 中進行測試。
底下的開發者也都非常興奮,紛紛表示這可以改變 AI 生成程式碼的遊戲規則。
Claude 系列模型最新的這個「Artifacts」功能,究竟為什麽能被全球開發者吹得神乎其技?為此,我們也搞來了免費版的 Claude 3.5 Sonnet,打算親自試一試。
所謂 Artifacts,就是指在我們熟悉的聊天視窗 右邊再多加一個特殊的視窗,這個視窗會在你用 AI 進行程式碼生成的時候展示程式碼,生成結束後還能將程式碼渲染成網頁。
比方說,我們先讓 Claude 建立一個 AI 新聞網站 , 他不會像 ChatGPT 那樣直接在聊天對話方塊直接開始生成大量的程式碼,而是在右邊的 Artifacts 視窗裏進行工作:
最後,Claude 可以直接把後續工作也一起完成,直接在 Artifacts 視窗提供了一個我想要的新聞網頁:
當然,由於我的 Prompt 非常簡陋,它生成的網頁自然也很難看。而 Claude 也自行猜 測了我的下一步建議,並詢問我要不要進一步改善網頁,比如添加更多的新聞文章和內容、改進網站的設計和樣式、添加動態功能( 如新聞訂閱、評論系統 ),或是考慮使用內容管理系統(CMS)來更方便地管理網站內容等等。
於是,我直接復制貼上了 Claude 提供的建議,讓它進一步改善程式碼:
現在這個樣子,相比最開始那種黑白色是好看多了。如果我們進一步要求 Claude,他就會開始將其視為復雜的計畫,並分前後端的實作進行討論,相當專業 —— 當然,這就需要更長的上下文,所以今天才有開發者說,8K Token 是「 改變了 AI 生成程式碼的遊戲規則 」。
而隨著 Artifacts 開放了分享功能,大家現在可以復制別人的 Artifacts 連結,直接拿到自己的 Claude 網頁端上進行復現。比方說,我剛剛從頭到尾只想了第一句話,剩下全部交給 Claude 完成的這個網頁,就能直接變成連結開啟:
在開發者社群,現在還有非常多的有趣 Artifacts 用例,比方說,下面這位開發者直接靠 Claude 搓出了一個魔術方塊程式:
Artifacts 連結: https://claude.site/artifacts/0a4a1e14-85d8-4169-b251-6ceebda740cb
或者是由日本開發者制作的這款小遊戲【Flappy Chicken】:
Artifacts 連結: https://claude.site/artifacts/0e67b4a8-c21e-40f6-a40f-3a031b46501f
看到這可能有人要問,這些小網頁和小遊戲,不是 GPT-4 早就能做到的嗎?
沒錯,但 Anthropic 的聰明之處就在於,他們不止甘心於「做到」,還讓使用者能「看到」。Artifacts 會出現聊天界面旁邊,這樣你能夠即時檢視、叠代和建立自己的作品,因此 Claude 事實上是從普遍意義上的對話機器人前進演化為協作式工作環境。
Artifacts 最終代表著一個方向,它能讓編程小白首先享受到生成套用的樂趣,而不是卡在部署程式碼這一步碰壁。在【 】一文中,資深程式設計師天豬老師就表示 Artifacts 的特色在於 將程式碼執行過程 視覺化,引入了雙向互動機制 。傳統的程式碼直譯器僅負責程式碼執行,無法直觀觀察執行細節,而 Artifacts 額外提供了互動層,使得程式碼執行和結果展示過程變得生動直觀,極大提升了使用者體驗。
不 過,以上的例子都還屬於玩票性質,對於程式設計師來說,究竟要怎麽把 Artifacts 套用到自己的實際開發過程呢?事實上,今天還有一則新聞,便是 Claude Engineer 2.0 的正式釋出和開源。這是 EverArt AI 創始人 Pietro Schirano 操刀的一個開源計畫,目前為止已經 在 GitHub 斬獲了 3.2k 的 Stars 。
計畫連結: https://github.com/Doriandarko/claude-engineer
Pietro Schirano(左一)在 GPT-4o 釋出當晚的現場
想象一下,如果能在命令列整合 Claude 3.5 Sonnet,一邊生成 Artifacts,一邊結合圖片,然後讓人類幹預操作修改整個計畫程式碼,最終完成一個生產級別的計畫,會是一種怎麽樣的體驗?
這就是 Claude Engineer 的最初理念:打造一款先進的 互動式命令列界面 (CLI),利用 Claude 3 和 Claude 3.5 模型的強大功能來協助完成各種軟體開發任務。這款開源工具將最先進的大型語言模型的功能與實用的檔案系統操作、網路搜 索功能、智慧代分碼析和執行功能完美地結合在一起。
先來個視訊,看看這個開源計畫到底是做啥的:
這次重大更新引入了程式碼編輯器、程式碼執行代理以及動態編輯等革命性功能,大幅提升了開發者的工作效率。下面,讓我們深入了解這款強大工具的核心特性和使用體驗:
智慧程式碼編輯與執行
Claude Engineer 2.0 最引人註目的特性之一是其智慧程式碼編輯和執行能力。在處理大型檔時,Engineer 會指揮編碼代理,根據檔復雜度智慧地分批提供修改建議。這種方法不僅提高了效率,還確保了修改的準確性和連貫性。
與此同時,程式碼執行代理能夠執行程式碼並檢查潛在問題。它甚至可以啟動和終止行程,比如即時伺服器,這對於 Web 開發者來說是一個極其有用的功能。這種智慧化的程式碼管理和執行方式,極大地簡化了開發流程,讓開發者能夠更專註於創意和核心邏輯的實作。
多智慧體(Agent)系統與 Auto Mode
Claude Engineer 2.0 充分利用了 Claude 3.5 Sonnet 強大的程式碼能力,結合多智慧體系統,實作了令人印象深刻的 Auto Mode 功能。在這種模式下,開發者只需釋出命令,AI 就能自動解決問題、修改目錄結構、輸出程式碼。這種自動化程度的提高,大大減少了開發者的重復性工作。
同時,Claude Engineer 2.0 也保留了人類幹預的可能性。開發者可以透過上傳圖片或提供檔地址來輔助 AI 更好地理解和執行任務。這種人機協作的模式,既發揮了 AI 的高效性,又保證了人類開發者對整個過程的掌控。
互動式命令列界面
Claude Engineer 2.0 提供了一個功能強大的命令列界面(CLI),使開發者能夠與 Claude 進行高效的互動。透過簡單的命令,開發者可以完成各種復雜的任務,例如:
為 Web 應用程式建立新的 Python 計畫結構
解釋特定檔的程式碼並提出改進建議
偵錯錯誤資訊
分析影像並描述其內容
執行 Python 程式碼並分析結果
會話管理與資源監控
為了提高工作的連續性和可追溯性,Claude Engineer 2.0 引入了會話管理功能。開發者可以透過輸入"save chat"命令,將整個對話保存為 Markdown 檔。這一功能使得開發者可以輕松地在不同時間恢復之前的工作上下文,大大提高了長期計畫的管理效率。
此外,Claude Engineer 2.0 還提供了詳細的資源使用監控。它會顯示每個模型和代理使用的輸入輸出 token 數量,以及整個對話的總 token 數和相應成本。在每次互動後,系統還會顯示 token 使用情況、耗時和模型剩余視窗大小,方便開發者進行後續操作規劃。
安全性和效能最佳化
在註重功能的同時,Claude Engineer 2.0 也沒有忽視安全性。所有程式碼都在預定義的虛擬環境中執行,確保了執行過程的安全性。系統能夠在需要時安全地安裝依賴,為開發者提供一個可靠的程式碼執行環境。
在效能方面,Claude Engineer 2.0 也在今天光速支持了我們在文章開頭提到的 Anthropic 官方更新: 超過 8000 token 的輸出 。這大大增加了單次互動的資訊量。同時,它還支持模型呼叫程式碼執行工具來執行程式碼或長任務,從而能夠更高效地分析程式碼並給出簡潔的建議。
值得一提的是,Claude Engineer 2.0 的開發過程中涉及了大量的"提示系統工程"(Prompt System Engineering)理念。開發者們可以透過研究其原始碼,深入了解這一強大工具的工作原理,從而在自己的計畫中套用這些先進的概念。
正如制作人所說: 這個計畫投入了大量精力。這是我給社群的禮物,讓人們能夠創造一個每個人都能創造任何夢想的未來。
既可以玩,又能拿來生產,Anthropic 這次打出的「 大殺招 」 Artifacts 是真正擊中了 OpenAI 的要害了。 隨著 Claude 和 Claude Engineer 這類計畫的不斷完善和普及,我們有理由相信,軟體開發的未來將變得更加智慧、高效,讓更多的創意得以實作。
大模型重新整理一切,讓我們有著諸多的迷茫,AI 這股熱潮究竟會推著我們走向何方?面對時不時一夜變天,焦慮感油然而生,開發者怎麽能夠更快、更系統地擁抱大模型?【新程式設計師 007】以「大模型時代,開發者的成長指南」為核心,希望撥開層層迷霧,讓開發者定下心地看到及擁抱未來。
讀過本書的開發者這樣感慨道:「讓我驚喜的是,中國還有這種高品質、貼近開發者的雜誌,我感到非常激動。最吸引我的是裏面有很多人對 AI 的看法和經驗和一些采訪的內容,這些內容既真實又有價值。」
能學習到新知識、產生共鳴,解答久困於心的困惑,這是【 】的核心價值。歡迎掃描下方二維碼訂閱紙書和電子書。