當前位置: 妍妍網 > 資訊

OpenAI 釋出全新 GPT-4 Turbo with Vision,網友實測:編碼不如舊版本!

2024-04-10資訊

編譯 | 屠敏

出品 | CSDN(ID:CSDNnews)

今天,OpenAI 宣布 GPT-4 Turbo with Vision 版(具有視覺功能的最新 GPT-4 Turbo 模型)已經透過 OpenAI API 正式上線。

GPT-4 Turbo 是一種強大的多模態模型,能夠處理文本和影像輸入,並憑借其廣泛的常識和先進的推理能力提供準確的輸出。

OpenAI 在去年 11 月的 ,展示了其增強的功能和截至 2023 年 4 月的擴充套件知識庫。憑借 128k 上下文視窗,該模型可以在單個 Prompt 中處理超過 300 頁的文本。

時下這個最新的模型保持了原有 GPT-4 Turbo 的 128k 上下文視窗, 模型訓練的數據截 日期更新為 2023 年 12 月。 而主要更新在於它的視覺功能,可以理解影像和視覺內容。

升級後的 GPT-4 Turbo 模型有望提高效能,並且不久之後也將在 ChatGPT 中推出。

此前,GPT-4 Turbo 的顯著亮點之一是其最佳化的效能,從而大幅降低使用者的成本。與之前的 GPT-4 模型相比,輸入 token 的價格現在降低了三倍,而輸出 token 的成本則降低了一半,這使得此次升級對不少使用者來說既高效又經濟,而且還為各種用例開啟了新大門。

在 X 平台上,OpenAI 也隨之分享了一些開發人員使用該模型的具體方法, 例如,AI 軟體工程助手 Devin 利用 GPT-4 Turbo with Vision 來更好地協助編碼。

健康和健身套用 Healthify 使用 GPT-4 Turbo with Vision 掃描使用者的膳食照片,並透過照片辨識提供對營養的見解。

Make Real 使用 GPT-4 Turbo with Vision 將使用者的草圖轉換成可執行的網站。

一張草圖生成一個網站似乎已經逐漸成為了現實。

不過就在 GPT-4 Turbo with Vision 正式釋出之際,也有一位網友 Paul-Gauthier 對編碼功能展開了評測。

有些出乎意料的是,Paul-Gauthier 稱,「 GPT-4 Turbo with Vision 版本在 aider 的編碼基準套件中的表現比之前所有的 GPT-4 模型都要差。尤其是,與現有的 GPT-4 Turbo "預覽"模型相比,它似乎更容易在編碼方面「偷懶」。

程式碼編輯能力

Aider 依靠程式碼編輯基準來定量評估 LLM 對現有程式碼進行修改的能力。該基準使用 aider 嘗試完成 133 個 Exercism Python 編碼練習(https://github.com/exercism/python)。

對於每個練習,LLM 會嘗試兩次來解決每個問題:

  • 在第一次嘗試中,它將獲得初始存根程式碼和編碼任務的英文描述。如果測試全部透過,我們就完成了。

  • 如果有測試失敗,aider 會向 LLM 發送失敗的測試輸出,並讓它進行第二次嘗試以完成任務。

  • GPT-4 Turbo with Vision 在這項基準測試中的得分僅為 62%,是現有 GPT-4 模型中得分最低的。 其他模型的得分在 63-66% 之間時,這個最新的模型只是稍有退步,與 gpt-4-0613 相比差距並不明顯。

    編碼的惰性測試

    還記得彼時 GPT-4 Turbo preview 模型因在編碼時「偷懶」,受到了不少業界開發者的批評。它們經常省略所需的程式碼,而在註釋中留下「在此處實作方法」之類的語句,如

    def some_complex_method(foo, bar): # ... 在此處實作方法 ...

    Aider 使用一個「懶惰」基準套件,旨在激發和量化懶惰編碼。它由 89 個 Python 重構任務組成,這些任務往往會讓 GPT-4 Turbo 以懶惰的方式編碼。

    新的 GPT-4 Turbo with Vision 模型在 aider 的重構基準測試中只獲得了 34% 的分數,是所有 GPT-4 Turbo 模型中最懶惰的編碼工具。

    完整的評測可以詳見:https://aider.chat/2024/04/09/gpt-4-turbo.html

    最後,你是否體驗上了 GPT-4 Turbo with Vision 版本,有什麽樣的感受?

    來源:

    https://www.zdnet.com/article/openai-makes-gpt-4-turbo-with-vision-available-for-developers/

    https://twitter.com/OpenAIDevs/status/1777769468996845718

    https://aider.chat/2024/04/09/gpt-4-turbo.html

    推薦閱讀:


    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼 進一步了解詳情。