當前位置：妍妍網 > 碼農

「史丹佛AI團隊抄襲中國開源大模型」最新進展：創始人稱已經比較確信對方是套殼

2024-06-03碼農

針對「史丹佛AI團隊被曝抄襲清華系AI創業公司面壁智慧釋出的開源大模型」，面壁智慧創始人劉知遠在知乎平台回應稱：

已經比較確信Llama3-V是對我們MiniCPM-Llama3-V 2.5套殼，比較有意思的證據是MiniCPM-Llama3-V 2.5研發時內建了一個彩蛋，就是對清華簡的辨識能力。

這是我們從清華簡逐字掃描並標註的數據集，並未公開，而Llama3-V展現出了一模一樣的清華簡辨識能力，連做錯的樣例都一樣。

事件回顧：

1、史丹佛大學的一個 AI 團隊 5 月 29 日釋出了名為 Llama3V 的開源多模態模型，聲稱只要 500 美元就能訓練出一個 SOTA 多模態模型，且效果比肩 GPT-4V、Gemini Ultra 與 Claude Opus 。

2、網友發現 Llama3V 與面壁智慧 5 月中旬釋出的 8B 多模態小模型 MiniCPM-Llama3-V 2.5 在模型結構、程式碼、配置檔上高度相似，只是變量名有所不同。

3、面對質疑，史丹佛團隊成員刪除了在社交媒體上官宣模型的推文，並將計畫在 GitHub 和 HuggingFace 上的庫一並刪除。

4、面壁智慧團隊透過測試發現，Llama3V 在辨識清華簡的文字時，結果與 MiniCPM-Llama3-V 2.5 高度相似，不僅在正確的地方一樣，在錯誤的地方也雷同，且兩個模型在清華簡上的高斯雜訊也高度相似。

5、史丹佛團隊辯稱只是使用了 MiniCPM-Llama3-V 2.5的tokenizer，並聲稱在 MiniCPM-Llama3-V 2.5 釋出前就開始了這項工作。

6、史丹佛團隊的抄襲行為引發了廣泛關註和討論，被認為是對中國國產大模型成果的抄襲。

Reference

https://www.zhihu.com/question/657971226/answer/3519010839
https://github.com/OpenBMB/MiniCPM-V/issues/196

END

熱門文章

-

-

-

-

Copyright © 2024 ai.jasve.com NO.1 妍妍網

文章部分內容源自網絡，僅供AI學習使用，如有侵權請告知，我們將在48小時內刪除：xingwa#jasve.com（傳送郵件請將#換成@）