當前位置: 妍妍網 > 碼農

「史丹佛AI團隊抄襲中國開源大模型」最新進展:創始人稱已經比較確信對方是套殼

2024-06-03碼農

針對「史丹佛AI團隊被曝抄襲 清華系AI創業 公司面壁智慧釋出的開源大模型 」,面壁智慧創始人劉知遠在知乎平台回應稱:

已經比較確信Llama3-V是對我們MiniCPM-Llama3-V 2.5套殼,比較有意思的證據是MiniCPM-Llama3-V 2.5研發時內建了一個彩蛋,就是對清華簡的辨識能力。

這是我們從清華簡逐字掃描並標註的數據集,並未公開,而Llama3-V展現出了一模一樣的清華簡辨識能力,連做錯的樣例都一樣。

事件回顧:

1、史丹佛大學的一個 AI 團隊 5 月 29 日釋出了名為 Llama3V 的開源多模態模型,聲稱 只要 500 美元就能訓練出一個 SOTA 多模態模型,且效果比肩 GPT-4V、Gemini Ultra 與 Claude Opus 。

2、網友發現 Llama3V 與面壁智慧 5 月中旬釋出的 8B 多模態小模型 MiniCPM-Llama3-V 2.5 在模型結構、程式碼、配置檔上高度相似,只是變量名有所不同。

3、面對質疑,史丹佛團隊成員刪除了在社交媒體上官宣模型的推文,並將計畫在 GitHub 和 HuggingFace 上的庫一並刪除。

4、面壁智慧團隊透過測試發現,Llama3V 在辨識清華簡的文字時,結果與 MiniCPM-Llama3-V 2.5 高度相似,不僅在正確的地方一樣,在錯誤的地方也雷同,且兩個模型在清華簡上的高斯雜訊也高度相似。

5、史丹佛團隊辯稱只是使用了 MiniCPM-Llama3-V 2.5的tokenizer,並聲稱在 MiniCPM-Llama3-V 2.5 釋出前就開始了這項工作。

6、史丹佛團隊的抄襲行為引發了廣泛關註和討論,被認為是對中國國產大模型成果的抄襲。


Reference

https://www.zhihu.com/question/657971226/answer/3519010839
https://github.com/OpenBMB/MiniCPM-V/issues/196

END

熱門文章

-

-

-

-