事情是這樣的,近日,斯坦福AI團隊被曝出了抄襲事件,而且抄襲的還是中國國產(chǎn)的大模型成果,模型結(jié)構和代碼,幾乎一模一樣。
斯坦福的Llama3-V項目在5月29日發(fā)布,宣稱僅需500美元就能訓練出一個性能超越GPT-4V、Gemini Ultra、Claude Opus等的多模態(tài)大模型。

Llama3-V 的 3 位作者或許是擁有名校頭銜加持,又有特斯拉、SpaceX 的大廠相關背景,這個項目短短幾天就受到了不小的關注。
然而,一位網(wǎng)友發(fā)現(xiàn),Llama3-V的模型結(jié)構和代碼與出自清華系明星創(chuàng)業(yè)公司面壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣,只是變量名有所變化。
面對抄襲的指控,斯坦福團隊選擇了刪庫跑路,目前在GitHub和HuggingFace上的相關項目均顯示404,無法訪問。

面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能,如識別清華簡一種罕見的中國古代文字。
Llama3-V在未公開的實驗性特征上與MiniCPM-Llama3-V 2.5表現(xiàn)出高度相似的行為,這些特征是根據(jù)MiniCPM-Llama3-V 2.5團隊內(nèi)部數(shù)據(jù)訓練的。
面對抄襲的質(zhì)疑,斯坦福團隊最初辯稱,他們的工作早于面壁智能的MiniCPM,只是使用了他們的tokenizer。
然而,隨后他們在Medium上的聲明被刪除,且最新的回應也被撤回。
面壁智能CEO李大海對此事件做出了正式回應,要求Llama3-V作者對這個問題給出一個正式的解釋,目前,此事仍在持續(xù)發(fā)酵中。