X

斯坦福AI项目团队为剽窃中国模型道歉

斯坦福AI项目团队为剽窃中国模型道歉
星期五 07 六月 2024 - 18:20
Zoom

斯坦福大学人工智能团队因抄袭中国某人工智能公司的大型语言模型(LLM)而道歉,这一事件在周二成为中国社交媒体平台的热门话题,引发网民担忧。多模态人工智能模型Llama3-V的

开发人员在社交平台X上发文称,“我们向MiniCPM(一家中国公司开发的人工智能模型)的作者们道歉,因为我们没有尽全力去验证和同行评审这项工作的新颖性,所以给你们带来了任何不便。”

此前,斯坦福大学团队于5月29日宣布了Llama3-V,声称它的性能与GPT4-V和其他模型相当,而且训练成本不到500美元。 

据媒体报道,团队成员发布的这一声明很快获得了30多万的浏览量。 

然而,一些来自 X 的网友发现并列出了 Llama3-V 项目代码被重新格式化并且与 MiniCPM-Llama3-V 2.5(由中国科技公司 ModelBest 和清华大学开发的法学硕士)相似的证据。

两名团队成员 Aksh Garg 和 Siddharth Sharma 于周一转发了网友的疑问并道歉,同时声称他们的职责是在 Medium 和 X(以前的 Twitter)上推广该模型,并且他们无法联系为该项目编写代码的成员。根据他们的回复,

他们查看了最近的论文以验证这项工作的新颖性,但并未被告知或意识到由清华大学自然语言处理实验室和 ModelBest 成立的大模型库开放实验室的任何工作。他们指出,他们已经删除了对 Llama3-V 的所有引用,以尊重原始工作。

对此,ModelBest首席科学家刘志远在知乎上发文称,Llama3-V团队没有遵守开源协议,没有尊重和表彰前辈研究人员的成果,严重破坏了开源共享的基石。据网上泄露的

截图显示,ModelBest CEO李大海也在朋友圈发文称,两个模型经过验证,在给出的答案甚至错误上高度相似,部分相关数据尚未向公众公布。 

他表示,团队希望他们的工作能得到更多的关注和认可,但不是以这种方式。他还呼吁建立一个开放、合作和信任的社区环境。

斯坦福人工智能实验室主任克里斯托弗·曼宁周日也回应了加格的解释,在X上评论“如何不承认自己的错误!”

随着该事件成为新浪微博上的热门话题,中国网民评论称,学术研究应该以事实为依据,但该事件也证明了中国的技术发展正在进步。《


阅读更多