创客100
当前位置:主页 > 资讯 >

斯坦福团队“套壳”清华系公司面壁智能,中国的大模型被低估了吗?

2024-06-05 16:00 来源:创客100      

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

近日,斯坦福研究团队大模型套壳清华系创业公司面壁智能一事,引发广泛关注。

遭受质疑的是斯坦福研究团队推出的一款名为Llama 3-V的大模型,号称比OpenAI、谷歌等领先的模型都要好,一经发布便在开源社区受到追捧。

但随后,不少网友和面壁智能官方实锤,其在模型结构、代码等方面套壳了面壁的“小钢炮”模型。最新进展显示,该团队发文致歉,并将有关模型从开源社区撤下。

这一事件也让国外更多关注到了中国开源大模型的能力,以往更多是中国团队套壳国外产品居多,如李开复创办的零一万物此前就被质疑套壳Llama。

有业内人士对搜狐科技表示,国内开源模型差距与国外已不是很大,或即将赶超Meta的Llama 3,而中国已成为AI科技创新的关键推动者。

开源的事儿,能叫抄袭吗?

在这次事件中,答案是确定的。

FutureLabs未来实验室首席专家胡延平表示,模型开源本身就意味着开放给他人使用,可以说所有基于开源大模型的微调等二次开发都是在套壳。

判定是否“抄袭”的关键在于,是否标明了基于别人的开源大模型来做——一个比较流行的规范做法是明示:同时感谢或致敬。

斯坦福团队的Llama3V显然没有这些明示。这次事件的起因还要追溯到5月底,该团队推出了一款名为Llama 3-V的开源多模态大模型。

这款模型尺寸比GPT-4小100倍,但号称比GPT-4、Gemini Ultra和Claude Opus 等模型能力更强,而且训练成本只需要500美元。这使得其很快就受到广泛关注,在全球知名开源社区HuggingFace上,Llama 3-V很快冲上趋势榜首页。

但有网友发现,该项目使用的模型结构、代码、配置文件,与清华系大模型创业公司面壁智能不久前发布的MiniCPM-Llama3-V2.5惊人相似,只是斯坦福AI团队将其中的变量名称做了更改。

免责声明: 创客100遵守行业规则,本站所转载的稿件都标注作者和来源。 创客100原创文章,请转载时务必注明文章作者和来源“创客100”, 不尊重本站原创的行为将受到创客100的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:admin@100tmt.com