当前位置：主页 > 资讯 >

斯坦福团队“套壳”清华系公司面壁智能，中国的大模型被低估了吗？

2024-06-05 16:00 来源：创客100 　　

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

近日，斯坦福研究团队大模型套壳清华系创业公司面壁智能一事，引发广泛关注。

遭受质疑的是斯坦福研究团队推出的一款名为Llama 3-V的大模型，号称比OpenAI、谷歌等领先的模型都要好，一经发布便在开源社区受到追捧。

但随后，不少网友和面壁智能官方实锤，其在模型结构、代码等方面套壳了面壁的“小钢炮”模型。最新进展显示，该团队发文致歉，并将有关模型从开源社区撤下。

这一事件也让国外更多关注到了中国开源大模型的能力，以往更多是中国团队套壳国外产品居多，如李开复创办的零一万物此前就被质疑套壳Llama。

有业内人士对搜狐科技表示，国内开源模型差距与国外已不是很大，或即将赶超Meta的Llama 3，而中国已成为AI科技创新的关键推动者。

开源的事儿，能叫抄袭吗？

在这次事件中，答案是确定的。

FutureLabs未来实验室首席专家胡延平表示，模型开源本身就意味着开放给他人使用，可以说所有基于开源大模型的微调等二次开发都是在套壳。

判定是否“抄袭”的关键在于，是否标明了基于别人的开源大模型来做——一个比较流行的规范做法是明示：同时感谢或致敬。

斯坦福团队的Llama3V显然没有这些明示。这次事件的起因还要追溯到5月底，该团队推出了一款名为Llama 3-V的开源多模态大模型。

这款模型尺寸比GPT-4小100倍，但号称比GPT-4、Gemini Ultra和Claude Opus 等模型能力更强，而且训练成本只需要500美元。这使得其很快就受到广泛关注，在全球知名开源社区HuggingFace上，Llama 3-V很快冲上趋势榜首页。

但有网友发现，该项目使用的模型结构、代码、配置文件，与清华系大模型创业公司面壁智能不久前发布的MiniCPM-Llama3-V2.5惊人相似，只是斯坦福AI团队将其中的变量名称做了更改。

免责声明： 创客100遵守行业规则，本站所转载的稿件都标注作者和来源。创客100原创文章，请转载时务必注明文章作者和来源“创客100”，不尊重本站原创的行为将受到创客100的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：admin@100tmt.com

大数据