斯坦福AI团队深陷抄袭丑闻:Llama 3-V被指剽窃清华模型
5月29日,斯坦福大学的一个团队宣布开发出Llama 3-V,这一突破性的AI模型自称在性能上超越了GPT-4V、Gemini Ultra和Claude Opus等领先模型,同时训练成本更低、模型更小。然而,这一兴奋之情很快被抄袭指控所取代,有迹象表明Llama 3-V大量借鉴了清华大学AI公司面壁智能开发的MiniCPM-Llama3-V 2.5模型。争议随即升级,有证据显示Llama 3-V可能抄袭了MiniCPM模型的关键部分,引发了AI界的热烈讨论。
关键要点
- 模型发布:斯坦福团队声称Llama 3-V是一款性能优越、成本效益高的模型,优于其他领先的AI模型。
- 抄袭指控:该模型被指控抄袭清华大学的MiniCPM-Llama3-V 2.5,包括其结构和代码。
- 抄袭证据:详细对比显示两个模型在结构和代码库上存在惊人的相似之处。
- 斯坦福的辩护:斯坦福团队否认指控,称仅使用了MiniCPM的Tokenizer。
- 证据删除:争议发生后,斯坦福团队删除了相关帖子和仓库,加剧了疑虑。
分析
斯坦福团队在Medium上发表文章,吹嘘Llama 3-V的能力,从而引发了这场丑闻。该模型被宣传为一种先进的、多模态的AI,比其竞争对手更小、更便宜。然而,AI爱好者和专家很快注意到Llama 3-V与清华大学的MiniCPM-Llama3-V 2.5惊人地相似。
支持这些指控的证据包括:
- 模型结构和代码:对比显示Llama 3-V和MiniCPM-Llama3-V 2.5的结构和配置几乎完全相同,仅变量名有所不同。
- Token化过程:斯坦福团队声称仅使用了MiniCPM的Tokenizer。然而,有人指出MiniCPM-Llama3-V 2.5中使用的特定Tokenizer在Llama 3-V开发之前并未公开,这引发了斯坦福如何获取它的疑问。
- 行为相似性:测试显示Llama 3-V的性能和错误与MiniCPM-Llama3-V 2.5高度一致,表明不仅仅是巧合。
- 删除仓库:斯坦福团队突然删除GitHub和HuggingFace仓库的行为进一步加剧了争议,暗示有掩盖行为。
对此,斯坦福团队的辩护遭到了怀疑。他们声称自己的工作早于MiniCPM-Llama3-V 2.5的发布,并使用了公开的配置。然而,他们的解释中的不一致以及两个模型之间的惊人相似之处导致了广泛的怀疑。
争议达到高潮时,面壁智能团队提供了额外的证据,包括对古代汉字(清华竹简)的识别等特定功能,这些功能是MiniCPM-Llama3-V 2.5独有的。他们认为,没有访问他们的专有数据,这种细节水平是无法复制的。
你知道吗?
- 多模态AI模型:像Llama 3-V和MiniCPM-Llama3-V 2.5这样的模型设计用于同时处理和解释多种类型的数据输入(例如文本、图像),显著增强了其多功能性和应用范围。
- Tokenizer:这是AI语言模型中的关键组件,它将文本分解成可管理的片段(tokens),使模型更容易处理和理解。Tokenizer的特异性和定制化对于AI模型的准确性和效率至关重要。
- 清华竹简:这些古代中文文本可追溯到战国时期(公元前475-221年),被认为是极其罕见和宝贵的历史研究资料。AI模型能够识别和解释这些文本,表明了高水平的复杂性和专业训练。
Llama 3-V抄袭丑闻在AI界引发了激烈的辩论,突显了人工智能研究领域面临的道德挑战和竞争压力。这一争议的结果可能对学术诚信和AI开发中的知识产权产生重大影响。