大模型互相薅羊毛：真·世界是个巨大的草台班子？

12月16日，字节跳动被爆秘密使用Open AI技术开发自己的大模型，这违反了Open AI的条款，目前，字节跳动账户已被Open AI暂停使用。

无独有偶，12月18日，谷歌的Gemini自曝中文使用百度文心一言训练。

我用AI就是为了减轻工作压力，好让我摸摸鱼，怎么你们开发AI工具的也在摸鱼了呢？

相信这个瓜大家都吃了，我就概括为一个省流版：

Open AI：你违规使用我们的产品开发自己的大模型！

字节跳动：我买的微软的服务！

微软：瑟瑟发抖。

目前，字节那边给的回应是：只是在初期探索阶段用了 GPT 的 API 服务，并且探索阶段的模型还只是测试，没有上线对外使用。

不过程序员们都知道这个行为有争议，“他们在飞书上讨论如何通过‘数据脱敏’来‘洗白’证据。”

而Gemini的故事更为精彩。

在微博客户@阑夕的博文中，他在Poe平台（Poe是一个集合了各家聊天大模型的平台，可以选择和哪个大模型进行对话）上询问Gemini—pro，

你是谁？

Gemini—Pro说：

我是百度文心大模型

谷歌的反应也是很迅速——那我就修复呗~

俗话说得好，按下葫芦浮起瓢。修完这一个，还有下一个。

中国网友们就像挖番薯一样，一挖一个准：它的英文语料，清洗了Open AI。

当你采取更秘密的方式询问，他就会告诉你。

他是Open AI

当然，还有更多花里胡哨的答案：

比如：我是北京智源人工智能研究院开发的……

不过总的来看，23年整年度各家在大模型领域打的飞起，谷歌到12月才推出Gemini，

还比不上一年前推出的ChatGPT3.5 Turbo，一时间还真不知道应该先吐槽哪个……

国产AI实力不容小觑

Gemini使用百度文心一言的大数据训练自己的中文语料，似乎从另一个角度证明了，文心一言在某种程度上已经排在了世界前列。

根据Super Clue中的排名来看，GPT—Turbo的评分遥遥领先，显著高于国内所有大模型和国外代表性大模型，其中国内最好的模型是文心一言，排在世界第三位。

其他国内大模型表现也不俗，可以看到，腾讯混元，通义千问2.0，讯飞星火都强于GPT3.5—Turbo。而Gemini Pro，目前业内人士普遍认为，相比于 GPT-4 来说，还是会逊色，不过很多方面都超越了 GPT 3.5。

在大模型的应用方面，国内更是全面开花。当你以为写作工具已经卷的不能再卷，新华社推出了自己的公文写作AI工具——新华妙笔，内置材料金句，事迹分析，意见建议，专为法定公文服务；图片工具分为绘图和设计两条线路，但是也有I Pensoul这种两个方向都很擅长的图片工具，还有智能思维导图工具，智能产品经理工具……

大模型的数据危机

其实早在半年前，就有人表明，对于入局晚的大模型来说，最重要的问题是：数据不够用了。

一个模型的好坏，20%取决于算法，80%取决于数据。以 OpenAI 的 GPT 为例，从 GPT-1 到 GPT-3，其训练数据集就从 4.5GB 指数级增长到了 570GB。

数据告罄的结果就是，许多中小模型，会选择用AI生成的数据来训练自己的模型。

使用过语言大模型的用户都知道，大模型偶尔会答非所问，生成一些看似很有道理实际上完全逻辑不同的答案。

这些错误的、逻辑不通的答案被拿来训练其他的模型，错误会迅速沉淀，离真实世界的最初数据越来越远。被无数次强化后，模型极有可能会认为这些错误的结果是正确的结论。

而目前对这种垃圾数据的清洗工作，只能由人工来完成。但是，在大语言模型学习的时候，人模型训练师尚不能确定模型学习了哪些，又排列组合生成了哪些错误数据，又怎么能高效完美的清除错误数据呢。日后，对真实世界的高质量数据的高需求，也许会代替算力、芯片，成为又一个大模型的必争之地。

幸福双城资讯网

大模型互相薅羊毛：真·世界是个巨大的草台班子？

IPensoul