大模型互相薅羊毛:真·世界是个巨大的草台班子?

IPensoul 2024-01-04 17:53:21

12月16日,字节跳动被爆秘密使用Open AI技术开发自己的大模型,这违反了Open AI的条款,目前,字节跳动账户已被Open AI暂停使用。

无独有偶,12月18日,谷歌的Gemini自曝中文使用百度文心一言训练。

我用AI就是为了减轻工作压力,好让我摸摸鱼,怎么你们开发AI工具的也在摸鱼了呢?

相信这个瓜大家都吃了,我就概括为一个省流版:

Open AI:你违规使用我们的产品开发自己的大模型!

字节跳动:我买的微软的服务!

微软:瑟瑟发抖。

目前,字节那边给的回应是:只是在初期探索阶段用了 GPT 的 API 服务,并且探索阶段的模型还只是测试,没有上线对外使用。

不过程序员们都知道这个行为有争议,“他们在飞书上讨论如何通过‘数据脱敏’来‘洗白’证据。”

而Gemini的故事更为精彩。

在微博客户@阑夕的博文中,他在Poe平台(Poe是一个集合了各家聊天大模型的平台,可以选择和哪个大模型进行对话)上询问Gemini—pro,

你是谁?

Gemini—Pro说:

我是百度文心大模型

谷歌的反应也是很迅速——那我就修复呗~

俗话说得好,按下葫芦浮起瓢。修完这一个,还有下一个。

中国网友们就像挖番薯一样,一挖一个准:它的英文语料,清洗了Open AI。

当你采取更秘密的方式询问,他就会告诉你。

他是Open AI

当然,还有更多花里胡哨的答案:

比如:我是北京智源人工智能研究院开发的……

不过总的来看,23年整年度各家在大模型领域打的飞起,谷歌到12月才推出Gemini,

还比不上一年前推出的ChatGPT3.5 Turbo, 一时间还真不知道应该先吐槽哪个……

国产AI实力不容小觑

Gemini使用百度文心一言的大数据训练自己的中文语料,似乎从另一个角度证明了,文心一言在某种程度上已经排在了世界前列。

根据Super Clue中的排名来看,GPT—Turbo的评分遥遥领先,显著高于国内所有大模型和国外代表性大模型,其中国内最好的模型是文心一言,排在世界第三位。

其他国内大模型表现也不俗,可以看到,腾讯混元,通义千问2.0,讯飞星火都强于GPT3.5—Turbo。而Gemini Pro,目前业内人士普遍认为,相比于 GPT-4 来说,还是会逊色,不过很多方面都超越了 GPT 3.5。

在大模型的应用方面,国内更是全面开花。当你以为写作工具已经卷的不能再卷,新华社推出了自己的公文写作AI工具——新华妙笔,内置材料金句,事迹分析,意见建议,专为法定公文服务;图片工具分为绘图和设计两条线路,但是也有I Pensoul这种两个方向都很擅长的图片工具,还有智能思维导图工具,智能产品经理工具……

大模型的数据危机

其实早在半年前,就有人表明,对于入局晚的大模型来说,最重要的问题是:数据不够用了。

一个模型的好坏,20%取决于算法,80%取决于数据。以 OpenAI 的 GPT 为例,从 GPT-1 到 GPT-3,其训练数据集就从 4.5GB 指数级增长到了 570GB。

数据告罄的结果就是,许多中小模型,会选择用AI生成的数据来训练自己的模型。

使用过语言大模型的用户都知道,大模型偶尔会答非所问,生成一些看似很有道理实际上完全逻辑不同的答案。

这些错误的、逻辑不通的答案被拿来训练其他的模型,错误会迅速沉淀,离真实世界的最初数据越来越远。被无数次强化后,模型极有可能会认为这些错误的结果是正确的结论。

而目前对这种垃圾数据的清洗工作,只能由人工来完成。但是,在大语言模型学习的时候,人模型训练师尚不能确定模型学习了哪些,又排列组合生成了哪些错误数据,又怎么能高效完美的清除错误数据呢。日后,对真实世界的高质量数据的高需求,也许会代替算力、芯片,成为又一个大模型的必争之地。

2 阅读:317
评论列表

IPensoul

简介:评说热点,关注实事,AIGC和数字人行业探索者