阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有学习揭露效果
2023-12-12 02:03:09

原标题 :阿里前副总裁贾扬清吐槽国产大模型“套壳” ,套壳李开复公司回应称有学习揭露效果 。阿里

出品 | 搜狐科技 。前副清吐

作者 | 梁昌均 。总裁

国内大模型再陷“套壳”争议。贾扬阿里巴巴前副总裁、槽国产闻名AI结构大牛贾扬清发朋友圈,模型慨叹做小公司不容易,李开露效期望国内企业要是应称有学便是开源的模型结构 ,不要做换名假装 ,习揭以免做剩余的套壳适配作业。

依据贾扬清的阿里朋友圈 ,他表明有某海外客户要其公司帮他们适配某国内大厂的前副清吐新模型 ,但后来有朋友奉告 ,总裁这个大厂新模型彻底便是贾扬LLaMA的架构,但为了表明不一致,把代码里边的姓名从LLaMA改成了他们的姓名 ,然后换了几个变量名 。此外,海外也有工程师直接指出了这一点。

“咱们是小公司也不想开罪大佬们,姓名我就不说了,不过各位大佬 ,开源社区不容易 ,要是你们便是开源的模型结构,求高抬贵手就叫本来的姓名吧,以免咱们还做一堆作业就为了适配你们改姓名 。”贾扬清说。

前述音讯在业界传开后 ,国内不少依据开源的LLaMA的国产大模型纷繁躺枪 。但贾扬清所说的“大厂”到底是谁并不结论 ,他还特别声明到不是老东家阿里 。LLaMA是Meta在本年开源的系列大模型 ,参数包含13B  、65B等。

打开全文 。

不过 ,业界的置疑目标指向刚发布首款预练习大模型Yi-34B的零一万物 ,其是李开复在本年7月入局AI大模型新建立的公司,由李开复牵头兴办并担任CEO 。

搜狐科技注意到  ,零一万物开源发布的Yi-34B模型现在在Hugging Face的Open LLM Leaderboard开源大言语模型排行榜排名榜首 。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称 ,除了两个张量被从头命名外(input_layernorm 和 post_attention_layernorm),Yi彻底运用了LLaMA的架构  。

“因此环绕LLaMA架构有很多的出资和东西,因此对张量运用相同的名称是有价值的  。开源社区肯定会从头发布Yi,并从头命名张量 ,以便有一个契合LLaMA架构的版别。咱们期望您能考虑在该模型取得很多选用之前,在您的官方模型中选用这一更改,以便它最终可以享用它应得的选用 。”该留言称 。

关于商场质疑,零一万物方面临搜狐科技回应称 ,GPT是一个业界公认的老练架构 ,LLaMA在GPT上做了总结 。零一万物研制大模型的结构设计依据GPT老练结构 ,学习了职业顶尖水平的揭露效果 ,因而大模型技术发展还在十分初期 ,与职业干流保持一致的结构,更有利于全体的适配与未来的迭代  。一起依据零一万物团队对模型和练习的了解做了很多作业 ,也在继续探究模型结构层面实质上的打破  。

零一万物还表明  ,模型结构仅是模型练习其间一部分。Yi 开源模型在其他方面的精力  ,例如数据工程、练习方法、baby sitting(练习进程监测)的技巧 、hyperparameter设置 、评价方法以及对评价目标的实质了解深度 、对模型泛化才能的原理的研讨深度 、职业顶尖的 AI infra 才能等  ,投入了很多研制和打底作业,这些作业往往比起根本结构能起到更大的效果跟价值 ,这些也是零一万物在大模型预练习阶段的核心技术护城河 。

“在很多练习实验进程中,因而实验履行的需要对代码做了更名 ,咱们尊重开源社区的反应,将代码进行更新,也更好的融入Transformer生态。”零一万物称,十分感谢社区的反应,期望和咱们携手共创社区昌盛 ,Yi Open-source 会尽最大尽力继续前进。

关于Hugging Face上说到的留言,零一万物有关负责人也对其作出了回复,称会依照留言的主张 ,把张量的命名从Yi改为LLaMA,保证准确度和透明度 。

“这个命名问题是咱们的忽略  。在很多的实验中 ,咱们对代码进行了屡次重命名,以满意实验要求 ,但在推出发行版前没有把姓名换回来 。”该回应称 ,零一万物将加强流程 ,保证这样的失误不会再次发生 ,并将查看一切代码 ,保证其它没有问题  。

零一万物在11月初正式发布首款预练习大模型 Yi系列模型 ,包含34B和6B两个版别  ,其间34B模型版别开源。零一万物其时声称  ,依据 Hugging Face 英文开源社区渠道和C-Eval中文评测的最新榜单 ,Yi-34B预练习模型成为全球开源大模型“双料冠军”,这也是迄今为止仅有成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

此前,国内不少大模型都堕入过“套壳”质疑 ,不少企业正是依据开源模型(特别是LLaMA系列)做微调  ,包含二次练习等 ,也有企业直接依据开源模型做应用层的开发,因此研制本钱更低 ,但往往缺少技术护城河,不被商场看好。

OpenAI CEO Sam Altman此前就表明,“套壳”OpenAI的公司活不持久 ,因此OpenAI已经在处理模型自身的问题,一起这些仅在本钱和速度上与OpenAI一较高下的公司,竞赛优势并不会持久且继续 ,企业有必要供给真实共同的价值。

(作者:汽车专用电瓶)