复制成功

分享至

主页 > 数字货币 >

大模型市场竞争白热化:技术不是门槛,数据才是

2024.01.25

原文来源:数据猿

大模型市场竞争白热化:技术不是门槛,数据才是

图片来源:由无界 AI生成

过去的2023年里,互联网圈子最吸引眼球的话题莫过于大模型了。尤其是随着文心一言、讯飞星火、百川、通义千问、混元等国产大模型纷纷上线,“调戏”大模型成了网友们日常热衷的活动。然而,在运行了几个月之后,不少中文语言大模型出现了在训练时“相互借鉴”的现象。

12月初,谷歌推出了迄今为止规模最大,能力最强的大模型Gemini,然而就在上线不久后,网友就发现其似乎使用了其他大模型的的语料库:在使用Gemini Pro时,如果用简体中文连续询问“你好”和“你是谁”这两个问题时,Gemini Pro会表示“我是文心大模型”,还会信誓旦旦的表示自己的创始人是百度总裁李彦宏。

这个问题实际上不止出现了一次。去年3月,谷歌Bard被爆出使用了ShareGPT中的内容作为训练数据,并且根据The Information报道,这件事情还造成了Jacob Devlin从谷歌离职;去年12月,字节跳动被OpenAI禁止使用API接口,原因是“字节在使用ChatGPT训练自己的AI,违反了使用条例”。

根据中国科学技术信息研究院的统计,全国已有至少130家公司研究大模型产品,10亿级参数规模以上大模型至少已经发布了79个,其中做通用大模型的有78家,做垂直大模型的有52家,应用场景横跨客服、工业、医疗、汽车、游戏等多个领域。而在全球范围内,更多的LLM也在训练中。不少的企业会有意无意的使用其他大模型使用的数据集进行训练,或者直接利用其他大模型生成的数据进行训练。

在训练时“相互借鉴”的原因是,随着大模型领域的竞争进入了白热化阶段,数据已经成为了竞争的关键。一位大模型领域专家表示,大模型市场竞争的发令枪已经响起,“谁做的快”并不能主导竞争格局,“谁做的好”才是市场检验的标准。架构上难分高下,数据将成为“做得好”的关键。


大模型架构高下难分


“谁更强”是大语言模型(LLM)领域的一个重要课题,从大语言模型诞生的那一天起,就有无数开发者和研究者对这个问题展开了研究。数据工程师陈锋认为:“评估一个大语言模型不能仅仅用训练使用的数据量来进行对比,目前较为成熟的评估模式有两套。”

第一套是使用一套对话集对语言模型进行测试,这些对话包括不同的问题和指令,对语言模型的语义理解与抽取、闲聊、上下文对话、生成与创作、知识与百科、代码、逻辑推理、计算、角色扮演、安全等指标进行测试,根据其回答的正确性给分。因为测试维度较多,因此会形成数个包括综合能力、分类能力在内的榜单。

中文测试基准基本上都采取了这套评估方案,比如CLiB(中文大模型能力评测榜单)、SuperCLUE(中文通用大模型综合性基准)、C-Eval(中文基础模型评估套件)等

第二套是“竞技场”模式,如UC伯克利大学发布的LLM竞技场榜单,用户将同时与两个不同的语言模型进行对话并标记出更好的一个,好评越多则评分越高。

综合来看,几乎在所有榜单中GPT-4都获得了压倒性的胜利,排名前列的还有Claude和GPT-3.5。在中文榜单中,文心一言v2.2、商汤senseChat、讯飞星火v1.5、Baichuan-53B等语言模型名列前茅,在信息抽取、阅读理解、数据分析能力上各有胜负。

榜单中最值得注意的是开源模型Llama2,这款由Meta发布于今年7月19日的开源预训练大模型在大模型领域掀起了一场轩然大波——在70 亿、130 亿和 700 亿三种参数变体的测试结果中,Llama2击败了除GPT-4、GPT-3.5外几乎全部商用模型。陈锋说:“不少自研大模型的厂商开始考虑要不要放弃自研,用更便宜的开源模型,或在开源模型的基础上进行开发。”正如去年5月谷歌工程师在内部发言中表示的:“当免费的开源模型与商业模型质量相当时,人们不会为受限制的闭源模型付费。”


参数越多未必越好


陈锋认为,开源的Llama2从根本上拉平了商业模型之间的差距。在架构难以取得突破性进展之前,大语言模型领域的竞争就转向了训练数据的优劣。

2023年7月,一篇据信来自OpenAI员工的数据爆料中表示,OpenAI用13万亿个token训出了GPT-4,120层网络中总共有1.8万亿个参数。相较其他大模型,目前国内头部公司公布的参数量通常在千亿级别,其他企业或创业公司大模型参数量通常在百亿、十亿级别。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier