复制成功

分享至

主页 > 数字货币 >

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

2024.04.01

作者:文子

编辑:小迪

马斯克又一大招,直逼OpenAI。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

Grok-1.5突然发布,挑战“劲敌”GPT-4

继一周前开源GroK-1后,马斯克又有了新动作,再一次剑指OpenAI。

3月29日,马斯克旗下xAI团队突然对外发布Grok-1.5大模型,主打就是一个“字少事大”。而这一次的动作,明摆着也是冲着GPT-4去的。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

从Grok-1.5的基准测试结果来看,各项能力都有巨大的飞跃。其中最明显的改进之一就是在代码和数学相关方面的性能,尤其是涵盖了从小学到高中的各种竞赛问题。

比如在MATH基准测试中,Grok-1.5就取得50.6%的得分;在GSM8K基准测试中,Grok-1.5更获得90%的得分。

而在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5更是超越了GPT-4,得分高达74.1%,同时碾压了一众热门的开源模型 Mistral Large、Claude 2等等。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

另一个重要升级之一就是Grok-1.5改进了推理能力,从原先的24 %提升至50%。该模型现在能够在上下文窗口中处理高达128K token的长文本,这相当于一部中篇小说的篇幅。这一改进使得Grok的处理能力达到了之前上下文长度的16倍,进而能够充分利用长文档中的信息。

此外,Grok-1.5模型还具备处理更长且更复杂的指令的能力,即便在上下文窗口扩大时,也能保持良好的指令遵循性。

无独有偶,在Needle In A Haystack(NIAH)评估中,Grok-1.5还展现出了强大的信息检索技能,能够在一个包含128K字节的上下文中准确检索到嵌入的文本,并实现了完美的检索结果。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

根据xAI官方的介绍,Grok-1.5是基于JAX、Rust和Kubernetes构建的定制分布式训练框架之上。在大型计算集群中,维持大规模语言模型(LLMs)训练作业的稳定性和持续性是关键的挑战之一。xAI团队开发的专属训练协调器,具备自动识别并隔离训练过程中出现的故障节点的先进能力。

此外,xAI团队还对检查点的创建、数据加载以及训练作业的重启流程进行了优化,以降低故障带来的停机时间。

在未来几日内,Grok-1.5将向早期测试者和平台用户开放。随着Grok-1.5逐渐普及至更广泛的用户群体,预计还将推出多项新功能。

全面对战OpenAI,Grok-1.5开源成谜

要知道,这次Grok-1.5发布前,马斯克因为起诉了OpenAI不开源,所以选择开源了3140 亿参数的模型Grok-1,也是截至目前参数量最大的开源大语言模型,规模相当于 Meta LlaMA 2 70B的4.4倍。

其实抛开马斯克本身与OpenAI的恩怨情仇不讲,Grok的开源决策并非仓促决定,而是经过深思熟虑。

表面上看Grok占据着X平台资源优势和马斯克的影响力加持,但在大模型大爆发的当下,却并没有在大模型的“军备竞赛”中有太多竞争优势。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

特别是自2024年以来,Gemini、Claude 3等模型的发布,它们的能力已经接近甚至超越了GPT-4,这三个模型基本上确立了行业的第一梯队。再加上Mistral AI和Inflection AI也在积极追赶,大模型的“虹吸效应”愈发显著,留给马斯克和Grok的时间已经不多了。

在这种形势下,如果Grok坚持闭源开发的路线,它很可能会像之前诺基亚的Symbian系统一样,被淘汰只是时间问题。这样的结果不仅无法帮助马斯克将X平台商业化,还会成为一种昂贵的沉没成本。

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

因此,摆在马斯克面前的只剩下一条路,就是破釜沉舟用“开源”为Grok杀出一条血路。

月之暗面CEO杨植麟就曾表示,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

而Grok-1自开源5天后,在开源社区GitHub就获得了高达4.2万人的收藏,可见马斯克这一步棋下的赢了民心。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier