神秘模型"gpt2-chatbot"现身，引发GPT-4.5/GPT-5疯狂猜想

2024.05.01

文章来源：头部科技

文丨Congerry

图片来源：由无界AI生成

OpenAI 放出了一个迷雾弹。

当Google、Meta、Anthropic等公司都在猛推大模型的时候，OpenAI除了对GPT-4修修补补，似乎一直没有什么大的动静。

但是今天，一个名为"gpt2-chatbot"的神秘大模型凭空杀出，其能力似乎与 GPT-4 保持在同一水准，甚至在一些任务上的表现比 GPT-4 Turbo 还要好，让整个AI社区炸开了锅。

这不禁让人联想一直未曾露面的GPT-4.5或GPT-5。就连Sam Altman也发了一段让人摸不着头脑的话，自己对 gpt2 情有独钟。

这个"gpt2-chatbot"表现如何呢？

该模型第一次尝试就解决了国际数学奥林匹克竞赛（一项面向高中生的著名竞赛）中的一个问题。

人工智能研究员、斯坦福大学学生Andrew Gao说，要知道国际数学奥林匹克竞赛难得要命，只有美国数学成绩最好的四名学生才能参加比赛。

宾夕法尼亚大学沃顿商学院研究 AI 的教授 Ethan Mollick 表示，在他的实验中，该模型在复杂的推理任务（例如编写代码绘制独角兽图片）上表现优于 GPT-4。“也许比 GPT-4 更好，”他说。“很难说，但它在标志性的‘用代码画独角兽’任务上确实做得更好。”

该模型还表现出了编写具有挑战性的代码的能力。

CodeGen 的创始工程师 Chase McCoy 表示，gpt2-chatbot “在我们用来测试新模型的所有编码提示上都做得更好”，而不是 GPT-4 或 Claude Opus。“这种氛围肯定是存在的，”他说。

但也有不少人持谨慎怀疑态度，认为gpt2-chatbot的能力被过度夸大了。他们指出：

这个模型在经典的24点游戏、数学推导等老题types仍然采取的是暴力式枚举推理，而未展现出任何更先进的解题手段。

在绘画时，也不遵从指令。

在经典的"农夫过河"推理题上，gpt2-chatbot的5步解法也显得冗长。

那么，这个gpt2-chatbot到底是什么来头？

通过对它的一些细节分析，网友们给出了以下几种可能：

它就是OpenAI后继GPT-4的下一代大模型GPT-4.5，或者是传闻已久的GPT-5。

但是Andrew Gao认为，如果这就是GPT-4.5或者GPT-5的能力，那么意味着人类在AI上面碰壁了。言外之意，gpt2-chatbot“不配”。

相关推荐