金色午报 | 4月30日午间重
神秘模型"gpt2-chatbot"现身,引发GPT-4.5/GPT-5疯狂猜想
文章来源:头部科技
文丨Congerry
OpenAI 放出了一个迷雾弹。
当Google、Meta、Anthropic等公司都在猛推大模型的时候,OpenAI除了对GPT-4修修补补,似乎一直没有什么大的动静。
但是今天,一个名为"gpt2-chatbot"的神秘大模型凭空杀出,其能力似乎与 GPT-4 保持在同一水准,甚至在一些任务上的表现比 GPT-4 Turbo 还要好,让整个AI社区炸开了锅。
这不禁让人联想一直未曾露面的GPT-4.5或GPT-5。就连Sam Altman也发了一段让人摸不着头脑的话,自己对 gpt2 情有独钟。
神秘模型"gpt2-chatbot"现身
这个"gpt2-chatbot"表现如何呢?
该模型第一次尝试就解决了国际数学奥林匹克竞赛(一项面向高中生的著名竞赛)中的一个问题。
人工智能研究员、斯坦福大学学生Andrew Gao说,要知道国际数学奥林匹克竞赛难得要命,只有美国数学成绩最好的四名学生才能参加比赛。
宾夕法尼亚大学沃顿商学院研究 AI 的教授 Ethan Mollick 表示,在他的实验中,该模型在复杂的推理任务(例如编写代码绘制独角兽图片)上表现优于 GPT-4。“也许比 GPT-4 更好,”他说。“很难说,但它在标志性的‘用代码画独角兽’任务上确实做得更好。”
该模型还表现出了编写具有挑战性的代码的能力。
CodeGen 的创始工程师 Chase McCoy 表示,gpt2-chatbot “在我们用来测试新模型的所有编码提示上都做得更好”,而不是 GPT-4 或 Claude Opus。“这种氛围肯定是存在的,”他说。
但也有不少人持谨慎怀疑态度,认为gpt2-chatbot的能力被过度夸大了。他们指出:
这个模型在经典的24点游戏、数学推导等老题types仍然采取的是暴力式枚举推理,而未展现出任何更先进的解题手段。
在绘画时,也不遵从指令。
在经典的"农夫过河"推理题上,gpt2-chatbot的5步解法也显得冗长。
引发GPT-4.5/GPT-5疯狂猜想
那么,这个gpt2-chatbot到底是什么来头?
通过对它的一些细节分析,网友们给出了以下几种可能:
它就是OpenAI后继GPT-4的下一代大模型GPT-4.5,或者是传闻已久的GPT-5。
但是Andrew Gao认为,如果这就是GPT-4.5或者GPT-5的能力,那么意味着人类在AI上面碰壁了。言外之意,gpt2-chatbot“不配”。