OpenAI出手后，GPT-4真的不懒了？

2024.01.30

文章来源：硅星人Pro

图片来源：由无界AI生成

大模型会从人类经验中学习，如果人类本身越来越懒，那模仿人类的程序是不是也会越来越懒？

OpenAI 发布更新，解决 GPT-4“变懒”问题

近日，OpenAI 在一篇博文中发布了多项更新，并表示更新后的 GPT-4 Turbo“拥有比之前预览模型更好的代码生成等能力，且减少了模型在任务中途罢工的「变懒」情况。”但该公司并没有对更新内容做进一步解释。

OpenAI 在帖子中提到，由于知识库更新，已经有超过 70% 的 GPT-4 API 用户转向了 GPT-4 Turbo。OpenAI 表示，未来几个月内将陆续推出更多 GPT-4 Turbo 更新，包括发布具有视觉模态处理能力的 GPT-4 Turbo 正式版。这意味着用户将可输入各类多模态提示词，例如文本到图像生成提示。

此外，OpenAI 还推出了被称为“嵌入”的小体量 AI 模型。OpenAI 对于嵌入的定义，是“代表自然语言或代码等内容中概念的数字序列”。以此为基础，即可搭配检索增强生成（简称 RAG，一种从数据库获取信息、而非生成答案的 AI 方法）应用找到各类可访问内容间的关系。这些新模型、text-embedding-3-small 嵌入乃至更强大的 text-embedding-3-large 版本现均已正式开放。

经过改进的各 GPT 模型现已通过 API 开放，包括质量更高、价格更低廉的嵌入模型（e.gone 模型的成本仅为此前嵌入模型的五分之一，但性能更强）。

用户抱怨 GPT-4 学会偷懒：越来越像人类了？

2023 年 12 月，有不少用户抱怨称，“这段时间使用 ChatGPT 或 GPT-4 API 时，会遇到高峰期速度非常慢、敷衍回答、拒绝回答、中断会话等一系列问题”。

比如，某些时候，GPT-4 系统会给出一些特别模糊的答案，特别是关于 Docker、Kubernetes 以及其他 CI/CD 的问题。此外，GPT-4 还学会了“废话文学”——不直接回答问题，只是堆叠素材来讲解应该怎样回答问题。有用户反映，哪怕明确要求不要使用空白占位符，模型也仍然会用占位符把回答截得七零八落。这种限制回复质量的作法倒是替服务商节约了资源，但却极大浪费了普通用户的时间。

用户 jonathanallengrant 在 OpenAI 社区一个名为“为什么我觉得 GPT 变懒了”的帖子中提到：“不少人注意到自从 Dev Day 活动以来，模型的输出上限就变成了 850 个 token。换言之就是 ChatGPT 变懒了，不光留出大量空白，还常常在同一条消息里半天停在原地。我相信这应该是 OpenAI 正在以某种方式扩展模型的推理方法。”

用户 manchkiran 表示自己也遇到过类似的情况，并吐槽“现在的模型绝对是变懒了，只会快速搜索并给出 Bing 引擎的链接”，他猜测大模型变懒的原因或许与“微软加入 OpenAI 董事会后下调了算力分配”有关。

sasindujayashmaavmu 则从另一个角度分析了 GPT-4 变懒的原因：“我觉得这可能是人机回圈的锅……大模型会从人类经验中学习，所以如果人类本身越来越懒，那模仿人类的程序也会越来越懒。”

对于漫天盖地的吐槽声，ChatGPT 官方通过 X 平台通知用户，“我们听到了你们关于 GPT-4 变得越来越懒的反馈！我们自 11 月 11 日起就没有更新过模型了，当然这不是故意的。”

OpenAI 出手后，GPT-4 真的不懒了？

OpenAI 本次更新承诺解决了 GPT-4“变懒”问题，根据社区用户反馈来看，如今的 GPT-4 似乎真的聪明多了。

用户 Distinct_Salad_6683 提到，最近自己发现 GPT 在编码能力有所提升，能够根据提示词快速提供完整的示例。之前 GPT 经常会拒绝给出具体示例，只是在描述自己要求它干的工作，并用“在此处插入函数逻辑”之类的废话来搪塞问题。

也有用户“阴阳”OpenAI：软件只要更新一下就能解决“变懒”，真羡慕。要是能有补丁帮我扛过礼拜一就好了。

由于 OpenAI 并未对更新内容做进一步解释，因此也有不少用户开始分析其到底是怎么解决 GPT-4“变懒”问题的。语言学家 christelle.hilz 分析，GPT-4 变懒的问题跟算法无关，单靠打补丁恐怕无济于事。这个问题还得从其他角度尝试解决。“我好奇的是 OpenAI 愿意花多少钱来解决 GPT 变懒问题”。

也有观点认为，OpenAI 并未真正地解决问题。因为大语言模型就是算法加公式的组合，所以哪怕更新真的解决了变懒问题，只能用这种方法改进模型本身也不是什么好兆头。

OpenAI出手后，GPT-4真的不懒了？

加⼊OKEx全球社群

相关推荐