OpenAI神秘新模型Q*曝光，太强大让董事会警惕，或是奥特曼被开除导火索

2023.11.25

文章来源：量子位

图片来源：由无界 AI生成

OpenAI宫斗大戏刚刚落幕，马上又掀起另一场轩然大波！

路透社曝光，在奥特曼被解雇之前，几位研究人员给董事会写的警告信可能是整个事件导火索：

内部名为Q （发音为Q-Star）*的下一代AI模型，过于强大和先进，可能会威胁人类。

Q*正是由这场风暴的中心人物，首席科学家Ilya Sutskever主导。

人们迅速把奥特曼此前在APEC峰会上的发言联系在了一起：

OpenAI历史上已经有过四次，最近一次就是在过去几周，当我们推开无知之幕并抵达探索发现的前沿时，我就在房间里，这是职业生涯中的最高荣誉。”

Q*可能有以下几个核心特性，被认为是通往AGI或超级智能的关键一步。

突破了人类数据的限制，可以自己生产巨量训练数据

有自主学习和自我改进的能力

这则消息迅速引发了巨大讨论，马斯克也带着链接来追问。

最新的梗图则是，好像一夜之间，人们都从研究奥特曼和OpenAI董事会的专家，变成了Q*专家。

突破数据限制

根据来自The Information的最新消息，Q*的前身是GPT-Zero，这个项目由Ilya Sutskever发起，名字致敬了DeepMind的Alpha-Zero。

Alpha-Zero无需学习人类棋谱，通过自己跟自己博弈来掌握下围棋。

GPT-Zero让下一代AI模型不用依赖互联网上抓取的文本或图片等真实世界数据，而是使用合成数据训练。

2021年，GPT-Zero正式立项，此后并未有太多直接相关的消息传出。

但就在几周前，Ilya在一次访谈中提到：

不谈太多细节，我只想说数据限制是可以被克服的，进步仍将继续。

在GPT-Zero的基础上，由Jakub Pachocki和Szymon Sidor开发出了Q*。

两人都是OpenAI早期成员，也都是第一批宣布要跟着奥特曼去微软的成员。

Jakub Pachocki上个月刚刚晋升研究总监，过去很多突破包括Dota 2项目和GPT-4的预训练，他都是核心贡献者。

Szymon Sidor同样参与过Dota 2项目，个人简介是“正在造AGI，一行代码接一行代码”。

在路透社的消息中，提到给Q*提供庞大的计算资源，能够解决某些数学问题。虽然目前数学能力仅达到小学水平，但让研究者对未来的成功非常乐观。

另外还提到了OpenAI成立了“AI科学家”新团队，由早期的“Code Gen”和“Math Gen”两个团队合并而来，正在探索优化提高AI的推理能力，并最终开展科学探索。

关于Q*到底是什么没有更具体的消息传出，但一些人从名字猜测可能与Q-Learning有关。

Q-Learning可以追溯到1989年，是一种无模型强化学习算法，不需要对环境建模，即使对带有随机因素的转移函数或者奖励函数也无需特别改动就可以适应。

与其他强化学习算法相比，Q-Learning专注于学习每个状态-行动对的价值，以决定哪个动作在长期会带来最大的回报，而不是直接学习行动策略本身。

免责声明:数字资产交易涉及重大风险，本资料不应作为投资决策依据，亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考，不构成任何投资建议，用户一切投资行为与本站无关。

和全球数字资产投资者交流讨论

扫码加入OKEx社群