复制成功

分享至

主页 > 比特币 >

深度丨当生成式 AI 被持续优化提供人类“奖励”其产生的答案时,该如何破译其“隐藏思想”

2023.03.31

撰文:Ian Scheffler

来源:Freethink

编译:巴比特

深度丨当生成式 AI 被持续优化提供人类“奖励”其产生的答案时,该如何破译其“隐藏思想”

图片来源:由无界 AI工具生成

两千多年前,当柏拉图设想理想社会时,他选择驱逐诗人。“所有诗意的模仿都是毁灭性的,”他在《理想国》中写道。

柏拉图心目中的“模仿性”诗歌,在很大程度上是指讲故事 -- 一种试图对我们周围的世界做出令人信服的摹本语言。柏拉图写道:“所有这些诗意的个体,从荷马开始,都只是模仿者;他们复制美德之类的形象,但他们永远无法触及真理。”

对柏拉图来说,荷马的《伊利亚特》能够让我们憧憬特洛伊战争的场景并使我们相信它们的真实性,与其说是一种艺术成就,不如说是一种威胁。他认为,玩弄我们情感的强大虚构,会使我们误入歧途,或者,更糟糕的是,使我们相信一个虚假的现实,并根据虚构的东西冲动行事。

当然,所有社会都有讲故事的人,从西非的格里特人到当代的 TikTokers。但从来没有一个讲故事的人像 ChatGPT、DALL-E 以及近几个月抢占头条的其他各种生成式人工智能工具那样多产,或缺乏道德直觉。

正如柏拉图可能被迫承认的那样 -- 毕竟他自己的作品采取了虚构对话的形式 -- 艺术模仿往往是吸引观众注意力所必需的,但随着生成式人工智能将这种模仿的成本降低到几乎为零,曾经困扰柏拉图的哲学问题已经进入了政策领域。

这种工具是否应该被监管,甚至被禁止,就像在纽约市的公立学校一样?鉴于这些模型背后的大部分研究都是现成的,你可以在 YouTube 上用不到两个小时的时间建立 GPT(ChatGPT 的前身之一),那么有效的监管是否可能?

也许最重要的是,随着大型语言模型 -- 当今最先进的人工智能的技术基础 -- 越来越强大,未来会发生什么?目前,我们仍然可以训练大型语言模型的行为,但必须有大量的人工干预,就像 OpenAI 在肯尼亚雇用了几十个承包商来手动训练 ChatGPT,以避免其最不适当的输出。

大型语言模型的不完善之处显而易见(而且每当你打开 ChatGPT、新的 Bing 或谷歌的 Bard AI 时,都会有弹出式的提示):这些模型不断地编造信息,导致它们产生一些被比喻为幻觉的内容,而且容易反映出其训练数据中的偏见。

但是,如果有一天 ChatGPT 和 Bing AI 等工具的捏造和错误不再是无意的呢?如果这些可以令人信服地生成几乎任何风格的图像、文本和音频的工具主动欺骗我们,该怎么办?


黑匣子的内部


“想象一下,一只猩猩试图建立一个只追求猩猩价值的人类级别的智能,”德克萨斯大学奥斯汀分校的计算机科学家 Scott Aaronson 说。“这个想法听起来很荒唐。”

在过去的一年里,Aaronson 从 UT 休假,并在 ChatGPT 和 DALL-E 的制造商 OpenAI 工作,负责人工智能安全。他说:“与我交谈过的人工智能安全研究中的每一个人都认为,有一件事很重要”,那就是可解释性——让人类观察者能够理解人工智能认知的‘黑匣子’。”

对人类来说,可解释性是一门不精确的科学。“我们对人类大脑内部的观察能力非常有限且粗糙,”Aaronson 说,“(但)至少对哪些区域是活跃的有一些了解——比如哪些区域燃烧更多的葡萄糖。”

但是大型语言模型的思维——如果你可以把多维向量空间称为思维的话——是不同的。“我们可以完全访问这些系统的代码,”Aaronson 说。“唯一的问题是你如何理解它。”


透过模式看问题


十几岁的时候,Collin Burns 就已经很喜欢思考了。他在费城郊区长大,十几岁时就在宾夕法尼亚大学学习大学水平的数学课程。他还花了几个小时来解决魔方问题。

他没有记住独特情况下的复杂算法,而是非常、非常缓慢地扭动魔方。矛盾的是,这种方法使他变得非常、非常快。Burns 对下一次扭动后可能发生的情况形成了直觉。2015 年,他打破了世界纪录,仅用 5.25 秒就解决了三阶魔方难题。

疫情期间,Burns 在加州大学伯克利分校攻读计算机科学博士学位,他在研究中采用了类似的方法。随着时间的推移,他产生了一种强烈的直觉:阅读大型语言模型的思想是可能的。

在 Burns 看来,人类的思维和大型语言模型的思维在一个突出的方面并没有什么不同:相关的信息聚集在一起,使你能够搜索到模式和结构。

例如,如果你要求一个人依次考虑真实和虚假的陈述,并监测他们的大脑活动,不同的区域可能会亮起。同样,Burns 意识到,在作为大型语言模型思维的“向量空间”中,“突出的特征往往被很好地分开”-- 这意味着,从本质上讲,类似的信息会聚在一起。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier