难倒大模型的《西游记》问题，“个人 AI 计算机”或是一种解决方案

2024.01.15

来源：量子位

原文标题：《西游记》把大模型给难倒了

问：《西游记》里，总共提到过孙悟空这只猴多少次？

咱问了问ChatGPT，ChatGPT连连摇头，说《西游记》篇幅太长，它统计不出来。

不死心，又把这个问题问向了Claude。

Claude频频摆手，说因为不具备完整阅读和分析长篇文学作品的能力，无法统计。

事实上，不仅仅是ChatGPT和Claude答不上来，市面上的大模型几乎都无法（准确）回答这个问题。

除了《西游记》作为章回体小说，本身篇幅太长外，“孙悟空”还在书里有各种各样的代词指代，比如大圣、孙行者、美猴王、心猿、甚至是你/我/他……

于是，大模型们在这道题面前只能束手就擒。

然而，对于任何一名人类传统程序员来说，这压根不算一个难题，只要用编程、逻辑推理去解决，确定的答案很容易摆在眼前。

但如果非要把解决方式切回“大模型”模式，幻觉和精度，就是最直接的问题。

一家国内的AI创业公司给出了它们的答案：选择做个人AI计算机，用它补齐大模型和AI应用间缺失的那一环。

尝试统一神经网路和高级编程语言

这家公司名为KMind，创始人吴翰清，他更为业内人士所熟知的身份是阿里云的道哥/小黑，是前阿里云首席安全科学家、P10级研究员。

去年5月离职阿里后，他和阿里前同事陈冬白携手创业，又邀请来西湖大学AutoLab（自主智能实验室）负责人于开丞担任首席科学家，KMind的核心团队就这么搭建起来了。

在去年7月，KMind曾推出过一款面向C端用户的AIGC效率工具。

7月份推出，不到3个月时间，这款AIGC效率工具已经拥有了10万用户。

但困境伴随而生：用户流失率非常高。

吴翰清最终思考出的结论是，没有人喜欢一个满嘴谎话、不懂装懂的人，尤其是那些从未接触过AI、不知AI为何物的用户，第一次用上AIGC效率工具，往往会把对方当成一个在和自己交流的真实的人。

这样就会导致用户一旦发现AI不靠谱，就会气到当场弃用。

“目前LLM在解决幻觉问题上主要还是靠对齐，但这类技术治标不治本。要想彻底解决这个问题，我认为还得从LLM之外寻求答案。”

当然，“幻觉”仅仅是大模型存在的最大问题之一，另一个问题，也是大模型无法准确回答西游记里有多少孙悟空的另一个原因，是书中指代孙悟空的名词、代词太多，大模型目前的推理能力还无法进行精准判断。

“对于所有的程序员来说，逻辑推理都不是一个问题，1+1必然等于2。”正如吴翰清所说，“但是对于所有做神经网络的人来说，如何让神经网络自动生成1+1=2这个答案并不容易。”

基于这一点，KMind团队的思考逐渐清晰：

不如试试，统一神经网络和高级编程语言。

神经网络主要提供泛化能力，高级编程语言则提供逻辑推理能力和精准控制能力，两者连接起来，双管齐下，就能解决大部分问题。

提出“个人AI计算机”

沿着这个思路提出一种具体的解决办法，就是KMind所提出的造一个拥有新型计算机操作系统kOS的“个人AI计算机”。

先简单了解一下，什么是个人AI计算机。

一起来看个人AI计算机长啥样：

在这个架构中，依次有输入输出、记忆器、控制器、运算器和存储器。

其中，控制器相当于整个系统的“大脑”，是真正理解用户意图、并对复杂任务进行拆解，以及调度不同执行单元来完成用户任务的部分。

在这个部分里，为了模拟人的思考过程，又存在评估器和决策器。

与此同时，控制器还会不断和外界进行交互，通过多轮对话等方式，需要用户不断提供新的信息，形成反馈，然后整个系统不断进行迭代、循环。

相关推荐