复制成功

分享至

主页 > 数字货币 >

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

2024.01.15

来源:量子位

原文标题:《西游记》把大模型给难倒了

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

问:《西游记》里,总共提到过孙悟空这只猴多少次?

咱问了问ChatGPT,ChatGPT连连摇头,说《西游记》篇幅太长,它统计不出来。

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

不死心,又把这个问题问向了Claude。

Claude频频摆手,说因为不具备完整阅读和分析长篇文学作品的能力,无法统计。

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

事实上,不仅仅是ChatGPT和Claude答不上来,市面上的大模型几乎都无法(准确)回答这个问题。

除了《西游记》作为章回体小说,本身篇幅太长外,“孙悟空”还在书里有各种各样的代词指代,比如大圣、孙行者、美猴王、心猿、甚至是你/我/他……

于是,大模型们在这道题面前只能束手就擒。

然而,对于任何一名人类传统程序员来说,这压根不算一个难题,只要用编程、逻辑推理去解决,确定的答案很容易摆在眼前。

但如果非要把解决方式切回“大模型”模式,幻觉和精度,就是最直接的问题。

一家国内的AI创业公司给出了它们的答案:选择做个人AI计算机,用它补齐大模型和AI应用间缺失的那一环。


尝试统一神经网路和高级编程语言


这家公司名为KMind,创始人吴翰清,他更为业内人士所熟知的身份是阿里云的道哥/小黑,是前阿里云首席安全科学家、P10级研究员。

去年5月离职阿里后,他和阿里前同事陈冬白携手创业,又邀请来西湖大学AutoLab(自主智能实验室)负责人于开丞担任首席科学家,KMind的核心团队就这么搭建起来了。

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

在去年7月,KMind曾推出过一款面向C端用户的AIGC效率工具。

7月份推出,不到3个月时间,这款AIGC效率工具已经拥有了10万用户。

但困境伴随而生:用户流失率非常高。

吴翰清最终思考出的结论是,没有人喜欢一个满嘴谎话、不懂装懂的人,尤其是那些从未接触过AI、不知AI为何物的用户,第一次用上AIGC效率工具,往往会把对方当成一个在和自己交流的真实的人。

这样就会导致用户一旦发现AI不靠谱,就会气到当场弃用。

“目前LLM在解决幻觉问题上主要还是靠对齐,但这类技术治标不治本。要想彻底解决这个问题,我认为还得从LLM之外寻求答案。”

当然,“幻觉”仅仅是大模型存在的最大问题之一,另一个问题,也是大模型无法准确回答西游记里有多少孙悟空的另一个原因,是书中指代孙悟空的名词、代词太多,大模型目前的推理能力还无法进行精准判断。

“对于所有的程序员来说,逻辑推理都不是一个问题,1+1必然等于2。”正如吴翰清所说,“但是对于所有做神经网络的人来说,如何让神经网络自动生成1+1=2这个答案并不容易。”

基于这一点,KMind团队的思考逐渐清晰:

不如试试,统一神经网络和高级编程语言。

神经网络主要提供泛化能力,高级编程语言则提供逻辑推理能力和精准控制能力,两者连接起来,双管齐下,就能解决大部分问题。


提出“个人AI计算机”


沿着这个思路提出一种具体的解决办法,就是KMind所提出的造一个拥有新型计算机操作系统kOS的“个人AI计算机”。

先简单了解一下,什么是个人AI计算机。

一起来看个人AI计算机长啥样:

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

在这个架构中,依次有输入输出、记忆器、控制器、运算器和存储器。

其中,控制器相当于整个系统的“大脑”,是真正理解用户意图、并对复杂任务进行拆解,以及调度不同执行单元来完成用户任务的部分。

在这个部分里,为了模拟人的思考过程,又存在评估器和决策器。

与此同时,控制器还会不断和外界进行交互,通过多轮对话等方式,需要用户不断提供新的信息,形成反馈,然后整个系统不断进行迭代、循环。

难倒大模型的《西游记》问题,“个人 AI 计算机”或是一种解决方案

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier