对话王小川：大模型创业核心，是想好技术如何匹配产品

2023.12.18

原文来源：极客公园

作者 | 宛辰、Moonshot

编辑 | 靖宇

图片来源：由无界 AI生成

过去八个月，百川智能团队依托对搜索、高质量数据处理等 AI 技术积累，在模型尺寸、质量上迅速迭代。百川智能创始人、CEO 王小川认为，百川应该在「理想上慢半步，落地上快三步」。

2023 年 12 月 16 日，在极客公园创新大会 2024 的现场，王小川进一步分享了大模型的新思考。

对于大模型的演进方向，王小川认为，目前大模型是「学」，但是「不思」，接下来模型演进的方向是把「学」和「思」要合在一起。而大模型时代做应用，必须考虑大模型技术的特点，这是过去做产品和现在最大的不同。

「过去做应用，老讲产品和市场之间的匹配——PMF(Product Market Fit，产品市场匹配），但产品和市场之外把一个词丢掉了，技术。」

他认为，当前的大模型技术距离 AGI 还比较远，这种不完美的前提下更要明确：「这样一个技术适合什么样的产品」，而不是产品经理洞察市场，回来就开始做。

在王小川看来，大模型带来的新的开发范式下，产品经理的出发点，应该从思考产品市场匹配（PMF），到思考技术与产品的匹配怎么做，即 TPF（Technology Product Fit，技术产品匹配）。

一个大模型应用，怎么才算成功，王小川认为首先是能提供比传统应用好十倍的体验，用户能「用得爽」。而要做出这样的应用，产品经理不仅首先自己要是大模型的狂热粉丝，而且还既要有传统产品经验，又有想象力，能够想出大模型长什么样。

以下为王小川极客公园创新大会 2024 对话实录

01 大模型的「学」和「思」

张鹏：你来过我们大会很多次了，刚才你也很认真地在听两位技术专家的探讨，他们谈到了前一段时间 OpenAI 事件背后有一些技术的关键因素，甚至提到了大模型需要慢思考的能力，不知道你有什么看法？

王小川：是的，今年筹备大模型到 4 月份成立公司，我提了几个关键词，一个叫搜索增强，因为要把传统知识接进去，第二个我希望是大模型做强化学习，当时提这个点，是因为已经看到了大模型本身代表了一种快思考的方式，像人一样，一拍脑袋我就给你答案，张口就能说，它这种学习和应用推理的方法是有自己的不足的，以大模型为原点肯定不够，当时我们认为强化学习可以产生很大帮助，这在百川内部工作里面，也是一直非常关注的领域。

张鹏：就是慢思考？

王小川：对，就是慢思考，相对于慢思考，今天的大模型就是代表快思考。说两点自己的见解吧：快思考它都不叫「思」，慢思考的话我认为它才有这样更多「思」，以 OpenAI 大模型为代表，它叫「学」，它的知识来源是学过来的。

我并不强调推理的「思」，其实人在学习的时候，你可能就要想半天，这叫思，所以之前话孔子有一句话「学而不思则罔、思而不学则殆。」

具体投射下来，大模型就是学，它其实是不思的，它不像人一样，会来回琢磨，会把想象空间打开来看，什么系统是在思？OpenAI 刚成立公司以及 DeepMind 做的事情，比如做 AlphaZero 和打游戏，这个事情是在思。

但是那个是强化学习的设置上，叫多智能体的对抗，AlphaZero 它不是一个学习系统，它把之前 6000 万局（棋谱训练）的棋都扔掉了，反而是自己在对抗博弈，在博弈中找到一种新的理解，最后通了，它是这样一个「思」。

AlphaZero 思完之后它停在原地，就是「殆」，它只做特定的任务，无法把它拓展到其他的领域里面，因此我们说大模型代表了「学」，AlphaZero 代表了「思」，这两个系统集在一块就会很厉害。

百川智能创始人、CEO 王小川和极客公园创始人兼总裁张鹏分析大模型的「学」与「思」｜极客公园

张鹏：所以接下来很重要的是要真正做到学而思是吧？学和思要合在一起。

王小川：对。具体一点的话，我们想的「思」这个场景，是你问大模型围棋怎么下，它其实是不会下的。但是你问一个围棋输了赢了能判定吗？大模型根据它已有的知识，是能够判定的。甚至你说写一个代码来判定这个围棋的输赢，大模型是可以把这个代码写出来的。

你再让它写一个代码，每走一步棋之后这个棋的状态是怎么转移的，也就是下棋的整个过程，它也能写出来。

对话王小川：大模型创业核心，是想好技术如何匹配产品

01 大模型的「学」和「思」

加⼊OKEx全球社群

相关推荐