某地址近24小时内从Binan
对话王小川:大模型创业核心,是想好技术如何匹配产品
原文来源:极客公园
作者 | 宛辰、Moonshot
编辑 | 靖宇
图片来源:由无界 AI生成
过去八个月,百川智能团队依托对搜索、高质量数据处理等 AI 技术积累,在模型尺寸、质量上迅速迭代。百川智能创始人、CEO 王小川认为,百川应该在「理想上慢半步,落地上快三步」。
2023 年 12 月 16 日,在极客公园创新大会 2024 的现场,王小川进一步分享了大模型的新思考。
对于大模型的演进方向,王小川认为,目前大模型是「学」,但是「不思」,接下来模型演进的方向是把「学」和「思」要合在一起。而大模型时代做应用,必须考虑大模型技术的特点,这是过去做产品和现在最大的不同。
「过去做应用,老讲产品和市场之间的匹配——PMF(Product Market Fit,产品市场匹配),但产品和市场之外把一个词丢掉了,技术。」
他认为,当前的大模型技术距离 AGI 还比较远,这种不完美的前提下更要明确:「这样一个技术适合什么样的产品」,而不是产品经理洞察市场,回来就开始做。
在王小川看来,大模型带来的新的开发范式下,产品经理的出发点,应该从思考产品市场匹配(PMF),到思考技术与产品的匹配怎么做,即 TPF(Technology Product Fit,技术产品匹配)。
一个大模型应用,怎么才算成功,王小川认为首先是能提供比传统应用好十倍的体验,用户能「用得爽」。而要做出这样的应用,产品经理不仅首先自己要是大模型的狂热粉丝,而且还既要有传统产品经验,又有想象力,能够想出大模型长什么样。
以下为王小川极客公园创新大会 2024 对话实录
01 大模型的「学」和「思」
张鹏:你来过我们大会很多次了,刚才你也很认真地在听两位技术专家的探讨,他们谈到了前一段时间 OpenAI 事件背后有一些技术的关键因素,甚至提到了大模型需要慢思考的能力,不知道你有什么看法?
王小川:是的,今年筹备大模型到 4 月份成立公司,我提了几个关键词,一个叫搜索增强,因为要把传统知识接进去,第二个我希望是大模型做强化学习,当时提这个点,是因为已经看到了大模型本身代表了一种快思考的方式,像人一样,一拍脑袋我就给你答案,张口就能说,它这种学习和应用推理的方法是有自己的不足的,以大模型为原点肯定不够,当时我们认为强化学习可以产生很大帮助,这在百川内部工作里面,也是一直非常关注的领域。
张鹏:就是慢思考?
王小川:对,就是慢思考,相对于慢思考,今天的大模型就是代表快思考。说两点自己的见解吧:快思考它都不叫「思」,慢思考的话我认为它才有这样更多「思」,以 OpenAI 大模型为代表,它叫「学」,它的知识来源是学过来的。
我并不强调推理的「思」,其实人在学习的时候,你可能就要想半天,这叫思,所以之前话孔子有一句话「学而不思则罔、思而不学则殆。」
具体投射下来,大模型就是学,它其实是不思的,它不像人一样,会来回琢磨,会把想象空间打开来看,什么系统是在思?OpenAI 刚成立公司以及 DeepMind 做的事情,比如做 AlphaZero 和打游戏,这个事情是在思。
但是那个是强化学习的设置上,叫多智能体的对抗,AlphaZero 它不是一个学习系统,它把之前 6000 万局(棋谱训练)的棋都扔掉了,反而是自己在对抗博弈,在博弈中找到一种新的理解,最后通了,它是这样一个「思」。
AlphaZero 思完之后它停在原地,就是「殆」,它只做特定的任务,无法把它拓展到其他的领域里面,因此我们说大模型代表了「学」,AlphaZero 代表了「思」,这两个系统集在一块就会很厉害。
百川智能创始人、CEO 王小川和极客公园创始人兼总裁张鹏分析大模型的「学」与「思」|极客公园
张鹏:所以接下来很重要的是要真正做到学而思是吧?学和思要合在一起。
王小川:对。具体一点的话,我们想的「思」这个场景,是你问大模型围棋怎么下,它其实是不会下的。但是你问一个围棋输了赢了能判定吗?大模型根据它已有的知识,是能够判定的。甚至你说写一个代码来判定这个围棋的输赢,大模型是可以把这个代码写出来的。
你再让它写一个代码,每走一步棋之后这个棋的状态是怎么转移的,也就是下棋的整个过程,它也能写出来。