对话百度肖阳：生成式大模型，搜索最重要的一块拼图

2023.10.20

图片来源：由无界 AI生成

大模型的出现，让「搜索」正在迎来一场从技术底层开启的变革。

国外谷歌、微软已经有了动作，国内百度也早已开始行动。今年三月推出文心一言以来，百度已经围绕搜索产品进行了多次升级，包括推出拥有多轮交互能力的 AI 伙伴；推出文心一言插件平台「灵境矩阵」；发布被 AI 重构的新产品「简单搜索」等。

在 2023 百度世界大会上，百度搜索完成了进一步的升级。李彦宏现场宣布，升级后的百度搜索将拥有「极致满足」的生成能力——在搜索框里输入问题，搜索可以不再是给出链接，而是直接生成一个最好的答案。此外，百度搜索还将增加帮助用户更好表达的「多轮交互」能力，和更能满足用户内容需求的「推荐激发」功能。

互联网世界如何变化，「搜索」都是用户刚需。其本质是，用户永远有主动对世界探索的需求。

而过去影响「搜索」的一个关键问题是「交付」——用户不太会搜，或者搜完了不精准、不全面，需要反复输入或打开链接才能得到答案。

这些问题由很多因素导致，一部分是商业模式，但关键还在于搜索引擎自身的技术原理——过去的「搜索」不是用户问搜索引擎，就给出一个答案，而是用户问完，它给出一串最有可能包含答案的「链接」。这些链接可能是网页、百科、文章或者短视频，需要用户一个个打开，然后判断有没有解答自己的问题。

而大模型和生成式 AI，至少会从三个层面改变「搜索」的逻辑：更精准地理解用户的提问并给到回复，在更懂用户的基础上推荐更多更合适的内容，以及给用户更多机会表达——这三个层面，也分别对应「新搜索」所强调的，极致满足、推荐激发和多轮交互。

这个逻辑本身不难推演，但要落地却面临很多现实问题。大模型的技术能力是否达到要求，新的搜索产品如何定义，是否需要构建一个新的商业模式来支撑，以及如何规划一个清晰的路线图，实现到「新搜索」的过渡。

带着这些问题，百度世界大会期间，极客公园创始人张鹏和百度集团副总裁、搜索平台负责人肖阳进行了近两个小时的交流。他们共同追溯了百度搜索演变的历史，分析了大模型如何改变搜索体系，并探讨了大模型时代搜索的未来。

以下是对话全文。

01 搜索的持续进化

极客公园：百度内部是怎么定义所谓的搜索层面的变革或者说重构？

肖阳：搜索内部这几年都在发生巨大的重构，我们的系统每两三年也要重构一次。技术的浪潮，有些是看得见的，更多是看不见的，ChatGPT 这次是公众能看得见的浪潮，因为它和自然语言的关联很紧密，所以人们能理解这次变革意味着什么。

但是过去也都有这种大的技术变革不断发生，我们的系统也在发生相关变化。回顾起来，百度搜索历史上有好几次都是属于重构性质的，比如框计算，深度语义匹配，深度问答……

随着技术的发展日新月异，我们肯定会很频繁地继续做这种深度重构。最近四、五年，每一年我都感觉搜索在做一个彻底的变革，而且速度越来越快，这会是一个永远持续不断的过程。

极客公园：3 月份文心大模型发布之后，搜索经历了什么样的变化过程？大模型对搜索这个体系是怎么产生影响的？

肖阳：实际上我们在 ChatGPT 发布之后，立刻就将生成式技术融合进搜索了。

在这个过程中，百度一直想聚焦的一件事就是让用户更自然地表达需求，一个是更精准，一个是更好消费。历史上几次代际变革也是朝这个方向走。

2009 年 Robin（注：李彦宏，下同）提出的框计算其实就是这个概念。那个时候，阿拉丁是 Robin 在全球最先提出来的概念，现在我们的阿拉丁覆盖面，做得精细程度和投入的资源，都比包括谷歌在内的其他搜索引擎更好。

还有我们做的语义检索、语义匹配。之前的对称匹配技术，需要答案中带有跟问题相同的关键字才能识别。2019 年 Transformer 成熟了以后，它能突破非对称语义匹配的技术瓶颈。很多答案只要是在回答问题，都能很好识别。我们很早就判断出这个技术，能给搜索带来很大提升，在这方面大规模应用是最早、最深、最广的。

极客公园：你们是怎么用大模型来解决「非对称匹配」的问题？

肖阳：我们对搜索的要求是给到用户精准性很高的回答，精准的同时还要丰富。

对话百度肖阳：生成式大模型，搜索最重要的一块拼图

加⼊OKEx全球社群

相关推荐