复制成功

分享至

主页 > 比特币 >

对话百度肖阳:生成式大模型,搜索最重要的一块拼图

2023.10.20
对话百度肖阳:生成式大模型,搜索最重要的一块拼图

图片来源:由无界 AI生成

大模型的出现,让「搜索」正在迎来一场从技术底层开启的变革。

国外谷歌、微软已经有了动作,国内百度也早已开始行动。今年三月推出文心一言以来,百度已经围绕搜索产品进行了多次升级,包括推出拥有多轮交互能力的 AI 伙伴;推出文心一言插件平台「灵境矩阵」;发布被 AI 重构的新产品「简单搜索」等。

在 2023 百度世界大会上,百度搜索完成了进一步的升级。李彦宏现场宣布,升级后的百度搜索将拥有「极致满足」的生成能力——在搜索框里输入问题,搜索可以不再是给出链接,而是直接生成一个最好的答案。此外,百度搜索还将增加帮助用户更好表达的「多轮交互」能力,和更能满足用户内容需求的「推荐激发」功能。

互联网世界如何变化,「搜索」都是用户刚需。其本质是,用户永远有主动对世界探索的需求。

而过去影响「搜索」的一个关键问题是「交付」——用户不太会搜,或者搜完了不精准、不全面,需要反复输入或打开链接才能得到答案。

这些问题由很多因素导致,一部分是商业模式,但关键还在于搜索引擎自身的技术原理——过去的「搜索」不是用户问搜索引擎,就给出一个答案,而是用户问完,它给出一串最有可能包含答案的「链接」。这些链接可能是网页、百科、文章或者短视频,需要用户一个个打开,然后判断有没有解答自己的问题。

而大模型和生成式 AI,至少会从三个层面改变「搜索」的逻辑:更精准地理解用户的提问并给到回复,在更懂用户的基础上推荐更多更合适的内容,以及给用户更多机会表达——这三个层面,也分别对应「新搜索」所强调的,极致满足、推荐激发和多轮交互。

这个逻辑本身不难推演,但要落地却面临很多现实问题。大模型的技术能力是否达到要求,新的搜索产品如何定义,是否需要构建一个新的商业模式来支撑,以及如何规划一个清晰的路线图,实现到「新搜索」的过渡。

带着这些问题,百度世界大会期间,极客公园创始人张鹏和百度集团副总裁、搜索平台负责人肖阳进行了近两个小时的交流。他们共同追溯了百度搜索演变的历史,分析了大模型如何改变搜索体系,并探讨了大模型时代搜索的未来。

以下是对话全文。


01 搜索的持续进化


极客公园:百度内部是怎么定义所谓的搜索层面的变革或者说重构?

肖阳:搜索内部这几年都在发生巨大的重构,我们的系统每两三年也要重构一次。技术的浪潮,有些是看得见的,更多是看不见的,ChatGPT 这次是公众能看得见的浪潮,因为它和自然语言的关联很紧密,所以人们能理解这次变革意味着什么。

但是过去也都有这种大的技术变革不断发生,我们的系统也在发生相关变化。回顾起来,百度搜索历史上有好几次都是属于重构性质的,比如框计算,深度语义匹配,深度问答……

随着技术的发展日新月异,我们肯定会很频繁地继续做这种深度重构。最近四、五年,每一年我都感觉搜索在做一个彻底的变革,而且速度越来越快,这会是一个永远持续不断的过程。

极客公园:3 月份文心大模型发布之后,搜索经历了什么样的变化过程?大模型对搜索这个体系是怎么产生影响的?

肖阳:实际上我们在 ChatGPT 发布之后,立刻就将生成式技术融合进搜索了。

在这个过程中,百度一直想聚焦的一件事就是让用户更自然地表达需求,一个是更精准,一个是更好消费。历史上几次代际变革也是朝这个方向走。

2009 年 Robin(注:李彦宏,下同)提出的框计算其实就是这个概念。那个时候,阿拉丁是 Robin 在全球最先提出来的概念,现在我们的阿拉丁覆盖面,做得精细程度和投入的资源,都比包括谷歌在内的其他搜索引擎更好。

还有我们做的语义检索、语义匹配。之前的对称匹配技术,需要答案中带有跟问题相同的关键字才能识别。2019 年 Transformer 成熟了以后,它能突破非对称语义匹配的技术瓶颈。很多答案只要是在回答问题,都能很好识别。我们很早就判断出这个技术,能给搜索带来很大提升,在这方面大规模应用是最早、最深、最广的。

极客公园:你们是怎么用大模型来解决「非对称匹配」的问题?

肖阳:我们对搜索的要求是给到用户精准性很高的回答,精准的同时还要丰富。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier