开源竞速:AI大模型的“
谁在布局生成式AI?一文详解生成式AI的行业应用版图
原标题:《谁在布局生成式AI?》
作者:白惠天,腾讯研究院研究员;王强,腾讯研究院资深专家、前沿科技研究中心主任
纵览生成式人工智能(Generative AI或AIGC,两种表述均可,国内更多用AIGC)进化史,从AI诞生之始,人们就试图让机器生成内容,与其对话,并诞生了最早的图灵测试标准。多年来,生成式AI的发展一直不温不火。直到去年Midjourney、Stable Diffusion等文生图应用点燃了大众的热情,再到11月ChatGPT的横空出世,更是引发了现象级热潮,让生成式AI走入了亿万用户的视野。
本文结合国际企业实践经验,从大模型生态构建方式、行业应用的切入路径这两个视角切入,描绘生成式AI的行业应用版图,分享我们初步的观察与思考。
大模型的生态
模型即服务(MaaS)的新生态加速形成
结合目前行业“基础设施层-模型层(MaaS)-应用层”三层结构,我们预计未来可能形成一个模型即服务(MaaS)的新生态。自下而上,三层结构的构成如下:
基础设施层:GPU芯片、AI芯片、超级计算机等算法基础设施,以及机器学习框架、云操作系统等软件。
模型层(MaaS):通用AI大模型,以及基于大模型在垂直领域训练生成的行业模型(中间层),即在预训练AI大模型基础上,可以快速微调或使用嵌入等方式、开发出场景化、定制化、个性化的中小模型,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。
应用层:AIGC技术面向终端用户带来的新的功能、产品、服务和应用等;正如之前的“互联网+”一样,“AIGC+”或者说“AI+”将来有望和各行各业深度结合,持续带来新的应用形式。未来,一方面,现有的APP都可以用大模型重做一遍,另一方面,还会出现更多新的AI原生类APP,从而诞生更多新的独角兽甚至巨头企业。
大模型走向通用性和垂直性并重的纵深布局
在AIGC技术应用布局上,通用性和垂直性并重。
所谓“通用性”指的是横向能力,适用于各个行业,具体而言包括语义多轮对话、知识库构建、智能搜索、企业级RPA、多模态内容生成、代码生成等方面:
1、语义多轮对话:AIGC技术在语义多轮对话中发挥着巨大的优势,尤其是在高客单价销售和私域交流场景下。例如,直播话术中,AIGC能够迅速学习并掌握最佳实践,如各类Chatbot和IQ for sales。
2、知识库构建:AIGC技术从简单的资料概括整理发展到帮助用户阅读理解、生成个性化资料库,以及基于高效资讯归纳的新搜索功能。这使得AIGC既可应用于企业级人工智能,也可成为个人助理(如Mem)。
3、智能搜索:AIGC在智能搜索领域的应用也取得了显著成果,如New Bing、Perplexity等。凡积累了知识库的系统,都可以借助AIGC实现语义搜索功能。
4、企业级RPA(Robotic Process Automation):结合LLM(Large Language Models)技术和RPA,AIGC在企业级应用中发挥着重要作用。典型应用包括微软的Copilot以及CRM领域的Salesforce等,它们紧密结合行业场景,为用户赋能。
5、多模态内容生成:在智能写作助手、广告主视觉创作、智能NPC等领域,AIGC技术带来了创新应用,除了文字,还可以生成图片、视频,甚至3D数字内容。
6、代码生成:代码作为一种更标准化的文本,AIGC在代码生成方面具有巨大潜力,如GitHub Copilo已经有很不错的表现,在这个领域,正在有更多的代码生成工具出出现,有望大幅提升码农的生产力,也为普通的非技术工作者提供了更为便捷的工具,大幅降低了编程门槛。
所谓“垂直性”指的是纵向能力,通过对不同行业Know-how的学习,AIGC技术可以进化为行业专家,从而大幅加速各行业的数字化转型。
结合国外企业的投融资信息,我们列举了医疗、金融、零售和制造几个行业的典型例子:
国外科技企业纷纷“卷”出了新高度
在Open AI的直接带动(微软)或刺激(谷歌等)下,大模型已经成为巨头军备竞赛新的杀手锏。不仅加速大炼“大模型”,还在原有的产品中快速加入大模型的能力,以期在新的范式转换和技术浪潮中占得先机。