大模型之战下半场：从通用到行业垂直，「向下」扎根

2023.12.19

原文来源：第一新声

作者 | 秋平，编辑 | 也行

图片来源：由无界 AI生成

近日，第一新声联合天眼查正式发布了《2023年中国AIGC创新企业系列榜》，从基础层、模型层、应用层三个维度展示了生成式AI的产业链布局。其中模型层主要包括通用大模型和垂直大模型（场景/领域/行业大模型）。

目前基础层只有头部"氪金玩家"才有资格入局，不在激烈内卷之列。应用层是长在大模型上的“高岭之花”。而大模型作为生成式AI的基础模型，为其提供强大的语言处理能力和广泛的适用性。根据公开资料显示，截至今年10月份，国内已经发布了238个大模型。“百模大战”正厮杀得异常火热！

第一新声从榜单评选与调研的过程中发现，国内大模型之战正逐渐步入后半场。头部科技企业的发力点开始从通用大模型，转向行业/领域等垂直大模型，开始「向下」扎根。

例如阿里云在10月31日不仅发布了通义千问大模型最新的2.0版本，还推出了八大行业大模型；9月21日，华为云发布了盘古医学大模型；9月19日，百度正式发布国内首个“产业级”医疗AI大模型——灵医大模型。可以说继“AI For Science”之后，大模型已然开始步入“AI For Industries”阶段。

为了深入研究通用大模型和垂直大模型的发展方向和应用效果，第一新声特别采访了3家企业，以各家企业的实践为出发点，全面介绍了通用VS垂直大模型的演进方向。

01 国内大模型超200+，聚焦3大基础应用场景

从年初ChatGPT横空出世至今，引爆了国内外大模型的热情，各路资金蜂拥而至。

据相关媒体报道，目前全球最大的大模型开源社区Hugging Face上的预训练模型数量，已经从此前积累的10万个增长到了超过30万个。不知Open AI当初发布ChatGPT的时候，是否预想到会有如今的盛况。

回归国内市场来看，据公开资料不完全统计显示，截至2023年11月底，国内已经有200+大模型推出，并且在各行各业“落子不断”。从统计数据来看，除了通用大模型外，在金融行业的落地速度最快，有近15%的大模型都是金融垂直大模型。

在大模型厂商类型方面，国内互联网科技公司纷纷入局，包括百度、阿里、腾讯、华为等大厂，科大讯飞、商汤科技、旷视科技等垂直于AI领域的厂商，以及智谱华章、百川智能、达观数据、等大模型初创企业，还有金融、汽车、教育、智能家居、消费电子等垂直行业企业也基于垂直领域人工智能技术和数据积累等能力，推出大模型。（点击《2023年中国AIGC创新企业系列榜》，查看国内通用大模型和垂直大模型企业榜）

值得注意的是，今年上半年，大家关注点主要集中在大模型的参数数量和效果优化上。从下半年开始，将关注重点转向如何实际进行应用，以及企业怎样利用其能力带来革命性提效。第一新声采访到的三家企业，经过半年实践，也逐渐摸索出各具特色的大模型发展道路。

例如沃丰科技于今年4月推出的“原心大模型”，其解决方案吸收了通用大模型能力，并在营销+服务领域的8年经验基础上进行行业知识训练，将通用大模型转变为行业专家，并能依托企业信息搭建专属知识库。目前沃丰科技已成功将该大模型应用于旗下Udesk、GaussMind、ServiceGo、微丰四大产品线。

沃丰科技AI算法专家赵超表示：“大模型对算力和数据有巨大需求，而沃丰科技自成立以来就积累了大量线上文字、文本和语音数据。基于现有数据，公司计划针对行业或特定场景进行模型迭代。为此，团队采用行业开源模型，并利用自己在客服行业积累的数据，进行模型的优化和创新，以更好地满足行业需求，并提高在特定场景中的应用效果。”

在大模型全量参数的迭代中，会遇到一些技巧和语言问题，为此沃丰科技采取了两种训练策略。一是固定一部分参数，只对其余参数进行迭代。二是在通用大模型基础上，进行小模型迭代。

云从科技在5月份正式推出“从容大模型”，最大的特色就是云从科技具有多模态系列大模型，并具有对行业大模型的调整能力，可以根据行业场景需求去帮助客户部署模型，实现性价比最优。7月份云从科技携手华为正式联合发布了“从容大模型训推一体化解决方案”。该方案基于云从从容大模型算法及工具，使得用户可以轻松地训练、构建和管理自己的大模型。

大模型之战下半场：从通用到行业垂直，「向下」扎根

加⼊OKEx全球社群

相关推荐