复制成功

分享至

主页 > 比特币 >

“百模大战”下半场开打,平台将成关键

2023.11.10

原文来源:钛媒体

“百模大战”下半场开打,平台将成关键

图片来源:由无界 AI生成

离大模型走进人们的视野已经过去近一年的时间,在AI大模型的浪潮下,各大科技企业争先恐后的推出了各自的大模型产品。与此同时,各行业企业也对大模型保持着高度关注。

如果说,各大厂商纷纷推出大模型产品形成“百模大战”的局势,是大模型这场“战役”的上半场的话,那么这场“战役”的下半场将更聚焦在大模型产品的整合能力,以及平台化、行业化的发展方向。


下半场开打,平台化、行业化将成关键赛道


从大模型这一年的发展可以看出,目前各个厂商的大模型几乎是“各自为战”,都通过自身的产品意图抢占更多的市场,以大模型“鼻祖”ChatGPT为例,ChatGPT是个应用,可以看作一个APP,而GPT4则是个大模型,构建了类似大模型的生态,让企业可以以此为基础,打造自身的大模型。

从上述案例可以看出,过去近一年的时间,各家都将主要精力放在类似“ChatGPT”的产品打磨上,落地点在应用侧,而对于企业侧而言,目前行业还是较缺乏一个平台,让企业可以灵活调用各家大模型产品,或者基于某家的产品开放针对自身需求的大模型。在神州数码副总裁CTO李刚看来,大模型如果想要在企业侧实现应用的爆发,需要一个,甚至多个开源、开放的大模型平台。

说到企业级大模型应用,就不得不提一提行业大模型,钛媒体观察发现,目前行业级大模型还处于发展的初级阶段,虽然有很多家企业推出了行业大模型,但是应用并不很好。

以发展较快的金融行业为例,今年3月,彭博首度针对金融业推出大型语言模型BloombergGPT,引发市场对金融垂直领域大模型的关注;6月,哥伦比亚大学联合上海纽约大学推出FinGPT 。

在国内,7月,华为全新发布盘古大模型,金融行业大模型正是其中数个行业通用大模型之一;9月,蚂蚁集团正式发布自研“蚂蚁基础大模型”,以及在此基础上进行定制的“蚂蚁金融大模型”。

李刚对钛媒体表示,目前市面上的大模型种类主要分为几类,一类是通用的基础大模型,一般来说,这些大模型通过自然语言的语料构建数据库,经过清洗、训练等操作,打造了基础大模型,“这类模型,语料库越大、参数量越大,能力就越强。”李刚表示。

另一类就是行业大模型,这类模型具有极强的专业性,需要大量行业专业知识库,“目前,这个行业知识库的语料需控制在20%,不多不少。”李刚强调,“超过20%,训练出来的大模型可能就‘不会说人话’,造成沟通障碍;少于20%,又不具备行业的专业性。”


打造大模型的“PaaS”层


就像云计算有IaaS、PaaS、SaaS之分一样,在神州数码战略营销部总经理皇甫子乔看来,大模型时代,企业也需要一个类似云时代PaaS平台。

为了给企业构建一个更好使用大模型的平台,神州数码近日正式发布了神州问学平台,谈及平台发布的意义时,李刚对钛媒体表示:“以神州问学平台为核心,我们不做基础大模型,而是做大模型的集成与应用开发交付平台,从而加速企业AI创新;我们做大数据的服务伙伴,从而加速企业数据治理升级;我们做生态纽带、模型市场、数据集市、应用商店,从而加速产业创新与生态破局。”

今年初,华为云发布了盘古大模型,并将大模型按照L0、L1、L2进行了分级。按照华为云的分类,L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。

基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。

行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。

推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。

上述是华为云对于大模型的理解,以及华为云的一些产业布局。基于此,皇甫子乔对钛媒体表示,神州数码问学平台在帮助企业从L0到L2行业应用场景落地过的程中,将起到“转换器”的作用,“为企业提供一个类似云计算时代PaaS平台的能力。”皇甫子乔如是说。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier