大模型慢半拍，字节甘做“嫁衣”？

2023.05.05

文：财经故事荟，采写：王舒然，编辑：万天南

图片来源：由无界 AI工具生成

在大模型甚嚣尘上的当下，一向高举高打的字节，却一反常态，低调得让人不太习惯。

当百度、阿里、华为、360等知名互联网公司的一把手们亲自挂帅，为大模型站台，并不吝用“智能化时代的开端”、“科技和商业史上的革命性时刻”来赞誉它时，字节却安静得多。

相关的官宣只有两个，一是4月11日,飞书宣布将推出AI助手“My AI”，二是4月18日，火山引擎推出大模型训练云平台，包括自研DPU（数据处理器）、新版机器学习平台等系列云产品，以服务于大模型创业公司——字节自研大模型始终未露面。

相反的是，火山引擎总裁谭待公开“承诺”，火山引擎不做大模型，将化身赋能者，为大模型客户提供算力等AI基础设施，帮助其做好大模型开发。

此举似乎表明，字节避开了大模型战火，选择以幕后卖水者的身份入局。

只是，在算力、算法、数据这大模型的三要素上均具备优势的字节，为何会选择“韬光养晦”？字节真的会彻底放弃大模型，甘为他人做“嫁衣”吗？

慢一拍的字节大模型

火山引擎不做大模型，或许并不代表字节对大模型无动于衷，这可能是个文字游戏。

实际上，虽然字节从未大张旗鼓得官宣自研大模型，但已经有所部署。

据36Kr在今年2月的报道，字节跳动在大模型上已有布局，会在语言和图像两方面发力，语言大模型团队由字节搜索部门牵头，目前团队规模在十数人左右；图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

另据《晚点LatePost》报道，张一鸣开始看人工智能论文，且时常会和一些字节人士分享论文心得和对ChatGPT的思考。

这表明，字节并不想缺席这场盛宴，但必须承认的是，字节在大模型上的反应确实有点“迟钝”了。

民生证券4月9日发布的《当大模型不再稀缺》报告显示，国内至少已有30多家大模型亮相。大部分都在3～4月份官宣，比如3月16日的百度“文心一言”大模型，4月8日的华为盘古系列AI大模型，4月10日的商汤“日日新”大模型，4月11日的阿里“通义千问”大模型......

而据36Kr报道，字节语言大模型团队今年初才成立，预期今年年中推出大模型，字节跳动相关技术负责人表示，技术中台在这些领域的探索仍处于初期，尚未成熟。

事实上，大模型竞赛的起点并非今天，而在更早的布局，这方面，字节有些晚了。

对比来看，百度、阿里、华为、腾讯等企业的大模型均在2019年～2021年间就已有雏形，比如，百度在2019年发布了文心大模型，阿里在2021年发布了M6大模型，同年华为发布盘古大模型，这些雏形可以视为近期发布的类ChatGPT大模型的“基座”。

而字节方面，虽然其AI布局不算晚，字节AI Lab早在2016年就成立，与腾讯同一年，但其似乎并未在大模型上下足功夫。

据《晚点LatePost》报道，一位字节人士称，在去年底ChatGPT出现前，字节对大模型的投入还比较少，表现之一是，约有100人的字节AI Lab NLP（自然语言处理）组，只有不到10人在研究语言大模型，其他人主要在做翻译和抖音安全等优化。

知乎上一位字节AI Lab工程师的回答也印证了这一点，他表示，字节AI Lab的主要研究方向和业务应用有关，比如抖音特效、视频和图片审核等。

简单来说，字节对AI的探索比较务实，主要服务于自家业务，这种务实而非务远的策略，或许反而成了其布局通用大模型的“阻碍”。

而除了晚一步之外，字节对大模型的野望似乎也不是很大。

据《晚点LatePost》报道，字节语言大模型的探索方向主要与搜索相关，可能会在抖音、TikTok中推出类似微软New Bing的功能；图像大模型则主要服务商业化需求，以帮助字节的广告客户以更低成本制作视频。

另据字母榜报道，有知情人士称，飞书推出的“My AI”背后的大模型是由飞书自行操盘，而非字节大模型团队负责。

从上述信息判断，字节大模型似乎并不打算“大包大揽”，而是与自家部分业务紧密相关，这与百度“文心一言”、阿里“通义千问”等通用大模型有所差别。

比如“文心一言”，在发布会现场，文心一言展示了五个使用场景，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

免责声明:数字资产交易涉及重大风险，本资料不应作为投资决策依据，亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考，不构成任何投资建议，用户一切投资行为与本站无关。

和全球数字资产投资者交流讨论

扫码加入OKEx社群