Lens推出基础设施Lens Netw
大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘
文章来源: 机器之心
作者:Esther
大模型的性价比之战已经来到了新的阶段。
5月15日,2024火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布,字节跳动内部自研的豆包大模型正式在火山引擎上对外开放服务。
豆包大模型在价格上主打“极致性价比”:豆包通用模型pro-32k版,推理输入价格0.0008元/千tokens,较行业价格低99.3%。一元钱能买到豆包主力模型的125万tokens,相当于三本《三国演义》的输入量。
谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。过去一年时间中,许多企业已经从探索尝试大模型,到成功将大模型与核心业务流结合。不论是探索阶段的小场景试错环节,还是大流量的核心业务流结合环节,大模型成本高昂问题始终是制约大模型在千行百业落地的关键要素之一。
除了成本,企业大模型落地过程中还可能面临的模型效果差、信息安全、算法实践经验少等问题,大模型服务平台火山方舟2.0版本提出了更具体的解决方案,其平台模型效果、核心插件、系统性能和平台体验层面全面升级。
在大会前的采访中,火山引擎智能算法负责人、火山方舟负责人吴迪向机器之心透露,根据字节跳动内部的判断,当前阶段已经处在大模型规模化落地的爆发前夕,预计2024年年底或者2025年初,企业对大模型的调用量将出现一个陡峭上升、流量激增的拐点。
吴迪认为,在大模型整体落地走向拐点的过程中,模型效果、系统承载力以及性价比三个重要痛点将会更加明显,火山方舟未来也将在这三方面持续发力。
模型效果提升,支持日千亿级别tokens调用量
模型的性能和效果是制约许多企业创新场景的首要条件。作为大模型服务平台,火山方舟平台在模型上希望打造一个“精品模型商店”。根据吴迪的说法,跟去年相比,火山方舟平台在模型的上架上,呈现更加严谨和收缩的态势。“只选择最优秀的闭源大模型,以及能够持续发展的开源大模型”。
在这次的火山引擎FORCE原动力大会上,字节跳动内部的豆包大模型首次面世,而火山方舟将是豆包大模型的唯一使用入口。
字节跳动向外一次性推出了豆包大模型的全系列模型,包括豆包通用模型pro/lite、角色扮演模型、语音合成模型、语音识别模型、声音复刻模型、Function call模型、文生图模型以及向量化模型。
不同模型面向不同的场景需求。在通用需求上,豆包通用模型pro版能够提供更加专业且泛化的能力,窗口尺寸最大可达128K,全系列可精调,具备强理解、生成、逻辑和记忆力,在问答、总结摘要、创作、文本分类、角色扮演等通用场景具备全面通用的能力。而lite版,则面向更追求性价比的客户,更加轻量。
其他细分场景模型支持和加强单一细分场景的能力。比如,角色扮演模型极大地加强了模型在角色扮演方面的能力,能够支持老师、朋友、宠物等角色的扮演需求;语音合成模型拥有超自然语音合成能力,做到5s声音克隆,支持听书、陪伴交互等场景;语音识别模型,支持多语种复杂场景语言识别需求,相比小模型识别错误率降低30%,在音乐、科技、教育、医疗等垂直领域识别错误率降低50%以上。
经过过去一年的内部打磨,豆包大模型从1.0进化到3.0,在字节跳动内部被用于办公智能助手、电商导购、售后客服、营销创作、数据智能分析、编程助手等等50余个业务场景,日调用量达到1200亿tokens(约1800亿汉字),图片生成量超过3000万张。目前由豆包大模型支持的AI应用助手豆包APP累计下载量超过1亿,桌面+App双端月活用户量2600万,支持创建的智能体总量超过800万。
在采访中,吴迪向机器之心解释称,当前豆包大模型每日千亿tokens级别的量级是目前中国(大模型)市场上非常大的单日吞吐量。这意味着,豆包大模型以及火山方舟的平台已经经过了大流量的生产环境验证,因此即使面对流量非常大,对效果要求非常严苛的客户,被内部业务打磨后的豆包大模型也能够支持这类需求。
处理大流量的能力在大模型落地拐点到来后将非常重要。根据吴迪的预判,到了24年底或者到了25年的时候,企业在大语言模型的调用量上面将是今年的数十倍以上。随着企业将大模型纳入自己的核心业务流中,处理大流量的需求也会逐渐拓展。
“大模型的落地不是一件从帽子里拽出来兔子的一个魔法。要把大模型在企业的具体环境里面用好,来解决那些远高于公开评测集的困难问题,是需要有一定的算法协助的。”
在模型效果的提升上,除了模型本身的能力提升和场景聚焦,针对许多客户在工程落地上的困难,火山方舟还形成了专业的算法服务团队,可以在落地全过程,协助业务诊断、训练优化、问题解答,比如提示词工程,协助用模型和客户的数据去做一些精调和训练,保障项目落地。
目前,豆包大模型团队还在重兵投入,持续招揽研究型专家和高潜人才。在字节跳动招聘官网上搜索“豆包大模型”,即可看到该团队有大量职位在招,对大模型的坚决投入可见一斑。
系统承载力增强,完成分钟级千卡伸缩