ChatGPT成企业应用最多生成
Meta 发布新模型架构 Megabyte,比 Transformer 快四成
2023.05.30
据《科创板日报》5 月 30 日报道,Meta 日前发布全新模型架构 Megabyte,这是一种多尺度解码器架构,可对超过一百万字节的序列进行端到端可微分建模,并可跨多种格式生成超过 100 万个 token。Meta 团队声称,Megabyte 能解决 Transformer 硬伤,速度还能提高 40%。
原文链接