复制成功

分享至

主页 > 比特币 >

ChatGPT 启示录系列丨谁卡住了中国 GPT 的“脖子”?

2023.04.06

作者 | 罗辑 程心

编辑 | 庄颜 排版 | 李帛锦

来源:自象限‌

回顾过去几次世界变革的历史会发现,每隔 100 年世界就会重新交换一次霸权。

只要是成为了霸主,他的技术等核心优势就会变得普世化,被其他国家和民族所掌握,从而被追平。如果霸主想“续命”,需要有一次根本的技术革命。英国靠着工业革命,续费了 100 年的霸业。

在 ChatGPT 出现之前,美国基本上已经走到 100 年霸主的末端,他的技术优势已经被更多国家掌握,甚至在互联网的某些领域,中国还曾出现反超之势。想要续命要再靠一场技术革命。以 ChatGPT 为代表的大模型开启的 AI 2.0 时代,很可能就是。

这是新一轮排位赛的开始。面临技术差距,中国大模型一边技术赶超,另一边也在走一条更“接地气”的路。

本文为自象限策划的「ChatGPT启示录」系列一部分。
ChatGPT 启示录系列丨谁卡住了中国 GPT 的“脖子”?

图片来源:由无界 AI工具生成

“百度几乎将整个集团所有的 A100 都调给了文心一言。”

2 月份百度“冲刺”文心一言时,一位接近百度的人士对「自象限」描述了当时的激烈战况。

当然,在大模型训练上,不止百度“勒紧了腰带”。即使是微软,在 AI 大模型初始期算力上也并不宽裕。2023 年 3 月中旬,微软发文透露:曾斥资数亿美元,使用了数万个英伟达 A100 芯片帮助 OpenAI 组装了一台 AI 超级计算机。

两个现象表现了算力在 AI 大模型训练上的重要性,作为 AI 大模型的三要素的之一,在芯片发展受限的背景下,许多人将中国 AI 大模型的薄弱和短板粗暴归结于中国芯片的不足。

但实际上,芯片算力只是整个 AI 大模型的训练的一个起点,围绕着芯片的算力是一个巨大而复杂的系统。

除了不同芯片的架构和设计,还有建立在芯片之上的软件开发系统,和云的计算存储资源,以及围绕这两者工具和平台。

如果说 ChatGPT 这把火已经燎原,那算力,就是点燃它的火种。

但在热闹表象下面,算力正在成为生成式 AI 大模型发展最大的桎梏,这种桎梏表现在许多方面,从我们所熟知的芯片性能的不足,再到芯片开发操作系统的视野盲区,甚至是对云计算底层的重构,都成为了即将要攻克的关键问题。


“泛而不强”的中国芯片


面对中国算力短缺的问题,更多人是“知其然不知所以然”,本质是因为整个算力体系相当复杂,而芯片只是中间最重要的一部分。

通常来讲,我们说的算力包含三部分,即基础算力、智能算力和超算算力,而 AI 大模型主要依靠的是智能算力。

所谓智能算力,就是由 GPGPU、FPGA、ASIC 这样可以加速 AI 计算的芯片组成的服务器平台提供的算力,它们负责大模型的训练和推理。据 IDC 数据,2021 年中国人工智能服务器工作负载中,57.6% 的负载用于推理,42.4% 用于模型训练。

ChatGPT 启示录系列丨谁卡住了中国 GPT 的“脖子”?

▲ 图源:信达证券研报

虽然可以提供的智能算力的芯片有三类,但 GPGPU 其实占了目前主流市场 90% 的份额,剩下的 10% 才是 FPGA、ASIC 之类的产品。

GPU 市场份额更大在于其通用化。

梳理中国算力的发展脉络,大致趋势可以以深度学习和大模型为节点划分为三个阶段,包括前深度学习时代,深度学习时代和大模型时代。2015 年,以 AlphaGo 为节点,算力进入大模型时代。

在大模型时代之前,人脸识别、语音识别还是 AI 的主要应用场景。这个阶段大多数训练就已经是基于 GPGPU 来实现的了,也因此 GPGPU 形成了目前最为成熟、完备的软件生态。由于其芯片特点,GPGPU 的通用性也更强,架构也更适合 AI 大模型的训练和部署。

而相应的,作为定制化和半定制化的 FPGA 和 ASIC,就只能应用在一些针对性的垂类领域。因此它们对模型的成熟度、对企业的模型研究深度都有更高的要求。

简单来讲,通用型的 GPGPU 适合刚入门的小白和资深大牛在内的所有人,而 FPGA 和 ASIC 作为定制款就只适合真正有经验的“玩家”。当然,通过这样的定制化之后,FPGA 和 ASIC 芯片的产品和解决方案也有更高的性价比。

在应用场景的基础上,芯片的应用在 AI 大模型的训练上又分为训练和推理两个具体的环节。目前能够运行大模型训练的只有 GPGPU,具有代表性的芯片就是英伟达的 A100、A800、p00、H800。

但这类芯片目前国内的储备并不多。据「财经十一人」报道,国内目前拥有超 1 万枚 GPU 的企业不超过 5 家,其中拥有 1 万枚英伟达 A100 芯片的最多只有一家。另有消息提到,目前腾讯、字节、百度英伟达 A100 的存量都不超过 2000 枚,阿里的存量大约能过万,而更多公司都只能采用英伟达的中低端性能产品。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier