复制成功

分享至

主页 > 数字货币 >

写在 GTC 大会之后 Web3 能拯救 AI 算力吗?

2024.03.28

云算力的复活——以 AI 之名

时尚是个循环,Web 3 也是。

Near “重新”成为 AI 公链,创始人 Transformer 作者之一身份让其得以出席英伟达 GTC 大会,和皮衣老黄畅谈生成式 AI 的未来,Solana 作为 io.net、Bittensor、Render Network 的聚居地成功转型为 AI 概念链,此外还有 Akash、GAIMIN、Gensyn 等涉及 GPU 计算的异军突起者。

如果我们将视线抬高,在币价上涨之余,可以发现几个有趣的事实:

GPU 算力之争来到去中心化平台,算力越多,等同于计算效果越强,CPU、存储和 GPU 互相搭售;

计算范式从云化到去中心化过渡中,背后是 AI 训练到推理的需求转变,链上模型不再是空玄之谈;

互联网架构的底层软硬件组成和运行逻辑并未发生根本改变,去中心化算力层更多承担激励组网作用。

先进行概念区分,Web3 世界的云算力诞生于云挖矿时代,指将矿机的算力打包出售,免去用户购买矿机的巨额支出,但是算力厂商经常会“超售”,比如将 100 台矿机算力混合出售给 105 个人,以获取超额收益,最终让该词等同于骗人。

本文中的云算力特指基于 GPU 的云厂商的算力资源,这里的问题是去中心化算力平台究竟是云厂商的前台傀儡还是下一步的版本更新。

传统云厂商和区块链的结合比我们想象的要深,比如公链节点、开发和日常存储,基本上都会围绕着 AWS、阿里云和华为云来展开,免去购买实体硬件的昂贵投资,但是带来的问题也不容忽视,极端情况下拔网线就会造成公链宕机,严重违背去中心化精神。

另一方面,去中心化算力平台,要么直接搭建“机房”以维护网络稳健性,要么直接搭建激励网络,比如 IO.NET 的空投促 GPU 数量策略,一如 Filecoin 的存储送 FIL 代币,出发点不是满足使用需求,而是进行代币赋能,一个证据是大厂、个人或学术机构甚少会真正使用它们来进行 ML 训练、推理或图形渲染等工作,造成严重的资源浪费。

只不过在币价高涨和 FOMO 情绪面前,一切对去中心化算力是云算力骗局的指责都烟消云散了。

写在 GTC 大会之后 Web3 能拯救 AI 算力吗?

两种云算力,同名同运吗?

推理和 FLOPS,量化 GPU 计算能力

AI 模型的算力需求正从训练到推理演进。

先以 OpenAI 的 Sora 为例,虽然也是基于 Transformer 技术制造而来,但是其参数量相较于 GPT-4 的万亿级,学界推测在千亿级以下,杨立昆更是说只有 30 亿,即训练成本较低,这也非常好理解,参数量小所需要的计算资源也等比例的衰减。

但是反过来,Sora 可能需要更强的“推理”能力,推理可以理解为根据指令生成特定视频的能力,视频长期被视为创意内容,因此需要 AI 更强的理解能力,而训练相对简单一些,可以理解为根据已有的内容总结出规律,无脑堆算力,大力出奇迹。

在以往阶段,AI 算力主要用于训练层面,少部分用于推理能力,并且基本都被英伟达各类产品包圆,但是在 Groq LPU(Language Processing Unit)面世后,事情开始起变化,更好的推理能力,叠加大模型的瘦身和精度提高,有脑讲逻辑,正在慢慢成为主流。

另外还要补充下 GPU 的分类,经常能看到是臭打游戏的拯救了 AI,这话有理的地方在于游戏市场对高性能 GPU 的强烈需求覆盖了研发成本,比如 4090 显卡,打游戏的和 AI 炼丹的都能用,但是要注意的是,慢慢的游戏卡和算力卡会逐步解耦,这个过程类似于比特币矿机从个人电脑发展到专用矿机,其所用的芯片也遵循从 CPU、GPU、FPGA 和 ASIC 的顺序。

写在 GTC 大会之后 Web3 能拯救 AI 算力吗?

LLM 专用卡研发中···

随着 AI 技术,尤其是 LLM 路线的成熟和进步,更多 TPU、DPU 和 LPU 的类似尝试会越来越多,当然,目前主要产品还是英伟达家的 GPU,下文所有的论述也是基于 GPU,LPU 等更多是对 GPU 的一种补充,完全取代尚需时日。

去中心化算力竞赛不争抢 GPU 的拿货渠道,而是尝试建立新的盈利模式。

行文至此,英伟达快成了主角,根本上是英伟达占据了显卡市场的 80% 份额,N 卡和 A 卡之争只存在理论上,现实中大家都是口嫌体正直。

绝对的垄断地位,造就了各家争抢 GPU 的盛况,从消费级的 RTX 4090 到企业级的 A100/p00 都是如此,各家云厂商更是囤货主力。但是 Google、Meta、特斯拉和 OpenAI 等涉及 AI 公司都有自制芯片的行动或计划,而国内企业已经纷纷转向华为等国产厂商,GPU 赛道仍然拥挤异常。

对于传统云厂商而言,出售的实际上是算力和存储空间,所以用不用自己的芯片没有 AI 公司那么紧迫,但是对于去中心化算力项目而言,目前处于前半截,即跟传统云厂商抢算力生意,主打廉价和易得,但是未来会不会像比特币挖矿一样,出现 Web3 AI 芯片几率不大。

额外吐槽一句,自从以太坊转 PoS 之后,币圈的专用硬件已经越来越少,Saga 手机、ZK 硬件加速和 DePIN 等市场规模太小,希望去中心化算力能为专用 AI 算力卡探索出一条 Web3 特色道路。

去中心化算力是云的下一步还是补充。

GPU 的运算能力,业界通常以 FLOPS (Floating Point Operations Per Second,每秒浮点运算次数)比较,这是最常用的计算速度的的指标,不论 GPU 的规格还是应用并行等优化措施,最终都以 FLOPS 论高低。

从本地计算到上云,大约进行了半个世纪,而分布式概念从计算机诞生之初便存在,在 LLM 的推动下,去中心化和算力结合,不再像以往那般虚无缥缈,我会尽可能多总结现有的去中心化算力项目,考察维度只有两点:

GPU 等硬件数量,即考察其计算速度,根据摩尔定律, 越新 GPU 的计算能力越强,相等规格下数量越多则计算能力越强;

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier