复制成功

主页 > 数字货币 >

深度：探索Web3与生成式AI的联姻

2023.03.27

原文标题：《 Generative AI and Web3 》

原文作者：Joel John

原文编译：Kxp，BLockBeats

自 2022 年底 OpenAI 的 ChatGPT 上线以来，人工智能已经风靡全球。这台机器能够回答大多数问题，它已迅速成为增长最快的应用程序，吸引了超过一亿的用户。然而，与许多风投支持的初创公司一样，它每天都在烧掉数百万美元。

但这么烧钱也不是什么大问题，因为微软刚刚向 OpenAI 投资了 100 亿美元。加上 Azure 的硬件和 Bing 的流量分发，ChatGPT 的流行度已经跨越了成见的鸿沟。

不过，参与竞争的不仅仅是微软。Alphabet 的生成式 AI 产品 demo 版失败后，其股票市值损失了 1000 亿美元。阿里巴巴和亚马逊相继宣布入局，与 ChatGPT 争夺人工智能的主导地位；而苹果很可能会把 Siri 作为进入该市场的前锋产品。

人工智能工具的这种爆炸性增长是因为人们现在可以真正的使用人工智能。与其他趋势不同，如 Crypto、无人机或自动驾驶汽车，人工智能没有高准入门槛的限制。任何人都可以使用人工智能来完成家庭作业，甚至提高他们在 Bumble 等约会软件中的成功机会。相比之下，在 Crypto 中，你只能购买一个 Token，并假装它是你人格的全部。

Arthur C. Clarke 曾经说过：「任何足够先进的技术似乎都与魔法无异。」人工智能已经变得如此复杂，以至于现在许多人认为它就是魔法。在 2022 年第二季度，人工智能相关企业获得了高达 170 亿美元的资金投资。这种来自 FAANG、风险投资公司和散户投资者的资金激增表明，人工智能已经准备好吸引大众的注意力。

我们花了几周时间调查了人工智能行业的现状及其在未来十年的潜在影响。本文介绍了我们对该行业的有限理解，以及为什么我们认为区块链和人工智能将在未来十年内融合。然而，在深入研究这个话题之前，让我们首先重温一下经济学中的一些基本概念。

注意：我在整篇文章中用了 AI 模型/模型两个说法。为了便于阅读，任何提到「模型」一词的地方都是指生成性人工智能模型。

稀缺性的消亡

人类的历史是与稀缺性作斗争的历史，为寻找资源而进行的迁徙可以追溯到数万年前。当我们学会利用火和农业的力量之后，我们的祖先便成功茁壮成长了起来，并创造了整个文明。为了确保社会拥有必要的资源，我们冒险漂洋过海，参与贸易。

随着文明的发展，人类将注意力从基本需求转移到了地位的竞争上。中国的长城、埃及的金字塔、印度的泰姬陵和欧洲的文艺复兴时期的大教堂都是地位象征的例子，在当时那些时代的社会经济结构中发挥了关键作用。人们之所以可以动用数千人，花数十载的时间完成这些恢宏建筑，是因为那时的人们已不再为寻找食物而发愁。

当我们过渡到追求地位的社会之后，技能和服务变得稀缺起来。到了 14 世纪，战争英雄的庆祝活动减少了，而艺人、艺术家和发明家变得更加受人尊敬。莎士比亚、米开朗基罗和班克斯的作品说明了艺术家可以用独特的方式解释世界，而这往往需要几十年的文化体验。没有对文化的深刻理解，就无法创造文化。

我们今天面临的稀缺性与其说是围绕着物质商品，不如说是围绕着那些影响我们精神状态的商品。杰出的艺术家在一代人中只会出现一次，因为产生他们的环境很难复制。即使数百人经历了同样的环境，也只有少数人，如说唱明星 Jay-Z，能够成为数十亿美元的富翁。这些人的出现往往是不可预测、难以捉摸的。

在技能稀缺的社会里，杰出的人才会得到高昂的奖励。在欧洲的文艺复兴时代，为大教堂工作的艺术家往往被委托进行多年的创作。然而，在过去几个世纪的大部分时间里，经济产出与所消耗的能量成正比。能源要么被燃烧来为工厂提供动力，要么被人类用来生产商品。

过去的财富生产主要取决于人的数量或一个人能够获得的资源，这就是为什么我们的历史上会出现奴隶制这样可怕的阶段。财富的增长是一个线性的轨迹，往往依赖于征服。

在 20 世纪，代码和服务器改变了传统的财富生产途径。人们不再需要入侵外国土地或征服人民来获得筹码。正如 Naval Ravikant 所指出的，代码和媒体是新的筹码，人们能够通过代码来驾驭机器人军队。

看看 Instagram 或 Tiktok 这样的平台你就会发现，员工的数量与用户的数量并不成正比。相反，可扩展性是通过增加硬件来支持不断增长的用户群而实现的。

这个富足的时代可以追溯到 90 年代初互联网的出现。例如，通信成本的降低产生了垃圾邮件的问题。数字存储和带宽变得更容易获得，如 Limewire 和 Napster 等平台就是证明。今天，游戏和社交网络成为数百万用户的数字聚会场所，空间的稀缺性不再是一个问题。

在数字时代，满足一个额外用户需求的边际成本已经大大下降。随着数字技术的发展，稀缺性已经成为一个过去的概念。Naval 在这个视频中更详细地讨论了这个话题。

开发者拥有巨大的权力，类似于文艺复兴时代的熟练工匠，因为他们可以利用自己的时间和专业知识创造出强大的工具。然而，这种权力动态正在慢慢演变。微软最近的行为——裁员 1 万名员工，同时向 ChatGPT 的公司 OpenAI 投资 100 亿美元，鲜明地说明了这种对比。

我无意于灌输恐惧或暗示开发者将被淘汰。相反，我们有可能见证由人工智能赋予的替代工作的崛起。这种转变正体现在当前生成性人工智能技术的发展之中。

富足时代的到来

我们目前正处于一个数字消费极为丰富的时代。与此同时，传播的成本也越来越低。无论读者数量是 1000 还是 100000，分发这篇文章的成本都是一样的。Substack 的基础设施可以快速扩展，因此，它不按浏览量收费。不过，虽然我们已经可以随意分发内容了，但由于人们的注意力有限，内容创作量和文章阅读量都很匮乏。

作为一位作者，我的生产力受限于我在特定的时间框架内能创造多少有意义的内容。作为一个读者，你想从我这里读到的东西也只有这么多。

ChatGPT 和生成性人工智能等概念的兴起，正在颠覆生产和消费的经济学理论。我们上一次见证类似的情况可能还是在印刷业出现的时期。书籍的普及极大地降低了人类思想的存储和传播成本。虽然英国花了四个世纪的时间才将识字率从 5% 提高到 50%，但人们现在每天的阅读时间已经达到了差不多两个小时。

深度：探索Web3与生成式AI的联姻

这种智力行为的变化直接推动了启蒙时代的到来，这一时期的特点是科学和哲学的快速发展，康德、伏尔泰、笛卡尔和亚当·斯密等人永远改变了我们的世界观。纵观历史，从洞穴壁画到谷歌上的数字文件，存储、分享和迭代思想的过程每一次都创造出了伟大的成就。

为了理解生成性人工智能的影响，我们必须认识到其降低生产和消费成本的潜力。诸如 ChatGPT 和 Midjourney 这类的应用程序会根据现有数据生成结果：ChatGPT 使用来自书籍、维基百科和期刊的数据来创建其文本回复，而 Stable Diffusion 最初依靠的是库存图片；Github 的 Copilot 利用数十亿行的代码来协助开发者。

从本质上讲，生成式人工智能综合了公开可用的信息，并根据用户的要求进行处理，从用简单的术语解释复杂的概念到创建特定场景的视觉画面。人工智能可以在几分钟内给出指令要求的结果，即便这些输出结果可能并不总是令人信服。但经过充分的调整，你最终会得到一些可能被认为是人类生成的内容。前提是主题通用，而且你不期望有任何个性化的元素。

深度：探索Web3与生成式AI的联姻

摘自红杉关于生成式 AI 的文章

那么我们目前发展到哪个阶段了？上图来自 Sequoia 的博客，为我们提供了一个对当前情况的良好展望。如今，AI 模型能够实时处理文字输入、编辑文本以及调整语气，并且可以编辑图片和代码。这些功能的实现离不开生成式 AI 模型利用数据集进行的大量训练。如果我们可以在短时间内从多本书中获取并整合知识，或者生成艺术作品，那么我们最终将面临信息过载的问题。在处理复杂任务，如编辑电影或音乐方面，人类参与仍然必不可少，但 AI 确实可以加速这一进程。

讽刺的是，AI 已经开始用于总结大量文献并提供关键见解。然而，挑战在于我们无法确认其引用来源。例如，ChatGPT 在公共领域没有充分信息的情况下，可能会给出错误的答案，它也不会说明用于生成回答的数据来源。——这正是当前生成式 AI 面临的风险。

我们可以创作无尽的作品，却无法追踪其灵感来源或作者。在某个时刻，我们将依赖 AI 处理这些内容，并告诉我们其中哪些才是重要的信息。

深度：探索Web3与生成式AI的联姻

过去几周我的推特内容

如果没有追溯来源的基础设施或验证 AI 模型的机制，生成式 AI 将无非是今日互联网的翻版而已：一大堆由算法生成的虚假新闻，并根据用户喜好推送信息。虽然生成式 AI 能让每个人都成为艺术家，但它也可能会边缘化那些为 AI 模型提供训练素材的初始作品创作者。这将是信息爆炸时代的一个关键挑战：如何确保艺术、文本或代码等形式的作品在每个人都从中受益时得到有效的归属和商业化处理？

互联网已经为这个问题提供了一些答案。像 Instagram 的 Reels 和 TikTok 这样的平台，非常依赖第三方艺术家的音乐作品。用户将音频片段进行混剪，制作出朗朗上口、时尚、涉及舞蹈、烹饪等各种主题的短片。TikTok 推出了 SoundOn，以帮助艺术家上传并变现他们的作品。在这些情况下，平台需负责授权和支付版税。当音频相同，且分发由平台自身控制时，处理这一问题就变得相对简单了。

然而，当音频内容涉及多个作品并由平台外的用户混剪时，情况就不同了。还记得我之前提到的以莎士比亚风格改写《哈利·波特》的事情吗？考虑到这只涉及两人的作品，处理起来会相对容易。但如果我们以莎士比亚的风格改写《哈利·波特》，并加入《权力的游戏》的情节，那么最终作品就有三位作者需要分享版税了。

当前生成式 AI 面临的挑战在于，你需要处理数百个作者的作品，以生成数千个输出结果；而其中没有一个作品能够被准确地识别、归属或追踪。

通常，创作这些作品并无任何成本。我可以每天在 ChatGPT 上运行数百个指令，直到获得满足我要求的回答。现今的社交媒体网络在很大程度上类似于赌场老虎机，用户花费数小时寻找那个能给他们带来巨大惊喜的内容。

随着生成式 AI 的出现，我们激励人们不断尝试各种指令，直到得到一个理想的回答。但是有一种方法可以解决这个问题，那就是强制实施成本。在 NFT 领域我们有关于此的一些早期尝试。

可验证的事实真相

自上世纪 70 年代以来，复制粘贴功能就已经存在了。翻阅年轻一代的 Instagram 标题，你会发现我们无数次使用了这一功能。一项简单的技术改变了我们对复制粘贴功能的认识——NFT。

你当然可以复制一张无聊猿的图片，但要拥有它，你通常需要花一大笔钱把它买下来才行。区块链使得这种独一无二的资产在可以轻易复制的情况下仍然具有吸引力，同时实现了全网实时验证该资产的所有权。

有人可能会认为这项技术在现实生活中并没有太多用途。然而，一旦将生成式 AI 考虑在内，这两个工具便可相互融合。很快，生成式 AI 将在很大程度上依赖于版权。迪士尼或 Netflix 这样的大型影视公司拥有我们从孩提时代到青少年时期喜爱的角色版权。

影视公司可以利用 AI 挖掘观众最深刻、最珍贵的记忆，为他们打造个性化的角色。如果钢铁侠能教孩子们数学呢？Darth Vader 能给出约会建议又会怎样？没准这将帮助许多人脱单。

毫无疑问，影视公司可以拥有并发布这些 AI 生成的聊天机器人或互动角色的产品。但利用区块链技术他们将能够追踪、验证并索取版税。他们可以建立一个开放的市场，任何人都可以参与并创作，而不仅仅局限于影视公司内部开发人员所能生产的应用程序。实际上，任何拥有大量 IP 的公司都可以通过允许衍生作品，将自身发展为一个大型平台。

让我解释一下这意味着什么。想象一下，我决定让 Linkin Park 的 Chester Bennington（已故）来朗读我为您写的这篇长文，持有他 IP 的遗产继承人和持有他声音合成版本的工作室很快就可以让我获得授权。但这将是一个漫长而繁琐的过程，涉及律师和大量的文书工作。这似乎很愚蠢，但围绕已故名人和 IP 的产业已经出现了。

设想一下，Chester 的声音版权在链上的话会是什么情况。这样一来，它可以被授权给世界各地的数百个人。当然，人们可能担心这种声音会被滥用，比如用于制作深度伪造视频，或者用于逝者不愿意与之相关联的内容。但是，如果将使用权定价足够高，入场门槛将筛选掉大部分恶意行为者。

这种情况已经在某些领域得到了实践，那就是谜因。我最近在 Instagram 上看到了一系列由 Stoa 创始人之一 Raj Kunkolienkar 发布的帖子。用他自己的照片重新制作了几张流行的谜因，这是生成式 AI 的一个有趣应用。

谜因是文化的一部分，而且属于公共领域，人们曾尝试将它们制作成 NFT。但是，如果我们要以自己的身份「重塑」文化，我认为这些谜因需要有可验证的来源，而且还应该尽可能地奖励那些谜因原型人物。

Raj 是否应该「授权」对这些图像二次创作的权利？文化是否应该可以变现？我不知道。他可能只是在美丽的果阿度过一个周六早晨，似乎有途径可以做到这一点。

深度：探索Web3与生成式AI的联姻

对不起，Raj——我只是想找一种方式来推销我在 Stoa 的投资。这就算是增值了，对吗？

以前，超级英雄和游戏角色那样的知识产权更容易与观众产生共鸣。在漫展活动上，人们装扮成蝙蝠侠或 Darth Vader 都不会让人感到奇怪。我们不太可能让粉丝们购买许可证才能装扮成他们喜欢的角色。

但部分粉丝确实有可能会集资取得版权，从而合法地重新制作和发布新作品，对原创作者的思想内容进行补充。

你可能觉得这很离谱，但在 Web3 生态系统中，这已经成为现实。去年，一个社群筹集了 4700 万美元，试图在苏富比拍卖行竞拍美国宪法。尽管竞标失败，但仍有数千人汇集自己辛苦赚来的钱为此付出努力。最后，用户可以选择退款或持有 PEOPLEToken。截至目前，约有 17,000 名用户持有该 Token，其估值约为 1.4 亿美元。

Token 和链上溯源让社群能够团结起来购买知识产权，这些产权可以与 AI 共同创作出衍生艺术作品。

人类与机器协作已经得到了大规模的应用。2022 年 6 月，《大都会》杂志使用DALL-E创作了杂志封面。他们制作了一个 Darth Vader 登上杂志封面的版本，但选择不予发行。

在这种情况下，如果要组建大型社群的话，操作手册将由 DAO 来制定。工作室本身发行代表这些权利的链上工具，它可能是一个社区通过众筹获得的单一 NFT。Token 的发行比例与成员为购买知识产权所贡献的资金量成正比。然后，DAO 将决定如何管理和使用许可证。

社群可以规定使用许可证所需的最低 Token 数量，而其他更复杂功能的执行，如创建生成性艺术作品，则可能需要 DAO 进行投票。DAO 可以通过要求将上述 IP 的部分收入返还来产生现金流。

由于大型工作室无法承受这样的风险，新兴艺术家更可能采用这种商业模式。尽管这看似遥不可及，但每当我们尝试一种新的分发形式或更好地与观众互动的方式时，艺术家总是先行者。在过去的十年里，Spotify 和 Soundcloud 已成为发现新兴艺术家的关键工具。在未来十年中，艺术家将把链上原语和生成性音乐进行结合以创造收入，从而加速自己的职业发展。

重新思考技术栈

深度：探索Web3与生成式AI的联姻

来自 A16z 的文章「谁拥有生成式 AI 平台」

我想了解生成式 AI 技术栈的哪一部分可能被颠覆，以及哪些部分已经取得了显著的增长。上图来源于 A16z 的文章《谁拥有生成式 AI 平台》，揭示了过去 18 个月里价值正在哪里积累。

文章摘录：

我们观察到，基础设施供应商可能是迄今为止这个市场的最大赢家，占据了通过技术栈流动的大部分资金。应用程序公司的营收增长迅速，但往往在用户留存、产品差异化和毛利率方面存在困难。大多数模型提供商虽然形成了这样一个市场，但尚未实现大规模商业化。
换句话说，创造最大价值的公司（即训练生成式 AI 模型并将其应用于新应用程序）并未捕获大部分价值。虽然我们很难预测接下来会发生什么，但我们认为，问题的关键在于技术栈的哪些部分真正具有差异化和可维护性。这将对市场结构（如横向与纵向公司发展）和长期价值的驱动因素（如利润率和用户留存）产生重大影响。到目前为止，我们很难在技术栈的任何地方找到结构上的可维护性，除了现有公司的防御体系。

这篇文章表明，尽管多个领域的收入已超过 1 亿美元，但人们对于盈利能力和留存率仍存在担忧。当所有人都可以使用底层 AI 模型（如 Stable Diffusion 或 ChatGPT）时，就不会有人了解可维护性了，而且我们很难准确预测新鲜后退去后的用户留存率。

大部分的价值捕获发生在硬件和云平台领域。亚马逊 AWS、谷歌云和微软 Azure 已经花了几十年时间来完善存储和计算方面的技术，以符合实际需求的单位经济效益提供大规模硬件；而 Filecoin、Render 和 Akasha 等则成为了 Web3 领域的对应平台。

尽管如此，在现有形式下我仍不清楚该如何通过众包硬件击败目前中心化服务提供商所提供的可靠性和规模。根据 A16z 的分析，价值可以在三个方面积累：物理基础设施、AI 模型或应用程序。我们相信，在基于 Web3 的 AI 领域，我们可以通过策划利用 Token 激励的细分用户群体，制定可通过社区参与扩展的数据流和盈利模型，构建竞争壁垒。

我们已经看到了这方面的一些实例。

目标用户

Numeraire 的原始 MVP 为我们提供了一个例子。该 Token 背后的公司向研究人员发布有关股市的标准化数据集，研究人员使用自家的 AI 和机器学习模型对这些数据进行分析，进而得出一个「信号」。简单来说，该信号展示了他们对资产价格走势的预测。根据提供信号的人质押的 NMR 原生 Token 数量，信号会被赋予一定的权重。

向用户提供虚假信号的 Token 将被销毁。由于这些 Token 在流动性市场上交易，因此用户不会为了获得真实货币而提供错误信号。相反，提供准确信号的研究人员会得到奖励。随着时间的推移，这样做的实际效果是让准确预测的用户群体能够收集更多的 NMRToken，从而影响公司投放资金的模式，尽管这一切看似虚幻。

那么，一个通过 Token 激励的去中心化研究人员群体能否击败市场呢？事实上确实如此。自成立以来，该基金的回报率约为 48%。据该公司网站称，已有价值约 5500 万美元的 NMRToken 奖励给了曾开发超过 5000 个模型的数据科学家。

在 Numerai 的情况下，数据本身并非专有资源。真正具有价值的是信任该产品并愿意质押 Token、分享模型输出结果的数据科学家网络。该网络利用 Token 激励机制，打造了一个针对特定领域的数据科学家社群，这本身就是一道护城河。

数据流

插件可以在浏览器或硬件级别收集、匿名化数据，并将其传递给能从中受益的第三方。互联网本身已经在执行这一操作。我们的数据被收集并传递给那些向我们推销不必要商品的公司。

这样的系统不再依赖于像谷歌或 Facebook 这样的平台垄断，而是依赖于一个规范收集数据并在市场上提供数据的协议。公司可以提供福利（如高级访问权限），以换取用户分享数据的同意。我们已经在 Pocket上看到了这种模式的早期版本。

Pocket 背后的团队正在创建一个标准化的协议，该协议代表用户构建数据结构，让企业可以请求 Pocket 用户以便于使用的形式分享数据。同时，用户可以根据解锁的福利来选择分享哪些数据。Brave 浏览器的 BAT 奖励就是这种模式的早期版本。

模型变现

Web3 原生产品与 AI 之间可能通过租赁 AI 模型进行交互。Ocean Protocol 市场上已经有这种模式的早期版本。在这种情况下，研究团队可以开发并向第三方授权 AI 模型，后者将其应用于自身的硬件和数据中。

部分观点认为，在模型开源的世界中，不存在验证输出来源的原语。将 Crypto 经济原语（如 DAO 或 Token）与开源模型相结合，可以为研究人员的工作提供其他现金流来源，同时验证输出的来源。

AI 模型供应端通过与研究人员合作进行维护并更新，他们将获得通过租赁 AI 模型所产生的现金流的一部分。在这种背景下，我们可以将生成式 AI 模型视为 NFT，将研究人员视为艺术家。这种模式可能适用于数据过于敏感而无法共享的情况，例如医疗数据、专有财务数据或用户数据。我们在Hugging Face和Replicate等平台上已经可以看到这种模式的早期版本（尚未包含任何 Web3 元素）。

A16z 的文章在最后这样写道：