巴比特 | 元宇宙每日必读
【深度研究】平衡 AI/ML的力量:ZK 和区块链的作用
原文:sevenxventures
编译:GWEI Research
由 Hill Tan 和 Grace Deng 所著,SevenX Ventures Research
我们要特别感谢 Brian Retford, Sun Yi, Jason Morton, Shumo, Feng Boyuan, Daniel, Aaron Greenblatt, Nick Matthew, Baz, Marcin, 和 Brent 他们对这篇文章提供的宝贵见解,反馈和审阅。
对于我们这些生活在加密货币之下的人来说,人工智能已经火了一段时间。有趣的是,没人想看到一个AI失控。区块链被发明出来就是为了防止美元失控,所以我们可能会尝试一下。此外,我们现在有了一个新的叫做ZK的技术,它被用来确保事情不会出错。我只是假设普通人对区块链和ZK有一点了解。然而,为了驯服AI这个野兽,我们必须理解AI是如何工作的。
第一部分:易懂的机器学习简介 AI已经有了几个名称,从“专家系统”到“神经网络”,然后是“图形模型”,最后是“机器学习”。所有这些都是“AI”的子集,人们给它们不同的名字,我们对AI的了解也更深了。让我们深入了解机器学习,揭开机器学习的神秘面纱。
注意:现今大多数的机器学习模型都是神经网络,因为它们在很多任务上的表现优秀。我们主要将机器学习称为神经网络机器学习。
那么,机器学习是如何工作的呢?
首先,让我们快速了解一下机器学习的内部工作原理:
1 .输入数据预处理:
输入数据需要被处理成可以作为模型输入的格式。这通常涉及到预处理和特征工程,以提取有用的信息,并将数据转换成适当的形式,例如输入矩阵或张量(高维矩阵)。这是专家系统的方法。随着深度学习的出现,层的概念开始自动处理预处理的工作。
2.设置初始模型参数:
初始模型参数包括多个层,激活函数,初始权重,偏置,学习率等。有些可以在训练中调整,以使用优化算法提高模型的精度。
3.训练数据:
1)输入被送入神经网络,通常从一层或多层特征提取和关系建模开始,例如卷积层(CNN)、循环层(RNN)或自注意力层。这些层学习从输入数据中提取相关特征,并对这些特征之间的关系建模。
2)这些层的输出然后通过一个或多个附加层传递,这些附加层对输入数据执行不同的计算和转换。这些层通常主要涉及与可学习权重矩阵的矩阵乘法和非线性激活函数的应用,但它们也可能包括其他操作,例如卷积神经网络中的卷积和池化或递归神经网络中的迭代。这些层的输出作为模型中下一层的输入或作为预测的最终输出。
4.获取模型的输出:
神经网络计算的输出通常是一个向量或矩阵,表示图像分类的概率、情感分析分数或其他结果,具体取决于网络的应用。通常还有另一个错误评估和参数更新模块,它允许根据模型的目的自动更新参数。
如果上面的解释看起来太晦涩,你可以看看下面使用CNN模型识别苹果图像的例子。
- 图像作为像素值矩阵载入模型,这个矩阵可以被表示为一个三维张量,其维度为(高度、宽度、通道)。
- 卷积神经网络(CNN)模型的初始参数已设定。
- 输入图像通过CNN的多个隐藏层,每一层都应用卷积滤波器从图像中提取日益复杂的特征。每一层的输出通过一个非线性激活函数,然后进行池化以减少特征映射的维度。最后一层通常是一个全连接层,根据提取的特征产生输出预测。
- CNN的最终输出是概率最高的类别。这就是输入图像的预测标签。
机器学习信任框架
我们可以将上述内容总结为一个机器学习信任框架,它包括四个必须可靠的机器学习层次,以使整个机器学习过程可靠:
输入:原始数据需要被预处理,有时还需要保密。
完整性:输入数据未被篡改,未被敌对输入污染,并被正确预处理。
隐私:如有需要,输入数据不会被泄露。
输出:需要准确生成和传输。
完整性:正确生成输出。
隐私:如有需要,输出不会被泄露。
模型类型/算法:模型应该被正确计算。
完整性:模型被正确执行。
隐私:如有需要,模型本身或计算过程不会被泄露。
不同的神经网络模型有不同的算法和层次,以满足不同的用例和输入。
CNN常用于处理栅格数据,如图像,通过在小输入区域应用卷积运算可以捕获本地模式和特征。
另一方面,递归神经网络(RNN)适合处理顺序数据,如时间序列或自然语言,其中隐藏状态可以捕获来自先前时间步骤的信息并建模时间依赖性。
自注意力层对捕捉输入序列中元素之间的关系很有用,使其在需要长距离依赖的任务(如机器翻译或总结)中非常有效。
还存在其他类型的模型,包括多层感知器(MLP)等。
模型参数:参数在某些情况下应透明或民主生成,但在所有情况下都不易被篡改。
完整性:参数以正确的方式生成、维护和管理。
隐私:模型所有者通常保密机器学习模型参数,以保护开发模型的组织的知识产权和竞争优势。这只在Transformer模型训练成本极高之前才普遍存在,但无论如何,这对行业来说都是一个主要问题。
第二部分:机器学习的信任问题