复制成功

分享至

主页 > 数字货币 >

正值新技术成熟曲线顶峰?从平衡视角看 AI 技术新一年的发展

2024.01.16
2023 年被称为“AI 元年”,新的一年 AI 会如何发展?
正值新技术成熟曲线顶峰?从平衡视角看 AI 技术新一年的发展

图片来源:由无界 AI 生成

无论以何种标准衡量,2023 年对于人工智能(AI)来说都是令人惊叹的一年。大型语言模型(LLM)及其聊天机器人应用程序抢尽风头,同时在广泛的应用领域也取得了进展,这些功能包括图像、语音和视频生成。

这些数字技术的结合催生了新的用例和商业模式,甚至发展到了数字人变得司空见惯的地步,以至于替代人类成为了影响者和新闻主播。

更重要的是,2023 年是许多人开始有意使用和采用人工智能作为日常工作一部分的一年。与此同时,人工智能的快速创新也推动了对未来的预测,包括十年内从家庭机器人发展到真正的通用人工智能(AGI)。然而,技术发展从来不会一帆风顺,许多挑战可能会使人工智能的一些预期进展偏离轨道。

随着 AI 技术越来越多地融入我们的日常生活和工作中,它也带来了一个问题:“接下来我们可以期待什么?”


物理机器人可能很快就会出现


数字技术的进步不断让人感到惊讶,但人工智能的物理领域(尤其是机器人技术)在激发我们的想象力方面也不曾落后。对于机器人而言,大语音模型(LLMs)提供的部分本质上是一个大脑,特别是当与相机视觉的图像识别功能相结合时。借助这些技术,机器人可以更容易地理解和响应请求,并感知周围的世界。

在《机器人报告》中,英伟达(Nvidia)机器人和边缘计算事业部副总裁 Deepu Talla 表示,大语音模型将使机器人能够更好地理解人类指令,相互学习并理解其周围环境。

提高机器人性能的一种方法是使用多种模型。例如,麻省理工学院计算机科学与人工智能实验室(CSAIL)下属的一个团队 Improbable AI Lab 开发了一个框架,该框架利用了三种不同的基础模型,分别针对语言、视觉和动作等特定任务进行调整。

该实验室研究人员报告称,“每个基础模型都能捕捉到(机器人)决策过程的不同部分,然后在需要做出决策时协同工作。”

不过,仅仅结合这些模型可能不足以让机器人在现实世界中被广泛使用。为了解决这些局限性,斯坦福大学还开发了一种名为 Mobile ALOHA 的新型人工智能系统。

据介绍,该系统允许机器人“自主完成复杂的移动操作任务,例如炒菜和上菜,打开两门壁柜以存放沉重的烹饪锅、呼叫并进入电梯,以及使用厨房水龙头冲洗用过的锅”。


机器人技术的 ImageNet 时刻


AI 公司 Anthropic 联合创始人 Jack Clark 在其 ImportAI 时事通讯中表示:“机器人可能正在接近‘ImageNet 时刻’,届时学习机器人行为的成本和学习其行为的数据都会下降。”  

ImageNet 是一个由李飞飞(Fei Fei Lee,美国华裔计算机科学家)于 2006 年创建的大型标记图像数据集,被广泛用于推进计算机视觉和深度学习研究。从 2010 年开始,ImageNet 成为年度竞赛的数据集,旨在评估计算机视觉算法在图像分类、目标检测和定位任务中的性能。

而 Clark 提到的时刻是在 2012 年,当时包括 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 在内的几位人工智能研究人员开发了一种卷积神经网络(CNN)架构,这是深度学习的一种形式,该架构可以大幅降低图像分类的错误率。这一时刻展示了深度学习的潜力,并有效地开启了现代人工智能时代。

Clark 认为,物理机器人行业现在也正处于类似的时刻。如果这一观点成真,那么双足机器人可能会在十年内在医院、工厂、商店或家庭中提供帮助。


新一代人工智能正处于过高期望的顶峰


正如上文提到的,人工智能发展中的许多拐点可能即将到来。英伟达首席执行官黄仁勋最近表示,“人工智能可能在五年内实现,它可以在各种任务中达到人类水平。”英伟达高级研究科学家兼人工智能代理负责人 Jim Fan 则补充道:“过去一年的人工智能发展就像是从石器时代跨越到了太空时代。”

正值新技术成熟曲线顶峰?从平衡视角看 AI 技术新一年的发展

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier