复制成功

分享至

主页 > 数字货币 >

未来将至,人形机器人产业乘大模型东风进入发展“快车道”

2023.12.20

原文来源:元宇宙新声

未来将至,人形机器人产业乘大模型东风进入发展“快车道”

图片来源:由无界 AI生成

曾经我们在电影中看到的机器人,现在正乘着大模型的东风,离我们越来越近。

特斯拉日前展示了最新版本的擎天柱机器人Optimus二代。在一段新发布的视频中,第二代人形机器人看起来比上一代具有更大的灵活性,包括更优雅的行走姿势以及自由度更大的双手,甚至可以用它来完成煮鸡蛋等精细活,从Optimus二代的表现来看,特斯拉对于人行机器人的发展又起到了推动作用。

除了特斯拉外,不少科技厂商尝试将图像语言大模型的能力和知识迁移到机器人领域,比如包括微软的ChatGPT for Robotics,谷歌的PaLm-E、RT-1、RT-2,还有VoxPoser、BoboCat等。

那么,这是不是意味着人形机器人真的要走进我们的生活呢?


人形机器人很美,但离商业化还有些远


在发布机器人Optimus二代后,特斯拉表示,第二代擎天柱机器人在保留原有功能的情况下,重量减轻了10公斤,而且机器人的平衡性更好,例如可以自如地下蹲和起立,并且在行走时的速度提高了30%。

擎天柱的最大升级是双手,拥有11个自由度,能更巧妙地移动物体,如视频展示,机器人可以捡起鸡蛋并轻轻放下,这得益于传感技术的提升。全新的擎天柱发布标志着特斯拉距离创造一种“通用、双足、自主人形机器人”更近了一步。特斯拉的目标是,能够让人形机器人执行危险、重复烦琐的任务。

马斯克早在2021年表示,“未来每个人都会拥有一个人形机器人,这个市场将会是百亿美元级别的。”

但实现这一目标可能还需要很多年时间。特斯拉预计Optimus机器人的商业版本有望在未来三到五年才能上市,但早期版本也只可能会率先在汽车生产线上进行测试。

我们需要了解的是,人形机器人软硬件结构复杂,是智能机器人领域中技术难度极高的一个分支。其中,软硬件系统的结合与通讯的实时可靠是确保人形机器人实现稳健运动的基础。此外,动态稳定运动控制也是人形机器人的一大挑战。

除技术难点外,成本也一直是人形机器人难以商业化的重要原因之一。以波土顿动力的Atlas机器人为例,尽管其已经能自主规划路径,可实现后空翻、跑酷等高难度动作,但代价是需配置大量功率很大的液压驱动器,因此制造成本居高不下,预估达到200万美元。

不过,虽然会面临巨大的挑战,但我们还是乐于看到机器人产业的发展,而随着ChatGPT的爆发,促使科技巨头们不断强化自身生成式AI产品,这也许会让机器人产业来到一个新的高度。


被大模型带火的具身智能


长久以来,人类对人工智能技术和应用的探索从未停歇,今年以ChatGPT为代表的生成式AI走红全球,深刻影响着内容创作行业,将带来效率的极大提升。

但人工智能的应用还远不止于此,虽然生成式AI使得类人大脑变得越来越聪明,但始终是抽象的,如果将其具象化,比如加上一个机器人身体,是不是就能成为具身智能机器人。

具身智能(Embodied AI),又被视作人工智能的终极形态。他们用物理身体进行感知,通过智能体与环境的交互获取信息、理解问题、作出决策并实现行动。通俗来讲,既可以理解成是AI大模型披上机器人的壳,机器人长出AI大模型的脑。

图灵奖得主、上海期智研究院院长姚期智认为,人工智能领域下一个挑战将是实现“具身通用人工智能”,即如何构建能够通过自我学习掌握各种技能并执行现实生活中的种种通用任务的高端机器人。清华大学计算机系教授张钹院士,也在某产业智能论坛上提出,随着基础模型的突破,通用智能机器人是未来的发展方向。

英伟达创始人黄仁勋在ITF World 2023半导体大会上表示,具身智能是能理解、推理、并与物理世界互动的智能系统,是人工智能的下一个浪潮。

未来将至,人形机器人产业乘大模型东风进入发展“快车道”


在微软研究院发布“ChatGPT for Robotics” 文章中,研究者使用ChatGPT大型语言模型 (LLM) 将人的语言快速转换为机器人的高层控制代码,从而控制机械臂、无人机等机器人,ChatGPT带来了一种新的机器人应用范例。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier