复制成功

分享至

主页 > 数字货币 >

机器人的下一步:达到了ChatGPT的颠覆时刻吗?

2024.01.29

来源:Empower Labs

最近机器人进展有点大?

最近,智能机器人的研究进展如火如荼,新的演示层出不穷。

特斯拉在12月中旬发布了第二代Optimus。这个机器人并非工业产品,而是一个纯粹的原型,但是它的完成度很好。在演示中,这个宇航员外形的Optimus展示了精巧的运动能力。马斯克表示,之所以把它设计成人类的大小和形状,就是为了无缝取代人类劳动力,去执行任何人类不愿意做的事情。

机器人的下一步:达到了ChatGPT的颠覆时刻吗?

特斯拉的机器人一身浓浓的科幻工业风,造价不菲的样子,也许正是这个形象带给了它“一切都理所当然”的预期。事实上,特斯拉并未展示太多它的应用场景,所以人们似乎对它也就是“哦”了一声。但是,接下来1月份相继公布的两个机器人则让许多人发出了情真意切的“啊?”

首先亮相的是斯坦福大学研究团队公布的Mobile Aloha项目。这一项目之所以能引起广泛兴趣,可能在于它给机器人找的场景比较实用:做菜、逗猫、洗衣服。实际上,这一项目的主要创新之处在于它利用低成本的硬件(三万多美元,对于家用还是超贵的)实现了一个自主移动的双手操作机器人(虽然它外形不那么像人),并且它可以学会人的技能。这个学习过程显得有点中二,以做菜为例,你得先操作它做一遍菜,然后它就记住了大概动作。此时它不可能一下子就拿得稳锅,但奇妙之处在于,它会再通过手臂上的摄像头进行几十次自主训练,就能真正拿得稳了。

机器人的下一步:达到了ChatGPT的颠覆时刻吗?

紧接着,Figure公司公布了他们的人形机器人Figure 01做咖啡的视频。这个机器人听到人的语音指令“给我做杯咖啡”,就能熟练使用胶囊咖啡机制作了一杯咖啡。Figure公司把这个成就称为“人形机器人的ChatGPT时刻”,这倒不是因为它使用大语言模型理解了人类语音指令,而是因为这个制作咖啡的技能仅仅是通过观察人类动作而模仿学会的,这个成就带给人的震撼程度堪比ChatGPT。Figure 01通过视觉观察人类使用咖啡机的行为,建立了对任务行为的理解,然后通过若干次的自主训练纠错,掌握了这一技能。这展现了AI驱动的通用型人形机器人的广阔前景。

机器人的下一步:达到了ChatGPT的颠覆时刻吗?

比尔盖茨的A robot in every home

2007年的第一期《科学美国人》杂志上,曾经刊登过一篇比尔盖茨的署名文章,我记得是封面头条。文章的标题是“A robot in every home”。

机器人的下一步:达到了ChatGPT的颠覆时刻吗?

在文章中,比尔盖茨对机器人行业的机会表示非常激动,因为这像极了30年前他创办微软公司的时候:行业出现了突破性技术,但是专业级的商用机器依然被垄断在少数几个大公司手中。初创公司和极客们虽然也不断创造出来一些有趣的东西,但是高度分散,以至于没有任何通用的标准和开发工具。所以,比尔盖茨大胆预言:只要解决了这个问题,机器人必将走进千家万户。

所以,微软当时果断投资推动了这个事情,成立了Robotics部门,推出了Microsoft Robotics Studio,准备复刻当年微软在PC时代取得的成功。

在文章中,比尔盖茨引用了经典的DARPA 2004越野挑战赛。对,就是发明了互联网的那个传奇DARPA,它赞助这项比赛的目标是让完全自主导航的车辆穿越140多英里的莫哈维沙漠。在第一年的比赛中,最优秀的参赛者也只艰难行驶了7英里,第二年就有5辆车成功完成比赛,而且简直是一路狂奔着完成的。这项比赛极大的体现了机器人技术的进化速度。这也是比尔盖茨的信心所在。

微软当时努力的方向是开发工具层面。传感器、马达、伺服机构等硬件的能力在飞速提升,价格在不断下降,但是在开发层面,你不得不给每一个硬件专门写程序驱动它。而且,怎样让当时孱弱的处理器能实时处理多个传感器的数据也是一大挑战。微软的解决方案一是给驱动程序建立标准,二是提供多线程能力。微软甚至推出了.NET Micro Framework。了解.NET技术的同学们应该能想到,把这样的大杀器下放到机器人开发工具里,简直是降维打击。机器人开发者甚至连内存和线程调度都不需要头疼了,直接写逻辑就行。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier