IROS 2024机器人大会,我国机器人企业大放异彩。过去的机器人大会参展的机器人或在固定展区,或被套一层玻璃外壳只能远距离观看,或被围栏圈起来,都不可以进行直接互动,而今年的中东机器人大会,参展的我国机器人企业带着自研机器人能够全程与人近距离互动。
宇树科技的人形机器人身高132cm,但立定跳远可以跳到140cm,并且是9.9万元每台的量产版,四足机器狗也有很强的自动避障能力,就连人类的刻意阻拦也能迅速识别并避让。星动纪元的人形机器人的跑步速度达到了3.6米每秒,打破了人形机器人跑步的世界纪录,相当于在马拉松比赛中配速4.6,已达到了军人的合格水平,这在某种程度上预示着在抗震救灾等活动中机器人将有更大价值。
实际上,爆发的不单单是产品,长期资金市场同样看好人形机器人。有相关统计,仅2024年上半年,我国机器人领域已经披露的融资金额就已超越 70 亿元。其中,汽车企业成为人形机器人行业投资与自研的排头兵,今年智元机器人和逐际动力两家公司三次获得上汽旗下投资机构的投资,小鹏汽车则展示了自研的人形机器人PX5,第二代人形机器人也会在马上就要来临的1024科技日上亮相。
自从ChatGPT发布,让传统机器人最不擅长的交互有了生成式AI的处理方法,无论是手势还是语言,同样的摄像头和麦克风配合本地和云端的 AI 能力,曾经存在的问题能像弯道超车一般解决掉。
最近,字节跳动用3800万个视频训练机器人视觉大模型,让机器人在执行任务前能提前生成执行结果。例如让机械手把面包放到烤箱里,机器人AI会用视频生成能力去想象完成这个任务的画面,算法认为方法可行之后,机器人就会在现实中执行该操作,同时AI的思考速度很快,即使有外界干扰,比如故意把盘子推开,机械手也能及时作出调整动作锁定盘子的位置达成目标,解决以往机器人工作呆板的问题。同时,在GR-2模型的加持下,可以有效的进行对话,例如与机器人对话饿了,机器人如果看到桌子上有面包以及面包机,那么机器人会自主操作烤面包,并将烤好的面包放到盘子里。字节跳动的这一训练让机器人产生更多想象力。
通过对海量数据的学习和分析,大模型能够理解自然语言、进行智能推理和预测,为机器人提供更高级的决策支持。
例如在物流行业,配备大模型的智能机器人能快速识别包裹信息,规划最优搬运路线,大幅度的提升物流配送效率;在医疗领域,手术机器人在大模型的指导下,能更精准地进行复杂手术操作,降低手术风险;在家庭中,智能机器人则能够最终靠与大模型的交互,更好地理解主人的需求,如根据主人的日常习惯调整室内温度、播放喜欢的音乐等。
机器人,正在以其精准的动作和强大的物理执行力,在各行各业发挥着及其重要的作用。机器人与大模型的结合将一同推动科技的进步,为我们创造一个充满无限可能的未来。