(资料图片)
编程客栈()7月11日编程客栈消息:李飞飞团队的最新成果是一项名为 VoxPoser 的具身智能技术,可以使机器人直接听懂人类的自然语言指令并完成复杂任务,无需额外的数据和训练。
这项技术通过将大语言模型和视觉语言模型结合,从3D 空间中分析目标和障碍物,帮助机器人php进行行动规划。该方法实现了零样本能力,即机器人可以在未经过训练编程的情况下直接执行任务。
此外,该技术还具有涌现能力,能够评估物理特性DVHdCuJ、进行行为常识推理、进行细粒度校正和实现基于视觉的多步操作。研究人员将该技术称为计算机视觉的一颗北极星,为具身智能领域开辟了新世界。该研究成果引起了学术界的广泛兴趣,并改变了一些人对于人工智能的看法。