欢迎光临乐斯途机器人教育官网 网站地图
服务热线
0431-89623368
子页banner
通知公告
全国热线0431-89623368
当前位置:主页 > 通知公告 >
人类可以训练机器人如何做家务!
时间:2020-03-19 05:34

通过观察人类,机器人学会了执行复杂的任务,例如摆桌子。


长春机器人培训
 

有一天,即使是那些没有编程专业知识的人,也可以培训交互式机器人学会了执行复杂的任务,会成为一件非常容易的事情。

 

机器人学家正在开发自动化机器人,它们可以通过观察人类来学习新的任务。在家里,你也许有一天会教一个家庭机器人如何做日常家务。在办公场所,你可以像新员工一样训练机器人,教他们如何履行许多职责。

 

为了实现这一愿景,麻省理工的研究人员设计了一个系统,使这些类型的机器人可以学习复杂的任务。比如,在某些条件下摆放餐桌。

 

其核心是,研究人员的“不确定规格规划”(PUnS)系统,使机器人具有类似人类的规划能力,能够同时权衡许多模棱两可的、甚至可能相互矛盾的需求,以达到最终目标。在这样做的时候,系统总是基于对它应该执行的任务的一些可能的规范的“信念”,来选择最可能采取的操作。

 

研究过程中,研究人员收集了一个数据集,其中包含了如何将八个物体——杯子、玻璃杯、勺子、叉子、刀、餐盘、小盘和碗,以各种配置放置在桌子上的信息。首先,让机械手臂观察随机选择的人类摆放桌子的演示。然后,研究人员让机械手臂根据所看到的内容,在实际实验和仿真中自动配置桌子上的物品信息。

 

为了成功,机器人必须权衡许多可能的放置顺序,即使是故意移除、堆叠或隐藏的项目。通常情况下,所有这些都会让机器人感到困惑。但是研究人员的机器人在几次真实世界的实验中没有犯错误,在几万次模拟测试中只有少数错误。

 

研发人员介绍说:“我们的愿景是把编程交给领域专家,他们可以通过直观的方式对机器人编程,而不是向工程师描述添加代码的命令。这样,机器人就不再需要执行预先编程的任务了。工厂工人可以教机器人完成多种复杂的装配任务。家庭机器人可以向家里的人学习如何叠橱柜、装洗碗机或摆桌子。”

 

该系统建立在“线性时间逻辑”(LTL)之上,该语言是一种表达性语言,可以使机器人对当前和未来的结果进行推理。研究人员在LTL中定义了模板,这些模板对各种基于时间的条件进行了建模,例如现在必须发生的事情,必须最终发生的事情以及必须发生直到发生其他事情为止。

 

机器人对30个人演示设置表的观察产生了25种不同LTL公式的概率分布。每个公式设置有不同的偏好或规范。这种概率分布成为其指导核心信念。每个公式都编码不同的东西,但是当机器人考虑所有模板的各种组合,并试图使所有东西都满足时,它最终将做正确的事情。

 

研究人员还制定了一些标准,指导机器人满足对这些候选公式的全部信念。例如,一个满足最可能的公式,该公式以最高的概率丢弃除模板之外的所有其他内容。其他人满足最大数量的唯一公式,而不考虑其总概率,或者满足代表最高总概率的几个公式。另一个简单地将误差最小化,因此系统会忽略失败概率很高的公式。

 

设计人员可以在训练和测试之前选择四个标准中的任何一个进行预设。每个人在灵活性和规避风险之间都有自己的权衡。标准的选择完全取决于任务。例如,在安全关键的情况下,设计人员可以选择限制故障的可能性。但是在失败后果不那么严重的情况下,设计人员可以选择赋予机器人更大的灵活性,以尝试不同的方法。

 

有了这些标准,研究人员开发了一种算法,将机器人的信念——指向期望公式的概率分布——转化为一个等价的强化学习问题。该模型将根据机器人决定遵循的规范,对其所采取的行动给予奖励或惩罚。

 

在模拟中要求机器人将工作台设置为不同的配置时,在20,000次尝试中,它仅犯了6个错误。在现实世界中的演示中,它显示出类似于人类执行任务的行为。

 

例如,如果某个项目最初不可见,则机器人将完成不包含该项目的其余部分的设置。然后,当叉子被露出时,它将把叉子放在适当的位置。灵活性非常重要,当它期望放置叉子而不完成剩余的桌子设置时,它将卡住。

 

接下来,研究人员希望修改系统,以帮助机器人根据口头指示,更正或用户对机器人性能的评估来改变其行为。

 

研发人员说:“假设一个人向机器人演示了如何在一个位置摆放桌子。这个人可能会说,'对所有其他位置都做同样的事情',或者'将刀子放在这里的叉子之前',我们希望为系统开发方法,使其自然适应这些口头命令,而无需进行其他演示。”

 
免费回电
免费回电
课程介绍
联系我们