消息

谷歌通过云机器人技术让机器人互相学习技能

2017年1月02日经过史蒂夫asrar

机器人使用共享数据来学习技能比现在更快地学习技能。

机器人正在使用共享数据来更快地学习技能。

人类利用语言来获取他人的知识，更快地学习技能。这能帮助我们磨练我们的直觉，更有效地完成我们的日常活动。受此启发，谷歌研究中心、DeepMind(其英国人工智能实验室)和谷歌X决定让他们的机器人分享经验。该研究团队通过在多个机器人之间共享学习过程，大大加快了机器人通用技能的获取。

培训：如何以及为什么？

使用人工神经网络，我们可以通过分析其先前经验的结果来教导机器人来实现目标。首先，机器人似乎可以根据试验和错误随机行动。但是，它检查了每次试验的结果，如果令人满意，请侧重于下一次试验期间的类似实验。在每种体验和所获得的结果之间进行连接，机器人将能够逐渐做出更好的选择。

要教机器人，必须积累大量的经验，这是一个相当耗时的过程。例如，为了教机器人手臂如何抓取物体，我们可能需要让机器人经历多达80万次的抓取。而这只是它学习过程的开始。

虽然这种学习真的很耗时，但它有有趣的结果。设计用来执行某些预定义动作或与预定义对象交互的机器人不容易对环境的变化做出反应。然而，经过训练的机器人会根据其丰富的经验发展能力。在这种情况下，机器人获得了适应环境细微变化的能力。

为了迅速训练机器人，谷歌研究人员已经决定让机器人分享他们的经验 - 这也称为云机器人的概念。每个机器人都在服务器上施加了自己的体验，并采用最新版本的培训模型，这是由服务器中所有机器人获得的总体结果。有效地，机器人互相教导如何执行某项任务。这种基于云的方法显着减少了培训网络所需的时间。

谷歌之前的机器人数据共享实验

试图教授机器人武器以掌握物体，谷歌观察到机器人已经开发了预先掌握行为。他们可以将物体推开，从一个组中隔离某个对象，然后掌握它。而且，机器人学会了以不同的方式处理柔软和硬物。研究团队只能通过让机器人学习而不是通过在与对象交互之前进行编程而实现这些能力。

在此实验中，将于3月进行的，谷歌允许14个机器人的机器人来尝试采摘物体。机器人经历通过摄像机监测，结果用于训练基于卷积神经网络（CNN）的系统 - 机器学习的特定领域。

分享数据，机器人能够更快地学到更快。每个机器人都在略微不同的条件下进行实验。例如，研究团队为每个机器人稍微改变相机位置，照明和夹具硬件等参数。这些故意变化允许机器人找到更强大的解决方案并使自己适应环境变化。但是，系统仍然不太可能成功运行，具有明显不同的硬件或环境。

在最近进行的另一项实验中，谷歌团队让一组机器人完成开门的任务，并研究了数据共享的想法。他们在三种不同的条件下重复了这个实验:

加强学习

在第一个实验中，机器人仅仅依靠强化学习或试错法，结合深度神经网络。研究人员利用干扰技术使神经网络更快地建立数据。服务器监控试验结果，并帮助机器人找到更好的解决方案。

它需要机器人手臂约20分钟，首次开门。然而，在三个小时内，他们弄清楚如何整齐地伸出手柄，转动它，然后拉动打开门。虽然机器人成功打开了门，但它们不一定构建这项任务的显式模型。

基于预测模型的学习

在第二个实验中，开发并测试了一个预测模型。科学家们给机器人提供一盘日常用品。将这些物体推到桌子周围，机器人就会建立一个模型，以某种方式帮助它们预测如果采取某种行动可能会发生什么。这种因果模型在机器人之间同样适用。

然后，研究人员使用计算机界面显示测试环境，告诉机器人将对象移动到某个位置。机器人使用预测模型来了解如何移动对象。

基于人类指导的学习

最后一个实验旨在帮助机器人直接向人类学习。在这个实验中，机器人被人类移动去够门并打开它。

分析并转换成神经网络，形成机器人后续学习的基础。然后，研究人员让机器人尝试自己开门。同样，机器人可以彼此分享他们的经验。在几个小时内，学习过程会产生更多功能的机器人。

云机器人可以为机器人提供快速下载的智能。通过采用这种方法，我们可能很快就会看到机器人能够学习比简单地开门更复杂的任务。人类需要很多时间来掌握他人的知识，而机器人将能够将他们的信息放到一个共享的网络上，并立即获得彼此的技能。