【腾讯科技编者按】据《连线》杂志报道,美国的一个AI团队正在研究如何让机器人创造自己的语言,可以互相聊天。以下是原文内容:
伊果尔·麦多奇(Igor Mordatch)正在努力构建可以聊天的机器。这是很多人都在做的事情。毕竟在硅谷,聊天机器人已经成为了一个流行词汇。但是麦多奇的做法和他们不同。他不是语言学家。他也不研究语言处理AI技术。他是一个机器人专家,最初是以动画师的身份出道的。他在皮克斯时参加过《玩具总动员3》的制作,之后又在斯坦福大学和华盛顿大学等学术机构任教,教学生如何让机器人像人类一样移动。“我一直都对从零开始创造东西很感兴趣,”他说。现在,他所有的这些专业知识都以一种意想不到的方式结合到了一起。
麦多奇现年31岁,出生于乌克兰,在多伦多长大,现在是OpenAI的客座研究员。OpenAI是由特斯拉创始人马斯克(Elon Musk)和Y combinator总裁欧特曼(Sam Altman)创办的一家人工智能实验室。麦多奇正在探索一条新的道路,让机器不仅仅能与人交谈,还能互相交谈。他正在搭建一些需要软件机器人学会自己创造语言的虚拟世界。
OpenAI本周发表的一篇研究论文称,麦多奇和合作者搭建了一个世界,那里的机器人要负责完成某些任务,例如自己移动到一个特定的位置上。这个世界很简单,只是一个大大的白色正方形,所有的东西都是二维的——机器人则是彩色的,比如绿色、红色或蓝色圆圈。但是这个世界的意图更加复杂一些:它让机器人创建自己的语言,作为一种合作的方式,帮助彼此完成这些任务。
所有这一切都是通过“强化学习”来完成的。谷歌DeepMind AI实验室研发的围棋机器人AlphaGo所使用的基本技术同样是“强化学习”。简单来说,就是机器人在它们的世界中摸索,反复试错,对于实现一个目标(比如到达一个特定位置),机器人仔细记录下怎么做行得通,怎么做行不通。如果一个特定的行动有助于机器人达成这个目标,它们就知道需要继续这么做。它们也会以同样的方式学会建立自己的语言。告诉对方怎么走,可以更快地找到目标。
麦多奇说:“我们可以把交谈是否成功归结为:你最终找到那个绿色目标了吗?”
为了创造语言,机器人把随机的抽象字符分配给它们在虚拟世界学到的一些简单概念。它们给其他机器人分配字符,分配给虚拟世界中的位置或对象,还分配给“去”或“看”这样的动作。麦多奇和他的同事希望,随着这些机器人语言变得更加复杂,相关的技术可以把它们的语言翻译成英语等等。距离那一步还有很长的路要走——但OpenAI的另一个研究者已经在做这种“翻译机器人”了。
麦多奇说,最终,这些方法可以让机器更深入地掌握语言,展示为什么语言会存在——并为真正的对话提供了一个跳板,这是计算机科学家长久以来的梦想,但却从未真正做到过。
这些方法明显不同于和语言有关的近期AI研究。如今,顶尖研究人员通常采取的做法试图模仿人类语言,而不是创造一种新的语言。围绕深度神经网络进行的研究就是一个例子。近年来,深度神经网络(一种复杂的数学系统,可以通过在大量数据中寻找模式来学习执行任务)已经被证明是一种非常有效的方法,可以用来识别照片中的对象,以及识别智能手机中的命令等等。目前像谷歌、 Facebook和微软等公司的研究人员正在使用类似的方法来理解语言、寻找识别英语会话中的模式,迄今为止,它们取得的成果还很有限。
麦多奇和他的合作者(包括OpenAI研究员、加州大学伯克利分校教授Pieter Abbeel)怀疑这种方法未必可行,所以他们采取了一个完全不同的切入点。“对于可以与人类互动的机器人来说,仅仅捕获统计模式是不够的,”他们在文章中说。“一个机器人要在它所属的环境中使用语言(以及其他工具,比如非言语交流或肢体行为)来实现目标,就需要它对语言有所理解才行。”
人类早期之所以能掌握语言,是因为有这种必要。他们之所以学会了沟通,是因为沟通有利于他们开展一些活动,获得相对于其他动物的优势。OpenAI研究人员想为机器人创建相同的环境。在虚拟世界中,机器人不仅要学会它们自己的语言,还要使用简单的手势和动作来进行沟通——比如指出特定的方向,或者把彼此从一个地方引到另一个地方——很像人类小宝宝做的那样。这也是语言,或者至少是通向语言的一条路径。
然而很多AI研究人员都认为,深层神经网络方法仍然会有效果,它通过数据中的统计模式来弄清语言的奥秘。
尽管如此,麦多奇的项目表明,分析大量数据不是唯一的途径。系统还可以通过自己的行动来学习,这可能会带来非常不同的好处。 OpenAI的其他研究人员在使用一个更大更复杂的虚拟世界(他们称之为“宇宙”)来尝试同样的想法。在“宇宙”中,机器人可以学习使用常见的软件应用程序,如Web浏览器。这也是通过强化学习的一种形式来实现的。对于OpenAI的创始人之一伊尔亚·苏茨克维(Ilya Sutskever)来说,这种做法是通向理解语言的另一条道路。只有当AI理解人类谈话的自然方式之后,它才能浏览互联网。同时,微软也正在通过其他形式的强化学习来解决语言问题,斯坦福大学的研究人员也正在探索自己的方法,对于机器人之间的协作。
最后成功的,可能不是这些技术中的其中一个,而且它们融合起来的结晶。麦多奇提出了另一种技术——机器人不只要学会聊天,还要学习用自己创建的语言聊天。人类的历史已经显示,这是一个非常强大的想法。(编译/Kathy)