如何让AI机器人最终能与人类对话?

向朋友挥手问候、物体向地面降落和其他简单的动作很容易被人类理解,但会让机器迷糊。位于多伦多和柏林的创业公司Twenty Billion Neurons(以下简称TBN)正在开发一项人工智能功能,通过使用视频和深度学习来增进机器人对视觉世界的理解。TBN公司CEO兼首席科学家罗兰·梅尼塞维奇(Roland Memisevic)最近在硅谷举行的人工智能前沿大会(AI Frontiers conference)上发言。 

近日,TBN在蒙特利尔的一次会议上推出了一个人工智能支持的情境感知化身(AI-powered context-aware avatar)米莉Millie)。公司介绍,米莉是一个“真人大小的帮手,通过观察和理解你所处的环境以及你正在做的事情与你互动。该公司计划将米莉作为其主要产品,服务于零售和教育等行业。 

在接受沃顿知识在线的采访时,梅尼塞维奇谈到他对公司的展望以及为什么“视频是让人工智能系统了解世界如何运转的最佳窗口。

访谈文字内容整理如下。 

沃顿知识在线:能否简单介绍一下您的个人经历,您是怎么跟人工智能结缘的? 

罗兰· 梅尼塞维奇:我对人工智能(AI)的兴趣从十五六岁阅读道格拉斯·霍夫施塔特(Douglas Hofstadter)的书开始,他写了一些专注于人工智能的科普书籍。我在书店偶然发现了他的一本书,读了以后非常好奇。这就像魔术一样,独特、有趣、怪异和奇妙。 

沃顿知识在线:给您印象最深刻的是什么? 

梅尼塞维奇:我们通过发展AI学到了很多我们自己的知识。人类是如此怪异的生物……就像拿起一面镜子,看看人类是什么,以及为什么是这样。很多东西都令人惊讶。这就是AI的魅力所在。

这也是一个有趣的组合,有很强数学性,同时也涉及哲学问题,甚至在某些方面还有艺术性。当你深入了解AI,会有很多创意迸发。 

沃顿知识在线:TBN是如何产生的?你试图应对的机会是什么? 

梅尼塞维奇:在我读博士以及后来担任蒙特利尔大学助理教授的过程中,我对视频理解非常感兴趣,深受吸引。这不是因为视频本身,而是因为我认为视频是我们可以让AI系统了解世界如何运转的最佳窗口,包括了解物体是什么,物体如何运作,生物是什么,他们的行为方式和动机,这就是人们称之为直觉物理或常识理解。

在TBN,我们有一个规模庞大的数据生成运作系统,我们要求大量人员为我们拍摄视频,以便我们教会AI系统世界如何运作。我们公司只有20个人,专注解决这个问题。因为我们非常专注,这是吸引我的原因。 

沃顿知识在线:对于那些不熟悉AI以及AI和视频如何协同的人,您能解释一下公司业务对消费者的意义吗? 

梅尼塞维奇:人类使用语言时通常会通过类比来表达简单概念,以做出高级、抽象的决策。例如,一位CEO可能会说,“我们的前面正酝酿着一场风暴”,每个人都知道这意味着什么。如果你看看人们如何使用语言,如何思考以及如何推理,总是以日常的切身体验为基础。

视频是将这些知识引入AI系统的最佳方式,因为视频是一个非常丰富的信息来源,传达了很多这个世界的信息。例如,我们教AI的是,如果我不握住一个物体,那么它将以一种特定方式和完全确定的方向落下……所有这些在视频中都立即可见。如果您可以解释视频中的这些现象,那么您肯定从根本上了解了这些问题。

这就是我们创建数据的原因,这些数据显示了世界上可能发生的各种事情,然后要求神经网络进行预测,例如,要求AI系统用语言描述所看到的内容。如果神经网络掌握了这一技能,必然说明它们以某种方式吸收了其中的一些信息。 

沃顿知识在线:以医疗等行业背景来理解应该更容易。您能举一个运用例子吗?

梅尼塞维奇:医疗是视频理解应用的一个巨大机会,但医疗行业受到很严的监管,难以作为市场渗透。

有很多运用的例子。例如,我们开始与多伦多的一家医院合作使用手势控制,以便照顾患者的护士不必停下手头的工作来关闭警报,不用摘下手套,按下按钮,戴上新手套然后继续照顾患者。因此让护士的工作进程更流畅。

另一个例子与作记录有关。你照顾患者时,有必要记录自己做的事情。大家通常认为这很麻烦并且浪费时间。让观察你的相机创建一个文档,填充你活动的所有内容以及活动顺序,这非常容易。你随后只需要检查一遍,修改一些地方,然后批准说:“好了,这是日志文件。”

还有许多例子,特别是老年人护理方面。查看有没有人跌倒,或者仅仅是通过与你谈话来陪伴,让老人不孤单。讽刺的是,虽然这项技术可以在医疗领域带来很大改善,但也最难实现商业化。对于我们这样的小公司而言,很难涉入医疗领域。 

沃顿知识在线:让我们考虑另一个监管较少的行业,比如零售业。视频理解在该领域可能有什么发展? 

梅西塞维奇:有很多。我最感兴趣的是陪伴的概念。想象一个欢迎你到商店的化身或机器人,就你可能寻找的商品、价格等等回答你的问题。或者当你进入商店时让你微笑,并享受与人工虚拟生物互动的乐趣,这些生物可以真的看着你并以某种方式与你接触,以此提高顾客的参与度和满足感,并增加客流量。 

沃顿知识在线:“看着你”是什​​么意思? 

梅尼塞维奇:我们正在构建的技术和数据让机器人理解视频,一个重大变化是,我们可以在屏幕上赋予这些机器人向你报以目光并理解你正在看什么的能力。

如果是一个智能家居扬声器,你需要按下按钮并问:“嘿,明天天气怎么样?”我说的机器人可以看到你正在走近。他们可以向你挥手然后告诉你,“过来吧,让我告诉你些东西。”它们有目光方向,就像我们一样。它们朝某个方向看,以便专注世界的某些部分。只要让它们的眼睛指向某个方向,它们就可以将看到的内容传达给你。

它们可以向你表达它们正在看着你。它们也可以理解你在看它们。相比让你浏览一个目录或屏幕,你可以与这些AI生物进行更自然的交流。 

沃顿知识在线:您正在探索哪些商业模式让这些探索成为可行的业务? 

梅尼塞维奇:我们授权该技术。我们授权这些神经网络,例如商店中的机器人能够看到您并了解什么正在发生。我们也分析这些数据,因为我们在此过程中生成了海量数据。对于一些培训自身应用系统的公司来说,这些数据是宝贵的信息来源。

沃顿知识在线:用在自动驾驶汽车上似乎合乎逻辑。 

梅尼塞维奇:但是我们并没有踏入自动驾驶领域。这是一个战略性的考量。自动驾驶行业已经非常拥挤。我们可以在汽车领域提供其它价值,例如帮助你在车内用手势来控制,或帮助你了解乘客的行为等等。这是我们特有的。我们愿意关注房间和汽车的内部。美国人平均每天花费93%的时间在室内和车内,所以这是我们的重点。 

沃顿知识在线:您在接下来的两年内有哪些目标? 

梅尼塞维奇:我们正在寻找能将授权机会规模化的可能。我们在这些能与你互动的生物上有一些雄心勃勃的项目,我们的技术目标是让它们能够做一些事情。例如,按食谱烹饪或一些舞蹈动作。在商业方面,我们关注用户数量和营收。 

沃顿知识在线:谁是你们的主要竞争对手,你们如何差异化定位自己? 

梅尼塞维奇:有许多公司有相似之处,但目前没有哪家公司像我们一样完全专注于这个问题。我们并不担心市场会过于饱和。但是人才极度短缺,这就是真正的竞争。谷歌、亚马逊、脸书、微软这些大企业都在争夺人才。每隔一段时间,你还会看到云计算公司提供的服务涉及我们的一些功能。所以有一点重叠。但总而言之,我们的业务非常有针对性,没有太多竞争。

沃顿知识在线:到目前为止,您在管理企业中有什么体会? 

梅尼塞维奇:我们的团队从4人到6人再到10人和20人,每次都是新的挑战。你需要不同的流程,不同的文化氛围,来保持每个人有效率和好心情,还有企业的健康。我以前是大学教授,那是一个非常不同的世界,很大程度上以个人为主。我相信一个专注的20人团队可以取得不可想象的进步,但这群人必须成为一个有效运转的利益相关体。这是个挑战。现在,我们的状态非常好,合作很有效。 

沃顿知识在线:从教授到企业家,是否有挑战性? 

梅尼塞维奇:那当然了。但是你逐渐成长,学到很多东西,了解人类的行为以及团队如何协同运作。这本身就很有意思。 

沃顿知识在线:您未来的梦想是什么? 

梅尼塞维奇:想象一个AI机器人可以看着你、理解你并与你交谈的世界。如果说要与人际互动没有根本差别,我认为这个目标不可能实现。因为我们的肉体体验,比如痛苦和悲伤等等,AI永远不会真正理解和感同身受。但我们可以试着接近这一点,有一天你可以坐在机器人朋友面前,就经济形势和它进行深入的哲学对话,或类似情景。我预见,有一天,我们的AI同伴可以进行推理和思考。 

沃顿知识在线:推理和思考,确实。但您认为AI到底能够感受到情感吗? 

梅尼塞维奇:不会以明显的方式。也许有办法灌输一些。 

沃顿知识在线:他们可能会模仿情感,但他们感觉不到情感? 

梅尼塞维奇:这就回到AI系统是否具备意识?我不确定。你知道我有意识吗?你可以假设,但你不能真的证明。如果你坐在一个设备前面,这个设备可能以某种方式传达情感,你可能会说,“好吧,它看起来像有意识,但这是一个机器人,所以我认为它没有情感。”

这是一个根本障碍。在任何时刻你都无法感受到另一个人的切实感受。你可以有某种同理心,你可以理解他人感受,但你无法证明它。你不知道我有多少意识。这种障碍对设备来说也是同样。所以我认为最终没有任何区别。人们会将某种心态与机器相联系并从此习惯。如果你对设备做了某些让它感到受伤的东西,你甚至可能会感觉很糟。但这种判断很难论证。

如何引用沃顿知识在线文章

Close


用于个人/用於個人:

请使用以下引文

MLA

"如何让AI机器人最终能与人类对话?." China Knowledge@Wharton. The Wharton School, University of Pennsylvania, [08 一月, 2019]. Web. [24 April, 2024] <http://www.knowledgeatwharton.com.cn/article/9926/>

APA

如何让AI机器人最终能与人类对话?. China Knowledge@Wharton (2019, 一月 08). Retrieved from http://www.knowledgeatwharton.com.cn/article/9926/

Chicago

"如何让AI机器人最终能与人类对话?" China Knowledge@Wharton, [一月 08, 2019].
Accessed [April 24, 2024]. [http://www.knowledgeatwharton.com.cn/article/9926/]


教育/商业用途 教育:

如果您需要重复利用我们的文章、播客或是视频,请填写内容授权申请表.

 

Join The Discussion

No Comments So Far