如何讓AI機器人最終能與人類對話?

向朋友揮手問候、物體向地面降落和其他簡單的動作很容易被人類理解,但會讓機器迷糊。位於多倫多和柏林的創業公司Twenty Billion Neurons(以下簡稱TBN)正在開發一項人工智慧功能,通過使用視頻和深度學習來增進機器人對視覺世界的理解。TBN公司CEO兼首席科學家羅蘭·梅尼塞維奇(Roland Memisevic)最近在矽谷舉行的人工智慧前沿大會(AI Frontiers conference)上發言。 

近日,TBN在蒙特利爾的一次會議上推出了一個人工智慧支持的情境感知化身(AI-powered context-aware avatar)米莉(Millie)。公司介紹,米莉是一個真人大小的幫手,通過觀察和理解你所處的環境以及你正在做的事情與你互動。該公司計畫將米莉作為其主要產品,服務於零售和教育等行業。 

在接受沃頓知識線上的採訪時,梅尼塞維奇談到他對公司的展望以及為什麼視頻是讓人工智慧系統瞭解世界如何運轉的最佳視窗。

訪談文字內容整理如下。 

沃頓知識線上:能否簡單介紹一下您的個人經歷,您是怎麼跟人工智慧結緣的? 

羅蘭· 梅尼塞維奇:我對人工智慧(AI)的興趣從十五六歲閱讀道格拉斯·霍夫施塔特(Douglas Hofstadter)的書開始,他寫了一些專注於人工智慧的科普書籍。我在書店偶然發現了他的一本書,讀了以後非常好奇。這就像魔術一樣,獨特、有趣、怪異和奇妙。 

沃頓知識線上:給您印象最深刻的是什麼? 

梅尼塞維奇:我們通過發展AI學到了很多我們自己的知識。人類是如此怪異的生物……就像拿起一面鏡子,看看人類是什麼,以及為什麼是這樣。很多東西都令人驚訝。這就是AI的魅力所在。

這也是一個有趣的組合,有很強數學性,同時也涉及哲學問題,甚至在某些方面還有藝術性。當你深入瞭解AI,會有很多創意迸發。 

沃頓知識線上:TBN是如何產生的?你試圖應對的機會是什麼? 

梅尼塞維奇:在我讀博士以及後來擔任蒙特利爾大學助理教授的過程中,我對視頻理解非常感興趣,深受吸引。這不是因為視頻本身,而是因為我認為視頻是我們可以讓AI系統瞭解世界如何運轉的最佳視窗,包括瞭解物體是什麼,物體如何運作,生物是什麼,他們的行為方式和動機,這就是人們稱之為直覺物理或常識理解。

在TBN,我們有一個規模龐大的資料生成運作系統,我們要求大量人員為我們拍攝視頻,以便我們教會AI系統世界如何運作。我們公司只有20個人,專注解決這個問題。因為我們非常專注,這是吸引我的原因。 

沃頓知識線上:對於那些不熟悉AI以及AI和視頻如何協同的人,您能解釋一下公司業務對消費者的意義嗎? 

梅尼塞維奇:人類使用語言時通常會通過類比來表達簡單概念,以做出高級、抽象的決策。例如,一位CEO可能會說,“我們的前面正醞釀著一場風暴”,每個人都知道這意味著什麼。如果你看看人們如何使用語言,如何思考以及如何推理,總是以日常的切身體驗為基礎。

視頻是將這些知識引入AI系統的最佳方式,因為視頻是一個非常豐富的資訊來源,傳達了很多這個世界的資訊。例如,我們教AI的是,如果我不握住一個物體,那麼它將以一種特定方式和完全確定的方向落下……所有這些在視頻中都立即可見。如果您可以解釋視頻中的這些現象,那麼您肯定從根本上瞭解了這些問題。

這就是我們創建資料的原因,這些資料顯示了世界上可能發生的各種事情,然後要求神經網路進行預測,例如,要求AI系統用語言描述所看到的內容。如果神經網路掌握了這一技能,必然說明它們以某種方式吸收了其中的一些資訊。 

沃頓知識線上:以醫療等行業背景來理解應該更容易。您能舉一個運用例子嗎?

梅尼塞維奇:醫療是視頻理解應用的一個巨大機會,但醫療行業受到很嚴的監管,難以作為市場滲透。

有很多運用的例子。例如,我們開始與多倫多的一家醫院合作使用手勢控制,以便照顧患者的護士不必停下手頭的工作來關閉警報,不用摘下手套,按下按鈕,戴上新手套然後繼續照顧患者。因此讓護士的工作進程更流暢。

另一個例子與作記錄有關。你照顧患者時,有必要記錄自己做的事情。大家通常認為這很麻煩並且浪費時間。讓觀察你的相機創建一個文檔,填充你活動的所有內容以及活動順序,這非常容易。你隨後只需要檢查一遍,修改一些地方,然後批准說:“好了,這是日誌檔。”

還有許多例子,特別是老年人護理方面。查看有沒有人跌倒,或者僅僅是通過與你談話來陪伴,讓老人不孤單。諷刺的是,雖然這項技術可以在醫療領域帶來很大改善,但也最難實現商業化。對於我們這樣的小公司而言,很難涉入醫療領域。 

沃頓知識線上:讓我們考慮另一個監管較少的行業,比如零售業。視頻理解在該領域可能有什麼發展? 

梅西塞維奇:有很多。我最感興趣的是陪伴的概念。想像一個歡迎你到商店的化身或機器人,就你可能尋找的商品、價格等等回答你的問題。或者當你進入商店時讓你微笑,並享受與人工虛擬生物互動的樂趣,這些生物可以真的看著你並以某種方式與你接觸,以此提高顧客的參與度和滿足感,並增加客流量。 

沃頓知識線上:“看著你”是什​​麼意思? 

梅尼塞維奇:我們正在構建的技術和資料讓機器人理解視頻,一個重大變化是,我們可以在螢幕上賦予這些機器人向你報以目光並理解你正在看什麼的能力。

如果是一個智慧家居揚聲器,你需要按下按鈕並問:“嘿,明天天氣怎麼樣?”我說的機器人可以看到你正在走近。他們可以向你揮手然後告訴你,“過來吧,讓我告訴你些東西。”它們有目光方向,就像我們一樣。它們朝某個方向看,以便專注世界的某些部分。只要讓它們的眼睛指向某個方向,它們就可以將看到的內容傳達給你。

它們可以向你表達它們正在看著你。它們也可以理解你在看它們。相比讓你流覽一個目錄或螢幕,你可以與這些AI生物進行更自然的交流。 

沃頓知識線上:您正在探索哪些商業模式讓這些探索成為可行的業務? 

梅尼塞維奇:我們授權該技術。我們授權這些神經網路,例如商店中的機器人能夠看到您並瞭解什麼正在發生。我們也分析這些資料,因為我們在此過程中生成了海量資料。對於一些培訓自身應用系統的公司來說,這些資料是寶貴的資訊來源。

沃頓知識線上:用在自動駕駛汽車上似乎合乎邏輯。 

梅尼塞維奇:但是我們並沒有踏入自動駕駛領域。這是一個戰略性的考量。自動駕駛行業已經非常擁擠。我們可以在汽車領域提供其它價值,例如幫助你在車內用手勢來控制,或幫助你瞭解乘客的行為等等。這是我們特有的。我們願意關注房間和汽車的內部。美國人平均每天花費93%的時間在室內和車內,所以這是我們的重點。 

沃頓知識線上:您在接下來的兩年內有哪些目標? 

梅尼塞維奇:我們正在尋找能將授權機會規模化的可能。我們在這些能與你互動的生物上有一些雄心勃勃的專案,我們的技術目標是讓它們能夠做一些事情。例如,按食譜烹飪或一些舞蹈動作。在商業方面,我們關注用戶數量和營收。 

沃頓知識線上:誰是你們的主要競爭對手,你們如何差異化定位自己? 

梅尼塞維奇:有許多公司有相似之處,但目前沒有哪家公司像我們一樣完全專注於這個問題。我們並不擔心市場會過於飽和。但是人才極度短缺,這就是真正的競爭。谷歌、亞馬遜、臉書、微軟這些大企業都在爭奪人才。每隔一段時間,你還會看到雲計算公司提供的服務涉及我們的一些功能。所以有一點重疊。但總而言之,我們的業務非常有針對性,沒有太多競爭。

沃頓知識線上:到目前為止,您在管理企業中有什麼體會? 

梅尼塞維奇:我們的團隊從4人到6人再到10人和20人,每次都是新的挑戰。你需要不同的流程,不同的文化氛圍,來保持每個人有效率和好心情,還有企業的健康。我以前是大學教授,那是一個非常不同的世界,很大程度上以個人為主。我相信一個專注的20人團隊可以取得不可想像的進步,但這群人必須成為一個有效運轉的利益相關體。這是個挑戰。現在,我們的狀態非常好,合作很有效。 

沃頓知識線上:從教授到企業家,是否有挑戰性? 

梅尼塞維奇:那當然了。但是你逐漸成長,學到很多東西,瞭解人類的行為以及團隊如何協同運作。這本身就很有意思。 

沃頓知識線上:您未來的夢想是什麼? 

梅尼塞維奇:想像一個AI機器人可以看著你、理解你並與你交談的世界。如果說要與人際互動沒有根本差別,我認為這個目標不可能實現。因為我們的肉體體驗,比如痛苦和悲傷等等,AI永遠不會真正理解和感同身受。但我們可以試著接近這一點,有一天你可以坐在機器人朋友面前,就經濟形勢和它進行深入的哲學對話,或類似情景。我預見,有一天,我們的AI同伴可以進行推理和思考。 

沃頓知識線上:推理和思考,確實。但您認為AI到底能夠感受到情感嗎? 

梅尼塞維奇:不會以明顯的方式。也許有辦法灌輸一些。 

沃頓知識線上:他們可能會模仿情感,但他們感覺不到情感? 

梅尼塞維奇:這就回到AI系統是否具備意識?我不確定。你知道我有意識嗎?你可以假設,但你不能真的證明。如果你坐在一個設備前面,這個設備可能以某種方式傳達情感,你可能會說,“好吧,它看起來像有意識,但這是一個機器人,所以我認為它沒有情感。”

這是一個根本障礙。在任何時刻你都無法感受到另一個人的切實感受。你可以有某種同理心,你可以理解他人感受,但你無法證明它。你不知道我有多少意識。這種障礙對設備來說也是同樣。所以我認為最終沒有任何區別。人們會將某種心態與機器相聯繫並從此習慣。如果你對設備做了某些讓它感到受傷的東西,你甚至可能會感覺很糟。但這種判斷很難論證。

如何引用沃顿知识在线文章

Close


用于个人/用於個人:

请使用以下引文

MLA

"如何讓AI機器人最終能與人類對話?." China Knowledge@Wharton. The Wharton School, University of Pennsylvania, [08 一月, 2019]. Web. [29 March, 2024] <https://www.knowledgeatwharton.com.cn/zh-hant/article/9930/>

APA

如何讓AI機器人最終能與人類對話?. China Knowledge@Wharton (2019, 一月 08). Retrieved from https://www.knowledgeatwharton.com.cn/zh-hant/article/9930/

Chicago

"如何讓AI機器人最終能與人類對話?" China Knowledge@Wharton, [一月 08, 2019].
Accessed [March 29, 2024]. [https://www.knowledgeatwharton.com.cn/zh-hant/article/9930/]


教育/商业用途 教育:

如果您需要重复利用我们的文章、播客或是视频,请填写内容授权申请表.

 

Join The Discussion

No Comments So Far