溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

發(fā)布時間:2020-08-07 16:56:50 來源:ITPUB博客 閱讀:176 作者:AIBigbull2050 欄目:互聯(lián)網(wǎng)科技

10 月 31 日,由北京智源人工智能研究院主辦的 2019 北京智源大會在國家會議中心開幕,本次大會圍繞人工智能基礎(chǔ)研究現(xiàn)狀及面臨的機遇和挑戰(zhàn)、人工智能技術(shù)未來發(fā)展的核心方向等話題,回歸 AI 技術(shù)本身,開展深入研討,探索人工智能前沿科技發(fā)展趨勢。

在第一天的主論壇上,美國加州大學(xué)洛杉磯分校的朱松純教授帶來了《走向通用人工智能:從大數(shù)據(jù)到大任務(wù)》的主題演講,并提出了任務(wù)是智能中心的觀點。

以下是朱松純演講內(nèi)容實錄,AI科技大本營(ID:rgznai100)整理:

關(guān)于通用人工智能,每個人都有自己的想法,有人認(rèn)為不可能,有人認(rèn)為馬上就要到來,而且會很可怕。不管哪一種觀點,我們都要扎扎實實地去研究問題,今天我給大家分享一個從大數(shù)據(jù)到大任務(wù)的思路。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

第一,人工智能的兩種范式之爭:大數(shù)據(jù)VS 大任務(wù);第二,智能的中心核心是任務(wù),每時每刻都被各種各樣的任務(wù)驅(qū)動;第三,如何通過構(gòu)建一個大任務(wù)的平臺,來研究通用人工智能。

兩種AI范式之爭:“大數(shù)據(jù)”對“大任務(wù)”

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

首先是兩個范式之爭。如果你問大部分人工智能的研究者,他們會告訴你AI = B+C+D,也就是人工智能等于大數(shù)據(jù)加上算力加上深度學(xué)習(xí),這是被普遍接受的觀點,但是我一直在反對這個觀點。幾年前我反對把深度學(xué)習(xí)作為人工智能之解時,很多人還很不滿,但是今天很多人已經(jīng)同意這個觀點了。

目前以大數(shù)據(jù)驅(qū)動的人工智能,在產(chǎn)業(yè)落地的過程中遇到了很多問題,這個問題其實一早就可以預(yù)想到。比如只能做特定的、人類事先定義的任務(wù),而不能做通用任務(wù),或者自己定義任務(wù)。第二,每項任務(wù)需要大量的數(shù)據(jù),成本非常高,而且模型不具有解釋性,知識表達與人不同。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

其實我們是最早做大數(shù)據(jù)的一個團隊。2005年,我們帶領(lǐng)了一批國際學(xué)者,包括后來在斯坦福標(biāo)注 ImageNet 的人,以及后來的 MIT 實驗室主任等,在中國湖北蓮花 山標(biāo)數(shù)據(jù)。當(dāng)時大數(shù)據(jù)剛剛興起,我們雄心勃勃地想標(biāo)數(shù)據(jù),制定了200 多頁的數(shù)據(jù)標(biāo)注手冊,包括蓮花如何分解,花蕊、花瓣以及生活環(huán)境等。

標(biāo)了幾年之后,我發(fā)現(xiàn)這里面有問題。一些學(xué)生剛開始問我如何標(biāo)注時,我還能回答,但是后來我就答不出來了。于是我發(fā)現(xiàn)這條路走不通,所以2009 年左右,我就轉(zhuǎn)型去做認(rèn)知科學(xué)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

我之前寫過一篇文章,介紹了兩種人工智能的模式。

一種稱之為“鸚鵡范式”,鸚鵡可以與人類對話,但是不理解你在說什么。比如你說林黛玉,它也說林黛玉,但是它并不知道林黛玉是什么。

還有一種是“烏鴉范式”。烏鴉找到核桃之后,會把核桃扔在路上,讓車去壓,壓碎了再吃。但是因為路上車太多烏鴉吃不到核桃,于是烏鴉把核桃扔到斑馬線上,因為這里有紅綠燈,綠燈亮?xí)r車都停住了,它就可以去吃。這個例子是非常驚人的,因為烏鴉既沒有大數(shù)據(jù),也沒有監(jiān)督學(xué)習(xí),卻完全可以自主地研究其中的因果關(guān)系,然后利用資源完成任務(wù),而且功耗非常小,小于 1瓦,這給了我們很大的啟發(fā)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

但是烏鴉能做到的不僅是這些,它們還知道如何利用工具,我相信直到今天,很多機器人的規(guī)劃能力都遠(yuǎn)達不到烏鴉對物理的理解。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

假設(shè)我們要定義一個人工智能系統(tǒng),我可以認(rèn)為任何一個動物、機器都是 AI 系統(tǒng),它往往決定了三個要素:第一是構(gòu)架,你的腦袋里缺一塊,就永遠(yuǎn)進化不到一個層次,人的智能90% 多都是天生的;第二是環(huán)境數(shù)據(jù);第三是任務(wù)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

第一種層次的解法是用大數(shù)據(jù)給一個任務(wù),比如人臉識別。給一個構(gòu)架,比如深度學(xué)習(xí)有多少層,這就是目前通用的大數(shù)據(jù)系統(tǒng)。我認(rèn)為人類走了另外一條路,就是有很小量的數(shù)據(jù),但是有很大量的任務(wù),不過人類有很高級的構(gòu)架,這就成了另外一個系統(tǒng)。

舉個例子,怎么教計算機學(xué)會識別椅子?用大數(shù)據(jù)的辦法很簡單,也非常暴力。就是搜索大量的例子,用人工標(biāo)注。你需要搜集各種材質(zhì)、各種攝像頭角度的椅子,窮舉后拿去訓(xùn)練,訓(xùn)練之后系統(tǒng)記住這些特征。但是藝術(shù)家總是設(shè)計新的椅子出來,總是有特例,機器總是搞不清楚,所以不可泛化,不可解釋什么是椅子,這就是它的核心問題所在。在自動駕駛、視頻監(jiān)控等領(lǐng)域都存在這樣的問題,即不能窮舉所有的例子。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

第二種層次的解法是什么呢?假設(shè)我們要理解椅子,定義什么是椅子。首先獲得人的經(jīng)典坐姿,之后用坐姿擬合圖像,各種位置、各種朝向、各種姿態(tài)的坐姿,能夠坐舒服的就是椅子,這就是一個任務(wù)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

椅子變成了一個任務(wù)的等價類,不管什么物體能夠坐,坐得舒服的就是椅子。這代表了一種想象,我要想象這把椅子怎么坐,這和深度學(xué)習(xí)不同:regression是統(tǒng)計,拿特征去擬合,simulation 是用我的身體去想象,這是兩者根本的區(qū)別。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

第三個層次,什么是坐得舒服?首先這個椅子要坐得穩(wěn),物理穩(wěn)定是神經(jīng)系統(tǒng)里非常敏感的感知。

我做了一個簡單的實驗,把各種各樣的椅子放在辦公室和實驗室里,看學(xué)生進來時先坐哪兒、后坐哪兒,這時人會有一個偏好。

另外一件我們感同身受的事是,我們可以感覺這個人是如何用力,如何受力的,這都可以映射,這是人類非常強的能力。映射過來之后,我就知道你如何坐得舒服,從中學(xué)到你的價值觀。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

理解這點之后,就不需要任何數(shù)據(jù)了。我知道椅子是為了讓人坐得舒服,從根本出發(fā),我根本不需要數(shù)據(jù)。這就是我說的小數(shù)據(jù)、大任務(wù)。

以任務(wù)為中心的智能

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

以任務(wù)為中心的智能是大家經(jīng)過漫長的時間之后才體會到的。

第一層的表達是以圖像為中心。我們看到了一張圖像,然后以圖像為中心抽取各種特征,理解各個部件。第二層變成了以場景和物體為中心,即幾何表達。

第一層是深度學(xué)習(xí),即把圖像看成圖像,沒有幾何、物理和功能的理解。第二層開始以三維的幾何來表達場景,比如三維場景的桌子、椅子等。

最后,我認(rèn)為真正的表達是以任務(wù)為中心的 task-centered representation,因為我們先有任務(wù),才有世界上各種各樣的物體,這些物體都是被設(shè)計出來是為了滿足人的需求和完成某種任務(wù)。以任務(wù)為中心的表達,比如功能、因果、價值觀、物理、社會常識,我們統(tǒng)稱為physical and social common sense,這些常識是小孩在 18 個月之前獲取的。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

什么是以任務(wù)為中心的表達?我們考慮世界不是從某個物體類別的角度出發(fā)。比如開酒瓶,并不是只有開瓶器能開酒瓶,任何東西都能開酒瓶,砸核桃也隱藏著一個物理原理。我們知道物理原理之后,并不需要固定的東西開酒瓶,只要能完成開酒瓶任務(wù)都可以。我認(rèn)為這種就是通用的人工智能。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這個問題怎么解?最近的研究發(fā)現(xiàn),人腦里大部分的知識表達并不是按照物理的類別來組織的,比如椅子是一類,桌子是一類,車子是一類,而是按照如何使用它們來組織,大概可以分成兩個尺度:身體的尺度和手的尺度。

其實這一點不新鮮,因為我們漢字中超過 1/3 的漢字都是與人有關(guān)的偏旁部首。我們之所以發(fā)明漢字,是因為漢字里有一些任務(wù),任務(wù)就是要把人放進去,一起來考慮,比如手、腳、耳朵、身體等。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

還是以砸核桃為例,烏鴉用車輪碾核桃,如果在一個新的環(huán)境中,工具被拿走,但是你還是能完成砸核桃的任務(wù),這是小學(xué)教育很重要的事情,就是教會你具有基本的常識。

砸核桃雖然只有一個例子,但是人要從上萬個選擇中選擇一個方案,在這個過程中有大量的simulation。我看到了核桃和幾種工具,大腦會快速地想怎么做,可能你的大腦出現(xiàn)了上萬種選擇迅速。這是大量計算的過程,但不是深度學(xué)習(xí)的計算,而是一種 simulation 的計算。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

還有時空因果的推理,現(xiàn)在這種情況要達到各種各樣的目標(biāo),中間有各種各樣的動作,然后形成一個因果方程,在物理上統(tǒng)一。

另外一點是 Causal Learning 和 Reinforcement Learing。RL現(xiàn)在也非?;穑菗?jù)神經(jīng)科學(xué)研究者稱,RL 是老鼠這類的低等動物用的,要用大量的例子反復(fù)實驗。而人使用的是因果學(xué)習(xí),只需要有兩三個例子。

砸核桃的任務(wù)轉(zhuǎn)換到機器人不能只是簡單的轉(zhuǎn)換,必須是一個物理因果的等價,要推理物理的功能。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這是一個從一兩個例子中學(xué)習(xí)的過程。一個比較聰明的人可以從幾個簡單的選擇里就悟出坐椅子的價值觀,從一個簡單的砸核桃的動作悟出本質(zhì)。一旦悟出來還要數(shù)據(jù)做什么呢?所以,這是一個核心問題。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

以鏟土為例,如果讓你用工具鏟土,你就會想象如何去鏟。如果沒有工具,用家里的工具同樣你也能鏟土。經(jīng)過自動計算,機器的第一個選擇是鍋,第二個選擇是杯子。

當(dāng)人類或猿人走過石器時代時,神經(jīng)系統(tǒng)已經(jīng)學(xué)習(xí)了工具和物理知識,他理解的是本質(zhì)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

現(xiàn)在回到如何定義任務(wù)?圖像有多少個像素可以很清楚地定義,但是任務(wù)如何定義呢?定義任務(wù)是以符合因果的方式,改變場景中的流態(tài)?!傲鲬B(tài)”是牛頓發(fā)明的一個詞,包括時變的物理狀態(tài)、內(nèi)心狀態(tài)、社會關(guān)系等,可以簡單分類為物理流態(tài)和社會流態(tài)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

如果定義了這些原子的任務(wù)空間(atomic space),就可以組合產(chǎn)生復(fù)合的數(shù)學(xué)空間,這就是任務(wù)。這個事情說清楚,人工智能的問題就解決了一大半。

目前人工智能之所以遇到了很大的困難,是因為大家說不清楚到底要做什么任務(wù)。任務(wù)定義不清楚,是很多產(chǎn)品賣不出去,或者賣出去后被投訴的原因。比如掃地機器人產(chǎn)品定義不清楚應(yīng)該吸和不該吸的東西有哪些,給機器的任務(wù)本身就沒有清晰的定義。監(jiān)控也一樣,到底什么人該抓,什么人不該抓,或者什么樣的環(huán)境都無法準(zhǔn)確定義。

前面談到了一些基本的物理任務(wù)和常識,物理常識是目前人工智能面臨的主要障礙。比如自然語言理解,自然語言最多也是符號對符號,比如什么叫“玩水”,如果沒有三維數(shù)據(jù)的體驗,沒有物理常識,其實很難搞懂這個詞的含義,所以物理常識是關(guān)鍵。

中國有一則寓言故事“盲人辨日”。一個從未見過太陽的盲人,無法解釋什么是太陽,這就是自然語言的尷尬。自然語言必須和認(rèn)知科學(xué)、計算機視覺、機器人聯(lián)系在一起,否則沒法研究清楚,這是我的觀點。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

另外一種智能是社會的常識和任務(wù)。人類幼兒 12 個月之后開始指東西,他認(rèn)識一個東西,但認(rèn)為你不知道,所以他指給你看,這是一種非常強的智能。要實現(xiàn)這種智能,首先要有視角的轉(zhuǎn)換,即推理他人所見所想,這是智能基本的東西。人類在對話時要有context,要知道上下文是什么,共同知道哪些東西。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

一個人從第三視角看,是他真正看到的東西。然后我們從第三人稱想他看到了什么,這是計算機推理,相當(dāng)于我大概知道你在看什么,你突然問我問題時我就知道如何回答。這其中還有我們達成的共識,我知道你知道,你也知道我知道,這樣才形成了一個共同的任務(wù)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

人的認(rèn)知構(gòu)架是什么?要形成對話,對話和語言是很重要的問題。每個客觀的世界用一個圓圈表示,其中每一個點都代表一個狀態(tài)。紅色是我腦中所想,藍色是機器人看到的。

首先,機器人看到的是不完整、不確定的世界,人類看到的是共享的世界,因為看問題的角度一樣。我們彼此從對方的角度看問題,雙方互相了解對方看到的東西。有了共同的東西,才能建立模型。

決策函數(shù),即我知道你在這種狀態(tài)下應(yīng)該如何做,我應(yīng)該如何做。價值函數(shù),即我大概知道你應(yīng)該怎么做,以及我認(rèn)為你會怎么做,以及你認(rèn)為我怎么做,有共同的情境和知識,就會有共同的價值觀。最后通過交流的過程,我們達成了共識。

Christopher Manning 講到人和人之間的通信只有 10 個 bit,很慢,跟 5G 相比差太遠(yuǎn)了,但是通信很快,為什么?就是因為我們有這些東西。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

我總結(jié)一下 AI 的烏鴉模式。

用少量的例子,但是有功能、因果、價值觀等以后,就可以舉一反百,從初心出發(fā)來理解這個世界。我稱之為 智能暗物質(zhì)。你看見了這把椅子,想象身體如何去坐,這叫做暗物質(zhì)。其中95%都是認(rèn)知推理,只有把這 95% 搞定了,才能去理解剩下的 5%,否則就只能窮舉所有的情況。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這是一個簡單的演示,機器人如何與人類進行交互。機器人看到人進來了以后,它要理解人的意圖,知道意圖之后可以幫人打開冰箱,知道要把食物放到冰箱里。在整個過程中不僅有語言的交流,還有動作、表情的交流,使得雙方能夠達成一個共識,即猜測你的意圖是什么,這是一個基本的方式。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這是我們剛做出來的桌面機器人,它能夠進行三維場景的重建。三維場景重建可以使用一些基本的計算機視覺方法。然后想象在這個場景中人能夠做什么,才能定義家具的用處。

這其中包括 top-down 的 inference,但永遠(yuǎn)無法識別小物體,必須要通過場景 context。這是一個非常致命的問題,現(xiàn)在所有的深度學(xué)習(xí)都沒有 top-down,只有 bottom-up。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這時我們要做一個統(tǒng)一的系統(tǒng),融通六大領(lǐng)域,即計算機視覺、認(rèn)知科學(xué)、語言對話、機器學(xué)習(xí)、機器人學(xué)習(xí)等,融合了才能有一個像樣的計算機系統(tǒng)。

如何構(gòu)建“大任務(wù)”訓(xùn)練與測試平臺?

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

如何構(gòu)建大任務(wù)呢?我的目標(biāo)是,在一個系統(tǒng)中訓(xùn)練出一只具有通用人工智能的“烏鴉”,這是一個核心問題。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

當(dāng)然,只在一個物理場景中訓(xùn)練是不夠的。第一步要根據(jù)人的需求,生成大量的數(shù)據(jù)庫中的三維物體。這是生成的各種例子,生成以后可以在各種環(huán)境中測試?,F(xiàn)在做的大數(shù)據(jù)擬合,大家都可以測試,這是其中一種玩法。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

我的玩法不同,智能系統(tǒng)來了以后,我用一個全新的系統(tǒng)給你看,看你能不能完成各種各樣的任務(wù),而不是事先規(guī)定的任務(wù)。

在這個系統(tǒng)里面必須要做物理逼真的東西,比如可以倒酒、倒水、擠牙膏、玩沙子、玩水,這是非常費勁的,我們已經(jīng)做了好多年。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

先定義基本的任務(wù),人可以接進去,機器可以接進去,然后可以身臨其境地共同完成任務(wù)。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

我們做了一個手套,它可以精細(xì)化地記錄一些感知和運動行為。我進入了以后就知道有一些基本的操作,就是Learing from demonstration。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

這是一個虛擬的機器人智能體,讓它完成鮮榨果汁。比如說它要先找橘子,然后把橘子切了,再到榨果汁的地方去壓,它要有訓(xùn)練的過程。比如做飯、做面條,這都是非常大的任務(wù)。一般的日常生活中,你們看不起的東西越難。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

人可以在里面與機器進行交互,也就是人機協(xié)作完成一件事情。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

最后人也可以教機器人,比如說這個男的演示怎么砸核桃,這個動作背后其實有很大的工程量。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

機器人會去想,怎樣在一個新環(huán)境下完成砸核桃,整個推理的過程都可以在這個地方完成。

朱松純:走向通用人工智能——從大數(shù)據(jù)到大任務(wù)

最重要的事情,我可以隨時把機器叫停,然后問它,你現(xiàn)在知道什么,你知道我在干什么,或者叫它解釋,打算做什么,為什么要做,這就是Explainable AI。

智能體的核心就是把自然語言對話、計算機視覺、機器人等結(jié)合在一起,就像教小孩一樣,怎么樣用小數(shù)據(jù)教會他。

總結(jié)

第一,“大數(shù)據(jù)”對“大任務(wù)”兩種范式之爭,99%的人都是押注大數(shù)據(jù),但是10年前我就押注大任務(wù)。

第二,我認(rèn)為任務(wù)是智能中心。我們有task-orientated操作系統(tǒng)、編程語言和體系結(jié)構(gòu)。

第三,如何構(gòu)建大任務(wù)的平臺。我要能在里面訓(xùn)練出“烏鴉”,通過自主的任務(wù)去驅(qū)動它。這里面有很多數(shù)學(xué)問題、理論問題和工程問題要解決,中美必須合作來解決這個問題。

https://www.toutiao.com/i6754302467501982212/

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI