感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

發(fā)布時(shí)間：2020-08-16 08:23:28 來(lái)源：ITPUB博客閱讀：165 作者：naojiti 欄目：互聯(lián)網(wǎng)科技

如果我們要鍛煉一個(gè)人類小孩最基本的運(yùn)動(dòng)智力，比如抓握抬舉，或者是疊被子疊衣服這樣的家務(wù)活兒，幾乎是不需要指導(dǎo)的。

很多時(shí)候只要將嬰孩放置到日常生活情境中，讓他與周圍的環(huán)境和物體互動(dòng)，大多數(shù)就能在玩耍中自動(dòng)掌握判斷空間、重力、協(xié)調(diào)等能力了。

與之相比，機(jī)器人就比較“嬌生慣養(yǎng)”了。

目前絕大多數(shù)機(jī)器人，都無(wú)法自我適應(yīng)和從對(duì)復(fù)雜的環(huán)境中學(xué)習(xí)通用運(yùn)動(dòng)能力。

這就帶來(lái)了一個(gè)難題：機(jī)器人只能很“笨拙”地完成一些程序員率先編程好的動(dòng)作，并且是用單一的物體來(lái)完成單一的技能，這個(gè)特定的任務(wù)和道具就是它的全世界。比如，會(huì)遞杯子就不會(huì)疊被子。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

這意味著，我們可能要設(shè)計(jì)成千上萬(wàn)種機(jī)器人，只為了應(yīng)對(duì)某一個(gè)具體任務(wù)。這實(shí)在是太蠢了。

不過(guò)，要讓機(jī)器學(xué)會(huì)自主感知世界，并根據(jù)環(huán)境變化做出相應(yīng)的動(dòng)作，那可是個(gè)大工程。

最近，伯克利大學(xué)就研究出了一種新的算法，基于視覺模型的強(qiáng)化學(xué)習(xí)，讓全能機(jī)器人成為可能。

換句話說(shuō)，原本獨(dú)屬于人類的“元運(yùn)動(dòng)智力”，也有望在機(jī)器身上打開。

當(dāng)機(jī)器人具有了掌握一般性技能并將其內(nèi)化成“經(jīng)驗(yàn)”的能力，能夠靈活地執(zhí)行多種同類任務(wù)，不需要每次都重新學(xué)習(xí)或編程，前景顯然是值得驚喜的。

那么，這么神奇的事情究竟是怎么實(shí)現(xiàn)的？

新算法是如何指導(dǎo)機(jī)器工作的？

簡(jiǎn)要來(lái)說(shuō)，這種算法可以通過(guò)一個(gè)預(yù)測(cè)墨西哥，使用沒有標(biāo)簽的感官數(shù)據(jù)集，讓機(jī)器自主學(xué)習(xí)大量多樣化的圖像，進(jìn)而在完成任務(wù)時(shí)更靈活地預(yù)測(cè)和判斷。這樣，它就能執(zhí)行在各種不同的物體上執(zhí)行很多不同任務(wù)，而不需要針對(duì)每個(gè)對(duì)象或每個(gè)任務(wù)都重新學(xué)習(xí)一次。

在伯克利大學(xué)的研究人員眼中，能夠在單一模式下獲得這種通用型運(yùn)動(dòng)能力，是智力的一個(gè)基本體現(xiàn)。

那么，這種方法究竟是如何指導(dǎo)機(jī)器人完成工作的呢？

首先，研究人員為機(jī)器人制作一個(gè)龐大且豐富多彩的數(shù)據(jù)集合，不局限于某一個(gè)物體或某一項(xiàng)技能；

然后，為機(jī)器人裝上了能夠感知圖像像素（視覺）、手臂位置（自我感覺）和發(fā)送電機(jī)指令（動(dòng)作）的各種傳感器。

完成這些準(zhǔn)備工作之后，就讓兩個(gè)機(jī)器人同時(shí)在資源庫(kù)中自主收集數(shù)據(jù)和學(xué)習(xí)，并且實(shí)時(shí)進(jìn)行分享。

由于兩個(gè)機(jī)器人可以分享彼此的感覺和數(shù)據(jù)，這就使其掌握了預(yù)測(cè)接下來(lái)手臂移動(dòng)路線的能力，從而使得動(dòng)作的運(yùn)動(dòng)范圍具備了更大的伸縮彈性，以完成操作不同類型物體的多樣任務(wù)。

比如他們就讓一臺(tái)機(jī)器完成了移動(dòng)蘋果這樣的剛性物體，以及折疊衣服這樣的柔性物體，機(jī)器人都表現(xiàn)的還不錯(cuò)。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

而且，即使面對(duì)以前從未見過(guò)的目標(biāo)，雖然做出的預(yù)測(cè)并非和人類一樣十全十美，但仍然可以有效地完成指定任務(wù)。

比如下圖中，研究人員給出的任務(wù)是把蘋果放在盤子里，中間是機(jī)器人做出的計(jì)劃，然后是執(zhí)行的情況。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

這個(gè)算法模型在想法上絕對(duì)是別具一格。一直以來(lái)，基于預(yù)期結(jié)果來(lái)規(guī)劃行動(dòng)路線，并根據(jù)不同步驟和觀察狀況來(lái)實(shí)時(shí)迭代和改進(jìn)計(jì)劃，是人類應(yīng)對(duì)復(fù)雜世界意外的獨(dú)特技能。如今，機(jī)器人也有望學(xué)會(huì)這樣的“高智力”游戲，在應(yīng)用性上帶來(lái)的改變令人真實(shí)心動(dòng)了。

重建機(jī)器效率的坐標(biāo)系：新模型的應(yīng)用場(chǎng)景

現(xiàn)實(shí)環(huán)境是復(fù)雜多樣的，提高機(jī)器人對(duì)環(huán)境的適應(yīng)能力，讓任務(wù)執(zhí)行更加靈活，這個(gè)新算法確實(shí)給機(jī)器人應(yīng)用帶來(lái)了極大的想象空間。

最大的亮點(diǎn)在于，對(duì)機(jī)器的功能設(shè)想更符合現(xiàn)實(shí)情況。通用能力可以很容易地被遷移到不同的任務(wù)上，大大減少了完成特定任務(wù)所需要開發(fā)和部署的算法數(shù)量。

目前看來(lái)，新模型至少會(huì)在以下領(lǐng)域革新機(jī)器人的表現(xiàn)：

1.客服機(jī)器人。大多數(shù)客服機(jī)器人對(duì)環(huán)境不具備適應(yīng)性，需要程序員將各種情況考慮在內(nèi)，有的甚至直接由人工在后臺(tái)進(jìn)行交互操作。但有了通用模型算法之后，機(jī)器人就能夠在與人類用戶的交互中自主學(xué)習(xí)，學(xué)會(huì)解決一些開放型問(wèn)題，變得更加自主靈活。

2.醫(yī)學(xué)機(jī)械。目前，醫(yī)學(xué)機(jī)器人只能作為醫(yī)生雙手的延伸來(lái)協(xié)助完成手術(shù)任務(wù)。要自主完成高精度手術(shù)，幫助減少醫(yī)生的勞力，醫(yī)學(xué)機(jī)器人必須能夠感知手術(shù)部位的空間位置、處理更精細(xì)、更高復(fù)雜度的操作，新的模型顯然提供了更多的可能性。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

3.工業(yè)機(jī)械。工業(yè)機(jī)器人已經(jīng)擁有了一定的通用性和適應(yīng)性，但往往都需要跟隨其工作環(huán)境變化的需求再編程，或者是更換不同的操作器來(lái)執(zhí)行不同任務(wù)，都會(huì)帶來(lái)一定的成本。如果新算法被真實(shí)應(yīng)用起來(lái)，工業(yè)生產(chǎn)的成本和效率都將變得更低。

4.個(gè)性化視頻生成。除了在現(xiàn)實(shí)世界中進(jìn)行動(dòng)作感知和理解預(yù)測(cè)，該算法在視頻生成領(lǐng)域也有極大空間。比如系統(tǒng)可以通過(guò)大量無(wú)需標(biāo)記的視頻資源自主學(xué)習(xí)，根據(jù)視頻中的人物進(jìn)行體態(tài)識(shí)別和模仿，讓AI量身定制高擬人度的視頻成為可能。

掌握了通用技能的機(jī)器應(yīng)用還有很多，其背后的商業(yè)前景也十分廣闊，畢竟效率才是人類發(fā)明機(jī)器的初衷。

品嘗果實(shí)之前，還需應(yīng)對(duì)哪些挑戰(zhàn)？

說(shuō)了這么多，感覺新算法的實(shí)現(xiàn)并不難，應(yīng)用端也有著足夠的承托力。是不是很快就可以成為現(xiàn)實(shí)了呢？

目前來(lái)看，在“摘桃子”之前，該算法還有一些特殊的限制，可能會(huì)使其在實(shí)際應(yīng)用中受阻。

一是需要的訓(xùn)練數(shù)據(jù)量很大。機(jī)器做出實(shí)際可執(zhí)行的操作預(yù)測(cè)，完全依賴于龐大多元化數(shù)據(jù)集。

為了讓機(jī)器能夠根據(jù)預(yù)測(cè)先前幀的運(yùn)動(dòng)分布來(lái)想象和模擬接下來(lái)的像素運(yùn)動(dòng)，研究人員引入了59,000個(gè)機(jī)器人交互的數(shù)據(jù)集，進(jìn)行大規(guī)模自監(jiān)督學(xué)習(xí)。

如何在成本控制之下獲取龐大優(yōu)質(zhì)的數(shù)據(jù)資源，恐怕會(huì)成為算法落地的頭號(hào)門檻。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

二是無(wú)監(jiān)督學(xué)習(xí)帶來(lái)的一系列問(wèn)題。比如，由于訓(xùn)練數(shù)據(jù)完全沒有標(biāo)簽和獎(jiǎng)勵(lì)機(jī)制，如何保證機(jī)器人能夠理解并接受指定任務(wù)，再以結(jié)果導(dǎo)向展開行動(dòng)，在現(xiàn)實(shí)層面有很多未知性。

伯克利的解決方案是設(shè)置一個(gè)自我監(jiān)督算法，讓機(jī)器保持對(duì)目標(biāo)的興趣，持續(xù)跟蹤并不斷重試，直至成功。但是否能夠穩(wěn)定輸出，還需要更多的補(bǔ)充研究。

再比如，無(wú)監(jiān)督下機(jī)器做出的預(yù)測(cè)都是人類無(wú)法用自主經(jīng)驗(yàn)來(lái)解釋的，有可能并不是最優(yōu)的傳輸方案，還可能因?yàn)椤昂谙洹睅?lái)不可預(yù)知的風(fēng)險(xiǎn)。

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

當(dāng)我們還不理解自己的“元智力”是如何運(yùn)作的時(shí)候，又如何保證可以將機(jī)器的“元智力”控制的很好呢？

總而言之，這一算法雖然很令人驚喜，但也并非完美。想象很美好，實(shí)用性也不算差，但從實(shí)驗(yàn)室到商業(yè)場(chǎng)景之間，還有很長(zhǎng)的一段路要走。

向AI問(wèn)一下細(xì)節(jié)

感動(dòng)哭了，機(jī)器人終于學(xué)會(huì)自己疊衣服了

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽