您好,登錄后才能下訂單哦!
小編給大家分享一下關(guān)于人工智能的簡介,相信大部分人都還不怎么了解,因此分享這篇文章給大家學(xué)習(xí),希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學(xué)習(xí)方法吧!
簡介
在跟非IT行業(yè)的朋友解釋人工智能總是一個(gè)比較費(fèi)勁的事情,他們對這塊也有比較大的誤區(qū),本人雖然不是什么知名人士,但也從事過一段時(shí)間相關(guān)內(nèi)容的學(xué)習(xí)與研究,本篇文章就嘗試從較高的層面去討論一下人工智能以及它目前的局限。
我會以我比較擅長的NLP(自然語言處理)領(lǐng)域作為例子,下面都是我個(gè)人觀點(diǎn),如有不對,還請斧正。
當(dāng)前人工智能的本質(zhì)
我們常說的人工智能通常指的是深度學(xué)習(xí),因?yàn)榻甏髷?shù)據(jù)的興起,讓深度學(xué)習(xí)大展拳腳,但深度學(xué)習(xí)「理論層面的東西并沒有大的突破」,依舊是舊的東西,本質(zhì)依舊是概率論與統(tǒng)計(jì)學(xué)。
這里以微軟小冰、蘋果Siri這些智能助手為例,它們的技術(shù)原理其實(shí)都是對話系統(tǒng)+語音識別。當(dāng)我們說一句話給小冰時(shí),小冰此時(shí)做了什么?
小冰接收到這句話時(shí),首先會進(jìn)行語音識別,所謂語音識別就是利用它此前訓(xùn)練好的概率模型,計(jì)算這些語音數(shù)據(jù)對應(yīng)了哪些文字,然后再進(jìn)行對話預(yù)測,即這些文字下一句出現(xiàn)概率最大的文字是哪些,「小冰本身并沒有理解我說的話,它只是通過計(jì)算概率給出回答」。
訓(xùn)練一個(gè)可以商用的聊天機(jī)器需要很多工程技巧的支撐,但本質(zhì)就是概率模型這么回事,我們可以從微博上、從論壇上爬取大量的語料數(shù)據(jù),這些數(shù)據(jù)是我們正常人類在網(wǎng)上留下的,進(jìn)行復(fù)雜的預(yù)處理后,得到訓(xùn)練數(shù)據(jù),而訓(xùn)練大致就是從這些數(shù)據(jù)中找到文字之間的規(guī)律。
舉個(gè)例子,比如一個(gè)100T的語料中,出現(xiàn)了很多次「快來關(guān)注HackPython」這句話,那么模型就會記住「關(guān)注」這個(gè)詞后大概率要接「HackPython」,但模型并沒有理解這句話,它并不知道「HackPython」是一個(gè)公眾號,并不知道「快來關(guān)注」是一種宣傳表述,它知道的就只有概率。
NLP領(lǐng)域中,無論是「LSTM」、「GRU」,還是「注意力機(jī)制」,亦或是當(dāng)前比較熱門的「知識圖譜」,都是基于文本在玩概率游戲,不同的方式只是在使用訓(xùn)練數(shù)據(jù)的信息時(shí)不同。
當(dāng)前所有知名模型的本質(zhì)都是如此,通過矩陣運(yùn)算訓(xùn)練數(shù)據(jù)來獲得某種概率分布,復(fù)雜模型的概率分布通常是高維的,這里又會引申出各種數(shù)學(xué)方法,如測度論、流形,但本質(zhì)的思想依舊是想通過概率分布來描述訓(xùn)練數(shù)據(jù)的特征。有了這些,對于同類的數(shù)據(jù),就可以使用相同的概率分布去描述,從而實(shí)現(xiàn)所謂的「識別」。
獲得了概率分布后,其實(shí)還有問題纏繞著我們,如:為什么會訓(xùn)練出這樣的概率分布?
這塊對我們來說依舊是黑盒,我們也不知道這些數(shù)據(jù)通過這種模型訓(xùn)練后,為什么是這樣的概率分布,即不可解釋。
不可解釋性的問題讓深度學(xué)習(xí)在某些領(lǐng)域的使用受到一定的障礙,如金融領(lǐng)域,模型說這樣投,大概率賺錢,但你無法嚴(yán)格的去證明這個(gè)結(jié)論的可靠性,只能直觀的去解釋,這就會讓人猶豫,畢竟可能損失大量金錢。
同樣的,自動駕駛也受到模型不可解釋帶來的困擾,自動駕駛依賴于圖像識別技術(shù)。通過大量數(shù)據(jù)訓(xùn)練出的圖像識別模型雖然有很高的識別率,但依舊存在問題,這點(diǎn)從「對抗攻擊」領(lǐng)域的研究可以看出,當(dāng)我們改變圖像中少量的數(shù)據(jù),圖像識別模型就無法識別或識別錯(cuò)誤。因?yàn)槲覀儫o法從數(shù)據(jù)層面去解釋圖像識別模型的概率分布,所以不清楚它在什么情況會失效。
識別與理解的差異
通過前面的討論,可以知道,目前的深度學(xué)習(xí)做到的是「識別」,如語言識別、圖像識別等,而并沒有做到「理解」,這點(diǎn)從NLP領(lǐng)域可以很直觀的看出,最智能的對話系統(tǒng)表現(xiàn)的依舊強(qiáng)差人意。
我們通過大量的數(shù)據(jù)的訓(xùn)練,在「識別」上已經(jīng)有了不錯(cuò)的效果,這些效果已經(jīng)可以產(chǎn)生很大的作用,比如人臉識別用于安檢領(lǐng)域、車牌識別用于交通系統(tǒng)等等,「但關(guān)于理解的工作可能才剛剛開始」。
人工智能并不像我們想象的那么智能,無論是多么大的公司,推出多么先進(jìn)的框架,什么自動調(diào)參、什么自動學(xué)習(xí)等牛逼的功能,本質(zhì)都是如此,先進(jìn)的框架只是讓我們更快、更好的獲得可以描述數(shù)據(jù)特征的概率分布,而這些概率分布并不能實(shí)現(xiàn)「理解」。
我們思考一下,人類是怎么做到「理解」的?
我們「理解」某個(gè)東西,通常指知道其背后抽象的概念,如「蘋果」這個(gè)詞,當(dāng)我們看到這個(gè)詞時(shí),腦中會浮現(xiàn)出「蘋果」相關(guān)的信息,這些信息并不來自「蘋果」這個(gè)詞,而是來自我曾經(jīng)經(jīng)歷的生活,這些生活給了我們相應(yīng)的背景知識,而這些背景知識讓我們可以理解「蘋果」這個(gè)詞。
這些背景知識我們是怎么得到的?目前也還在研究。
這讓很多學(xué)者開始質(zhì)疑當(dāng)前深度學(xué)習(xí)的研究路徑是否正確,這里給出一個(gè)著名的討論來展現(xiàn)當(dāng)下我們訓(xùn)練模型的方式與自然界中真正學(xué)習(xí)方式的巨大差異。
日本的街頭有很多烏鴉,研究人員發(fā)現(xiàn)這些烏鴉會偷堅(jiān)果來吃,但烏鴉本身無法破開堅(jiān)果的殼,那它們是怎么吃到堅(jiān)果果肉的呢?它們在電線桿上觀察十字路口的紅綠燈,當(dāng)紅燈的時(shí)候,將堅(jiān)果放在馬路上,然后飛走,等綠燈,綠燈時(shí),車流走過,將堅(jiān)果果殼碾碎,當(dāng)下次紅燈時(shí),烏鴉再飛過去悠閑的吃其中的果肉。
這件普通的事情表現(xiàn)了生物的學(xué)習(xí)其實(shí)只需要簡單的觀察就可以習(xí)得某個(gè)技能,這與深度學(xué)習(xí)學(xué)習(xí)方式完全不同,深度學(xué)習(xí)會利用大量的數(shù)據(jù),然后反復(fù)的訓(xùn)練試錯(cuò),使用試錯(cuò)獲得的損失,利用梯度下降與反向傳播的算法去更新模型,最終得到可以描述數(shù)據(jù)特征的概率分布,而烏鴉沒有那么多命去試錯(cuò),也沒有那么多時(shí)間去試錯(cuò)。
可以說,烏鴉通過少量的觀察「理解」了紅綠燈的規(guī)律,而深度學(xué)習(xí)獲得的模型無法做到。
自然界生物的學(xué)習(xí)方式與當(dāng)前深度學(xué)習(xí)主流的學(xué)習(xí)方式之間具有的差異難以不讓人疑惑。
莫拉維克悖論
1980 年漢斯?莫拉維克提到:要讓電腦如成人般地下棋是相對容易的,但是要讓電腦有如一歲小孩般的感知和行動能力卻是相當(dāng)困難甚至是不可能的。這便是著名的莫拉維克悖論(Moravec's paradox),這個(gè)悖論在當(dāng)下依舊適用,簡單而言,「困難的問題是簡單的,簡單的問題是困難的」是當(dāng)下人工智能的處境。
對計(jì)算機(jī)而言,實(shí)現(xiàn)邏輯推理、數(shù)學(xué)運(yùn)算等人類高級智慧只需要相對很少的計(jì)算能力,而實(shí)現(xiàn)感知、運(yùn)動等低等級智慧卻需要巨大的計(jì)算資源,這剛好與人類相反,對于感知、運(yùn)動等,我們自身并不用費(fèi)多少腦子就可以做好,而邏輯推導(dǎo)、數(shù)學(xué)計(jì)算這類問題卻需要思考很久。
如何讓人工智能具有「理解」能力?如何讓人工智能對真實(shí)世界有基本的背景知識與反應(yīng)?
當(dāng)這兩個(gè)問題解決了,我們才需要開始擔(dān)心,人類會不會被人工智能取代。
但,深度學(xué)習(xí)帶來的對數(shù)據(jù)特征的描述能力已經(jīng)可以對一些職業(yè)產(chǎn)生致命的沖擊,如工廠的工人,加了圖像識別的機(jī)械臂可以很好的代替工人的大部分工作。
尾
如果你擔(dān)心一種技術(shù)或某件事情會對自己的產(chǎn)生影響,最好的方法就是去了解它,弄明白它的原理,而不是看各種媒體文章,他們只能擾亂視線,增加游戲難度。知道原理后,無知帶來的擔(dān)憂就會消散,自己也可以做出相應(yīng)的調(diào)整。
文章雖然主要從NLP的角度去討論問題,但這些現(xiàn)象存在于不同的領(lǐng)域,如圖像處理、強(qiáng)化學(xué)習(xí)等。
以上是關(guān)于人工智能的簡介的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。