溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

人大:和清、北做不一樣的AI

發(fā)布時(shí)間:2020-08-07 23:23:10 來源:ITPUB博客 閱讀:157 作者:AIBigbull2050 欄目:互聯(lián)網(wǎng)科技
導(dǎo)語:智能而有溫度~

人大:和清、北做不一樣的AI

前幾日,雷鋒網(wǎng)報(bào)道了  武漢大學(xué)成立人工智能研究院的消息   后,有讀者看到國內(nèi)已成立的人工智能學(xué)院列表中有「中國人民大學(xué)-高瓴人工智能學(xué)院」,表示好奇人大成立人工智能學(xué)院做什么。雷鋒網(wǎng)在這篇文章中詳解「高瓴人工智能學(xué)院」的「思」與「做」。

一千個(gè)讀者,就有一千個(gè)哈姆雷特。

一千所高校,也將有一千個(gè)不同特色的人工智能學(xué)院/研究院。

中國人民大學(xué),與清、北并稱三大超一流名校,清華理工,北大文理醫(yī),人大社科。一直以來在人們的印象中,人大是社科的巨無霸,但理工卻幾無存在感。

然而,在今年年初(1月19日),人民大學(xué)宣布成立了高瓴人工智能學(xué)院,并做如下定位:

“高瓴人工智能學(xué)院是學(xué)校下屬的二級學(xué)院,負(fù)責(zé)學(xué)校人工智能相關(guān)學(xué)科的規(guī)劃與建設(shè),開展本學(xué)科領(lǐng)域的人才培養(yǎng)和科學(xué)研究工作……充分發(fā)揮學(xué)校在人工智能相關(guān)學(xué)科的已有優(yōu)勢,建設(shè)世界一流的人工智能學(xué)科,提升學(xué)校的國際影響力和競爭力?!?nbsp;

高瓴人工智能學(xué)院的副院長張國富教授曾多次表示:“我們想和北面兩所學(xué)校(作者注:清、北)做不一樣的 AI?!?/span>

如何不一樣?人大有自己的考慮,我們可以先從科學(xué)方法范式的變革說起。

(以下部分內(nèi)容借鑒了高瓴人工智能學(xué)院院長文繼榮教授11月19日的演講內(nèi)容, 未經(jīng)文繼榮院長本人確認(rèn),僅代表個(gè)人見解。

一、y = f(x) :科學(xué)方法的變革

1、傳統(tǒng)方法

在以往的數(shù)百年中,無論是自然科學(xué)還是社會(huì)科學(xué),思考其研究方法的核心本質(zhì),總可以歸結(jié)為如下公式:

人大:和清、北做不一樣的AI

所有研究都只是為了從紛繁復(fù)雜的世界,從多變的樣本當(dāng)中尋找出隱藏在表象背后的客觀規(guī)律,一個(gè)不變的、穩(wěn)定的規(guī)律。特別是在自然科學(xué)領(lǐng)域,我們總希望能夠?qū)⒖陀^規(guī)律表示成一個(gè)模型或方程。

這種方法,本質(zhì)上是一種科學(xué)主義傳統(tǒng)或者理性主義傳統(tǒng),我們希望能夠從直覺或少量樣本中通過歸納、演繹等方法得出這樣的模型、函數(shù)或方程。一旦掌握了這樣的模型/函數(shù)/方程,我們就可以拿著它來解釋各種各樣看起來比較多變的現(xiàn)象,去分析無常的世界中那些穩(wěn)定不變的東西。 

人大:和清、北做不一樣的AI

在人類發(fā)展歷史上,尤其是在科學(xué)進(jìn)程上,我們一直在各個(gè)領(lǐng)域探尋盡可能簡單優(yōu)美的模型。這個(gè)模型越簡單,越優(yōu)美,越具有普適性,我們就會(huì)覺得這個(gè)模型越好。

這種方法在自然科學(xué)領(lǐng)域取得了很大的成功,也已經(jīng)成為現(xiàn)代社會(huì)最為核心的推動(dòng)力??梢哉f今天生活中的方方面面都是這種思想指導(dǎo)下的科技所帶來的成果。

我們找到了自然中這樣的一些穩(wěn)定的、不變的、客觀的規(guī)律。

但我們也應(yīng)當(dāng)注意到,在過去這么多年里,當(dāng)我們把這種科學(xué)方法應(yīng)用在社會(huì)科學(xué)當(dāng)中時(shí),我們發(fā)現(xiàn)了很多困難。例如我們用公式來描述經(jīng)濟(jì)規(guī)律、預(yù)測股市等,常常會(huì)出現(xiàn)預(yù)測之外的結(jié)果。

這說明,這種方法在社會(huì)科學(xué)中并不適用。

原因在于,社會(huì)科學(xué)是一個(gè)復(fù)雜的、非線性的、(超)多變量的系統(tǒng),通過小數(shù)據(jù)/直覺,往往難以揭示這樣系統(tǒng)背后真正的不變規(guī)律。

更重要的則在于,自然科學(xué)可以通過大量的實(shí)驗(yàn)來收集大量數(shù)據(jù),而社會(huì)科學(xué)則很難通過重復(fù)實(shí)驗(yàn)來獲取數(shù)據(jù),因此存在樣本數(shù)據(jù)稀少的情況。這也給人們留下了“社會(huì)科學(xué)并不科學(xué)”的印象。

2、大數(shù)據(jù)方法/經(jīng)驗(yàn)方法

大數(shù)據(jù)時(shí)代的出現(xiàn),給我們提供一個(gè)前所未有的機(jī)會(huì)。我們突然有機(jī)會(huì)收集很多數(shù)據(jù),尤其是在一些以前很難做實(shí)驗(yàn)的場合來收集數(shù)據(jù)。我們發(fā)現(xiàn)當(dāng)我們收集數(shù)據(jù)越來越多的時(shí)候,我們甚至可以不用去找數(shù)據(jù)背后隱藏的模型。

人大:和清、北做不一樣的AI

大數(shù)據(jù)提供了這樣一種方法,可以直接從輸入到輸出的映射,相當(dāng)于是純經(jīng)驗(yàn)的方法。我們知道如果經(jīng)驗(yàn)足夠多,我們可以不用去尋找模型,繞開模型,直接用經(jīng)驗(yàn)解決問題。這是用大數(shù)據(jù)解決辦法的本質(zhì)。

這種方法在很多領(lǐng)域已經(jīng)取得成功,但是這個(gè)方法有一個(gè)問題,即,很多時(shí)候數(shù)據(jù)不夠多。很多情況下,你會(huì)發(fā)現(xiàn)你的數(shù)據(jù)不能覆蓋到所有的情況。

3、新范式:大數(shù)據(jù)+智能 

人工智能,是在大數(shù)據(jù)背景下出現(xiàn)的新方法:盡管問題很復(fù)雜,我還是能夠找到數(shù)據(jù)背后的模型,從而把握事物的不變性和規(guī)律性。它的方法與傳統(tǒng)方法的不同,它是從“海量的樣本數(shù)據(jù)”中尋求“復(fù)雜模型”。

人大:和清、北做不一樣的AI  

以前自然科學(xué)的方法是從少量的數(shù)據(jù)、少量的實(shí)驗(yàn)樣本里面尋求簡單的模型,它可以用在自然科學(xué)方面,但是社會(huì)科學(xué)不可以,因?yàn)閱栴}太復(fù)雜、變量太多。

但是現(xiàn)在有了基于大數(shù)據(jù)的人工智能方法,我們會(huì)發(fā)現(xiàn)可以從海量的數(shù)據(jù)里面尋求復(fù)雜的模型。

一個(gè)系統(tǒng)可能有幾千萬、幾十億的變量,背后可能是非常復(fù)雜的非線性問題,沒有關(guān)系,我們?nèi)匀豢梢詷?gòu)建出來這樣的模型。

深度學(xué)習(xí),正是這種方法的代表,它能夠從海量數(shù)據(jù)中非常高效地學(xué)習(xí)出復(fù)雜模型。事實(shí)上,深度學(xué)習(xí)不僅僅只是去做人臉識別、自動(dòng)駕駛,它對社會(huì)科學(xué)同樣有效,將之應(yīng)用于社會(huì)科學(xué),將產(chǎn)生顛覆性的革命。因?yàn)樗o我們提供了一種有效的研究復(fù)雜問題的新方法。

這種新的科學(xué)范式就是:大數(shù)據(jù)+人工智能的研究范式。

二、新范式初探

深度神經(jīng)網(wǎng)絡(luò),可以理解為一個(gè)非常復(fù)雜的函數(shù) f。在計(jì)算機(jī)視覺中,我們用它來表征建模人看見一個(gè)物體時(shí)發(fā)生了什么,現(xiàn)在我們在這方面已經(jīng)取得了非常好的成績,在特定領(lǐng)域已經(jīng)能夠超過人類的表現(xiàn)。

那么將這種方法應(yīng)用到社會(huì)科學(xué)中會(huì)有什么不一樣的呢?

文繼榮教授舉了幾個(gè)例子:

1、+經(jīng)濟(jì)學(xué) 

  人大:和清、北做不一樣的AI

文繼榮介紹,他們從30萬條新聞中,將產(chǎn)業(yè)轉(zhuǎn)型的數(shù)據(jù)抽取出來。其中的 x 就是這 30萬的新聞數(shù)據(jù),而通過建立模型,繪制除了如圖所示的產(chǎn)業(yè)轉(zhuǎn)移結(jié)果 y = 產(chǎn)業(yè)轉(zhuǎn)移數(shù)(時(shí)間,省份1,省份2)。把其中低頻的數(shù)據(jù)去掉后,得到右邊的圖。

從中便可以很容易地看出,中國的產(chǎn)業(yè)轉(zhuǎn)移是以北、上、廣為中心;而三地轉(zhuǎn)移情況卻各不相同,北京往周邊轉(zhuǎn),上海往中東部轉(zhuǎn),而廣州則仍然轉(zhuǎn)在本地。通過這種方式,便可以將原有的數(shù)據(jù)變得形象化、可視化,從而揭示出原來不可能發(fā)現(xiàn)的經(jīng)濟(jì)規(guī)律。

2、+社會(huì)學(xué) 

人大:和清、北做不一樣的AI  

文繼榮繼續(xù)舉了與社科院合作的一個(gè)成果,研究意識形態(tài)問題。他們根據(jù) 1.7億用戶、27億的微博數(shù)據(jù)(其中有幾百萬的大V),發(fā)現(xiàn)很多有意思的現(xiàn)象。例如他們從微博數(shù)據(jù)中發(fā)現(xiàn)事實(shí)上中國近年來并沒有嚴(yán)重的民粹主義,且呈現(xiàn)民粹主義呈現(xiàn)多元化,民眾更關(guān)心國內(nèi)事務(wù)和政策。

3、+ 政治學(xué)

  人大:和清、北做不一樣的AI

第三個(gè)例子是文繼榮在微軟期間的工作。2012年文繼榮通過公開的網(wǎng)絡(luò)數(shù)據(jù)來分析奧巴馬和羅姆尼的民意基礎(chǔ),從而預(yù)測美國總統(tǒng)大選,結(jié)果相當(dāng)準(zhǔn)確。文繼榮打趣說,這個(gè)模型放到現(xiàn)在再去預(yù)測已經(jīng)不準(zhǔn)了,“因?yàn)槊绹娨呀?jīng)成長起來了”。

4、+ 歷史學(xué)

人大:和清、北做不一樣的AI

注:右側(cè)的災(zāi)害分布圖來源于網(wǎng)絡(luò),此處僅為示例

歷史,也同樣可以做。我們可以把史料數(shù)據(jù)化,通過各種方式來建模,比如說災(zāi)害(水災(zāi)、旱災(zāi)、蝗災(zāi))在歷朝歷代是怎么發(fā)生的,產(chǎn)生什么樣的影響,跟人口出生、GDP、戰(zhàn)爭、瘟疫等等有什么關(guān)系等。我們可以把這些問題轉(zhuǎn)化成數(shù)據(jù)分析的問題來做,現(xiàn)在的技術(shù)已經(jīng)可以做到,但距離真正的數(shù)據(jù)化歷史還很遙遠(yuǎn),這涉及到如何去構(gòu)建一個(gè)龐大的技術(shù)平臺。

 5、+法學(xué)

人大:和清、北做不一樣的AI

法律方面,文繼榮有頗多成果。舉例來講,如上圖,他們利用幾千萬法律文本判決書做了分析系統(tǒng),輸入“黑社會(huì)”,就會(huì)得出如上圖右側(cè)的分布圖,其中顏色越深表示相應(yīng)的案件越多。從中可以看出江西很特別,而東三省和大家想象的似乎不太一樣。

以上僅為部分社會(huì)學(xué)科與新范式科學(xué)方法的結(jié)合,且只是初步。實(shí)際上目前已經(jīng)有很多人在作者相似的事情,很多社會(huì)科學(xué)研究也正受益于大數(shù)據(jù) + 人工智能。 

但目前這種方法在與各個(gè)學(xué)科結(jié)合的過程中仍然存在著一系列的問題。例如往往沒有直接數(shù)據(jù),或者數(shù)據(jù)是以非結(jié)構(gòu)化的文本形式而存在的。

此外,目前懂得使用這種技術(shù)的計(jì)算機(jī)專家并不懂得相應(yīng)的社會(huì)科學(xué),而反過來其他的領(lǐng)域?qū)<彝植⒉簧瞄L對大數(shù)據(jù)和人工智能的利用。抽取什么數(shù)據(jù)來分析?分析什么問題?怎么分析?領(lǐng)域?qū)<覒?yīng)當(dāng)與計(jì)算機(jī)專家進(jìn)行深度合作。

人大最不缺的就是社科領(lǐng)域?qū)<摇?/span>

這正是人大的優(yōu)勢所在,也正是人大高瓴人工智能學(xué)院的優(yōu)勢所在。

三、智能社會(huì)治理十大前沿問題

正如前面提到,高瓴人工智能學(xué)院若想“充分發(fā)揮學(xué)校在人工智能相關(guān)學(xué)科的已有優(yōu)勢”,就必須與其他學(xué)院緊密協(xié)作。

在本月19日,在中國科協(xié)的支持下,由中國人民大學(xué)主辦了“首屆智能社會(huì)治理論壇”。

這次論壇的參與方包括中國科協(xié)-中國人民大學(xué)智能社會(huì)治理研究中心、中國人民大學(xué)國家發(fā)展與戰(zhàn)略研究院、中國人民大學(xué)文化科技園、民盟中國人民大學(xué)委員會(huì)、高瓴人工智能學(xué)院、經(jīng)濟(jì)學(xué)院、法學(xué)院、社會(huì)與人口學(xué)院、新聞學(xué)院、勞動(dòng)人事學(xué)院、未來法治研究院、新聞與社會(huì)發(fā)展研究中心等。

這次會(huì)議,事實(shí)上可以看做是人大高瓴人工智能學(xué)院與各個(gè)兄弟學(xué)院正式“結(jié)盟”的一次標(biāo)志。

文繼榮作為高瓴人工智能學(xué)院院長,在會(huì)議上宣布了十個(gè)“智能社會(huì)治理的前沿問題”,作為他們在未來與兄弟學(xué)院共同合作的靶標(biāo)。分別為:

第一個(gè)課題:智能社會(huì)治理大數(shù)據(jù)平臺建設(shè)(人工智能學(xué)院)。

第二個(gè)課題:智能社會(huì)治理的算法與機(jī)制設(shè)計(jì)(人工智能學(xué)院)。

第三個(gè)課題:是智能社會(huì)算法和數(shù)據(jù)的法律規(guī)制(法學(xué)院)。

第四個(gè)課題:智能社會(huì)互聯(lián)網(wǎng)平臺的法律責(zé)任(法學(xué)院)。

第五個(gè)課題:智能社會(huì)的經(jīng)濟(jì)規(guī)制和競爭政策(經(jīng)濟(jì)學(xué)院)。

第六個(gè)課題:智能社會(huì)數(shù)字經(jīng)濟(jì)與中國經(jīng)濟(jì)轉(zhuǎn)型(經(jīng)濟(jì)學(xué)院)。

第七個(gè)課題:智能社會(huì)公共理性與輿論治理(新聞學(xué)院)。

第八個(gè)課題:智能社會(huì)公共倫理建設(shè)與規(guī)范(新聞學(xué)院)。

第九個(gè)課題,智能社會(huì)互聯(lián)網(wǎng)與人際關(guān)系重塑(社會(huì)與人口學(xué)院)。

第十個(gè)課題:智能社會(huì)秩序與智能化治理(社會(huì)與人口學(xué)院)。

從這個(gè)列表中,我們可以看出人大在人工智能的發(fā)展定位上,與清、北完全不同。人大更加強(qiáng)調(diào)人工智能技術(shù)與各個(gè)社會(huì)科學(xué)之間的結(jié)合,通過新的技術(shù)、新的研究范式來改變傳統(tǒng)的社會(huì)科學(xué)。在這個(gè)過程中,人工智能學(xué)院即是中心,又是邊緣。

或許我們可以認(rèn)為,人大把 AI 技術(shù)視作為社會(huì)科學(xué)的「新數(shù)學(xué)」。

https://www.leiphone.com/news/201911/5enGTF6LCAB1oL4V.html

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI