人大：和清、北做不一樣的AI

發(fā)布時(shí)間：2020-08-07 23:23:10 來源：ITPUB博客閱讀：157 作者：AIBigbull2050 欄目：互聯(lián)網(wǎng)科技

導(dǎo)語：智能而有溫度~

人大：和清、北做不一樣的AI

前幾日，雷鋒網(wǎng)報(bào)道了武漢大學(xué)成立人工智能研究院的消息后，有讀者看到國內(nèi)已成立的人工智能學(xué)院列表中有「中國人民大學(xué)-高瓴人工智能學(xué)院」，表示好奇人大成立人工智能學(xué)院做什么。雷鋒網(wǎng)在這篇文章中詳解「高瓴人工智能學(xué)院」的「思」與「做」。

一千個(gè)讀者，就有一千個(gè)哈姆雷特。

一千所高校，也將有一千個(gè)不同特色的人工智能學(xué)院/研究院。

中國人民大學(xué)，與清、北并稱三大超一流名校，清華理工，北大文理醫(yī)，人大社科。一直以來在人們的印象中，人大是社科的巨無霸，但理工卻幾無存在感。

然而，在今年年初（1月19日），人民大學(xué)宣布成立了高瓴人工智能學(xué)院，并做如下定位：

“高瓴人工智能學(xué)院是學(xué)校下屬的二級學(xué)院，負(fù)責(zé)學(xué)校人工智能相關(guān)學(xué)科的規(guī)劃與建設(shè)，開展本學(xué)科領(lǐng)域的人才培養(yǎng)和科學(xué)研究工作……充分發(fā)揮學(xué)校在人工智能相關(guān)學(xué)科的已有優(yōu)勢，建設(shè)世界一流的人工智能學(xué)科，提升學(xué)校的國際影響力和競爭力?！?nbsp;

高瓴人工智能學(xué)院的副院長張國富教授曾多次表示：“我們想和北面兩所學(xué)校（作者注：清、北）做不一樣的 AI?！?/span>

如何不一樣？人大有自己的考慮，我們可以先從科學(xué)方法范式的變革說起。

（以下部分內(nèi)容借鑒了高瓴人工智能學(xué)院院長文繼榮教授11月19日的演講內(nèi)容， 未經(jīng)文繼榮院長本人確認(rèn)，僅代表個(gè)人見解。）

一、y = f(x) ：科學(xué)方法的變革

1、傳統(tǒng)方法

在以往的數(shù)百年中，無論是自然科學(xué)還是社會(huì)科學(xué)，思考其研究方法的核心本質(zhì)，總可以歸結(jié)為如下公式：

人大：和清、北做不一樣的AI

所有研究都只是為了從紛繁復(fù)雜的世界，從多變的樣本當(dāng)中尋找出隱藏在表象背后的客觀規(guī)律，一個(gè)不變的、穩(wěn)定的規(guī)律。特別是在自然科學(xué)領(lǐng)域，我們總希望能夠?qū)⒖陀^規(guī)律表示成一個(gè)模型或方程。

這種方法，本質(zhì)上是一種科學(xué)主義傳統(tǒng)或者理性主義傳統(tǒng)，我們希望能夠從直覺或少量樣本中通過歸納、演繹等方法得出這樣的模型、函數(shù)或方程。一旦掌握了這樣的模型/函數(shù)/方程，我們就可以拿著它來解釋各種各樣看起來比較多變的現(xiàn)象，去分析無常的世界中那些穩(wěn)定不變的東西。

人大：和清、北做不一樣的AI

在人類發(fā)展歷史上，尤其是在科學(xué)進(jìn)程上，我們一直在各個(gè)領(lǐng)域探尋盡可能簡單優(yōu)美的模型。這個(gè)模型越簡單，越優(yōu)美，越具有普適性，我們就會(huì)覺得這個(gè)模型越好。

這種方法在自然科學(xué)領(lǐng)域取得了很大的成功，也已經(jīng)成為現(xiàn)代社會(huì)最為核心的推動(dòng)力?？梢哉f今天生活中的方方面面都是這種思想指導(dǎo)下的科技所帶來的成果。

我們找到了自然中這樣的一些穩(wěn)定的、不變的、客觀的規(guī)律。

但我們也應(yīng)當(dāng)注意到，在過去這么多年里，當(dāng)我們把這種科學(xué)方法應(yīng)用在社會(huì)科學(xué)當(dāng)中時(shí)，我們發(fā)現(xiàn)了很多困難。例如我們用公式來描述經(jīng)濟(jì)規(guī)律、預(yù)測股市等，常常會(huì)出現(xiàn)預(yù)測之外的結(jié)果。

這說明，這種方法在社會(huì)科學(xué)中并不適用。

原因在于，社會(huì)科學(xué)是一個(gè)復(fù)雜的、非線性的、（超）多變量的系統(tǒng)，通過小數(shù)據(jù)/直覺，往往難以揭示這樣系統(tǒng)背后真正的不變規(guī)律。

更重要的則在于，自然科學(xué)可以通過大量的實(shí)驗(yàn)來收集大量數(shù)據(jù)，而社會(huì)科學(xué)則很難通過重復(fù)實(shí)驗(yàn)來獲取數(shù)據(jù)，因此存在樣本數(shù)據(jù)稀少的情況。這也給人們留下了“社會(huì)科學(xué)并不科學(xué)”的印象。

2、大數(shù)據(jù)方法/經(jīng)驗(yàn)方法

大數(shù)據(jù)時(shí)代的出現(xiàn)，給我們提供一個(gè)前所未有的機(jī)會(huì)。我們突然有機(jī)會(huì)收集很多數(shù)據(jù)，尤其是在一些以前很難做實(shí)驗(yàn)的場合來收集數(shù)據(jù)。我們發(fā)現(xiàn)當(dāng)我們收集數(shù)據(jù)越來越多的時(shí)候，我們甚至可以不用去找數(shù)據(jù)背后隱藏的模型。

人大：和清、北做不一樣的AI

大數(shù)據(jù)提供了這樣一種方法，可以直接從輸入到輸出的映射，相當(dāng)于是純經(jīng)驗(yàn)的方法。我們知道如果經(jīng)驗(yàn)足夠多，我們可以不用去尋找模型，繞開模型，直接用經(jīng)驗(yàn)解決問題。這是用大數(shù)據(jù)解決辦法的本質(zhì)。

這種方法在很多領(lǐng)域已經(jīng)取得成功，但是這個(gè)方法有一個(gè)問題，即，很多時(shí)候數(shù)據(jù)不夠多。很多情況下，你會(huì)發(fā)現(xiàn)你的數(shù)據(jù)不能覆蓋到所有的情況。

3、新范式：大數(shù)據(jù)+智能

人工智能，是在大數(shù)據(jù)背景下出現(xiàn)的新方法：盡管問題很復(fù)雜，我還是能夠找到數(shù)據(jù)背后的模型，從而把握事物的不變性和規(guī)律性。它的方法與傳統(tǒng)方法的不同，它是從“海量的樣本數(shù)據(jù)”中尋求“復(fù)雜模型”。

人大：和清、北做不一樣的AI

以前自然科學(xué)的方法是從少量的數(shù)據(jù)、少量的實(shí)驗(yàn)樣本里面尋求簡單的模型，它可以用在自然科學(xué)方面，但是社會(huì)科學(xué)不可以，因?yàn)閱栴}太復(fù)雜、變量太多。

但是現(xiàn)在有了基于大數(shù)據(jù)的人工智能方法，我們會(huì)發(fā)現(xiàn)可以從海量的數(shù)據(jù)里面尋求復(fù)雜的模型。

一個(gè)系統(tǒng)可能有幾千萬、幾十億的變量，背后可能是非常復(fù)雜的非線性問題，沒有關(guān)系，我們?nèi)匀豢梢詷?gòu)建出來這樣的模型。

深度學(xué)習(xí)，正是這種方法的代表，它能夠從海量數(shù)據(jù)中非常高效地學(xué)習(xí)出復(fù)雜模型。事實(shí)上，深度學(xué)習(xí)不僅僅只是去做人臉識別、自動(dòng)駕駛，它對社會(huì)科學(xué)同樣有效，將之應(yīng)用于社會(huì)科學(xué)，將產(chǎn)生顛覆性的革命。因?yàn)樗o我們提供了一種有效的研究復(fù)雜問題的新方法。

這種新的科學(xué)范式就是：大數(shù)據(jù)+人工智能的研究范式。

二、新范式初探

深度神經(jīng)網(wǎng)絡(luò)，可以理解為一個(gè)非常復(fù)雜的函數(shù) f。在計(jì)算機(jī)視覺中，我們用它來表征建模人看見一個(gè)物體時(shí)發(fā)生了什么，現(xiàn)在我們在這方面已經(jīng)取得了非常好的成績，在特定領(lǐng)域已經(jīng)能夠超過人類的表現(xiàn)。

那么將這種方法應(yīng)用到社會(huì)科學(xué)中會(huì)有什么不一樣的呢？

文繼榮教授舉了幾個(gè)例子：

1、+經(jīng)濟(jì)學(xué)

人大：和清、北做不一樣的AI

文繼榮介紹，他們從30萬條新聞中，將產(chǎn)業(yè)轉(zhuǎn)型的數(shù)據(jù)抽取出來。其中的 x 就是這 30萬的新聞數(shù)據(jù)，而通過建立模型，繪制除了如圖所示的產(chǎn)業(yè)轉(zhuǎn)移結(jié)果 y = 產(chǎn)業(yè)轉(zhuǎn)移數(shù)(時(shí)間，省份1，省份2)。把其中低頻的數(shù)據(jù)去掉后，得到右邊的圖。

從中便可以很容易地看出，中國的產(chǎn)業(yè)轉(zhuǎn)移是以北、上、廣為中心；而三地轉(zhuǎn)移情況卻各不相同，北京往周邊轉(zhuǎn)，上海往中東部轉(zhuǎn)，而廣州則仍然轉(zhuǎn)在本地。通過這種方式，便可以將原有的數(shù)據(jù)變得形象化、可視化，從而揭示出原來不可能發(fā)現(xiàn)的經(jīng)濟(jì)規(guī)律。

2、+社會(huì)學(xué)

人大：和清、北做不一樣的AI

文繼榮繼續(xù)舉了與社科院合作的一個(gè)成果，研究意識形態(tài)問題。他們根據(jù) 1.7億用戶、27億的微博數(shù)據(jù)（其中有幾百萬的大V），發(fā)現(xiàn)很多有意思的現(xiàn)象。例如他們從微博數(shù)據(jù)中發(fā)現(xiàn)事實(shí)上中國近年來并沒有嚴(yán)重的民粹主義，且呈現(xiàn)民粹主義呈現(xiàn)多元化，民眾更關(guān)心國內(nèi)事務(wù)和政策。

3、+ 政治學(xué)

第三個(gè)例子是文繼榮在微軟期間的工作。2012年文繼榮通過公開的網(wǎng)絡(luò)數(shù)據(jù)來分析奧巴馬和羅姆尼的民意基礎(chǔ)，從而預(yù)測美國總統(tǒng)大選，結(jié)果相當(dāng)準(zhǔn)確。文繼榮打趣說，這個(gè)模型放到現(xiàn)在再去預(yù)測已經(jīng)不準(zhǔn)了，“因?yàn)槊绹娨呀?jīng)成長起來了”。

4、+ 歷史學(xué)

人大：和清、北做不一樣的AI

注：右側(cè)的災(zāi)害分布圖來源于網(wǎng)絡(luò)，此處僅為示例

歷史，也同樣可以做。我們可以把史料數(shù)據(jù)化，通過各種方式來建模，比如說災(zāi)害（水災(zāi)、旱災(zāi)、蝗災(zāi)）在歷朝歷代是怎么發(fā)生的，產(chǎn)生什么樣的影響，跟人口出生、GDP、戰(zhàn)爭、瘟疫等等有什么關(guān)系等。我們可以把這些問題轉(zhuǎn)化成數(shù)據(jù)分析的問題來做，現(xiàn)在的技術(shù)已經(jīng)可以做到，但距離真正的數(shù)據(jù)化歷史還很遙遠(yuǎn)，這涉及到如何去構(gòu)建一個(gè)龐大的技術(shù)平臺。

5、+法學(xué)

人大：和清、北做不一樣的AI

法律方面，文繼榮有頗多成果。舉例來講，如上圖，他們利用幾千萬法律文本判決書做了分析系統(tǒng)，輸入“黑社會(huì)”，就會(huì)得出如上圖右側(cè)的分布圖，其中顏色越深表示相應(yīng)的案件越多。從中可以看出江西很特別，而東三省和大家想象的似乎不太一樣。

以上僅為部分社會(huì)學(xué)科與新范式科學(xué)方法的結(jié)合，且只是初步。實(shí)際上目前已經(jīng)有很多人在作者相似的事情，很多社會(huì)科學(xué)研究也正受益于大數(shù)據(jù) + 人工智能。

但目前這種方法在與各個(gè)學(xué)科結(jié)合的過程中仍然存在著一系列的問題。例如往往沒有直接數(shù)據(jù)，或者數(shù)據(jù)是以非結(jié)構(gòu)化的文本形式而存在的。

此外，目前懂得使用這種技術(shù)的計(jì)算機(jī)專家并不懂得相應(yīng)的社會(huì)科學(xué)，而反過來其他的領(lǐng)域?qū)＜彝植⒉簧瞄L對大數(shù)據(jù)和人工智能的利用。抽取什么數(shù)據(jù)來分析？分析什么問題？怎么分析？領(lǐng)域?qū)＜覒?yīng)當(dāng)與計(jì)算機(jī)專家進(jìn)行深度合作。

人大最不缺的就是社科領(lǐng)域?qū)＜摇?/span>

這正是人大的優(yōu)勢所在，也正是人大高瓴人工智能學(xué)院的優(yōu)勢所在。

三、智能社會(huì)治理十大前沿問題

正如前面提到，高瓴人工智能學(xué)院若想“充分發(fā)揮學(xué)校在人工智能相關(guān)學(xué)科的已有優(yōu)勢”，就必須與其他學(xué)院緊密協(xié)作。

在本月19日，在中國科協(xié)的支持下，由中國人民大學(xué)主辦了“首屆智能社會(huì)治理論壇”。

這次論壇的參與方包括中國科協(xié)-中國人民大學(xué)智能社會(huì)治理研究中心、中國人民大學(xué)國家發(fā)展與戰(zhàn)略研究院、中國人民大學(xué)文化科技園、民盟中國人民大學(xué)委員會(huì)、高瓴人工智能學(xué)院、經(jīng)濟(jì)學(xué)院、法學(xué)院、社會(huì)與人口學(xué)院、新聞學(xué)院、勞動(dòng)人事學(xué)院、未來法治研究院、新聞與社會(huì)發(fā)展研究中心等。

這次會(huì)議，事實(shí)上可以看做是人大高瓴人工智能學(xué)院與各個(gè)兄弟學(xué)院正式“結(jié)盟”的一次標(biāo)志。

文繼榮作為高瓴人工智能學(xué)院院長，在會(huì)議上宣布了十個(gè)“智能社會(huì)治理的前沿問題”，作為他們在未來與兄弟學(xué)院共同合作的靶標(biāo)。分別為：

第一個(gè)課題：智能社會(huì)治理大數(shù)據(jù)平臺建設(shè)（人工智能學(xué)院）。

第二個(gè)課題：智能社會(huì)治理的算法與機(jī)制設(shè)計(jì)（人工智能學(xué)院）。

第三個(gè)課題：是智能社會(huì)算法和數(shù)據(jù)的法律規(guī)制（法學(xué)院）。

第四個(gè)課題：智能社會(huì)互聯(lián)網(wǎng)平臺的法律責(zé)任（法學(xué)院）。

第五個(gè)課題：智能社會(huì)的經(jīng)濟(jì)規(guī)制和競爭政策（經(jīng)濟(jì)學(xué)院）。

第六個(gè)課題：智能社會(huì)數(shù)字經(jīng)濟(jì)與中國經(jīng)濟(jì)轉(zhuǎn)型（經(jīng)濟(jì)學(xué)院）。

第七個(gè)課題：智能社會(huì)公共理性與輿論治理（新聞學(xué)院）。

第八個(gè)課題：智能社會(huì)公共倫理建設(shè)與規(guī)范（新聞學(xué)院）。

第九個(gè)課題，智能社會(huì)互聯(lián)網(wǎng)與人際關(guān)系重塑（社會(huì)與人口學(xué)院）。

第十個(gè)課題：智能社會(huì)秩序與智能化治理（社會(huì)與人口學(xué)院）。

從這個(gè)列表中，我們可以看出人大在人工智能的發(fā)展定位上，與清、北完全不同。人大更加強(qiáng)調(diào)人工智能技術(shù)與各個(gè)社會(huì)科學(xué)之間的結(jié)合，通過新的技術(shù)、新的研究范式來改變傳統(tǒng)的社會(huì)科學(xué)。在這個(gè)過程中，人工智能學(xué)院即是中心，又是邊緣。

或許我們可以認(rèn)為，人大把 AI 技術(shù)視作為社會(huì)科學(xué)的「新數(shù)學(xué)」。

https://www.leiphone.com/news/201911/5enGTF6LCAB1oL4V.html

向AI問一下細(xì)節(jié)

人大：和清、北做不一樣的AI

一、y = f(x) ：科學(xué)方法的變革

1、傳統(tǒng)方法

2、大數(shù)據(jù)方法/經(jīng)驗(yàn)方法

3、新范式：大數(shù)據(jù)+智能

二、新范式初探

1、+經(jīng)濟(jì)學(xué)

2、+社會(huì)學(xué)

3、+ 政治學(xué)

4、+ 歷史學(xué)

5、+法學(xué)

三、智能社會(huì)治理十大前沿問題

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

人大：和清、北做不一樣的AI

一、y = f(x) ：科學(xué)方法的變革

1、傳統(tǒng)方法

3、新范式：大數(shù)據(jù)+智能

二、新范式初探

1、+經(jīng)濟(jì)學(xué)

2、+社會(huì)學(xué)

3、+ 政治學(xué)

三、智能社會(huì)治理十大前沿問題