溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

舉例說(shuō)明 數(shù)據(jù)分析思維

發(fā)布時(shí)間:2020-08-05 04:06:35 來(lái)源:網(wǎng)絡(luò) 閱讀:957 作者:若恒 欄目:大數(shù)據(jù)

前兩天刷知乎的時(shí)候看到這樣的問(wèn)題

“為什么我國(guó)人才流失如此嚴(yán)重?”

題主的疑問(wèn)來(lái)自于×××的數(shù)據(jù):
舉例說(shuō)明 數(shù)據(jù)分析思維

2014年出國(guó)人數(shù)為46萬(wàn),而回國(guó)人數(shù)僅為36.5萬(wàn)。

兩者相除,得出“歸國(guó)率”僅為79% ,而2015年僅有78%。

因此,題主得出結(jié)論:我國(guó)海外人才大量流失


隨后,各路人馬紛紛跳出來(lái),開(kāi)始一本正經(jīng)地分析為什么中國(guó)人才流失這么嚴(yán)重。

問(wèn)題是,這樣的數(shù)據(jù)解讀正確嗎?

用同一年內(nèi)的出國(guó)人數(shù)和歸國(guó)人,計(jì)算出來(lái)的所謂“歸國(guó)率”,真的有意義嗎?

如果這個(gè)數(shù)據(jù)本身就沒(méi)有意義,那么“分析”背后的“原因”,無(wú)疑是南轅北轍了。

——請(qǐng)先思考一分鐘——

2015年歸國(guó)的留學(xué)生,肯定在2014年甚至更早就出國(guó)了。

極少有學(xué)校會(huì)開(kāi)設(shè)1月入學(xué),12月畢業(yè)的Program。

所以,這里用同一年內(nèi)的回國(guó)人數(shù)和出國(guó)人數(shù)相除,算出來(lái)的所謂“歸國(guó)率”純粹是瞎幾把算。

一般國(guó)外本科是3-4年,美國(guó)的master是1.5-2年,英國(guó)及英聯(lián)邦是1-1.5年,PhD一般要5年。

由于查不到不同項(xiàng)目人數(shù)的比例,因此保守估計(jì)平均出國(guó)年份為2年。
舉例說(shuō)明 數(shù)據(jù)分析思維

-

根據(jù)×××的數(shù)據(jù),2015年回國(guó)是40.9萬(wàn),往前推2年,2013年出國(guó)人數(shù)是41.4萬(wàn)。

2915年歸國(guó)率 = 40.9/41.4 ≈ 99%,遠(yuǎn)高于所謂的“78%”。

同理,2014年的歸國(guó)率是 91%,2013年甚至超過(guò)100%(可能是由于較多其他年份出國(guó)留學(xué)的學(xué)生在2013年集中回國(guó),導(dǎo)致數(shù)據(jù)爆表)。

近幾年的歸國(guó)率均高達(dá)90%以上,因此“我國(guó)人才流失嚴(yán)重”顯然是不成立了。

所以說(shuō),以后數(shù)據(jù)分析之前應(yīng)該先動(dòng)動(dòng)腦子,不要總想著搞個(gè)大新聞批判一番。


這個(gè)問(wèn)題是解決了,那么還能挖出什么別的東西呢?

還可以觀測(cè)趨勢(shì)。

整理了從1949-2015年,每一年的出國(guó)留學(xué)和歸國(guó)人數(shù)。

加總后,得到歸國(guó)人數(shù)總計(jì)218萬(wàn),出國(guó)人數(shù)總計(jì)292萬(wàn)(不含2014和2015年),從而得出回國(guó)率75%。

為什么總體只有75%?這和我們計(jì)算的2013-2015年的歸國(guó)率相差甚大。

首先做一個(gè)簡(jiǎn)單推測(cè):早年的歸國(guó)率低,因此整體歸國(guó)率被拖了后腿。

分別計(jì)算每年的歸國(guó)率(篇幅原因,取1980年開(kāi)始):
舉例說(shuō)明 數(shù)據(jù)分析思維
果然,從改革開(kāi)放以來(lái),大部分年份的歸國(guó)率是非常低的,算術(shù)平均數(shù)僅為63%。

因此得出結(jié)論:近年來(lái),越來(lái)越多的留學(xué)生選擇回國(guó)。

那么,還能不能挖掘出別的東西?

在分析過(guò)程中,我發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象,如果只看2000年以后的數(shù)據(jù),2003-2008年出現(xiàn)了明顯的洼地。
舉例說(shuō)明 數(shù)據(jù)分析思維
為了找出原因,特別是要規(guī)避計(jì)算方法帶來(lái)的錯(cuò)誤,我計(jì)算了出國(guó)和歸國(guó)人數(shù)的逐年增長(zhǎng)率(YoY Growth)。
舉例說(shuō)明 數(shù)據(jù)分析思維
數(shù)據(jù)表明,2000-2002年出現(xiàn)了一波出國(guó)的高潮,隨后增長(zhǎng)率迅速下降,甚至出現(xiàn)負(fù)增長(zhǎng),直到2008年以后才恢復(fù)到了20%+的增長(zhǎng)率。

所以,2008年實(shí)際上是一個(gè)分水嶺,08年之后,出國(guó)留學(xué)變得更加熱門(mén)。

結(jié)合平時(shí)實(shí)際了解的出國(guó)人群的情況,我們可以做這樣一個(gè)假設(shè):2008年以前出國(guó)人群中,本科和博士比例更高,2008年以后則是碩士比例更高。

因此,2008年以前出國(guó)的學(xué)生,在國(guó)外停留的時(shí)間應(yīng)該更長(zhǎng),我們不妨認(rèn)為這個(gè)平均時(shí)間是3.5年,取整為4年。

重新計(jì)算歸國(guó)率后:
舉例說(shuō)明 數(shù)據(jù)分析思維
結(jié)果,不僅2005-2007年的洼地沒(méi)有改變,還在2002年出現(xiàn)了一波高峰。

因?yàn)檫@里已經(jīng)排除了計(jì)算方法帶來(lái)的錯(cuò)誤,因此需要去探究背后的動(dòng)因。

但想要真正透徹地探究其中的原因,只能通過(guò)大規(guī)模調(diào)研的方式詢問(wèn)當(dāng)時(shí)的留學(xué)生,顯然不太現(xiàn)實(shí)。


在這里先開(kāi)一波腦洞大致推測(cè)下原因:

  • 2001年,中國(guó)發(fā)生了幾件大事:申奧成功,WTO,APEC會(huì)議,因此鼓舞了一批留學(xué)生在2002年集中回國(guó)效力

  • 2004-2008年,國(guó)內(nèi)輿論風(fēng)波逐漸興起,各路公知興風(fēng)作浪,在2008年到達(dá)頂峰,這幾年的留學(xué)生更多選擇在留在國(guó)外;

  • 2008年,內(nèi)有雪災(zāi)、地震、毒奶粉,外有分裂反華勢(shì)力,中國(guó)在內(nèi)交外困之下成功地舉辦奧運(yùn)會(huì),從此國(guó)內(nèi)輿論形式逐漸反轉(zhuǎn);加之全球性的金融危機(jī),導(dǎo)致海外的機(jī)會(huì)減少,大批留學(xué)生又選擇回國(guó)發(fā)展。

如果這是一次正式的數(shù)據(jù)分析,我們可以利用調(diào)研結(jié)果進(jìn)一步分析出留學(xué)生回國(guó)的驅(qū)動(dòng)因素,進(jìn)而預(yù)測(cè)未來(lái)幾年的歸國(guó)率。

綜上,數(shù)據(jù)分析首先要保證數(shù)據(jù)和方法的準(zhǔn)確性,然后大膽假設(shè),小心求證。在不斷地論證中,會(huì)逐漸挖掘出有價(jià)值的新信息。

除此以外,這些數(shù)據(jù)還可以做別的嗎?

還可以匡算市場(chǎng)規(guī)模。

從2015年開(kāi)始,每年出國(guó)留學(xué)的人數(shù)已經(jīng)超過(guò)了50萬(wàn)。

算上出國(guó)留學(xué)有至少2-3年的準(zhǔn)備期,那么留學(xué)產(chǎn)業(yè)每年的基礎(chǔ)人群高達(dá)150萬(wàn)

由此可以大致分別估算留學(xué)考試輔導(dǎo)、留學(xué)咨詢/中介、國(guó)際學(xué)校的市場(chǎng)規(guī)模。

同理,每年歸國(guó)的留學(xué)生超過(guò)40萬(wàn),這些留學(xué)生都需要在國(guó)內(nèi)求職。

算上1-2年的準(zhǔn)備期,由此可以大致估算求職輔導(dǎo)(針對(duì)留學(xué)生)的市場(chǎng)規(guī)模。


以上這些僅僅是最簡(jiǎn)單最粗淺的分析。

在實(shí)際咨詢項(xiàng)目中,一般會(huì)首先通過(guò)多方渠道驗(yàn)證數(shù)據(jù)的準(zhǔn)確性,然后搭建模型進(jìn)行深入地分析,當(dāng)然同樣少不了反復(fù)驗(yàn)證的程序,結(jié)合定性分析,得出最終的結(jié)論。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI