您好,登錄后才能下訂單哦!
這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)Google工程師的大數(shù)據(jù)處理方法論是什么,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
毫無疑問,Google是公認(rèn)的大數(shù)據(jù)鼻祖。如今很多人提起大數(shù)據(jù),還停留在 Google 開啟的“三駕馬車”時(shí)代:Google FS、MapReduce、BigTable。其實(shí),“三駕馬車”早已不是浪潮之巔。
近年來,大數(shù)據(jù)技術(shù)的發(fā)展,不論是技術(shù)迭代,還是生態(tài)圈的繁榮,都遠(yuǎn)超我們的想象。從 Spark 成為 Hadoop 生態(tài)的一部分,到 Flink 橫空出世挑戰(zhàn) Spark 成為大數(shù)據(jù)處理領(lǐng)域的新星,再到如今 Google 又決心用 Apache Beam 一統(tǒng)天下。大數(shù)據(jù)技術(shù)的發(fā)展可謂跌宕起伏,波瀾壯闊。
豐富的工具,繁榮的生態(tài),也增加了開發(fā)者選擇合適工具的難度。把開源框架,工具,類庫,平臺(tái)整合到一起,所需要的工作量以及復(fù)雜度,可想而知。技術(shù)的選擇與使用,也是大數(shù)據(jù)開發(fā)者非常頭疼的問題。
之前和 Google Brain 的工程師交流的時(shí)候,他提到在大數(shù)據(jù)領(lǐng)域,能把技術(shù)想明白,用明白的開發(fā)者太少了,一些中小型公司的技術(shù) VP ,往往也是在“趕技術(shù)的時(shí)髦”的狀態(tài)中,更別說普通的開發(fā)者。對(duì)大數(shù)據(jù)處理,比較常見的誤區(qū)有下面幾種:
1.低估了數(shù)據(jù)處理的重要性。
沒有高質(zhì)量的數(shù)據(jù)處理,人工智能只有人工沒有智能。例如在語義理解上,Google 就曾犯過這樣的錯(cuò)誤,直到被一家德國(guó)的小公司超過,才認(rèn)識(shí)到高質(zhì)量的數(shù)據(jù)標(biāo)注和處理的重要性。
2.低估了數(shù)據(jù)處理工程師在組織架構(gòu)上的重要性。
大數(shù)據(jù)領(lǐng)域泰斗級(jí)人物Jesse Anderson曾做過一項(xiàng)研究,一個(gè)人工智能團(tuán)隊(duì)的合理組織架構(gòu),需要4/5的數(shù)據(jù)處理工程師。其實(shí),即使是一個(gè)寫前端的工程師,很多工作還是數(shù)據(jù)處理。很不幸,很多團(tuán)隊(duì)沒有認(rèn)識(shí)到這一點(diǎn)。
3.低估了數(shù)據(jù)處理規(guī)模變大帶來的復(fù)雜度。
很多人還沒有遇到過“大規(guī)模”的問題,因此容易把問題想的過于簡(jiǎn)單。Google有很多優(yōu)秀的候選人,他們對(duì)常見的編程問題可以很好的解決,但只要追問數(shù)據(jù)規(guī)模變大時(shí)怎么設(shè)計(jì)系統(tǒng),回答卻常常不盡人意。
4.高估了上手?jǐn)?shù)據(jù)處理的難度。
一方面我們需要認(rèn)識(shí)到大規(guī)模的數(shù)據(jù)處理是有復(fù)雜的因素的。但另一方面,有了正確的工具和技術(shù)理念,現(xiàn)在上手?jǐn)?shù)據(jù)處理并不困難。在Google,很多應(yīng)屆生入職半年后也能輕松應(yīng)對(duì)上億的數(shù)據(jù)量。
為了幫你比別人更準(zhǔn)確深入地掌握實(shí)用的大規(guī)模數(shù)據(jù)處理技術(shù),甚至達(dá)到硅谷一線系統(tǒng)架構(gòu)師的水平。
簡(jiǎn)單提下 Google Brain(谷歌大腦):這個(gè)團(tuán)隊(duì)的項(xiàng)目包括使用神經(jīng)網(wǎng)絡(luò)的圖像增強(qiáng)系統(tǒng)、谷歌神經(jīng)機(jī)器翻譯的學(xué)習(xí)框架以及通過機(jī)器學(xué)習(xí)自動(dòng)學(xué)習(xí)獲取新技能的機(jī)器人。在Android操作系統(tǒng)的語音識(shí)別系統(tǒng),Google+的照片搜索和YouTube中的視頻推薦系統(tǒng)中,都用到了Google Brain的技術(shù)。
上述就是小編為大家分享的Google工程師的大數(shù)據(jù)處理方法論是什么了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。