溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Hadoop初學(xué)者該了解哪些知識(shí)

發(fā)布時(shí)間:2021-12-04 15:36:57 來(lái)源:億速云 閱讀:116 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“Hadoop初學(xué)者該了解哪些知識(shí)”,在日常操作中,相信很多人在Hadoop初學(xué)者該了解哪些知識(shí)問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”Hadoop初學(xué)者該了解哪些知識(shí)”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

首先我們要了解hadoop是什么?Hadoop能夠做什么?Hadoop的使用場(chǎng)景是什么?Hadoop和大數(shù)據(jù)、云計(jì)算的關(guān)系是什么?如何使用hadoop?

當(dāng)大家對(duì)這些問(wèn)題有了基本的了解之后,接下來(lái)我們就要系統(tǒng)性的學(xué)習(xí)hadoop了。我個(gè)人建議大家不要一味的去學(xué)習(xí)理論知識(shí),***是理論和實(shí)踐相結(jié)合,可以先跟著視頻和文檔去操作,先把偽分布式集群搭建起來(lái),把wordcount實(shí)例運(yùn)行起來(lái),對(duì)hadoop集群的搭建過(guò)程和運(yùn)行機(jī)制有個(gè)大概的了解和認(rèn)知,然后從操作的過(guò)程中去發(fā)現(xiàn)自己在哪方面是薄弱點(diǎn),有針對(duì)性的去彌補(bǔ),這樣學(xué)習(xí)就會(huì)更有針對(duì)性和目的性,學(xué)習(xí)效果也相對(duì)會(huì)更好一些,否則學(xué)習(xí)會(huì)很盲目、很痛苦的。

我們知道hadoop有單機(jī)模式,偽分布模式和分布式模式。同時(shí)hadoop的環(huán)境是Linux,所以我們還需要安裝Linux系統(tǒng)。因?yàn)槲覀兊牧?xí)慣是使用windows,所以對(duì)于Linux上來(lái)就安裝軟件之類的,困難程度會(huì)很大。并且我們要搭建集群,需要多臺(tái)硬件的,不可能為了搭建集群,去買三臺(tái)電腦。所以從成本和使用的角度我們還需要懂虛擬化方面的知識(shí)。這里的虛擬化其實(shí)就是我們需要懂得虛擬機(jī)的使用。因?yàn)閔adoop安裝在Linux中,才能真正發(fā)揮作用。所以我們也不會(huì)使用windows。

基于以上內(nèi)容。所以我們需要懂得

  1. 虛擬化

  2. Linux

  3. java基礎(chǔ)

下面我們來(lái)詳細(xì)介紹:

虛擬化:我們選擇的是VMware  Workstation,這里就要求我們會(huì)搭建虛擬機(jī),安裝linux(如centos)操作系統(tǒng),這方面只要按照視頻操作應(yīng)該還是很簡(jiǎn)單的,難點(diǎn)在于虛擬機(jī)網(wǎng)絡(luò)的配置,尤其是nat模式和bridge模式,因?yàn)閔adoop要求主機(jī)與虛擬機(jī)與外部網(wǎng)絡(luò)(能上網(wǎng)),這三者是相通的,都能夠連接上網(wǎng)絡(luò),只有這樣在安裝的過(guò)程中,才不會(huì)遇到麻煩。

Linux:對(duì)于Linux的學(xué)習(xí)也是一個(gè)過(guò)程,因?yàn)榭赡苣氵B最簡(jiǎn)單的開(kāi)機(jī)和關(guān)機(jī)命令都不會(huì),更不要談配置網(wǎng)絡(luò)。常用的linux命令也就20多種,我們需要做的就是在搭建集群的過(guò)程中不斷地加強(qiáng)練習(xí),在實(shí)踐中去記憶。但是我們會(huì)遇到各種不會(huì)的命令,即使能查到命令,我們也不能使用。為什么會(huì)這樣,因?yàn)橛械拿?,是需要使用安裝包的。所以我們也要學(xué)會(huì)如何下載安裝包。

我們需要使用一些命令,進(jìn)行網(wǎng)絡(luò)配置,但是在網(wǎng)絡(luò)配置中,這里面又必須懂得虛擬機(jī)的一些知識(shí),所以前面的虛擬機(jī)知識(shí)需要掌握扎實(shí)一些。

對(duì)于有l(wèi)inux基礎(chǔ)的學(xué)員也可以選擇hadoop運(yùn)維工程師作為職業(yè)選擇。

提醒大家切忌浮躁,我們不可能一兩天就能完成上面的所有內(nèi)容,我們至少需要花費(fèi)一周的時(shí)間不斷地去訓(xùn)練、強(qiáng)化。只要我們熟悉了Linux命令,熟悉了網(wǎng)絡(luò)知識(shí)。后面我們的學(xué)習(xí)才會(huì)很輕松,很快速。

通過(guò)以上的學(xué)習(xí)我們已經(jīng)會(huì)安裝集群了,那么接下來(lái)我們就需要進(jìn)入開(kāi)發(fā)階段。開(kāi)發(fā)零基礎(chǔ),該怎么辦呢?

hadoop編程是一個(gè)Java框架,同時(shí)也是編程的一次革命,使得傳統(tǒng)開(kāi)發(fā)運(yùn)行程序由單臺(tái)客戶端(單臺(tái)電腦)轉(zhuǎn)換為可以由多個(gè)客戶端運(yùn)行(多臺(tái)機(jī)器)運(yùn)行,使得任務(wù)得以分解,這大大提高了效率。

Hadoop既然是一個(gè)Java框架,因此就要求我們必須要懂Java,網(wǎng)上有大量的資料,所以學(xué)習(xí)Java不是件難事。但是學(xué)到什么程度,可能是我們零基礎(chǔ)同學(xué)所關(guān)心的。

Java:我們需要具備javaSE基礎(chǔ)知識(shí),暫時(shí)不需要java  Web及各種框架知識(shí)。如果沒(méi)有javaSE基礎(chǔ),建議在學(xué)習(xí)hadoop之前或過(guò)程中要加強(qiáng)這方面的學(xué)習(xí)和訓(xùn)練。當(dāng)然有java基礎(chǔ)和開(kāi)發(fā)經(jīng)驗(yàn)的學(xué)員學(xué)習(xí)hadoop就會(huì)更快速、更輕松。

到此,關(guān)于“Hadoop初學(xué)者該了解哪些知識(shí)”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI