spark與hadoop共存嗎

發(fā)布時間：2021-12-16 14:22:42 來源：億速云閱讀：239 作者：iii 欄目：云計算

這篇文章主要講解了“spark與hadoop共存嗎”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“spark與hadoop共存嗎”吧！

Q1：為了加快spark shuffle 的執(zhí)行速度是否可以把spark_local_dirs 指向一塊固態(tài)硬盤上面，這樣做是否有效果。

可以把spark_local_dirs指向一塊固態(tài)硬盤上面,這樣會非常有效的提升Spark執(zhí)行速度；
同時想更快的提升Spark運行速度的話可以指定多個Shuffle輸出的目錄，讓Shuffle并行讀寫磁盤；

Q2：solidation=true只是在同一機器上進行合并對吧

solidation=true是在同一臺機器上進行合并；
當(dāng)進行合并的時候會把屬于同一個Reducer的bucket放入同一個文件，這回極大的減少Shuffler文件的數(shù)量，提升性能；

Q3：未來spark與hadoop會共存嗎

Spark和hadoop會共存， Spark+Hadoop= A winning combination；
并存的時候，Hadoop主要使用HDFS進行數(shù)據(jù)存儲，Spark負(fù)責(zé)對大數(shù)據(jù)一體化多元化的計算；

感謝各位的閱讀，以上就是“spark與hadoop共存嗎”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對spark與hadoop共存嗎這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關(guān)知識點的文章，歡迎關(guān)注！

向AI問一下細(xì)節(jié)

spark與hadoop共存嗎

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽