<big id="r7ou6"></big>

<big id="r7ou6"></big>

^{<p id="r7ou6"></p>}

<td id="r7ou6"></td>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

IMF前期知識儲備-What is Spark詳細講解（四大特性）

發(fā)布時間：2020-04-09 11:39:58 來源：網絡閱讀：66 作者：lqding1980 欄目：大數據

Spark 官方網站使用如下簡潔的語言描述了Spark

IMF前期知識儲備-What is Spark詳細講解（四大特性）我們可以從中提取出如下信息：

Spark是一個引擎

快速
通用

Spark可以用來處理數據

數據是大規(guī)模的

Spark本身并不提供數據存儲能力，它只是一個計算框架

它的快速體現在什么地方呢？

IMF前期知識儲備-What is Spark詳細講解（四大特性）如果處理的數據在內存中，運行MapReduce比hadoop要快100倍以上，要是數據在磁盤中，也比Hadoop快10倍以上。

為什么會快呢，Spark在處理數據的時候，使用了一個高級的執(zhí)行引擎：DAG - 有向無環(huán)圖。以及內存計算。

易于使用：

可以使用scala、java、Python等語言快速的開發(fā)應用程序。Spark提供了超過80個操作來簡單的構建并行應用。只需幾行代碼，就可以完成wordcount的計算。

IMF前期知識儲備-What is Spark詳細講解（四大特性）

通用性：

Spark 提供了大數據一棧式解決方案。包含了流計算、圖計算、機器學習、SQL等。

IMF前期知識儲備-What is Spark詳細講解（四大特性）

對于開發(fā)、維護、學習成本都是大大的降低。

運行在任何地方：

Spark可以運行在Hadoop的YARN、Mesos, standalone,或者運行在云上。

Spark 處理的數據，可以存儲在HDFS, Cassandra, HBase,和S3等等。

IMF前期知識儲備-What is Spark詳細講解（四大特性）

Spark的發(fā)展非?？焖?，TimeLine如下

IMF前期知識儲備-What is Spark詳細講解（四大特性）

Spark進入Apache后，發(fā)展非常迅速。版本發(fā)布比較頻繁。

Spark的生態(tài)體系(BDAS，中文：伯克利分析棧)

MapReduce屬于Hadoop生態(tài)體系之一，Spark則屬于BDAS生態(tài)體系之一
Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等
BDAS包含了Spark、Shark（相當于Hive）、BlinkDB、Spark Streaming（消息實時處理框架,類似Storm）等等

BDAS生態(tài)體系圖：

IMF前期知識儲備-What is Spark詳細講解（四大特性）

MapReduce和Spark比較

IMF前期知識儲備-What is Spark詳細講解（四大特性）

異同點：

基本原理上

MapReduce 是基于磁盤的大數據批量處理
Spark 是基于RDD(彈性分布式數據集)數據處理，RDD可以存儲在內存中，也可以存儲在磁盤中。

2. 模型上

MapReduce 適合處理超大規(guī)模的數據集，用于批處理。適合處理較少迭代的長任務需求。
Spark 適合數據挖掘，迭代次數較多的，例如機器學習等多輪迭代任務。

3. 容錯性

MapReduce的每一步迭代，都需要將結果寫入硬盤，然后再從硬盤中讀取數據計算。只要一步失敗，則整個任務都失敗。
Spark使用DAG將任務拆分成許多步驟，每個步驟迭代的過程中，數據寫內存。而且Spark還提供容錯功能。

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
c語言中關鍵字類型的詳細介紹
下一篇新聞：
c語言注釋符號怎么打

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼