溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop 與 MPPDB 的區(qū)別是什么

發(fā)布時間:2021-07-20 11:36:28 來源:億速云 閱讀:424 作者:chen 欄目:大數(shù)據(jù)

本篇內容主要講解“Hadoop 與 MPPDB 的區(qū)別是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hadoop 與 MPPDB 的區(qū)別是什么”吧!

1、 什么是MPP?

MPP (Massively Parallel Processing),即大規(guī)模并行處理,在數(shù)據(jù)庫非共享集群中,每個節(jié)點都有獨立的磁盤存儲系統(tǒng)和內存系統(tǒng),業(yè)務數(shù)據(jù)根據(jù)數(shù)據(jù)庫模型和應用特點劃分到各個節(jié)點上,每臺數(shù)據(jù)節(jié)點通過專用網絡或者商業(yè)通用網絡互相連接,彼此協(xié)同計算,作為整體提供數(shù)據(jù)庫服務。非共享數(shù)據(jù)庫集群有完全的可伸縮性、高可用、高性能、優(yōu)秀的性價比、資源共享等優(yōu)勢。

簡單來說,MPP是將任務并行的分散到多個服務器和節(jié)點上,在每個節(jié)點上計算完成后,將各自部分的結果匯總在一起得到最終的結果(與Hadoop相似)。

2、MPP(大規(guī)模并行處理)架構 

Hadoop 與 MPPDB 的區(qū)別是什么

 (MPP架構)

3、 MPP架構特征

● 任務并行執(zhí)行;

● 數(shù)據(jù)分布式存儲(本地化);

● 分布式計算;

● 私有資源;

● 橫向擴展;

● Shared Nothing架構。

4、 MPP服務器架構

它由多個SMP服務器通過一定的節(jié)點互聯(lián)網絡進行連接,協(xié)同工作,完成相同的任務,從用戶的角度來看是一個服務器系統(tǒng)。其基本特征是由多個SMP服務器(每個SMP服務器稱節(jié)點)通過節(jié)點互聯(lián)網絡連接而成,每個節(jié)點只訪問自己的本地資源(內存、存儲等),是一種完全無共享(Share Nothing)結構,因而擴展能力最好,理論上其擴展無限制。

5、MPPDB

MPPDB是一款 Shared Nothing 架構的分布式并行結構化數(shù)據(jù)庫集群,具備高性能、高可用、高擴展特性,可以為超大規(guī)模數(shù)據(jù)管理提供高性價比的通用計算平臺,并廣泛地用于支撐各類數(shù)據(jù)倉庫系統(tǒng)、BI 系統(tǒng)和決策支持系統(tǒng)

6、MPPDB架構

MPP 采用完全并行的MPP + Shared Nothing 的分布式扁平架構,這種架構中的每一個節(jié)點(node)都是獨立的、自給的、節(jié)點之間對等,而且整個系統(tǒng)中不存在單點瓶頸,具有非常強的擴展性。

7、 MPPDB特征

MPP 具備以下技術特征:

1) 低硬件成本:完全使用 x86 架構的 PC Server,不需要昂貴的 Unix 服務器和磁盤陣列;

2) 集群架構與部署:完全并行的 MPP + Shared Nothing 的分布式架構,采用 Non-Master 部署,節(jié)點對等的扁平結構;

3) 海量數(shù)據(jù)分布壓縮存儲:可處理 PB 級別以上的結構化數(shù)據(jù),采用 hash分布、random 存儲策略進行數(shù)據(jù)存儲;同時采用先進的壓縮算法,減少存儲數(shù)據(jù)所需的空間,可以將所用空間減少 1~20 倍,并相應地提高 I/O 性能;

4) 數(shù)據(jù)加載高效性:基于策略的數(shù)據(jù)加載模式,集群整體加載速度可達2TB/h;

5) 高擴展、高可靠:支持集群節(jié)點的擴容和縮容,支持全量、增量的備份/恢復;

6) 高可用、易維護:數(shù)據(jù)通過副本提供冗余保護,自動故障探測和管理,自動同步元數(shù)據(jù)和業(yè)務數(shù)據(jù)。提供圖形化工具,以簡化管理員對數(shù)據(jù)庫的管理工作;

7) 高并發(fā):讀寫不互斥,支持數(shù)據(jù)的邊加載邊查詢,單個節(jié)點并發(fā)能力大于 300 用戶;

8) 行列混合存儲:提供行列混合存儲方案,從而提高了列存數(shù)據(jù)庫特殊查詢場景的查詢響應耗時;

9) 標準化:支持SQL92 標準,支持 C API、ODBC、JDBC、ADO.NET 等接口規(guī)范。

8、 常見MPPDB

● GREENPLUM(EMC)

● Asterdata(Teradata)

● Nettezza(IBM)

● Vertica(HP)

● GBase 8a MPP cluster(南大通用)

9、 MPPDB、Hadoop與傳統(tǒng)數(shù)據(jù)庫技術對比與適用場景

MPPDB與Hadoop都是將運算分布到節(jié)點中獨立運算后進行結果合并(分布式計算),但由于依據(jù)的理論和采用的技術路線不同而有各自的優(yōu)缺點和適用范圍。兩種技術以及傳統(tǒng)數(shù)據(jù)庫技術的對比如下:

Hadoop 與 MPPDB 的區(qū)別是什么

綜合而言,Hadoop和MPP兩種技術的特定和適用場景為:

● Hadoop在處理非結構化和半結構化數(shù)據(jù)上具備優(yōu)勢,尤其適合海量數(shù)據(jù)批處理等應用要求。

● MPP適合替代現(xiàn)有關系數(shù)據(jù)機構下的大數(shù)據(jù)處理,具有較高的效率。

MPP適合多維度數(shù)據(jù)自助分析、數(shù)據(jù)集市等;Hadoop適合海量數(shù)據(jù)存儲查詢、批量數(shù)據(jù)ETL、非機構化數(shù)據(jù)分析(日志分析、文本分析)等。

由上述對比可預見未來大數(shù)據(jù)存儲與處理趨勢:MPPDB+Hadoop混搭使用,用MPP處理PB級別的、高質量的結構化數(shù)據(jù),同時為應用提供豐富的SQL和事物支持能力;用Hadoop實現(xiàn)半結構化、非結構化數(shù)據(jù)處理。這樣可以同時滿足結構化、半結構化和非結構化數(shù)據(jù)的高效處理需求。

到此,相信大家對“Hadoop 與 MPPDB 的區(qū)別是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI