溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

大數(shù)據(jù)兩大核心技術(shù)是什么

發(fā)布時(shí)間:2022-01-14 17:37:07 來(lái)源:億速云 閱讀:1133 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“大數(shù)據(jù)兩大核心技術(shù)是什么”,在日常操作中,相信很多人在大數(shù)據(jù)兩大核心技術(shù)是什么問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”大數(shù)據(jù)兩大核心技術(shù)是什么”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

  Hadoop是什么?

  Hadoop在2006年開始成為雅虎項(xiàng)目,隨后晉升為頂級(jí)Apache開源項(xiàng)目。它是一種通用的分布式系統(tǒng)基礎(chǔ)架構(gòu),具有多個(gè)組件:Hadoop分布式文件系統(tǒng)(HDFS),它將文件以Hadoop本機(jī)格式存儲(chǔ)并在集群中并行化; YARN,協(xié)調(diào)應(yīng)用程序運(yùn)行時(shí)的調(diào)度程序; MapReduce,這是實(shí)際并行處理數(shù)據(jù)的算法。Hadoop使用Java編程語(yǔ)言構(gòu)建,其上的應(yīng)用程序也可以使用其他語(yǔ)言編寫。通過(guò)一個(gè)Thrift客戶端,用戶可以編寫MapReduce或者Python代碼。

  除了這些基本組件外,Hadoop還包括Sqoop,它將關(guān)系數(shù)據(jù)移入HDFS; Hive,一種類似SQL的接口,允許用戶在HDFS上運(yùn)行查詢; Mahout,機(jī)器學(xué)習(xí)。除了將HDFS用于文件存儲(chǔ)之外,Hadoop現(xiàn)在還可以配置使用S3 buckets或Azure blob作為輸入。

  它可以通過(guò)Apache發(fā)行版開源,也可以通過(guò)Cloudera(規(guī)模和范圍最大的Hadoop供應(yīng)商),MapR或HortonWorks等廠商提供。

  Spark是什么?

  Spark是一個(gè)較新的項(xiàng)目,在2012年誕生在加州大學(xué)伯克利分校的AMPLab。它也是一個(gè)頂級(jí)Apache項(xiàng)目,專注于在集群中并行處理數(shù)據(jù),一大區(qū)別在于它在內(nèi)存中運(yùn)行。

  類似于Hadoop讀取和寫入文件到HDFS的概念,Spark使用RDD(彈性分布式數(shù)據(jù)集)處理RAM中的數(shù)據(jù)。Spark以獨(dú)立模式運(yùn)行,Hadoop集群可用作數(shù)據(jù)源,也可與Mesos一起運(yùn)行。在后一種情況下,Mesos主站將取代Spark主站或YARN以進(jìn)行調(diào)度。

  Spark是圍繞Spark Core構(gòu)建的,Spark Core是驅(qū)動(dòng)調(diào)度,優(yōu)化和RDD抽象的引擎,并將Spark連接到正確的文件系統(tǒng)(HDFS,S3,RDBM或Elasticsearch)。Spark Core上還運(yùn)行了幾個(gè)庫(kù),包括Spark SQL,允許用戶在分布式數(shù)據(jù)集上運(yùn)行類似SQL的命令,用于機(jī)器學(xué)習(xí)的MLLib,用于解決圖形問(wèn)題的GraphX以及允許輸入連續(xù)流式日志數(shù)據(jù)的Streaming。

  Spark有幾個(gè)API。原始界面是用Scala編寫的,并且由于大量數(shù)據(jù)科學(xué)家的使用,還添加了Python和R接口。Java是編寫Spark作業(yè)的另一種選擇。

  Databricks是由Spark創(chuàng)始人Matei Zaharia創(chuàng)立的公司,現(xiàn)在負(fù)責(zé)    Spark開發(fā)并為客戶提供Spark分銷。

到此,關(guān)于“大數(shù)據(jù)兩大核心技術(shù)是什么”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI