<noframes id="6aawo"><tbody id="6aawo"></tbody></noframes>

<noframes id="6aawo"><fieldset id="6aawo"></fieldset></noframes>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Hadoop

發(fā)布時間：2020-07-03 14:19:11 來源：網絡閱讀：308 作者：TomJames 欄目：系統運維

Hadoop：
大數據集群，只能運行在Linux平臺
RDBMS：表
字段、數據類型、約束
結構化數據
關系數據庫在數據中占據重要的地位
但不是所有的數據都可以結構化
結構化數據：structured data
非結構化數據：unstructured data
半結構化數據：semi-structured data
通常保存為xml , json
Google：pagerank 頁面算法
化整為零，并行處理
將一個大問題切割成多個小問題
OLAP：數據挖掘
機器學習：deep learning
多節(jié)點并行處理

Map reduce：
函數式編程API
運行框架

HDFS + Mapreduce=Hadoop
HDFS：
namenode：NN節(jié)點
Datanode：DN節(jié)點
MapReduce：
jobTracker：JT節(jié)點
TaskTracker：TT節(jié)點

Hadoop
Hadoop
Hadoop使用Java語言開發(fā)，mapper,reducer都是使用Java語言開發(fā)

hadoop生態(tài)：
Hadoop

Hadoop
一個mapper,reducer可以沒有reduce,但不能沒有mapper
HDFS：
1、HDFS設計用來存儲大文件，對海量小文件的存儲不太適用；
2、用戶空間的文件系統；
3、HDFS不支持修改；新版本支持追加；
4、不支持掛載，并通過系統調用進行訪問，只能使用專用訪問接口，如專用命令行工具，API；

Scribe ,facebook
flume
hadoop外圍組件

hadoop集群生態(tài)，生態(tài)圈
Hadoop
hive 中間組件
技術是面向場景的
基于HBASE可以做數據修改
HBASE 是NoSQL，稀疏格式存儲方案
Cloudera , CDH 著名hadoop技術服務提供商類似于redhat

Hadoop

關系型數據庫數據導入到Hadoop流程圖：
RDBMS --> Sqoop --> Hbase --> HDFS

Avro ：將數據序列化
Hadoop

如何學習Hadoop
1、安裝配置HDFS
2、安裝配置MapReduce
3、HBase
4、Hive
5、sqoop
6、flume/scribe/chukwa

HDFS正常情況幾個節(jié)點：四個節(jié)點
本地模式調試模式
偽分布式（使用一個節(jié)點）
完全分布式（4以上的節(jié)點）

Hadoop 并行處理系統多副本
MapReduce
處理邏輯
Hadoop

關系數據庫：
行式數據庫，表

HBase ：
列式數據庫
鍵值對，鍵值組

收集日志的工具
flume (ASF)
chukwa (ASF)
scribe (facebook)

比hadoop更高級的編程接口讀入工具
Hive SQL
pig
Crunch Java API
Hadoop

Avro 序列化工具
Hadoop有強大的生態(tài)環(huán)境
sqoop ：
讓HDFS 分析關系數據庫（Oracle ，MySQl ，SQL Server ,DB2）中的數據
Zookeeper 管理組件

生態(tài)圖
Hadoop

Hadoop核心組件：
MapReduce
HDFS

R語言
R是用于統計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟件，它是一個用于統計計算和統計制圖的優(yōu)秀工具

偽分布式系統基本5個進程：
JobTracker
TaskTracker
NameNode
SecondaryNameNode
DataNode

Hadoop生態(tài)各個組件之間兼容性不太好組件來自于各個開源項目
Cloudera CDH 組合發(fā)行版是Hadoop的一個分支，比較著名的
各種配置文件 .xml
Hadoop

Hadoop進程監(jiān)聽的地址和端口
Hadoop

Hadoop

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
Internet SSL證書類型介紹
下一篇新聞：
pycharm的特點是什么

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

<button id="wsogu"></button>

<noframes id="wsogu"></noframes>

<sup id="wsogu"></sup>