您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“數(shù)據(jù)倉庫的基本功能是什么”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
數(shù)據(jù)倉庫的基本功能包括:1、ETL設(shè)計(jì),包括數(shù)據(jù)的抽取同步、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換;2、數(shù)據(jù)分層,一般會劃分為ODS層、CM層、ML層;3、數(shù)據(jù)初步建模。
本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。
數(shù)據(jù)倉庫,英文名稱為Data Warehouse,可簡寫為DW或DWH。數(shù)據(jù)倉庫,是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。 為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時間、成本、質(zhì)量以及控制。
數(shù)據(jù)倉庫的基本功能
ETL設(shè)計(jì):數(shù)據(jù)的抽取同步、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換。涉及關(guān)系型數(shù)據(jù)庫(mysql、mariadb、oracle等),文檔型數(shù)據(jù)庫(mongodb、elasticsearch等)。
數(shù)據(jù)分層:一般劃分為ODS層、CM層、ML層。ODS層表示未進(jìn)行加工的數(shù)據(jù)。CM層表示清洗合并層的數(shù)據(jù)。
數(shù)據(jù)初步建模:對應(yīng)數(shù)據(jù)分層ML層,一般采用關(guān)系模型(雪花模型)或星型模型,形成寬表對外提供數(shù)據(jù)支持。
涉及技術(shù):HDFS、HIVE、HBASE、MR、SPARK、YARN等。
數(shù)據(jù)倉庫架構(gòu)
下圖為工作中參考很多公司的數(shù)據(jù)架構(gòu)規(guī)劃出的數(shù)據(jù)架構(gòu),僅供參考。
“數(shù)據(jù)倉庫的基本功能是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。