溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

發(fā)布時間:2022-01-15 11:17:20 來源:億速云 閱讀:229 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

Amundsen的使命,整理有關(guān)數(shù)據(jù)的所有信息,并使其具有普遍適用性

這是Amundsen官網(wǎng)的一句話,對于元數(shù)據(jù)的管理工作,復(fù)雜且繁瑣??捎玫墓ぞ吆芏嗟饔星铮瑪?shù)據(jù)血緣做的較好的應(yīng)該是Apache Atlas,而數(shù)據(jù)可視化做的較好的應(yīng)該是Apache Superset。業(yè)界一直需要一個可以整合這些功能,讓數(shù)據(jù)治理更加的簡單便捷,而這正是Amundsen的使命。

類似于Atlas (Apache),Datahub (LinkedIn)。Amundsen主要在于提高數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的工作效率。它可以通過為數(shù)據(jù)資源建立索引,并通過一定的機制來支持在頁面上進(jìn)行排名搜索??梢詫⑵湟暈樗阉鞴δ?,但搜索的是元數(shù)據(jù)。該項目以挪威探險家Roald Amundsen(第一個發(fā)現(xiàn)南極的人)的名字命名。

Amundsen由LF AI&Data基金會維護(hù)。LF AI&Data是Linux Foundation的保護(hù)基金會,支持人工智能,機器學(xué)習(xí),深度學(xué)習(xí)和數(shù)據(jù)方面的開源創(chuàng)新。

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

目前Amundsen在github有1.9kStar,還沒有Releases的版本,項目正處于蒸蒸日上的上升期。

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

架構(gòu)

下圖顯示了Amundsen的總體架構(gòu)。

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

可見,Hive,Presto等數(shù)據(jù)源通過Databuilder ingestion框架獲取元數(shù)據(jù),寫入Elasticsearch和Neo4j,通過搜索服務(wù)與元數(shù)據(jù)服務(wù)提供給前端。

主要模塊如下:

前端服務(wù)

作為用戶交互的web頁面。

這是基于Flask的Web應(yīng)用程序,頁面是React構(gòu)建的。

搜索服務(wù)

搜索服務(wù)采用Elasticsearch的搜索功能(或者Apache Atlas),并提供一個RESTful API服務(wù)。

元數(shù)據(jù)服務(wù)

元數(shù)據(jù)服務(wù)目前使用的Neo4j的圖數(shù)據(jù)庫進(jìn)行交互。

功能展示

Amundsen提供了搜索,推薦,表描述,數(shù)據(jù)預(yù)覽在內(nèi)的非常多的功能,數(shù)據(jù)血緣功能正在研發(fā)中。

以上是部分功能展示:

登陸頁面:Amundsen的登陸頁面

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

搜索預(yù)覽:查看搜索結(jié)果

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

表的詳細(xì)頁面:Hive 等表的可視化

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

列詳細(xì)信息:主要是一些列的統(tǒng)計信息

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

數(shù)據(jù)預(yù)覽頁面:表數(shù)據(jù)預(yù)覽的可視化,可以與Apache Superset或其他數(shù)據(jù)可視化工具集成。

Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解

集成

Amundsen支持的數(shù)據(jù)源非常多。

Apache Druid,Apache Hive,CSV,Oracle,

Mysql,Delta Lake等等。

Amundsen還可以連接到任何提供dbapisql_alchemy接口的數(shù)據(jù)庫。

同時Amundsen還支持和一些儀表盤的集成,比如

Redash,Tableau。

ETL工具的集成,Apache Airflow。

BI可視化工具,Apache Superset。

上述就是小編為大家分享的Github 1.9K Star的數(shù)據(jù)治理框架Amundsen如何理解了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI