您好,登錄后才能下訂單哦!
DIKW體系是關于數據、信息、知識及智慧的體系,可以追溯至托馬斯·斯特爾那斯·艾略特所寫的詩--《巖石》。在首段,他寫道:“我們在哪里丟失了知識中的智慧?又在哪里丟失了信息中的知識?”(Where is the wisdom we have lost in knowledge? / Where is the knowledge we have lost in information?)。
1982年12月,美國教育家哈藍·克利夫蘭引用艾略特的這些詩句在其出版的《未來主義者》一書提出了“信息即資源”(Information as a Resource)的主張。
其后,教育家米蘭·瑟蘭尼、管理思想家羅素·艾可夫進一步對此理論發(fā)揚光大,前者在1987年撰寫了《管理支援系統(tǒng):邁向整合知識管理》(Management Support Systems: Towards Integrated Knowledge Management ),后者在1989年撰寫了《從數據到智慧》(“From Data to Wisdom”,Human Systems Management)。
D
:Data(數據),是 DIKW 體系中最低級的材料,一般指原始數據,包含(或不包含)有用的信息。
I
:Information(信息),作為一個概念,信息有著多種多樣的含義。在數據工程里,表示由數據工程師(使用相關工具)或者 數據科學家(使用數學方法),按照某種特定規(guī)則,對原始數據進行整合提取后,找出來的更高層數據(具體數據)。
K
:Knowledge(知識),并且這些認識擁有潛在的能力為特定目的而使用。在數據工程里,表示對信息進行針對性的實用化,讓提取的信息可以用于商業(yè)應用或學術研究。
W
:Wisdom(智慧),表示對知識進行獨立的思考分析,得出的某些結論。在數據工程里,工程師和科學家做了大量的工作用計算機程序盡可能多地提取了價值(I/K),然而真正要從數據中洞察出更高的價值,甚至能夠對未來的情況進行預測,則需要數據分析師。
數據工程是一整套對數據(D)進行采集、處理、提取價值(變?yōu)?I 或 K)的過程。
首先介紹一下相關的幾種角色: Data Engineer(數據工程師), Data Scientist(數據科學家), Data Analyst(數據分析師)。 這三個角色任務重疊性高,要求合作密切,但各負責的領域稍有不同。大部分公司里的這些角色都會根據每個人本身的技能長短而身兼數職, 所以有時候比較難以區(qū)分:
但是這個角色出現的頻率不多 ,因為有現成的MySQL, Oracle等數據庫技術, 很多大公司只需要DBA就足夠了。而 Hadoop, MongoDB 等 NoSQL 技術的開源, 更是使在大數據的場景下都沒有太多 數據工程師 的事,一般都是交給 數據科學家 。
有人稱 Data Scientist 為 編程統(tǒng)計學家(Programming Statistician),因為他們需要有很好的統(tǒng)計學基礎,但也需要參與程序的開發(fā)(基于 Infrastructure 之上),而現在很多很多的數據科學家 職位都要求身兼數據工程師。 數據科學家 是把 D 轉為 I 或 K 的主力軍。
百度百科:數據分析是指用適當的統(tǒng)計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。
數據收集 -》 數據處理 -》 數據分析 -》數據展現
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。