您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)Hive中structured、semi-structured、unstructured是什么意思的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。
結(jié)構(gòu)化的數(shù)據(jù)是指可以使用關(guān)系型數(shù)據(jù)庫表示和存儲,表現(xiàn)為二維形式的數(shù)據(jù)。
一般特點(diǎn)是:數(shù)據(jù)以行為單位,一行數(shù)據(jù)表示一個(gè)實(shí)體的信息,每一行數(shù)據(jù)的屬性是相同的。舉一個(gè)例子:
半結(jié)構(gòu)化數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)的一種形式,它并不符合關(guān)系型數(shù)據(jù)庫或其他數(shù)據(jù)表的形式關(guān)聯(lián)起來的數(shù)據(jù)模型結(jié)構(gòu),但包含相關(guān)標(biāo)記,用來分隔語義元素以及對記錄和字段進(jìn)行分層。因此,它也被稱為自描述的結(jié)構(gòu)。
半結(jié)構(gòu)化數(shù)據(jù),屬于同一類實(shí)體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序并不重要。
常見的半結(jié)構(gòu)數(shù)據(jù)有XML、JSON、 HTML,對于對于兩個(gè)XML文件,
第一個(gè)可能有
<person> <name>張三</name> <age>20</age> <gender>female</gender> </person> 1 2 3 4 5
第二個(gè)可能為:
<person> <name>李四</name> <gender>male</gender> </person> 1 2 3 4
從上面的例子中,屬性的順序是不重要的,不同的半結(jié)構(gòu)化數(shù)據(jù)的屬性的個(gè)數(shù)是不一定一樣的。有些人說半結(jié)構(gòu)化數(shù)據(jù)是以樹或者圖的數(shù)據(jù)結(jié)構(gòu)存儲的數(shù)據(jù),怎么理解呢?上面的例子中,<person>標(biāo)簽是樹的根節(jié)點(diǎn),<name>和<gender>標(biāo)簽是子節(jié)點(diǎn)。通過這樣的數(shù)據(jù)格式,可以自由地表達(dá)很多有用的信息,包括自我描述信息(元數(shù)據(jù))。所以,半結(jié)構(gòu)化數(shù)據(jù)的擴(kuò)展性是很好的。
顧名思義,就是沒有固定結(jié)構(gòu)的數(shù)據(jù)。各種文檔、圖片、視頻/音頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。對于這類數(shù)據(jù),我們一般直接整體進(jìn)行存儲,而且一般存儲為二進(jìn)制的數(shù)據(jù)格式
感謝各位的閱讀!關(guān)于“Hive中structured、semi-structured、unstructured是什么意思”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。