溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

結(jié)構(gòu)化,半結(jié)構(gòu)化,非結(jié)構(gòu)化數(shù)據(jù)總結(jié)

發(fā)布時間:2020-10-05 21:02:01 來源:網(wǎng)絡(luò) 閱讀:1971 作者:wangkunj 欄目:大數(shù)據(jù)

前言:

  • Hive可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供類SQL查詢功能。在學(xué)習(xí)Hive之前 我們先了解下結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)的區(qū)別。
    1.結(jié)構(gòu)化數(shù)據(jù)
  • 結(jié)構(gòu)化的數(shù)據(jù)是指可以使用關(guān)系型數(shù)據(jù)庫表示和存儲,表現(xiàn)為二維形式的數(shù)據(jù)。一般特點是:數(shù)據(jù)以行為單位,一行數(shù)據(jù)表示一個實體的信息,每一行數(shù)據(jù)的屬性是相同的。舉一個例子:
    id      name    age     gender
    1       lyh     12      male
    2       liangyh 13      female
    3       liang   18      male
  • 所以,結(jié)構(gòu)化的數(shù)據(jù)的存儲和排列是很有規(guī)律的,這對查詢和修改等操作很有幫助。但是,顯然,它的擴(kuò)展性不好(比如,我希望增加一個字段,怎么辦?)。
    2.半結(jié)構(gòu)化數(shù)據(jù)
  • 半結(jié)構(gòu)化數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)的一種形式,它并不符合關(guān)系型數(shù)據(jù)庫或其他數(shù)據(jù)表的形式關(guān)聯(lián)起來的數(shù)據(jù)模型結(jié)構(gòu),但包含相關(guān)標(biāo)記,用來分隔語義元素以及對記錄和字段進(jìn)行分層。因此,它也被稱為自描述的結(jié)構(gòu)。
    半結(jié)構(gòu)化數(shù)據(jù),屬于同一類實體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序并不重要。
    常見的半結(jié)構(gòu)數(shù)據(jù)有XML和JSON,對于對于兩個XML文件,第一個可能有
    <person>
    <name>A</name>
    <age>13</age>
    <gender>female</gender>
    </person>

    第二個可能為:

    <person>
    <name>B</name>
    <gender>male</gender>
    </person>
  • 從上面的例子中,屬性的順序是不重要的,不同的半結(jié)構(gòu)化數(shù)據(jù)的屬性的個數(shù)是不一定一樣的。有些人說半結(jié)構(gòu)化數(shù)據(jù)是以樹或者圖的數(shù)據(jù)結(jié)構(gòu)存儲的數(shù)據(jù),怎么理解呢?上面的例子中,<person>標(biāo)簽是樹的根節(jié)點,<name>和<gender>標(biāo)簽是子節(jié)點。通過這樣的數(shù)據(jù)格式,可以自由地表達(dá)很多有用的信息,包括自我描述信息(元數(shù)據(jù))。所以,半結(jié)構(gòu)化數(shù)據(jù)的擴(kuò)展性是很好的。
    3.非結(jié)構(gòu)化數(shù)據(jù)
  • 顧名思義,就是沒有固定結(jié)構(gòu)的數(shù)據(jù)。各種文檔、圖片、視頻/音頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。對于這類數(shù)據(jù),我們一般直接整體進(jìn)行存儲,而且一般存儲為二進(jìn)制的數(shù)據(jù)格式。

參考:https://blog.csdn.net/liangyihuai/article/details/54864952

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI