#

大數(shù)據(jù)

  • Impala隱藏的驚天秘密

    元數(shù)據(jù)作為大數(shù)據(jù)的源泉,有著非常重要的作用??稍贗mpala中卻隱藏著一個(gè)秘密?和元數(shù)據(jù)有著頗深的淵源,我們一起來追溯!一、Impala體系結(jié)構(gòu)(1)每個(gè)slave節(jié)點(diǎn)運(yùn)行一個(gè)Impala進(jìn)程,和HD

    作者:caosheng03
    2020-08-22 13:20:19
  • 深度解析數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法

    01、關(guān)聯(lián)規(guī)則挖掘背景和基本概念如下所示的數(shù)據(jù)集,表中的每一行代表一次購買清單,注意我們只關(guān)心記錄出現(xiàn)與否,不關(guān)心某條記錄購買了幾次,如購買十盒牛奶也只計(jì)一次。數(shù)據(jù)記錄的所有項(xiàng)的集合稱為總項(xiàng)集,上表中

    作者:Hjiangxue
    2020-08-22 08:01:16
  • Spark基礎(chǔ)

    官方文檔:spark.apache.org/docs/latest ? Spark背景??? MapReduce局限性:??? 1>) 繁雜??????????? map/reduce (map

    作者:ycwyong
    2020-08-22 02:12:32
  • NEXT 2019:Hitachi Vantara的一場(chǎng)數(shù)據(jù)價(jià)值宣言

    Hitachi Vantara是一家為數(shù)據(jù)價(jià)值而生的公司。如果說2017年Hitachi Data System、Pentaho、Hitachi Insight Group三家公司的合并,標(biāo)志著Hit

    作者:大數(shù)據(jù)在線
    2020-08-20 12:13:12
  • Hive初識(shí)

    Hive產(chǎn)生背景: 在給大家講解Hive之前,我們要先熟悉下Hadoop的一些概念。 Hadoop可以分為一下幾個(gè)部分 HDFS hadoop的文件系統(tǒng),用于數(shù)據(jù)存儲(chǔ) MapReduc

    作者:昭帆
    2020-08-20 02:44:46
  • Storm筆記整理(二):Storm本地開發(fā)案例—總和計(jì)算與單詞統(tǒng)計(jì)

    [TOC] 概述 在Strom的API中提供了LocalCluster對(duì)象,這樣在不用搭建Storm環(huán)境或者Storm集群的情況下也能夠開發(fā)Storm的程序,非常方便。 基于Maven構(gòu)建工程項(xiàng)目,

    作者:xpleaf
    2020-08-18 16:18:06
  • spark源碼系列之累加器實(shí)現(xiàn)機(jī)制及自定義累加器

    一,基本概念 累加器是Spark的一種變量,顧名思義該變量只能增加。有以下特點(diǎn): 1,累加器只能在Driver端構(gòu)建及并只能是Driver讀取結(jié)果,Task只能累加。 2,累加器不會(huì)改變Spark L

    作者:鯨落大叔
    2020-08-17 09:31:05
  • 大數(shù)據(jù)之HBase基礎(chǔ)

    HBase簡(jiǎn)介1.1. 什么是HBaseHBase是一個(gè)高可靠性、高性能、面向列、可伸縮的分布式存儲(chǔ)系統(tǒng),利用HBase技術(shù)可在廉價(jià)PC Server上搭建起大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群。 HBase的目

    作者:鯨落大叔
    2020-08-17 07:07:52
  • Oracle樹查詢及相關(guān)函數(shù)

    Oracle樹查詢的最重要的就是select...start with... connect by ...prior 語法了。依托于該語法,我們可以將一個(gè)表形結(jié)構(gòu)的中以樹的順序列出來。在下面列述了Or

    作者:沙漏半杯
    2020-08-17 06:27:20
  • (第7篇)靈活易用易維護(hù)的hadoop數(shù)據(jù)倉庫工具——Hive

       Hivehive是基于Hadoop的一個(gè)數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供完整的sql查詢功能,Hive 定義了簡(jiǎn)單的類 SQL 查詢語言,稱為

    作者:I加加
    2020-08-14 11:20:37
香港云服務(wù)器