作者:向師富 轉(zhuǎn)自:阿里巴巴數(shù)據(jù)中臺官網(wǎng)
https://dp.alibaba.com
概述數(shù)據(jù)抽取是指從源數(shù)據(jù)抽取所需要的數(shù)據(jù), 是構(gòu)建數(shù)據(jù)中臺的第一步。 數(shù)據(jù)源一般是
關(guān)系型數(shù)據(jù)庫,近幾年,隨著移動互聯(lián)網(wǎng)的蓬勃發(fā)展,出現(xiàn)了其他類型的數(shù)據(jù)源,典型的如網(wǎng)站瀏覽日期、APP瀏覽日志、IoT設(shè)備日志
從技術(shù)實現(xiàn)方式來講,從關(guān)系型數(shù)據(jù)庫獲取數(shù)據(jù),可以細分為全量抽取、增量抽取2種方式,兩種方法分別適用于不用的業(yè)務(wù)場景