Sqoop底層運行的任務是將關系型數(shù)據(jù)庫中的數(shù)據(jù)導入到Hadoop集群中的HDFS或?qū)adoop集群中的數(shù)據(jù)導出到關系型數(shù)據(jù)庫中。具體來說,Sqoop會生成一個MapReduce作業(yè)來執(zhí)行數(shù)據(jù)傳輸任務。在導入任務中,Sqoop會將關系型數(shù)據(jù)庫中的數(shù)據(jù)按照分割規(guī)則劃分為若干個數(shù)據(jù)塊,并使用多個Map任務將數(shù)據(jù)塊同時導入到Hadoop集群中的HDFS中。在導出任務中,Sqoop會使用多個Map任務將Hadoop集群中的數(shù)據(jù)塊同時導出到關系型數(shù)據(jù)庫中。這樣可以充分利用Hadoop集群的分布式計算能力和數(shù)據(jù)處理能力,加快數(shù)據(jù)傳輸?shù)乃俣取?/p>