#

partitiner

  • 7.spark core之?dāng)?shù)據(jù)分區(qū)

    簡介 ??spark一個(gè)最重要的特性就是對(duì)數(shù)據(jù)集在各個(gè)節(jié)點(diǎn)的分區(qū)進(jìn)行控制??刂茢?shù)據(jù)分布可以減少網(wǎng)絡(luò)開銷,極大地提升整體性能。 ??只有Pair RDD才有分區(qū),非Pair RDD分區(qū)的值是None。如

    作者:菲立思教育
    2020-07-25 13:43:08