延遲操作(Delayed Operations)是指Spark中的轉(zhuǎn)換操作(transformation)不會(huì)立即執(zhí)行,而是等到觸發(fā)動(dòng)作操作(action)時(shí)才會(huì)被執(zhí)行。這樣的延遲執(zhí)行可以幫助Spark優(yōu)化執(zhí)行計(jì)劃,提高性能。常見(jiàn)的延遲操作包括map、filter、reduce等轉(zhuǎn)換操作,而觸發(fā)動(dòng)作包括collect、count、save等。通過(guò)延遲操作,Spark可以根據(jù)需要構(gòu)建一個(gè)完整的執(zhí)行計(jì)劃圖,然后一次性執(zhí)行,避免了頻繁的數(shù)據(jù)傳輸和計(jì)算。