您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)Spark2.4.0有什么功能的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。
SparkCore 和 SQL
增加了Barrier ExecutionMode,可以更好的和深度學(xué)習(xí)的框架整合
同時(shí)引入了 30+ 內(nèi)置函數(shù)和 higher-order函數(shù)可以處理更復(fù)雜的數(shù)據(jù)類(lèi)型
改善了與k8s的整合
支持scala 2.12
內(nèi)置支持了Avro格式數(shù)據(jù)源,這個(gè)感情好,后面浪尖給出測(cè)試案例,以后有pb的支持那就更好了。
性能和穩(wěn)定性
這個(gè)優(yōu)化比較多,值得關(guān)注
Connector優(yōu)化
這個(gè)優(yōu)化主要是Parquet,orc,csv及avro等的優(yōu)化升級(jí)
MLlib
MLlib支持了圖像格式的數(shù)據(jù)源
StructuredStreaming
使用foreachBatch(支持Python,Scala和Java)將每個(gè)微批的輸出行暴露為DataFrame。
為Python API 增加了foreach 和 ForeachWriter
支持使用“kafka.isolation.level”讀取使用事務(wù)的生產(chǎn)者生產(chǎn)到kafka topic的已提交消息。
感謝各位的閱讀!關(guān)于“Spark2.4.0有什么功能”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。