溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何理解Fedlearner

發(fā)布時(shí)間:2021-11-23 10:34:17 來(lái)源:億速云 閱讀:237 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)如何理解Fedlearner,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

Fedlearner

這次頭條開(kāi)源的Fedlearner與我之前分析過(guò)得華為、微眾的聯(lián)邦機(jī)器學(xué)習(xí)平臺(tái)有什么不同呢?主要體現(xiàn)在以下幾個(gè)方面:

  1. 產(chǎn)品化:Fedlearner的代碼里有大量的js、Html模塊,也是第一次讓我們可以直觀的看到聯(lián)邦機(jī)器學(xué)習(xí)平臺(tái)大概是什么樣的,如果做成產(chǎn)品需要長(zhǎng)成什么樣。

  2. 業(yè)務(wù)多樣化:之前華為、微眾更多地強(qiáng)調(diào)聯(lián)邦機(jī)器學(xué)習(xí)在風(fēng)控業(yè)務(wù)的落地。頭條開(kāi)始強(qiáng)調(diào)聯(lián)邦學(xué)習(xí)在推薦、廣告等業(yè)務(wù)中的落地,并且給了很明確的數(shù)據(jù),在某教育業(yè)務(wù)板塊廣告投放效果增加209%。

  3. 可輸出性:如果說(shuō)之前的聯(lián)邦機(jī)器學(xué)習(xí)平臺(tái)更多地從理論層面做介紹,這一次字節(jié)的Fedlearner強(qiáng)調(diào)了可輸出性,比如為了保持聯(lián)邦建模雙方的環(huán)境一致性,通過(guò)K8S的部署模式快速拉起和管理集群。這是為ToB對(duì)外輸出服務(wù)做技術(shù)準(zhǔn)備。

下面分別介紹下Fedlearner在這三方面的一些工作。

Fedlearner產(chǎn)品化工作

如何理解Fedlearner

以推薦廣告業(yè)務(wù)為例,聯(lián)邦機(jī)器學(xué)習(xí)平臺(tái)的廣告主和平臺(tái)方應(yīng)該各自管理一套模型展示服務(wù)和模型訓(xùn)練服務(wù)。 

需要有兩套協(xié)議保證客戶的聯(lián)邦建模,一套是數(shù)據(jù)一致性問(wèn)題。比如在縱向聯(lián)邦學(xué)習(xí)場(chǎng)景下,用戶在頁(yè)面上點(diǎn)擊了某個(gè)廣告,平臺(tái)方和廣告主各自會(huì)捕獲一部分日志。如何能實(shí)時(shí)的保證這兩部分捕獲的日志的一致性,并且拼接成訓(xùn)練樣本,需要一套實(shí)時(shí)數(shù)據(jù)樣本拼接協(xié)議。

另一個(gè)協(xié)議是多方數(shù)據(jù)安全協(xié)議。比如AB兩個(gè)業(yè)務(wù)方,A有4億用戶,B有3億用戶,如何做到通過(guò)某種方式找到A和B的交叉用戶,并且不讓A和B互相猜到對(duì)方的數(shù)據(jù),需要有一套多方數(shù)據(jù)安全協(xié)議。

基于以上兩套協(xié)議,在雙方聯(lián)合建模過(guò)程中,使用GRPC通信,利用TensorFlow做雙方梯度的交換進(jìn)行聯(lián)合建模。

如何理解Fedlearner

業(yè)務(wù)多樣性

 聯(lián)邦機(jī)器學(xué)習(xí)的最大業(yè)務(wù)場(chǎng)景在推薦廣告,這個(gè)我在一年前的文章中有預(yù)測(cè)過(guò)。果然頭條特別強(qiáng)調(diào)了推薦場(chǎng)景的應(yīng)用。他提到了推薦業(yè)務(wù)更適合神經(jīng)網(wǎng)絡(luò)算法,風(fēng)控業(yè)務(wù)適合樹(shù)形算法。作者也比較認(rèn)同這樣的說(shuō)法,因?yàn)轱L(fēng)控需要高可解釋性,樹(shù)形算法天然滿足這樣的需求。而推薦業(yè)務(wù)對(duì)模型可解釋性要求不高,神經(jīng)網(wǎng)絡(luò)算法的復(fù)雜性可以充分保證推薦排序算法的準(zhǔn)確率。

Fedlearner業(yè)務(wù)負(fù)責(zé)人給了一組數(shù)字可以證明聯(lián)邦機(jī)器學(xué)習(xí)在推薦業(yè)務(wù)中的落地效果。

這組數(shù)組還是非常有說(shuō)服力的。其實(shí)對(duì)于新技術(shù),很多時(shí)候面對(duì)的壁壘不是技術(shù)問(wèn)題,而是如何證明業(yè)務(wù)價(jià)值,需要第一個(gè)吃螃蟹的人,才能推動(dòng)新技術(shù)在行業(yè)的落地。聯(lián)邦機(jī)器學(xué)習(xí)在推薦廣告業(yè)務(wù)中大有可為。

可輸出性

 Fedlearner采用的是一套云原生的部署方案。數(shù)據(jù)存放在HDFS,用MySQL存儲(chǔ)系統(tǒng)數(shù)據(jù)。通過(guò)Kubernetes管理和拉起任務(wù)。每個(gè)Fedlearner的訓(xùn)練任務(wù)需要參與雙方同時(shí)拉起K8S任務(wù),通過(guò)Master節(jié)點(diǎn)統(tǒng)一管理,Worker建實(shí)現(xiàn)通信。

這套方案充分考慮了當(dāng)前做推薦業(yè)務(wù)的用戶的數(shù)倉(cāng)兼容性,因?yàn)榇蟛糠挚蛻舻臄?shù)倉(cāng)體系還是Hadoop生態(tài),數(shù)據(jù)存儲(chǔ)在HDFS。同時(shí)用K8S又最大限度的保證了聯(lián)合建模雙方計(jì)算引擎環(huán)境的一致性。

上述就是小編為大家分享的如何理解Fedlearner了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI