溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

component的生命周期怎么理解

發(fā)布時(shí)間:2021-12-21 09:32:27 來源:億速云 閱讀:308 作者:iii 欄目:云計(jì)算

這篇文章主要介紹“component的生命周期怎么理解”,在日常操作中,相信很多人在component的生命周期怎么理解問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”component的生命周期怎么理解”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!

storm中的spout,bolt的生命周期,都是storm幫你管理好,你只要新建一個(gè)實(shí)例,指定該component的并行數(shù),就可以。那么topology中所用到的工具類的生命周期該如何處理,例如數(shù)據(jù)庫(kù)連接池、redis的連接池,這些對(duì)象該放在哪里初始化?本文以jdbc連接池為例,討論此問題。閱讀本文前請(qǐng)先自行了解storm topology的運(yùn)行流程。

Storm Component的生命周期

storm component泛指topoloty中的spout、bolt,是spout和bolt的一個(gè)統(tǒng)稱。而component生命周期,我結(jié)合storm作者nathanmarz大神的回答和自己的理解,描述一下:

1,當(dāng)提交了topology后,spout、bolt的實(shí)例會(huì)在本地機(jī)器(執(zhí)行storm submit所在的機(jī)器)上被創(chuàng)建,并且在本地序列化。另外,所有的component的構(gòu)造函數(shù)、declareOutputFields方法都本地會(huì)運(yùn)行一次。

2,整個(gè)topology被上傳到nimbus上。

3,對(duì)應(yīng)supervisor會(huì)向nimbus獲取序列化后的topology代碼,交給對(duì)應(yīng)的worker執(zhí)行。

4,每個(gè)worker執(zhí)行如下:反序列化代碼,運(yùn)行對(duì)應(yīng)component的prepare/open(初始化對(duì)應(yīng)的component)。舉個(gè)例子,某spout在topology中設(shè)置了3個(gè)并行度,且topology設(shè)置了3個(gè)worker,該open方法就會(huì)在3個(gè)不同的worker上分別調(diào)用1次,共調(diào)用3次。

5,worker通知executor不斷循環(huán)去跑nextTuple/execute方法。

需要注意一點(diǎn):component的初始化相關(guān)的操作應(yīng)放在prepare/open方法中執(zhí)行, 而不是在實(shí)例化component的時(shí)候進(jìn)行或者topology的main函數(shù)。

Jdbc Pool 初始化方案

參考component的生命周期,能想到有兩種方案:

1,每個(gè)component都維持一個(gè)與數(shù)據(jù)庫(kù)的連接,此種方案適合于寫操作非常頻繁,component數(shù)目比較少,且中間不會(huì)有一段時(shí)間沒有任何寫、讀操作,否則會(huì)發(fā)生mysql connection timeout;另外可省去從連接池獲取連接,用完連接后返回給連接池這兩步操作。如果確定這種方案,則只要將數(shù)據(jù)庫(kù)的配置放到config中,在對(duì)應(yīng)的component中初始化數(shù)據(jù)庫(kù)連接即可。

2,在每worker中維持一個(gè)連接池,worker中所有executor需要用到連接時(shí),從連接池中獲取,用后歸還。一般還是推薦這種方案。

下面說一下第二種方案的連接池,應(yīng)該在什么時(shí)候初始化。

首先明確一點(diǎn),在topology運(yùn)行中,一個(gè)worker相當(dāng)于jvm進(jìn)程,相當(dāng)于有N個(gè)worker,就會(huì)有N個(gè)連接池。初始化連接池的動(dòng)作需要在worker端進(jìn)行,一個(gè)worker中只有一個(gè)連接池的實(shí)例,適合用單例模式。

初始化思路:每個(gè)component接收數(shù)據(jù)庫(kù)配置信息,在其prepare/open時(shí),初始化連接池,這里需要保證在單個(gè)worker中只需要初始化一次就可以,即對(duì)初始化的代碼加鎖處理,保證只能有一個(gè)component初始化。

在storm源碼包中,提供了storm-jdbc的實(shí)現(xiàn),其中用了JDBC 連接池組件,具體實(shí)現(xiàn)思路就是上面討論的第二種方案。以下為初始化時(shí)加鎖的部分。

public class HikariCPConnectionProvider implements ConnectionProvider {

    private Map<String, Object> configMap;
    private transient HikariDataSource dataSource;

    public HikariCPConnectionProvider(Map<String, Object> hikariCPConfigMap) {
        this.configMap = hikariCPConfigMap;
    }

    @Override
    public synchronized void prepare() {
        if(dataSource == null) {
            Properties properties = new Properties();
            properties.putAll(configMap);
            HikariConfig config = new HikariConfig(properties);
            this.dataSource = new HikariDataSource(config);
            this.dataSource.setAutoCommit(false);
        }
    }

    @Override
    public Connection getConnection() {
        try {
            return this.dataSource.getConnection();
        } catch (SQLException e) {
            throw new RuntimeException(e);
        }
    }

    @Override
    public void cleanup() {
        if(dataSource != null) {
            dataSource.shutdown();
        }
    }
}

看到,初始化prepare被上鎖了,以保證只初始化一次。其實(shí)這里可以再優(yōu)化一下:不要對(duì)方法加鎖,而是對(duì)具體初始化連接的代碼加鎖,減少鎖影響的范圍。

到此,關(guān)于“component的生命周期怎么理解”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI