溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

騰訊朱華:數(shù)據(jù)中心下一個(gè)風(fēng)向的探索

發(fā)布時(shí)間:2020-08-05 12:31:32 來(lái)源:網(wǎng)絡(luò) 閱讀:794 作者:騰訊技術(shù) 欄目:數(shù)據(jù)庫(kù)

導(dǎo)讀:朱華,騰訊數(shù)據(jù)中心技術(shù)發(fā)展中心總監(jiān),中國(guó)工程建設(shè)標(biāo)準(zhǔn)化協(xié)會(huì)數(shù)據(jù)中心技術(shù)委員會(huì)副主任委員,中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)開放數(shù)據(jù)中心委員會(huì)數(shù)據(jù)中心工作組組長(zhǎng),榮獲中國(guó)工程建設(shè)標(biāo)準(zhǔn)化協(xié)會(huì)頒發(fā)的2018數(shù)據(jù)中心青年科技人才獎(jiǎng)。11月30日,朱華在2018數(shù)據(jù)中心年度峰會(huì)上發(fā)表了演講,以下為演講內(nèi)容。


騰訊朱華:數(shù)據(jù)中心下一個(gè)風(fēng)向的探索



談起數(shù)據(jù)中心下一個(gè)風(fēng)向的探索,我想借此回顧過往這十年,騰訊數(shù)據(jù)中心對(duì)技術(shù)發(fā)展的探索歷史。


一.騰訊數(shù)據(jù)中心十年技術(shù)探索史

1.一石多鳥的高壓直流

2008年到2010年,為了解決電力轉(zhuǎn)換效能的問題,我們?cè)邴}城電信趙老師實(shí)驗(yàn)室的基礎(chǔ)上,發(fā)起了240V高壓直流替代UPS的技術(shù)架構(gòu)改造項(xiàng)目。這是一個(gè)重構(gòu)低壓配電架構(gòu)的過程。起初我們步履維艱,而如今BAT已經(jīng)有數(shù)百萬(wàn)服務(wù)器運(yùn)行在這個(gè)配電架構(gòu)上了。

有意思的是,原本我們意在節(jié)能,結(jié)果獲得更大收益的是運(yùn)維的便利性和運(yùn)行的可靠性??v觀整個(gè)行業(yè),所有使用這個(gè)配電架構(gòu)的數(shù)據(jù)中心,從未因高壓直流出現(xiàn)嚴(yán)重問題而影響業(yè)務(wù),反觀UPS配電架構(gòu),故障頻出,經(jīng)常導(dǎo)致業(yè)務(wù)損失慘重。

2.初嘗標(biāo)準(zhǔn)化和產(chǎn)品化的甜頭——微模塊

2011年到2012年,我們完善微模塊的架構(gòu),解決了IT模塊內(nèi)的標(biāo)準(zhǔn)化和部分結(jié)構(gòu)產(chǎn)品化問題。微模塊改變了原先IT模塊內(nèi)的工程做法,顛覆了以往數(shù)據(jù)中心的建設(shè)分工界面和模式,甚至打破了產(chǎn)業(yè)原先的格局。到如今,每年微模塊的產(chǎn)量為約為5000套。

3.萬(wàn)法歸宗的諾曼底模型

到了2013年,騰訊的在青浦和深汕開展大規(guī)模數(shù)據(jù)中心建設(shè),需要規(guī)范大型(10-15萬(wàn)服務(wù)器規(guī)模)數(shù)據(jù)中心規(guī)劃設(shè)計(jì)的方法論。因此我們發(fā)起了一個(gè)代號(hào)“諾曼底模型”的探索項(xiàng)目。這個(gè)方法論,就是一套邏輯算法。它解決了一個(gè)最重要的問題——解釋每個(gè)數(shù)據(jù)中心建設(shè)需求的邏輯,讓需求提得明白,讓設(shè)計(jì)院畫圖畫得明白,讓總包建設(shè)得明白,讓運(yùn)營(yíng)方接管得明白。所有項(xiàng)目從建筑到機(jī)電建設(shè)都是一個(gè)統(tǒng)一標(biāo)準(zhǔn)。這樣也就讓甲方、設(shè)計(jì)院、總包、驗(yàn)收方等所有相關(guān)方理解一致,方向一致,把數(shù)據(jù)中心當(dāng)成一個(gè)標(biāo)準(zhǔn)的工業(yè)品而不是一個(gè)獨(dú)特的藝術(shù)孤品。

4.制冷設(shè)備要去水化、去工程化、產(chǎn)品化,更要本土化

早期騰訊在天津嘗試了airside freecooling的技術(shù),這個(gè)技術(shù)在美國(guó)較為成熟,但是到了中國(guó)卻表現(xiàn)出水土不服:空氣中的有害物質(zhì)直接進(jìn)入機(jī)房,損耗了IT設(shè)備。怎樣才能既充分利用外界的冷量,同時(shí)又不讓IT設(shè)備直接暴露在外?2015年我們?cè)谫F陽(yáng)實(shí)驗(yàn)室引進(jìn)了中國(guó)第一套來(lái)自德國(guó)GEA的空空換熱的制冷設(shè)備,并對(duì)其做了適應(yīng)中國(guó)的技術(shù)改造,從而大獲成功。這種技術(shù)交換熱量而非交換物質(zhì)——它通過工程高分子材料或者金屬材料,使內(nèi)部空氣和外部空氣進(jìn)行熱量交換,但是氣體卻是隔離的。如今,這種設(shè)備已經(jīng)完全可由中國(guó)制造,在效率上不輸于進(jìn)口產(chǎn)品,成本卻是完全折半的。行業(yè)已經(jīng)大規(guī)模應(yīng)用,整個(gè)產(chǎn)業(yè)鏈也已興起。這種技術(shù)的探索成功,收獲遠(yuǎn)不止節(jié)能本身。由于這種間接制冷的方式是去水化、去工程化的,所以它放棄了大型的水冷機(jī)組,也就是去掉了錯(cuò)綜復(fù)雜管路工程。我們的制冷設(shè)備終于走上產(chǎn)品化的道路!

5.?dāng)?shù)據(jù)中心整體標(biāo)準(zhǔn)化和產(chǎn)品化的產(chǎn)物:T-block

實(shí)現(xiàn)制冷設(shè)備的產(chǎn)品化,讓我們有機(jī)會(huì)探索數(shù)據(jù)中心整體產(chǎn)品化。2016年我們推出了T-block技術(shù),設(shè)計(jì)了制冷方倉(cāng)、IT方倉(cāng)、電力方倉(cāng)、中壓方倉(cāng),整個(gè)產(chǎn)業(yè)鏈也隨之跟進(jìn)。至此,數(shù)據(jù)中心能夠以完全產(chǎn)品化的方式進(jìn)行建設(shè)和交付。

6.諾曼底模型再進(jìn)化—— Tbase模型

2018年,為配合全國(guó)的拿地大規(guī)模自建,我們將“諾曼底模型”方法論進(jìn)化為新的大型和超大型園區(qū)的建設(shè)方法論——“Tbase模型”,以應(yīng)對(duì)30萬(wàn)服務(wù)器及以上規(guī)模的數(shù)據(jù)中心規(guī)劃和設(shè)計(jì)。


騰訊朱華:數(shù)據(jù)中心下一個(gè)風(fēng)向的探索



這十年的探索,我們一直堅(jiān)持走模塊化、標(biāo)準(zhǔn)化、產(chǎn)品化的道路。這是一個(gè)漸進(jìn)的過程,也伴隨著產(chǎn)業(yè)鏈的跟進(jìn)和培養(yǎng)。重構(gòu)傳統(tǒng)的架構(gòu)、顛覆傳統(tǒng)的建設(shè)方式的路上充滿著不為人道的艱辛。 


二.騰訊數(shù)據(jù)中心技術(shù)發(fā)展未來(lái)探索方向

1.人工智能時(shí)代對(duì)數(shù)據(jù)存儲(chǔ)、計(jì)算、運(yùn)輸?shù)母咭?/span>

至此,在硬件層面,我們似乎已經(jīng)到了一個(gè)自我突破的瓶頸和天花板,其實(shí)不然。數(shù)據(jù)中心作為基礎(chǔ)服務(wù)工業(yè),會(huì)面臨一個(gè)新的發(fā)展時(shí)期——萬(wàn)物互聯(lián)的人工智能時(shí)代。以往這些年,熱度極高的云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)的發(fā)展,其實(shí)都是為了這個(gè)萬(wàn)物互聯(lián)的人工智能時(shí)代做了嫁衣,為這個(gè)時(shí)代的橫空出世奠定了基礎(chǔ)。

人工智能的實(shí)現(xiàn),依存于幾個(gè)基礎(chǔ)條件:①海量的存儲(chǔ)能力②更先進(jìn)的算法③大容量、大帶寬的通信信道。大數(shù)據(jù)作為人工智能的原始依據(jù),云計(jì)算進(jìn)行高能計(jì)算和存儲(chǔ),物聯(lián)網(wǎng)提供無(wú)所不在的數(shù)據(jù)采集場(chǎng)景,5G以極低時(shí)延的進(jìn)行高速傳送。

2.春江水暖鴨先知——互聯(lián)網(wǎng)巨頭迎戰(zhàn)新時(shí)代

最近阿里和騰訊的組織架構(gòu)調(diào)整,從名字上都能看出端倪:阿里新成立的BG名字后面加了”智能”。而騰訊云調(diào)整后,BG名字加上了“智慧產(chǎn)業(yè)”。自此云不再是獨(dú)立的存在,而是帶著應(yīng)用場(chǎng)景的存在。應(yīng)用場(chǎng)景是做增量,而過往我們大部分是做存量。存量意味著對(duì)原有IT的關(guān)停并轉(zhuǎn),伴隨著大量改造和遷移的艱難困苦。過程量終究是過程量,成敗之關(guān)鍵在落地的產(chǎn)業(yè)。

3.?dāng)?shù)據(jù)中心管理軟件發(fā)展的階段:從門面、輔助管理轉(zhuǎn)向生產(chǎn)管理

面臨新的機(jī)遇,數(shù)據(jù)中心作為一個(gè)行業(yè)的分支,實(shí)現(xiàn)萬(wàn)物互聯(lián)的人工智能數(shù)據(jù)中心,需要軟硬兩手。硬件已經(jīng)準(zhǔn)備得七七八八了,那么軟件呢?數(shù)據(jù)中心,我們真正的需要什么樣的智能大腦?無(wú)人值守和人工智能的平臺(tái),需要具備哪些先決條件以及能夠落地的場(chǎng)景?這是我們需要探索和實(shí)踐的下一個(gè)方向。

在這里,先回顧一下以往的發(fā)展情況。我羅列了數(shù)據(jù)中心管理軟件平臺(tái)發(fā)展的三個(gè)階段,總結(jié)來(lái)看,過往發(fā)展得很艱苦。


第一個(gè)階段是在2000-2010年,這時(shí)候的典型代表產(chǎn)品,就是動(dòng)環(huán)以及機(jī)房3D呈現(xiàn),市場(chǎng)的總價(jià)值在1-10個(gè)億。我們的甲方也沒有重視這一塊,從常用的招投標(biāo)模式就可以看出,這通常是放在總包里一帶而過。廠商們更注重以酷炫的3D視覺效果去掙得甲方的眼球,并無(wú)實(shí)用。這段時(shí)期,我歸納為“門面系統(tǒng)階段”。


第二個(gè)階段,2011-至今,這個(gè)時(shí)期的典型代表產(chǎn)品,就比較豐富。DCOM、DCIM、DCSM、DCRM開始從設(shè)備、人、流程的角度去把控信息,并且以數(shù)據(jù)和報(bào)表呈現(xiàn),去進(jìn)行設(shè)備健康管理、資產(chǎn)管理、簡(jiǎn)單的成本和容量管理。市場(chǎng)的總價(jià)值在10-50億。甲方也開始獨(dú)立地準(zhǔn)備技術(shù)規(guī)格書,獨(dú)立分包和招投標(biāo)。這段時(shí)期,我歸納為“輔助管理系統(tǒng)階段”。


第三個(gè)階段,就是我們大家需要一起去探索和努力達(dá)到的,結(jié)合數(shù)據(jù)中心的硬件產(chǎn)品,它的市場(chǎng)的價(jià)值或可超過1000億。這個(gè)時(shí)期,我把它歸納為“生產(chǎn)管理系統(tǒng)階段“。它將再一次顛覆運(yùn)維的大部分模式、習(xí)慣以及組織分工界面。少人值守、無(wú)人值守、人工智能將數(shù)據(jù)中心的運(yùn)維管理系統(tǒng)提升到生產(chǎn)管理系統(tǒng),其重要性不可同日而語(yǔ)。


騰訊朱華:數(shù)據(jù)中心下一個(gè)風(fēng)向的探索



4.整裝待發(fā)的產(chǎn)業(yè)鏈

產(chǎn)業(yè)鏈對(duì)于新時(shí)代到來(lái)的準(zhǔn)備充分嗎?首先我們來(lái)看各種傳感器的準(zhǔn)備情況:這個(gè)時(shí)代,我們需要大量的便于部署的傳感器,來(lái)當(dāng)我們的眼睛和耳朵,我們需要無(wú)線且無(wú)源的,大家看,從測(cè)溫、測(cè)速、測(cè)噪音、測(cè)定位、測(cè)污染以及熱成像,甚至各種控制器、執(zhí)行機(jī)構(gòu)都應(yīng)有盡有,產(chǎn)業(yè)已經(jīng)張開懷抱迎接我們的探索和革新了。

5.無(wú)人值守的應(yīng)用場(chǎng)景:安保、巡檢、設(shè)備的監(jiān)與控

① 安保:

這里我們簡(jiǎn)單列舉幾個(gè)人工智能無(wú)人值守的應(yīng)用場(chǎng)景:我們從人力比較密集的安保人員開始,向科技要人力,減少安防人員眼看、手摸、跑腿等工作。事前,我們使用安防安保機(jī)器人,大量部署高清視頻攝像頭,通過主動(dòng)監(jiān)控防御,提前劃定監(jiān)控區(qū)域,界定重要物品監(jiān)控列表,對(duì)火災(zāi)重點(diǎn)防范區(qū)域進(jìn)行布控。事中,我們通過算法對(duì)人的行為進(jìn)行預(yù)判,對(duì)可疑人員、可疑物資進(jìn)行預(yù)警。事后,我們可以快速分析和提取數(shù)據(jù)。有著人工智能的機(jī)器人,比人更可靠,比人更吃苦耐勞而不知疲倦和躲懶。這一個(gè)場(chǎng)景的應(yīng)用,我們的目標(biāo)是在超大型園區(qū)減少一半的安保人員配備。


騰訊朱華:數(shù)據(jù)中心下一個(gè)風(fēng)向的探索



② 巡檢:除安保外,人工智能的應(yīng)用可以取代部分日常巡檢的工作,這些帶著各種傳感能力的機(jī)器人可以在日常巡檢中實(shí)時(shí)傳遞視頻、聲音、味道,這些信息傳輸?shù)胶笈_(tái)與基礎(chǔ)設(shè)施原先的采集數(shù)據(jù)進(jìn)行比對(duì)和有益補(bǔ)充。這個(gè)場(chǎng)景的應(yīng)用,我們的目標(biāo)是減配基礎(chǔ)設(shè)施巡檢人員近三成。


③ 設(shè)備的監(jiān)與控:實(shí)現(xiàn)無(wú)人值守,需要大量的自動(dòng)化執(zhí)行機(jī)構(gòu),這是我們重點(diǎn)強(qiáng)化的區(qū)域。最近,我考察了很多的設(shè)備廠家,對(duì)于電力的自控,我們現(xiàn)在可以使用電操,操控列頭柜的開關(guān),使其能夠按照我們的指令執(zhí)行機(jī)柜的開關(guān)電。在演練或者大面積故障時(shí),從中壓側(cè)一直到低壓側(cè),從柴油發(fā)電機(jī)到機(jī)柜都可以做到遠(yuǎn)程自動(dòng)執(zhí)行。

實(shí)現(xiàn)無(wú)人值守和人工智能,有一個(gè)特別切題的應(yīng)用場(chǎng)景,這就是制冷自動(dòng)控制場(chǎng)景。在間接制冷產(chǎn)品化后,空調(diào)去水了,從原先異常復(fù)雜繁多的控制器件,簡(jiǎn)化到數(shù)十個(gè)控制器件,大大降低了自控和智能的門檻。我們可以根據(jù)不同地域、不同場(chǎng)地,優(yōu)化我們的算法,實(shí)現(xiàn)精細(xì)化管理,把制冷的狀況調(diào)整的最優(yōu),實(shí)現(xiàn)節(jié)能和穩(wěn)定的運(yùn)維環(huán)境。這是一個(gè)重點(diǎn),同時(shí)也是我們探索的關(guān)鍵。


針對(duì)設(shè)備監(jiān)控管理,我這里列舉一個(gè)電池健康管理的案例。眾所周知,數(shù)據(jù)中心里所有的設(shè)備可以分為三個(gè)大類,一個(gè)是化學(xué)類,一個(gè)是電子類,一個(gè)是機(jī)械類?;瘜W(xué)類的是最容易也是最快進(jìn)入故障高發(fā)階段的,而且化學(xué)類的設(shè)備一旦出現(xiàn)故障是最要命的。而對(duì)電池的設(shè)備健康管理是最典型的對(duì)“化學(xué)類”設(shè)備的管理。我們采集電池的電壓、內(nèi)阻、溫度三個(gè)狀態(tài)量,20秒一次,一天就是一萬(wàn)多條數(shù)據(jù),一年就是差不多5百萬(wàn)條數(shù)據(jù)。一條數(shù)據(jù)是個(gè)點(diǎn),一系列數(shù)據(jù)就是線,我們現(xiàn)在監(jiān)測(cè)近10萬(wàn)個(gè)電池,那就是一個(gè)異常龐大的數(shù)據(jù)立面。這個(gè)時(shí)候,我們可以不用人為的經(jīng)驗(yàn)來(lái)判斷,可以顛覆原先的因果關(guān)系,直接憑借這個(gè)立體的海量數(shù)據(jù)來(lái)判斷這個(gè)電池是否存在異常,是否要更換。平臺(tái)可以直接發(fā)出處理的指令,防患于未然。


《黃帝內(nèi)經(jīng)》說(shuō)道:“是故圣人不治已病治未病,不治已亂治未亂?!泵鎸?duì)海量巨型復(fù)雜的數(shù)據(jù)中心,現(xiàn)在的人類的科學(xué)人工智能的方式,正是體現(xiàn)了這種事前管理,消除隱患于未然的古人思想之精髓。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI