溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

發(fā)布時間:2020-06-13 19:37:32 來源:網(wǎng)絡(luò) 閱讀:237 作者:UCloud_TShare 欄目:云計算

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

2015年,UCloud在國內(nèi)云廠商中首先推出了K80-GPU云主機(jī)。此后,我們又相繼推出了P40、V100等GPU云主機(jī)、定制化物理機(jī)以及UAI-Train、UAI-Inference等以GPU為基礎(chǔ)的AI產(chǎn)品,為人工智能用戶持續(xù)創(chuàng)造價值。如今,我們更進(jìn)一步,推出專門的GPU可用區(qū)。通過對架構(gòu)精裁,其相比于普通可用區(qū),GPU價格降低20%,帶寬價格降低64%,并支持10G/25G物理網(wǎng)絡(luò)和VPC私有網(wǎng)絡(luò),憑借獨享性能、豐富產(chǎn)品互聯(lián)、自助購買、按月租賃,幫助用戶避免自行維護(hù)GPU集群做AI訓(xùn)練的高昂投入。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

目前,福建GPU可用區(qū)A已對全部用戶開放,并支持在控制臺直接購買下單。

降低20%成本,支持按月付費

GPU使用成本高,一方面是GPU卡本身非常昂貴,另一方面功耗與機(jī)柜成本幾乎占據(jù)了整體成本的40%,而這部分成本可以被有效降低。為此UCloud在國內(nèi)臻選電力成本較低且符合基礎(chǔ)標(biāo)準(zhǔn)的機(jī)房建立GPU可用區(qū)。此次上線的GPU可用區(qū)位于福建省,為省級骨干IDC機(jī)房,符合國際數(shù)據(jù)中心標(biāo)準(zhǔn)Tier3,提供移動線路。

UCloud的云計算核心原本為標(biāo)準(zhǔn)可用區(qū)設(shè)計,目的是支撐上萬級別的服務(wù)器,近百種不同的云計算服務(wù)。為了提升整體性價比,我們花費1周時間,便對GPU可用區(qū)快速進(jìn)行了定制,推出了一個全新版本的迷你型云計算核心,內(nèi)部代號“螞蟻”。“螞蟻”核心壓縮了超過50%的云控制面成本,依然能支撐起完整的物理云主機(jī)與網(wǎng)絡(luò)產(chǎn)品并提供穩(wěn)定的服務(wù)。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

受益于功耗、機(jī)柜、云計算核心攤銷成本的降低,GPU可用區(qū)的物理云單價比UCloud其他標(biāo)準(zhǔn)可用區(qū)都要便宜20%。以V100物理云為例,GPU可用區(qū)在北京二可用區(qū)E的列表單價降低5000元/月,和業(yè)內(nèi)相比也有突出的價格優(yōu)勢。UCloud亦提供更具性價比的GPU機(jī)型可供選擇。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線
降低20%成本,國內(nèi)首個GPU可用區(qū)上線

GPU可用區(qū)的計費模式與其他可用區(qū)一致,物理機(jī)支持按月與按年付費,可隨時釋放。用戶不必一次性投入巨大的開支,可自如增減集群規(guī)模,應(yīng)對市場的動態(tài)變化。此外,福建GPU可用區(qū)提供移動單線網(wǎng)絡(luò),帶寬費用比其他可用區(qū)降低64%。

最大單精浮點性能104 TFLOPs,獨享物理機(jī)

GPU可用區(qū)以成熟的物理云產(chǎn)品體系為依托。計算、存儲、網(wǎng)絡(luò)性能均沒有任何虛擬化帶來的額外開銷。這對AI訓(xùn)練這樣看重絕對性能的場景非常重要。

一臺GPU物理機(jī)最大能支持104 TFLOPs的單精度浮點性能,約等于2000顆CPU的算力。采用10G與25G兩套物理網(wǎng)絡(luò)環(huán)境。25G網(wǎng)絡(luò)帶來更高的集群運算效率,集群規(guī)?!?0臺計算節(jié)點時,均推薦采用25G。和普通可用區(qū)提供的GPU云主機(jī)相比,整體性能翻倍。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

物理云主機(jī)產(chǎn)品已實現(xiàn)后臺資源交付入庫、系統(tǒng)裝機(jī)等流程高度自動化,并支持多種鏡像、多種RAID模式可選。用戶直接在控制臺點選后就自動執(zhí)行裝機(jī)操作,30分鐘內(nèi)裝機(jī)完成即可使用,免去傳統(tǒng)物理機(jī)運輸、搭建、部署、調(diào)試等冗長過程。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

物理云主機(jī)裝機(jī)中

針對物理機(jī)難以避免的硬件故障隱患,UCloud硬件運維團(tuán)隊維護(hù)了詳細(xì)的固件問題列表,發(fā)現(xiàn)隱患會及時發(fā)起固件的全網(wǎng)升級;物理云主機(jī)在交付用戶前、用戶退還機(jī)器后均會自動執(zhí)行完整的硬件檢測。此外物理云集成了UCloud監(jiān)控平臺,通過監(jiān)控提前發(fā)現(xiàn)磁盤故障、GPU卡溫度過高等硬件問題,并通知NOC團(tuán)隊快速處理(7*24小時)。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

GPU物理云的網(wǎng)關(guān)有A/B兩套互備集群,網(wǎng)絡(luò)流量可在AB集群之間平滑切換。由于此架構(gòu),在主網(wǎng)關(guān)出現(xiàn)故障時能實現(xiàn)快速切換到備用網(wǎng)關(guān),最小化對用戶的影響;亦能通過集群切換實現(xiàn)網(wǎng)絡(luò)架構(gòu)的平滑升級。通過這套模式,北京地區(qū)的物理云集群實現(xiàn)了從10G網(wǎng)關(guān)到25G網(wǎng)關(guān)的在線動態(tài)升級,用戶除了低峰期網(wǎng)絡(luò)瞬斷外完全無感知。未來GPU可用區(qū)的網(wǎng)關(guān)也能通過這種能力不斷更新版本。

降低20%成本,國內(nèi)首個GPU可用區(qū)上線

物理云網(wǎng)關(guān)互備集群

豐富的產(chǎn)品互聯(lián)

GPU可用區(qū)支持標(biāo)準(zhǔn)的網(wǎng)絡(luò)產(chǎn)品,包括彈性EIP、私有網(wǎng)絡(luò)VPC、NAT網(wǎng)關(guān)等。未來計劃將上線高速通道UDPN,和廣州可用區(qū)互聯(lián)。

在AI訓(xùn)練場景下,TB級別的訓(xùn)練數(shù)據(jù)如何搬遷上云是用戶的核心訴求。UCloud提供高性能NAS盤柜寄送服務(wù),可支持最大100T的離線數(shù)據(jù)搬遷,傳輸作業(yè)完成后,會以低階格式化方式擦除數(shù)據(jù),以確保數(shù)據(jù)安全。

分布式訓(xùn)練場景下通常需要大容量的中央存儲節(jié)點。GPU可用區(qū)目前提供SSD磁盤的高性能物理機(jī)作為存儲節(jié)點。后續(xù)將提供UFS(分布式文件存儲)產(chǎn)品,給用戶提供最優(yōu)的存儲選擇。

對福建GPU可用區(qū)有任何建議和疑問,歡迎點擊http://ucloudtml.mikecrm.com/aiTDtNg垂詢。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI