溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

Linux服務(wù)器怎么搭建nvidia-docker環(huán)境

發(fā)布時(shí)間:2020-07-27 09:31:44 來(lái)源:億速云 閱讀:139 作者:小豬 欄目:開(kāi)發(fā)技術(shù)

小編這次要給大家分享的是Linux服務(wù)器怎么搭建nvidia-docker環(huán)境,文章內(nèi)容豐富,感興趣的小伙伴可以來(lái)了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

docker相當(dāng)于一個(gè)容器,其可以根據(jù)你所需要的運(yùn)行環(huán)境構(gòu)建相應(yīng)的運(yùn)行環(huán)境,此時(shí)各個(gè)環(huán)境之間彼此隔離,就不會(huì)存在在需要跑一個(gè)新的代碼的時(shí)候破壞原來(lái)跑的代碼所需要的環(huán)境,各個(gè)環(huán)境之間彼此隔離開(kāi),好像一個(gè)個(gè)容器將其隔離開(kāi)一樣

由于docker只針對(duì)在CPU上面跑的情況,對(duì)于需要在GPU上面運(yùn)行的服務(wù)器,其提供了一個(gè)nvidia-docker

sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP docker

對(duì)于怎么在服務(wù)器子賬戶(hù)上面搭建nvidia-docker,在百度上個(gè)個(gè)地方講的都不一樣,因此,在谷歌上查閱了相關(guān)的文檔之后,將在服務(wù)器子賬戶(hù)上搭建nvidia-docker的方法陳列如下

簡(jiǎn)單的來(lái)說(shuō),要安裝nvidia-docker總共的步驟分為三步:

Install NVIDIA driver
Install docker
Install nvidia-docker

安裝顯卡驅(qū)動(dòng)

對(duì)于我們的服務(wù)器甚至大多數(shù)服務(wù)器來(lái)說(shuō),這一步都是在裝機(jī)的時(shí)候必備的,因此這一步我們直接忽略,具體問(wèn)題可以百度

安裝docker

docker有兩種可用的版本:社區(qū)辦(CE)和企業(yè)版(EE),正如英偉達(dá)顯卡驅(qū)動(dòng)器,我們需要知道linux版本來(lái)選擇合適的安裝文件,以下的安裝版本是在ubuntu16.04上面安裝社區(qū)版

安裝docker步驟如下

首先,我們需要將存在于電腦上的老的版本的docker移除,如果你可以確定這是你第一次在你的機(jī)器上安裝docker,那么這一步就可以省略,否則你最好執(zhí)行一下以下的命令

sudo apt-get remove docker docker-engine docker.io

如果docker沒(méi)有在你的機(jī)器上安裝,那么apt-get將會(huì)告訴你這個(gè)問(wèn)題

接下來(lái),我們將安裝docker,推薦從repository(知識(shí)庫(kù))里面安裝docker,這樣可以實(shí)現(xiàn)當(dāng)新的版本出現(xiàn)的時(shí)候,我們也可以從repository里面很容易的獲得更新

我們?yōu)榱藦膔epository里面安裝docker,我們需要首先建立docker repository,通常,我們需要更新apt包

更新apt package index

sudo apt-get update

然后,安裝軟件包以允許apt通過(guò)HTTP

sudo apt-get install \
  apt-transport-https \
  ca-certificates \
  curl \
  software-properties-common

接下來(lái),加入docker的官方GPG密鑰

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo pt-key add -

驗(yàn)證下列指令輸出的是9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88

sudo apt-key fingerprint 0EBFCD88

接下來(lái),通過(guò)運(yùn)行下面的指令告訴apt用stable repository

sudo add-apt-repository \
"deb [arch=amd64] https://download.docker.com/linux/ubuntu \
(usb_release -cs) \
stable"

在這里,我們就已經(jīng)完成了對(duì)知識(shí)庫(kù)的建立,接下來(lái),我們將更新apt package index并且安裝Docker CE

sudo apt-get update && apt-get install docker-ce

然后這一步過(guò)后就是,等待安裝等待安裝,會(huì)下載很久,繼續(xù)等待

安裝完docker之后,當(dāng)然我們需要驗(yàn)證一下我們所安裝的是否成功

利用著名的hello-world 鏡像來(lái)測(cè)驗(yàn)我們安裝的docker是否成功

sudo docker run hello-world

Linux服務(wù)器怎么搭建nvidia-docker環(huán)境

如果得到如下的界面,證明docker安裝成功

安裝nvidia-docker

在下一步,我們將通過(guò)安裝nvidia-docker來(lái)完成我們的工作,其是在docker中的一個(gè)plug來(lái)幫助容器在GPU環(huán)境下的使用

首先,我們需要將已有的nvidia-docker移除

docker volume ls -q -f driver=nvidia-docker |xargs -r -I{} -n1 docker ps -q -a -f volum={} | xargs -r docker
sudo apt-get purge -y nvidia-docker

以前沒(méi)有安裝過(guò)的話(huà)這一步可以直接跳過(guò)

接下來(lái),我們將加入必要的repository,然后更新apt package index

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -

curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu16.04/amd64/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update

最后,我們將安裝nvidia-docker

sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

安裝成功之后,對(duì)我們所安裝的nvidia-docker進(jìn)行驗(yàn)證

docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi

如果這是你第一次用如下的指令,你可以看到docker正在嘗試下載一些東西

Linux服務(wù)器怎么搭建nvidia-docker環(huán)境

到這里,整個(gè)安裝步驟全部結(jié)束了

號(hào)外!在有一次服務(wù)器顯卡崩了之后,重新安裝顯卡驅(qū)動(dòng)之后,竟然“驚喜”地發(fā)現(xiàn)我的nvidia-docker環(huán)境竟然不在了,但是輸入

docker version

時(shí)顯示docker是存在的,因此就只需要按照前面的安裝步驟安裝nvidia-docker就可以,安裝成功之后會(huì)發(fā)現(xiàn)之前根據(jù)dockerfile搭建的實(shí)驗(yàn)環(huán)境仍然是在的,萬(wàn)幸!

看完這篇關(guān)于Linux服務(wù)器怎么搭建nvidia-docker環(huán)境的文章,如果覺(jué)得文章內(nèi)容寫(xiě)得不錯(cuò)的話(huà),可以把它分享出去給更多人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI