溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Ubuntu上如何安裝CUDA

發(fā)布時(shí)間:2022-10-27 09:26:06 來(lái)源:億速云 閱讀:517 作者:iii 欄目:服務(wù)器

本篇內(nèi)容介紹了“Ubuntu上如何安裝CUDA”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

安裝過(guò)程:

一、安裝、熟悉ubuntu16.04系統(tǒng)

安裝軟件之前最好對(duì)ubuntu的命令行有一些基本的了解,像sudo、cd、ls、nona、cat、chmod等等,這樣能夠在安裝過(guò)程中省去很多不必要的麻煩。

二、檢查自己的電腦環(huán)境是否具備安裝cuda的條件

1) 驗(yàn)證自己的電腦是否有一個(gè)可以支持cuda的gpu

你可以電腦的配置信息中找到顯卡的具體型號(hào),如果你是雙系統(tǒng),在windows下的設(shè)備管理器中也可以查到顯卡的詳細(xì)信息;
你也可以在ubuntu的終端中輸入命令: $ lspci | grep -i nvidia ,會(huì)顯示出你的nvidia gpu版本信息,不過(guò)不是很詳細(xì)。

我的顯示為(geforcegt630m):

01:00.0 3d controller: nvidia corporation gf117m [geforce 610m/710m/810m/820m / gt 620m/625m/630m/720m] (rev a1)

然后去cuda的查看自己的gpu版本是否在cuda的支持列表中。

2) 驗(yàn)證自己的linux版本是否支持 cuda(ubuntu 16.04沒(méi)問(wèn)題)

輸入命令:

$ uname -m && cat /etc/*release

結(jié)果顯示:

x86_64
distrib_id=ubuntu
distrib_release=16.04

......

3) 驗(yàn)證系統(tǒng)是否安裝了gcc

在終端中輸入: $  gcc –version     

結(jié)果顯示:

gcc (ubuntu 5.4.0-6ubuntu1~16.04.5) 5.4.0 20160609
......

若未安裝請(qǐng)使用下列命令進(jìn)行安裝:

sudo apt-get install build-essential

4) 驗(yàn)證系統(tǒng)是否安裝了kernel header和 package development

a、查看正在運(yùn)行的系統(tǒng)內(nèi)核版本:

在終端中輸入: $  uname –r

結(jié)果顯示:

4.10.0-40-generic

b、在終端中輸入:$  sudo apt-get install linux-headers-$(uname -r)

可以安裝對(duì)應(yīng)kernel版本的kernel header和package development

結(jié)果顯示:

......

升級(jí)了 0 個(gè)軟件包,新安裝了 0 個(gè)軟件包,要卸載 0 個(gè)軟件包,有 4 個(gè)軟件包未被升級(jí)。

表示系統(tǒng)里已經(jīng)有了,不用重復(fù)安裝。

若以上各項(xiàng)驗(yàn)證檢查均滿足要求,便可進(jìn)行下面的正式安裝過(guò)程。如果沒(méi)有滿足要求的話,可以參考cuda的官方文檔,里面有詳細(xì)的針對(duì)每個(gè)問(wèn)題的解決方案。

三、選擇安裝方式

cuda提供兩種安裝方式:package manager安裝和runfile安裝, package manager 安裝方式相對(duì)簡(jiǎn)單一些,但是我在閱讀別人博客的過(guò)程中發(fā)現(xiàn)選擇這種方式在安裝過(guò)程中問(wèn)題可能多一點(diǎn),失敗的概率較大。為了減少不必要的麻煩我選擇runfile安裝方式。
下載cuda安裝包:cuda官網(wǎng)下載,根據(jù)系統(tǒng)信息選擇對(duì)應(yīng)的版本,runfile安裝的話最后一項(xiàng)要選擇 runfile文件。

下載完后,用md5 檢驗(yàn),如果序號(hào)不和,得重新下載(由于當(dāng)時(shí)沒(méi)有保存,這里我采用了別人的截圖,注意這里的cuda版本號(hào),人家采用的cuda_8.0)

輸入命令:$  md5sum cuda_9.0.176_linux.run

Ubuntu上如何安裝CUDA

四、runfile安裝cuda

1) 禁用 nouveau驅(qū)動(dòng)

終端中運(yùn)行:$  lsmod | grep nouveau,如果有輸出則代表nouveau正在加載。需要我們手動(dòng)禁掉nouveau。

ubuntu的nouveau禁用方法:

a、在/etc/modprobe.d中創(chuàng)建文件blacklist-nouveau.conf

輸入命令:$  sudo vi /etc/modprobe.d/blacklist-nouveau.conf (利用vi編輯器編輯和保存文件)

在文件中輸入一下內(nèi)容:

blacklist nouveau
options nouveau modeset=0

b、執(zhí)行:

$ sudo update-initramfs –u

c、再執(zhí)行:

$ lsmod | grep nouveau

若無(wú)內(nèi)容輸出,則禁用成功,若仍有內(nèi)容輸出,請(qǐng)檢查操作,并重復(fù)上述操作。

注:vi是linux終端下或控制臺(tái)下常用的編輯器,基本的操作方式為:vi /路徑/文件名
例如:vi /etc/fstab表示顯示/etc/fstab文件的內(nèi)容。使用鍵盤(pán)上的page up和page down鍵可以上下翻頁(yè);按下insert鍵,可以見(jiàn)到窗口左下角有“insert”字樣,表示當(dāng)前為插入編輯狀態(tài),這時(shí)從鍵盤(pán)輸入的內(nèi)容將插入到光標(biāo)位置;再按下insert鍵,左下角將有“replace”字樣,表示當(dāng)前為替換編輯狀態(tài),這時(shí)從鍵盤(pán)輸入的內(nèi)容將替換光標(biāo)位置的內(nèi)容。編輯完內(nèi)容后,按下esc鍵,并輸入“:wq”,然后回車(chē)就可以保存退出。
如果不想保存而直接退出,則按下esc鍵后,輸入“:q!”,然后回車(chē)即可?!皐q”表示write和quit,即保存退出;“q!”表示忽略修改強(qiáng)行退出。

以下操作建議手機(jī)拍照,建議把下載的cuda_9.0.176_384.81_linux.run文件重命名為cuda.run并移動(dòng)到home文件夾下(為了安裝方便)

2) 重啟電腦,進(jìn)入登錄界面的時(shí)候,不要登錄進(jìn)入桌面(否則可能會(huì)失敗,若不小心進(jìn)入,請(qǐng)重啟電腦),直接按ctrl+alt+f1進(jìn)入文本模式(命令行界面),登錄賬戶。

3) 輸入 $ sudo service lightdm stop 關(guān)閉圖形化界面

4) 切換到cuda安裝文件的路徑:$  cd home/

運(yùn)行$ sudo sh cuda_7.5.18_linux.run
按照提示一步步操作

注:a、一定要按照提示)輸入相應(yīng)字符,例如有的需要輸入accept,有的需要輸入yes;

       b、遇到提示是否安裝opengl ,選擇no(如果你的電腦跟我一樣是雙顯,且主顯是非nvidia的gpu在工作需要選擇no,否則可以yes),其他都選擇yes或者默認(rèn)即可。(如果您的電腦是雙顯卡且在這一步選擇了yes,那么你極有可能安裝完cuda之后,重啟圖形化界面后遇到登錄界面循環(huán)問(wèn)題:輸入密碼后又跳回密碼輸入界面。 

這是因?yàn)槟愕碾娔X是雙顯,而且用來(lái)顯示的那塊gpu不是nvidia,則opengl libraries就不應(yīng)該安裝,否則你正在使用的那塊gpu(非nvidia的gpu)的opengl libraries會(huì)被覆蓋,然后gui就無(wú)法工作了。)

安裝成功后,會(huì)顯示installed,否則會(huì)顯示failed。

5) 輸入 $ sudo service lightdm start 重新啟動(dòng)圖形化界面。

同時(shí)按住alt + ctrl +f7,返回到圖形化登錄界面,輸入密碼登錄。
如果能夠成功登錄,則表示不會(huì)遇到循環(huán)登錄的問(wèn)題,基本說(shuō)明cuda的安裝成功了。

如果你遇到了重復(fù)登陸情況,不用急著重裝系統(tǒng),官方教程上有提及,原因上一步的注中有提及,在安裝opengl時(shí)你可能不注意選擇了yes,請(qǐng)卸載cuda,然后重裝。
卸載:由于登陸進(jìn)入不到圖形用戶界面(gui),但我們可以進(jìn)入到文本用戶界面(tui)

在登陸界面狀態(tài)下,按ctrl + alt + f1,進(jìn)入tui
執(zhí)行

$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
$ sudo /usr/bin/nvidia-uninstall

然后重啟

$ sudo reboot

重新安裝.run   再次安裝時(shí)請(qǐng)一定留意,在提示是否安裝opengl時(shí),你的是雙顯卡應(yīng)該選則n。

6) 重啟電腦,檢查device node verification。

執(zhí)行

$ ls /dev/nvidia*

可能出現(xiàn)a、b兩種結(jié)果,請(qǐng)對(duì)號(hào)入座。

a、若結(jié)果顯示

/dev/nvidia0      /dev/nvidiactl      /dev/nvidia-uvm

或顯示出類(lèi)似的信息,應(yīng)該有三個(gè)(包含一個(gè)類(lèi)似/dev/nvidia-nvm的),則安裝成功。

b、大多數(shù)結(jié)果可能會(huì)是這樣

ls: cannot access/dev/nvidia*: no such file or directory

或是這樣的,只出現(xiàn)

/dev/nvidia0     /dev/nvidiactl

a中的一個(gè)或兩個(gè),但沒(méi)有/dev/nvidia-num,即文件顯示不全。

不用著急也不用急著重裝系統(tǒng)(我在安裝時(shí)就是這種情況),官方指導(dǎo)中有詳細(xì)的解決方案,但是我的方法和官方稍微有些出入。

首先要添加一個(gè)啟動(dòng)腳本(添加啟動(dòng)腳本的方法大致有兩種,我采用最直接的方法,另一種可以先創(chuàng)建一個(gè)文件然后通過(guò)mv的方式移動(dòng)到啟動(dòng)文件夾下,可自行百度)
執(zhí)行

$ sudo vi /etc/rc.local

如果你是第一次打開(kāi)這個(gè)文件,它應(yīng)該是空的(除了一行又一行的#注釋項(xiàng)外)。這文件的第一行是

#!/bin/sh -e

把-e去掉(這步很重要,否則它不會(huì)加載這文本的內(nèi)容)
然后把下列內(nèi)容除了#!/bin/bash外復(fù)制到其中,(before exit 0 )保存退出。

#!/bin/bash

/sbin/modprobe nvidia

if [ "$?" -eq 0 ]; then
# count the number of nvidia controllers found.
nvdevs=`lspci | grep -i nvidia`
n3d=`echo "$nvdevs" | grep "3d controller" | wc -l`
nvga=`echo "$nvdevs" | grep "vga compatible controller" | wc -l`

n=`expr $n3d + $nvga - 1`
for i in `seq 0 $n`; do
mknod -m 666 /dev/nvidia$i c 195 $i
done

mknod -m 666 /dev/nvidiactl c 195 255

else
exit 1
fi

/sbin/modprobe nvidia-uvm

if [ "$?" -eq 0 ]; then
# find out the major device number used by the nvidia-uvm driver
d=`grep nvidia-uvm /proc/devices | awk '{print $1}'`

mknod -m 666 /dev/nvidia-uvm c $d 0
else
exit 1
fi

下次重啟時(shí),你應(yīng)該能直接看到/dev目錄下的三個(gè)nvidia的文件
輸入:$ ls /dev/nvidia*
結(jié)果顯示:/dev/nvidia0       /dev/nvidiactl       /dev/nvidia-uvm

成功!

7) 設(shè)置環(huán)境變量。

終端中輸入 $ sudo gedit /etc/profile
在打開(kāi)的文件末尾,添加以下兩行。

64位系統(tǒng):

export path=/usr/local/cuda-9.0/bin${path:+:${path}}
export ld_library_path=/usr/local/cuda-9.0/lib64\
                          ${ld_library_path:+:${ld_library_path}}

32位系統(tǒng):

export path=/usr/local/cuda-9.0/bin${path:+:${path}}

export ld_library_path=/usr/local/cuda-9.0/lib\
                          ${ld_library_path:+:${ld_library_path}}

保存文件,并重啟。因?yàn)閟ource /etc/profile是臨時(shí)生效,重啟電腦才是永久生效。

這里有點(diǎn)與官方安裝文檔稍有不同,需要說(shuō)明:
官方文檔里說(shuō)只需在終端中運(yùn)行上述兩條export語(yǔ)句即可,但如果不將它們不寫(xiě)入/etc/profile文件的話,這樣的環(huán)境變量在你退出終端后就消失了,不起作用了,所以寫(xiě)入才是永久的做法。

8) 重啟電腦,檢查上述的環(huán)境變量是否設(shè)置成功。

a、 驗(yàn)證驅(qū)動(dòng)版本

敲入

$ cat /proc/driver/nvidia/version

結(jié)果顯示

nvrm version: nvidia unix x86_64 kernel module 384.81 sat sep 2 02:43:11 pdt 2017
gcc version: gcc version 5.4.0 20160609 (ubuntu 5.4.0-6ubuntu1~16.04.5)

b、 驗(yàn)證cuda toolkit

敲入

$ nvcc -v       會(huì)輸出cuda的版本信息

 如果是這樣的:

the program 'nvcc' is currently not installed. you can install it by typing:
sudo apt-get install nvidia-cuda-toolkit

可能是環(huán)境配置沒(méi)有成功,請(qǐng)重復(fù)上述步驟7)。

五、 嘗試編譯cuda提供的例子

1)打開(kāi)終端輸入:$   cd /home/xxx/nvidia_cuda-9.0_samples        其中xxx是你自己的用戶名,通過(guò)命令cd進(jìn)入nvidia_cuda-9.0_samples目錄。

然后終端輸入:$ make

系統(tǒng)就會(huì)自動(dòng)進(jìn)入到編譯過(guò)程,整個(gè)過(guò)程大概需要十幾到二十分鐘,請(qǐng)耐心等待。如果出現(xiàn)錯(cuò)誤的話,系統(tǒng)會(huì)立即報(bào)錯(cuò)停止。

第一次運(yùn)行時(shí)可能會(huì)報(bào)錯(cuò),提示的錯(cuò)誤信息可能會(huì)是系統(tǒng)中沒(méi)有g(shù)cc,

解決辦法就是通過(guò)命令重新安裝gcc就行,在終端輸入:$ sudo apt-get install gcc 安裝完gcc后, 再make就正常了。

如果編譯成功,最后會(huì)顯示finished building cuda samples,如下圖所示。

Ubuntu上如何安裝CUDA

2)運(yùn)行編譯生成的二進(jìn)制文件。
編譯后的二進(jìn)制文件 默認(rèn)存放在nvidia_cuda-9.0_samples/bin中。
接著在上一個(gè)終端中輸入 :$  cd /home/lxxx/nvidia_cuda-9.0_samples/bin/x86_64/linux/release       其中xxx是你自己的用戶名
然后在終端輸入 :$ ./devicequery  

結(jié)果如下圖所示:看到類(lèi)似如下圖片中的顯示,則代表cuda安裝且配置成功,其中 result = pass代表成功,若失敗 result = fail

Ubuntu上如何安裝CUDA

3)最后再檢查一下系統(tǒng)和cuda-capable device的連接情況
終端輸入 : $ ./bandwidthtest
看到類(lèi)似如下圖片中的顯示,則代表成功

Ubuntu上如何安裝CUDA

“Ubuntu上如何安裝CUDA”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI