溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

基于AWS學(xué)習(xí)的10個Linux命令分別是什么

發(fā)布時間:2021-10-21 17:45:08 來源:億速云 閱讀:227 作者:柒染 欄目:大數(shù)據(jù)

基于AWS學(xué)習(xí)的10個Linux命令分別是什么,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

在AWS上執(zhí)行大規(guī)模的深度學(xué)習(xí)處理是一個廉價而且有效的學(xué)習(xí)和開發(fā)方式?;ㄉ倭康腻X就可以使用數(shù)十GB的內(nèi)存,數(shù)十個CPU,多個GPU,這是值得推薦的。

如果你是使用EC2或者Linux 命令的新人,在云端執(zhí)行深度學(xué)習(xí)腳本的時候, 這些命令是非常有效的。

本文的主要內(nèi)容包括:
1)在本機(jī)和EC2實例間復(fù)制數(shù)據(jù)
2)使腳本按天,周,月安全地運(yùn)行
3)監(jiān)測進(jìn)程,系統(tǒng)和GPU 的性能

注意:所有命令在類linux環(huán)境中執(zhí)行(Linux,OS x 或者 cygwin)

0、環(huán)境約定

假設(shè)AWS EC2 已經(jīng)正常運(yùn)行,方便起見,對環(huán)境做如下的設(shè)定:
1)EC2 服務(wù)器的IP地址為 54.218.86.47
2)用戶名為ec2-user
3)SSH 密鑰位于 ~/.ssh/ 中,文件名為aws-keypair.pem;
4)使用python 腳本工作

關(guān)于如何搭建一個 基于GPU的EC2實例來 執(zhí)行深度學(xué)習(xí),可以參見:
https://machinelearningmastery.com/develop-evaluate-large-deep-learning-models-keras-amazon-web-services/

1、 登陸到服務(wù)器

在做任何操作之前,首先要登陸到目標(biāo)服務(wù)器。簡單地,使用SSH命令。將SSH 密鑰存儲在 ~/.ssh/ 中,使用有意義的文件名,例如aws-keypair.pem。使用如下命令登陸EC2主機(jī),注意地址和用戶名:

ssh -i ~/.ssh/aws-keypair.pem ec2-user@54.218.86.47

2、 拷貝文件到服務(wù)器

使用SCP命令拷貝本地文件到服務(wù)器,例如將script.py 文件拷貝到EC2 服務(wù)器的命令如下:

scp -i ~/.ssh/aws-keypair.pem script.py ec2-user@54.218.86.47:~/

3、使腳本在服務(wù)器的后臺運(yùn)行

在服務(wù)的后臺執(zhí)行腳本,可以忽略其他進(jìn)行的信號量,忽略標(biāo)準(zhǔn)的輸入輸出,將所有的輸出和錯誤信息重定向到一個日志文件中。對于需要長時間運(yùn)行的深度學(xué)習(xí)模型而言, 這是非常必要的。

> nohup python /home/ec2-user/script.py >/home/ec2-user/script.py.log </dev/null 2>&1 &

該命令中script.py 和 script.py.log 都位于 /home/ec2-user/ 目錄下。關(guān)于 nohup 和重定向 參考其他的詳細(xì)介紹(例如wikipedia中的介紹)。

4、在服務(wù)器的指定 GPU 上執(zhí)行腳本

如果EC2 支持的話,推薦在同時運(yùn)行多個腳本。例如,EC2有4個GPU的話, 可以在每個GPU上單獨(dú)運(yùn)行一個腳本,示例代碼如下:

CUDA_VISIBLE_DEVICES=0  nohup python /home/ec2-user/script.py >/home/ec2-user/script.py.log </dev/null 2>&1 &

如果有4個GPU的話,可以指定CUDA_VISIBLE_DEVICES從0到3。這在TF做后臺的Keras上是可行的,在Theano 沒有測試過。

關(guān)于CUDA_VISIBLE_DEVICES 的更多信息可以參見https://devblogs.nvidia.com/parallelforall/cuda-pro-tip-control-gpu-visibility-cuda_visible_devices/

5、監(jiān)測腳本的輸出

如果輸出結(jié)果中有項目評分或者一個算法的運(yùn)行結(jié)果,實時監(jiān)控腳本的輸出是很有意義的。示例如下:

tail -f script.py.log

遺憾的是,當(dāng)屏幕上在一段時間沒有輸出的時候,AWS 會關(guān)閉這個終端,所以最好使用:

watch "tail script.py.log"

有的時候看不到python的標(biāo)準(zhǔn)輸出,不知道是python的問題還是EC2的問題。

6、監(jiān)測系統(tǒng)和進(jìn)程的性能

監(jiān)測EC2系統(tǒng)的性能是有意義的,尤其是已經(jīng)使用了或還剩下多少內(nèi)存。例如:

top -M

或者指定進(jìn)程標(biāo)識PID:

top -p PID -M

7、監(jiān)測GPU 性能

如果在GPU上同時執(zhí)行多個腳本,并行執(zhí)行的話,查看每個GPU 的性能和使用率是不錯的主意。例如:

watch "nvidia-smi"

8、檢查腳本是否還在服務(wù)器上運(yùn)行

一般地,會保持終端一直是開著的。

watch "ps -ef | grep python"

9、在服務(wù)器上編輯文件

一般不建議在服務(wù)器直接修改,當(dāng)然你熟知vi除外:

vi ~/script.py

vi 的用法就不在這里贅述了。

10、從服務(wù)器上下載文件

與上傳文件相對,這是一個下個png文件的例子:

scp -i ~/.ssh/aws-keypair.pem ec2-user@54.218.86.47:~/*.png .

需要注意的幾點(diǎn)

  • 如果希望同時運(yùn)行多個腳本,最好選用擁有多個GPU 的EC2

  • 最好在本地編寫腳本

  • 將執(zhí)行結(jié)果輸出到文件,下載到本地進(jìn)行分析

  • 使用watch 命令保持終端處于運(yùn)行中

  • 在本地執(zhí)行遠(yuǎn)程命令

實際上,其中多是后臺開發(fā)工程師的基本功,只是對興趣愛好者而言有一點(diǎn)兒參考價值而已。

看完上述內(nèi)容,你們掌握基于AWS學(xué)習(xí)的10個Linux命令分別是什么的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI