您好,登錄后才能下訂單哦!
這篇“Docker容器端口映射后突然無(wú)法連接如何排查”文章的知識(shí)點(diǎn)大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價(jià)值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來(lái)看看這篇“Docker容器端口映射后突然無(wú)法連接如何排查”文章吧。
一、背景
一般需要對(duì)外提供服務(wù)的docker容器,我們?cè)趩?dòng)時(shí)后使用-p命令將對(duì)外訪問端口暴露給外部,例如啟動(dòng)docker registry,我們將5000端口映射出來(lái)供外部訪問:
docker run -d -p 5000:5000 registry
但最近碰到一個(gè)非常奇怪的情況:研發(fā)組里一個(gè)centos 7測(cè)試環(huán)境里部署有docker registry,并對(duì)外暴露了端口。啟動(dòng)容器后一段時(shí)間內(nèi)都是可以正常工作的,但在不定時(shí)間間隔后,外部主機(jī)就會(huì)出現(xiàn)無(wú)法從倉(cāng)庫(kù)中拉取鏡像的情況,提示timeout:
然而在docker宿主機(jī)上訪問倉(cāng)庫(kù)則可以正常訪問:
至于這個(gè)問題,只有手動(dòng)重啟出問題的docker daemon服務(wù)后,外部才可以重新訪問,但只要再過一段時(shí)間又會(huì)出現(xiàn)這樣的問題。
二、問題排查
碰到這個(gè)問題我第一反應(yīng)就是問組里的人,是不是有人重啟過centos 7 自己的firewalld了。
因?yàn)檫@臺(tái)服務(wù)器是我配置的,防火墻雖然開著但我已經(jīng)開啟端口訪問了,所以肯定不是因?yàn)榉阑饓ψ钄噙B接的緣故。但由于這篇文章是篇踩坑排查文檔,所以還是把這種情況寫出來(lái)了
情況一:開著防火墻但沒有開放端口
centos 7自帶并啟用了防火墻firewalld,我們可以通過下面的命令檢查firewalld的狀態(tài):
firewall-cmd --state
如果輸出的是“not running”則firewalld沒有在運(yùn)行,且所有的防護(hù)策略都沒有啟動(dòng),那么可以排除防火墻阻斷連接的情況了。
如果輸出的是“running”,表示當(dāng)前firewalld正在運(yùn)行,需要再輸入下面的命令查看現(xiàn)在開放了哪些端口和服務(wù):
firewall-cmd --list-ports firewall-cmd --list-services
可以看到當(dāng)前防火墻只開放了80/tcp端口、ssh服務(wù)(22/tcp)和dhcpv6-client服務(wù),并沒有打開docker容器映射的5000/tcp端口。
解決方案有兩種:
1.關(guān)閉firewalld服務(wù):
如果您不需要防火墻,那直接關(guān)掉firewalld服務(wù)就好了
systemctl stop firewalld.service
2.添加策略對(duì)外打開指定的端口:
比如我們現(xiàn)在要打開對(duì)外5000/tcp端口,可以使用下面的命令:
firewall-cmd --add-port=5000/tcp --permanent firewall-cmd --reload
如果只是臨時(shí)打開端口,去掉第一行命令中的“--permanent”參數(shù),那么當(dāng)再次重啟firewalld服務(wù)時(shí),本策略將失效。
情況二:人為重啟centos 7的firewalld服務(wù)
firewalld是centos系統(tǒng)在7版本引入的新組件,簡(jiǎn)單的說就是iptables的包裝,用于簡(jiǎn)化防火墻相關(guān)的設(shè)置。
然而firewalld和docker相處的并不是特別好,當(dāng)firewalld啟動(dòng)(或重新啟動(dòng))時(shí),會(huì)從iptables中刪除docker鏈,造成docker不能正常工作:
firewalld
centos-7 introduced firewalld, which is a wrapper around iptables and can conflict with docker.
when firewalld is started or restarted it will remove the docker chain from iptables, preventing docker from working properly.
when using systemd, firewalld is started before docker, but if you start or restart firewalld after docker, you will have to restart the docker daemon.
摘自docker官方文檔《centos - docker documentation》
在centos 7中,如果設(shè)置使用systemd開機(jī)自啟動(dòng)docker服務(wù)是不會(huì)有問題的,因?yàn)閐ocker在systemd配置文件中明確注明了“after= firewalld.service”,以保證docker daemon 在firewalld啟動(dòng)后再啟動(dòng)。
(docker:惹不起我還躲不起嗎)
但每當(dāng)用戶手動(dòng)重啟過firewalld服務(wù)之后,firewalld服務(wù)會(huì)將docker daemon寫入iptables的docker鏈刪除,所以需要手動(dòng)重新啟動(dòng)一次docker daemon服務(wù),讓docker daemon服務(wù)重建docker鏈。
不過問了組里另外兩個(gè)研發(fā),都說沒有動(dòng)過。查看了shell的history也沒找到對(duì)應(yīng)的記錄。
這就很奇怪了。不過經(jīng)過一段時(shí)間的蹲點(diǎn)排查之后,我終于發(fā)現(xiàn)了一個(gè)新的原因:
情況三:沒有啟用ip_forward
因?yàn)橐恢睕]法定位出問題的所在,所以我們研發(fā)組都是發(fā)現(xiàn)不能正常訪問倉(cāng)庫(kù)時(shí),手動(dòng)登陸宿主機(jī)重啟docker daemon服務(wù)。
在有一次登錄到宿主服務(wù)器上準(zhǔn)備重啟docker daemon服務(wù)前,我突然想起之前在用docker的時(shí)候還碰到過另一個(gè)問題:如果宿主機(jī)沒有啟用ip_forward功能,那docker容器在啟動(dòng)時(shí)會(huì)輸出一條警告消息:
warning: ipv4 forwarding is disabled. networking will not work.
并且將不能在啟動(dòng)的容器中訪問外部網(wǎng)絡(luò),容器對(duì)外暴露的端口外部也不能正常訪問:
會(huì)不會(huì)是因?yàn)樗拗鳈C(jī)的ip_forward功能沒有啟用所以才引起的這個(gè)故障呢?
sysctl net.ipv4.ip_forward
果然,輸出表示當(dāng)前系統(tǒng)的ip_forward功能處于停用狀態(tài)!
可是問題來(lái)了,當(dāng)時(shí)啟動(dòng)容器的時(shí)候都是好的啊,什么都沒有輸出,怎么用著用著ip_forward功能就被禁用了呢?
等等,docker daemon服務(wù)在啟動(dòng)的時(shí)候會(huì)自動(dòng)設(shè)置iptables設(shè)置,難不成它還會(huì)檢查ip_forward設(shè)置,并幫我臨時(shí)啟用嗎?
帶著這個(gè)假設(shè),我手動(dòng)重啟了一下docker daemon服務(wù):
果然,docker daemon服務(wù)在啟動(dòng)過程中會(huì)檢查系統(tǒng)的ip_forward配置項(xiàng),如果當(dāng)前系統(tǒng)的ip_forward功能處于停用狀態(tài),會(huì)幫我們臨時(shí)啟用ip_forward功能,然而臨時(shí)啟用的ip_forward功能會(huì)因?yàn)槠渌鞣N各樣的原因失效…
雖然具體造成本次故障的原因現(xiàn)在還沒有確鑿的證據(jù)定位出,但我現(xiàn)在嚴(yán)重懷疑是因?yàn)橹貑⒕W(wǎng)絡(luò)服務(wù)造成的。因?yàn)槌鰡栴}的服務(wù)器宿主機(jī)上運(yùn)行著我們研發(fā)組正在開發(fā)的web項(xiàng)目,其中有一個(gè)功能是修改網(wǎng)卡ip地址,這個(gè)功能在修改完網(wǎng)卡ip后,會(huì)自動(dòng)調(diào)用下面的命令重啟網(wǎng)絡(luò)服務(wù):
systemctl restart network.service
而重啟網(wǎng)絡(luò)服務(wù)正會(huì)使docker daemon服務(wù)自動(dòng)設(shè)置的臨時(shí)啟用ip_forward配置失效:
另外因?yàn)槭浅绦蛑苯诱{(diào)用命令,所以不會(huì)在history命令中留下痕跡。
至于修復(fù)方案倒非常簡(jiǎn)單,只要一行命令就可以了:
echo 'net.ipv4.ip_forward = 1' >> /usr/lib/sysctl.d/50-default.conf
執(zhí)行完成后,重啟服務(wù)器或使用下面的命令從文件中加載配置:
sysctl -p /usr/lib/sysctl.d/50-default.conf
以上就是關(guān)于“Docker容器端口映射后突然無(wú)法連接如何排查”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對(duì)大家有幫助,若想了解更多相關(guān)的知識(shí)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。