溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Puppet使用ENC報(bào)'Could not load external node results for'

發(fā)布時(shí)間:2020-07-10 17:27:11 來源:網(wǎng)絡(luò) 閱讀:814 作者:kinda22 欄目:編程語言

這個(gè)問題出現(xiàn)有一段時(shí)間了,最開始的時(shí)候從一天3-5次左右到最近的一天出現(xiàn)10多次的告警郵件...

因?yàn)镻uppet同步采取了主動(dòng)觸發(fā)和定時(shí)同步兩種策略,幾乎每次的報(bào)錯(cuò)都是在定時(shí)同步時(shí)出現(xiàn)...

Puppet Server采用雙主結(jié)構(gòu),Web ui使用Foreman,為了確定這個(gè)報(bào)錯(cuò)是出現(xiàn)在那臺(tái)服務(wù)器上, 通過對(duì)源代碼的log增加主機(jī)標(biāo)記最終定位到了這個(gè)錯(cuò)誤只是出現(xiàn)在一臺(tái)服務(wù)器上...,出現(xiàn)的很偶然,但所有的錯(cuò)誤標(biāo)記中,都是它....

Level	Resource	message
err	Puppet	Could not retrieve catalog from remote server: Error 400 on SERVER: Failed when searching for node xxx: 001。,Could not load external node results for xxx: undefined method `inject' for false:FalseClass ::--- false
notice	Puppet	Using cached catalog
err	Puppet	Could not retrieve catalog; skipping run

 

最后面的 :: --- false    其中::是在log中追加的分解符,方便區(qū)分, --- false 是返回的output的信息..

 

在Puppet源代碼中 , 通過indirector與enc相關(guān)的find方法中可以看到這個(gè)find方法接受一個(gè)參數(shù) request

 indirector/node/exec.rb 
  def find(request)
    output = super or return nil

    # Translate the output to ruby.
    result = translate(request.key, output)

    create_node(request.key, result)
  end

output 是調(diào)用父方法的find

父方法的find會(huì)調(diào)用enc腳本獲取返回值,如果失敗或調(diào)用不成功則為Nil..

這時(shí)會(huì)繼續(xù)通過translate方法,將yaml輸出轉(zhuǎn)為ruby的對(duì)象

如果output為nil,這時(shí)yaml在讀取這個(gè)數(shù)據(jù)的時(shí)候就會(huì)拋出異常,異常就是收到的Puppet郵件告警的內(nèi)容了。

  def translate(name, output)
    YAML.load(output).inject({}) do |hash, data|                                             
      case data[0]                                                                           
      when String                                                                            
        hash[data[0].intern] = data[1]                                                       
      when Symbol                                                                            
        hash[data[0]] = data[1]                                                              
      else                                                                                   
        raise Puppet::Error, "key is a #{data[0].class}, not a string or symbol"             
      end                                                                                    
                                                                                             
      hash                                                                                   
    end                                                                                      
                                                                                             
  rescue => detail                                                                           
      raise Puppet::Error, "001,Could not load external node results for #{name}: #{detail} ::#{output} "
  end

 

 

羅嗦了一大堆,其實(shí)就是node.rb的腳本在通過api取參數(shù)的時(shí)候,沒有獲得200...導(dǎo)致的。

通過指向一個(gè)錯(cuò)誤的WEB服務(wù)器地址,可以看到 開頭--- false。。。。

[root@test puppet]# ruby node1.rb test
--- false
Error retrieving node test: Net::HTTPNotFound

 

分析node.rb

def enc(certname)
  foreman_url      = "#{url}/node/#{certname}?format=yml"
  uri              = URI.parse(foreman_url)
  req              = Net::HTTP::Get.new(uri.request_uri)
  http             = Net::HTTP.new(uri.host, uri.port)
  http.use_ssl     = uri.scheme == 'https'
  if http.use_ssl?
    if SETTINGS[:ssl_ca] && !SETTINGS[:ssl_ca].empty?
      http.ca_file = SETTINGS[:ssl_ca]
      http.verify_mode = OpenSSL::SSL::VERIFY_PEER
    else
      http.verify_mode = OpenSSL::SSL::VERIFY_NONE
    end
    if SETTINGS[:ssl_cert] && !SETTINGS[:ssl_cert].empty? && SETTINGS[:ssl_key] && !SETTINGS[:ssl_key].empty?
      http.cert = OpenSSL::X509::Certificate.new(File.read(SETTINGS[:ssl_cert]))
      http.key  = OpenSSL::PKey::RSA.new(File.read(SETTINGS[:ssl_key]), nil)
    end
  end
  res = http.start { |http| http.request(req) }

  raise "Error retrieving node #{certname}: #{res.class}" unless res.code == "200"
  res.body
end

腳本的前面都是在構(gòu)造一個(gè)http的對(duì)象...,直接看倒數(shù)第三行

可以清楚的看到一個(gè)判斷,然后拋出異常,沒有任何的重試機(jī)制....,為此我很確信我的web,它如果能有一次重試的機(jī)會(huì),那么下一次一定能正常獲得返回值,  然后我就給了它很多次的機(jī)會(huì)。。。

  #raise "Error retrieving node #{certname}: #{res.class}" unless res.code == "200"
  while res.code != "200"
    res = http.start { |http| http.request(req) }
    puts "Error retrieving node #{certname}: #{res.class}"    sleep 3
  end

這時(shí)有些人可能會(huì)想,while 循環(huán),加3秒重試,,如果一直不成功怎么辦?

在腳本最開頭會(huì)有配置timeout的地方,在timeout到了之后,會(huì)關(guān)閉http連接,然后讀取cache。

 

      # query External node
      begin
        result = ""
        timeout(tsecs) do
          result = enc(certname)
          cache(certname, result)
        end
      rescue TimeoutError, SocketError, Errno::EHOSTUNREACH, Errno::ECONNREFUSED
        # Read from cache, we got some sort of an error.
        result = read_cache(certname)

這段代碼可以很清晰的看出,在timeout沒超時(shí)時(shí)會(huì)調(diào)用enc這個(gè)方法返回結(jié)果,然后在調(diào)用cache方法寫入到cache文件

如果超時(shí)或http錯(cuò)誤,則讀取cache,但是這里的異常不包括...,HTTP的...,如果如果是4XX的錯(cuò)誤,不會(huì)觸發(fā)讀取cache的異常..


向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI