溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

發(fā)布時(shí)間:2020-10-24 14:02:25 來(lái)源:網(wǎng)絡(luò) 閱讀:1718 作者:IT圈老男孩 欄目:建站服務(wù)器

最近做了一個(gè)SCCM2012R2的項(xiàng)目,讓我真心是身心俱疲啊,遇到了各種的坑,今天就給大家分享下該項(xiàng)目遇到的一些坑與相關(guān)解決方案。


第一階段:PXE 啟動(dòng)失敗排查

 

問(wèn)題描述:

=========

跨網(wǎng)段做PXE的時(shí)候會(huì)有藍(lán)屏,同一個(gè)網(wǎng)段下PXE正常。

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

問(wèn)題排查:

=========

  1. 從報(bào)錯(cuò)來(lái)看,WDS no response,我們懷疑是WDS功能異常,我們嘗試以下步驟去重新啟用WDS,問(wèn)題依舊:

--------------------------------------

       登錄WDS服務(wù)器,停止Windows deployment     services server服務(wù);

       找到RemoteInstall\Mgmt路徑,將該路徑下的文件都剪切到一個(gè)新建文件夾做備份用;

       重啟Windows deployment     services server服務(wù),Mgmt路徑下的文件會(huì)重新被生成;

 

  1. 之后我們?cè)?/span>DHCP服務(wù)器和SCCM DP上抓了網(wǎng)絡(luò)包,可以看到在讀取BCD文件的時(shí)候顯示找不到文件,而找不到BCD文件直接導(dǎo)致了最初的藍(lán)屏報(bào)錯(cuò)(boot configuration     data is missing or contains errors)。

--------------------------------------

正常PXE boot執(zhí)行順序?yàn)椋?/span>Wdsnbp.com--Pxeboot.com—Bootmgr.exe—BCD文件—Boot.wim

 

故障機(jī)器的網(wǎng)絡(luò)包中可以看到:Wdsnbp.com文件讀取成功;

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

Pxeboot.com文件讀取成功;

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏Bootmgr.exe文件讀取launch成功;

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

然后讀取bcd文件的時(shí)候,顯示找不到文件。

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

3.   經(jīng)過(guò)溝通,我們了解到客戶配置了DHCP option     66,67,因?yàn)槲④洸恢С诌@種情形,所以我們建議客戶改為配置IP helper。在配置完IP helper之后,我們遇到以下新的報(bào)錯(cuò)。

      SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

4.   對(duì)于新的報(bào)錯(cuò)我們做了抓包分析,有以下分析發(fā)現(xiàn);

    SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

5.    我們拿到客戶的網(wǎng)絡(luò)拓?fù)渲?,給出了以下抓包方案:

--------------------------------------------

  在客戶端接入S2126G-6交換機(jī)的接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon;

  WDS服務(wù)器連接核心S7806A交換機(jī)的接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon

  在核心S7806AG1/42,G1/45以及匯聚S5750AG0/24接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon;

  WDS以及DHCP服務(wù)器上開啟netmon。

 

注意:沒有在S5750AG0/17以及接入層交換機(jī)上的端口一起抓包是因?yàn)槲覀兛紤]到問(wèn)題出在這一段的可能性不是很大。

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏


6.   之后等待4個(gè)月左右,貴方根據(jù)我們給出的方案做了抓包,并提交了日志。最新的網(wǎng)絡(luò)包中看到問(wèn)題又有變化,與前兩次不同。

----------------------------------------

這次客戶端拿到wdsnbp.com之后,再次發(fā)送的DHCP請(qǐng)求返回的文件不是正常的Pxeboot.com,而是abortpxe.com,直接終止了PXE boot行為。

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

7.   之后我們一起做了遠(yuǎn)程,有以下檢查發(fā)現(xiàn):

-------------------------------------------------------------

  • 在把 “廣東聯(lián)想MT4500T_Win7_X86_SP1” 部署給     ”所有未知計(jì)算機(jī)“時(shí), 發(fā)現(xiàn)在這個(gè)任務(wù)序列都?jí)牡舻模?/span> 其中的操作系統(tǒng)鏡像已經(jīng)不存在。我們對(duì)這個(gè)任務(wù)序列做了修復(fù),重新添加了Windows 7SP1 的系統(tǒng)景象。 在這之后, 我們成功的部署了此任務(wù)序列到     “所有未知計(jì)算機(jī)“ 集合。

 

  • 之后, 我們找了兩臺(tái)物理筆記本做測(cè)試。在通過(guò)網(wǎng)絡(luò)啟動(dòng)時(shí),現(xiàn)在的報(bào)錯(cuò)信息和之前的遇到錯(cuò)誤已經(jīng)完全不同,已經(jīng)沒有藍(lán)屏(     BCD Error)或者PXE -M0F 錯(cuò)誤。當(dāng)前的錯(cuò)誤信息為:

SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

  • 因?yàn)榭蛻舳诵枰騍CCM MP去請(qǐng)求policy,我們檢查MP相關(guān)日志發(fā)現(xiàn):MP 一直無(wú)法正常連接到站點(diǎn)數(shù)據(jù)庫(kù)做查尋, 而且MP 的狀態(tài)不正常;也發(fā)現(xiàn)了mpcontrol.log 中有大量持續(xù)的 DB 無(wú)法連接的錯(cuò)誤和Internal 500 的錯(cuò)誤;我們?cè)赟CCM DP服務(wù)器上去連接站點(diǎn)數(shù)據(jù)庫(kù)的1433 端口, 發(fā)現(xiàn)無(wú)法連接,這就是MP工作異常的問(wèn)題所在。

8.   根據(jù)遠(yuǎn)程會(huì)話中我們發(fā)現(xiàn)的報(bào)錯(cuò),貴方將445以及1433端口做了開放。之后再次進(jìn)行測(cè)試,發(fā)現(xiàn)客戶端依舊在向SCCM MP請(qǐng)求policy。我們建議按照以下步驟將PXE re-enable,       完成之后測(cè)試PXE boot成功。

----------------------

  1. SCCM console --- 管理--- 分發(fā)點(diǎn);

  2. 找到20GD 分發(fā)點(diǎn), 打開基屬性, 取消PXE 相關(guān)的設(shè)置, 確認(rèn)應(yīng)用;

  3. 等15-20分鐘, 重啟服務(wù)器;

  4. 刪除原來(lái)的RemoteInstall 目錄 (確認(rèn)各各分區(qū)下面都沒有這個(gè)目錄, 如果有請(qǐng)刪除或改名);

  5. 在SCCM 控制臺(tái)上, 找到20GD 分發(fā)點(diǎn), 再啟用PXE.  系統(tǒng)會(huì)重裝PXE (WDS);

  6. 等5-10分鐘后, 確認(rèn) WDS服務(wù)是否裝好(確認(rèn)系統(tǒng)服務(wù)deployment     service  和 數(shù)據(jù)分區(qū)中 RemoteInstall 目錄 ),安裝完成后測(cè)試PXE boot。

 

針對(duì)這兩部分的排查,根據(jù)我的分析和經(jīng)驗(yàn),之前發(fā)生PXE 啟動(dòng)失敗的原因有以下:

 

a. PXE/WDS 節(jié)點(diǎn)上的啟動(dòng)鏡像異常---我們?cè)诤罄m(xù)的PXE 重裝中, 專門刪除了之前的老的文件夾,確保了重新裝的PXE 不受之前老的文件影響。

b. 部署異常---之前并沒有部署給所有未知計(jì)算機(jī)的任務(wù)序列, 這樣也間接造成了PXE 啟動(dòng)時(shí), 找不到對(duì)應(yīng)的任務(wù)。

c.端口異常關(guān)閉---造成了在PXE啟動(dòng)階段,站點(diǎn)服務(wù)器無(wú)法正常的完成查詢,任務(wù)序列也無(wú)法被檢測(cè)到

 

第二階段:任務(wù)序列卡死

 

9. 在解決了PXE 啟動(dòng)問(wèn)題后, 系統(tǒng)已經(jīng)可以成功的從PXE 啟動(dòng)到WinPE 階段,但是在WinPE 階段卻沒有如預(yù)期的看到任務(wù)序列, 一直顯示一個(gè)空白界面如下:

    SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏

由于無(wú)法從現(xiàn)場(chǎng)機(jī)器上獲取WinPE 階段的日志: smsts.log, 我們嘗試通過(guò)虛擬機(jī)測(cè)試這一問(wèn)題。在這一過(guò)程中, 我們?cè)?/span>DP 上調(diào)整了設(shè)置, 使之可以在WinPE 階段做調(diào)試 (通過(guò)F8 鍵調(diào)出命令控制臺(tái))


10. 在通過(guò)虛擬機(jī)測(cè)試時(shí),我們收到了如下的錯(cuò)誤:

    SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏 

    這個(gè)錯(cuò)誤信息是由于損壞或有問(wèn)題的WinPE 鏡像造成的, 我們通過(guò)重新建立Boot鏡像, 并調(diào)整了任務(wù)序列里的Boot鏡像設(shè)置,確保對(duì)應(yīng)任務(wù)序列和操作系統(tǒng)匹配后,這個(gè)錯(cuò)誤消失。但是WinPE階段還是如上圖一樣,不顯示任何任務(wù)序列。



11. 在虛擬機(jī)收集到的smsts.log日志中,我們的發(fā)現(xiàn)了如下的信息。顯示在WinPE 階段, 這臺(tái)客戶端機(jī)器無(wú)法正常的連接到對(duì)應(yīng)的MP DP 服務(wù)器。

   SCCM2012R2跨網(wǎng)段PXE啟動(dòng)藍(lán)屏 

   在網(wǎng)絡(luò)同事調(diào)整DNS 設(shè)置后, 這個(gè)問(wèn)題很快的被解決。 也可以正常的看到任務(wù)序列了。

 

至此, 系統(tǒng)可以正常的部署, 在虛擬機(jī)上測(cè)試的結(jié)果也為正常。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI