您好,登錄后才能下訂單哦!
最近做了一個(gè)SCCM2012R2的項(xiàng)目,讓我真心是身心俱疲啊,遇到了各種的坑,今天就給大家分享下該項(xiàng)目遇到的一些坑與相關(guān)解決方案。
第一階段:PXE 啟動(dòng)失敗排查
問(wèn)題描述:
=========
跨網(wǎng)段做PXE的時(shí)候會(huì)有藍(lán)屏,同一個(gè)網(wǎng)段下PXE正常。
問(wèn)題排查:
=========
從報(bào)錯(cuò)來(lái)看,WDS no response,我們懷疑是WDS功能異常,我們嘗試以下步驟去重新啟用WDS,問(wèn)題依舊:
--------------------------------------
登錄WDS服務(wù)器,停止Windows deployment services server服務(wù);
找到RemoteInstall\Mgmt路徑,將該路徑下的文件都剪切到一個(gè)新建文件夾做備份用;
重啟Windows deployment services server服務(wù),Mgmt路徑下的文件會(huì)重新被生成;
之后我們?cè)?/span>DHCP服務(wù)器和SCCM DP上抓了網(wǎng)絡(luò)包,可以看到在讀取BCD文件的時(shí)候顯示找不到文件,而找不到BCD文件直接導(dǎo)致了最初的藍(lán)屏報(bào)錯(cuò)(boot configuration data is missing or contains errors)。
--------------------------------------
正常PXE boot執(zhí)行順序?yàn)椋?/span>Wdsnbp.com--Pxeboot.com—Bootmgr.exe—BCD文件—Boot.wim
故障機(jī)器的網(wǎng)絡(luò)包中可以看到:Wdsnbp.com文件讀取成功;
Pxeboot.com文件讀取成功;
Bootmgr.exe文件讀取launch成功;
然后讀取bcd文件的時(shí)候,顯示找不到文件。
3. 經(jīng)過(guò)溝通,我們了解到客戶配置了DHCP option 66,67,因?yàn)槲④洸恢С诌@種情形,所以我們建議客戶改為配置IP helper。在配置完IP helper之后,我們遇到以下新的報(bào)錯(cuò)。
4. 對(duì)于新的報(bào)錯(cuò)我們做了抓包分析,有以下分析發(fā)現(xiàn);
5. 我們拿到客戶的網(wǎng)絡(luò)拓?fù)渲?,給出了以下抓包方案:
--------------------------------------------
在客戶端接入S2126G-6交換機(jī)的接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon;
在WDS服務(wù)器連接核心S7806A交換機(jī)的接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon;
在核心S7806A的G1/42,G1/45以及匯聚S5750A的G0/24接口上啟用端口鏡像并在對(duì)應(yīng)機(jī)器上開啟netmon;
在WDS以及DHCP服務(wù)器上開啟netmon。
注意:沒有在S5750A的G0/17以及接入層交換機(jī)上的端口一起抓包是因?yàn)槲覀兛紤]到問(wèn)題出在這一段的可能性不是很大。
6. 之后等待4個(gè)月左右,貴方根據(jù)我們給出的方案做了抓包,并提交了日志。最新的網(wǎng)絡(luò)包中看到問(wèn)題又有變化,與前兩次不同。
----------------------------------------
這次客戶端拿到wdsnbp.com之后,再次發(fā)送的DHCP請(qǐng)求返回的文件不是正常的Pxeboot.com,而是abortpxe.com,直接終止了PXE boot行為。
7. 之后我們一起做了遠(yuǎn)程,有以下檢查發(fā)現(xiàn):
-------------------------------------------------------------
在把 “廣東聯(lián)想MT4500T_Win7_X86_SP1” 部署給 ”所有未知計(jì)算機(jī)“時(shí), 發(fā)現(xiàn)在這個(gè)任務(wù)序列都?jí)牡舻模?/span> 其中的操作系統(tǒng)鏡像已經(jīng)不存在。我們對(duì)這個(gè)任務(wù)序列做了修復(fù),重新添加了Windows 7SP1 的系統(tǒng)景象。 在這之后, 我們成功的部署了此任務(wù)序列到 “所有未知計(jì)算機(jī)“ 集合。
之后, 我們找了兩臺(tái)物理筆記本做測(cè)試。在通過(guò)網(wǎng)絡(luò)啟動(dòng)時(shí),現(xiàn)在的報(bào)錯(cuò)信息和之前的遇到錯(cuò)誤已經(jīng)完全不同,已經(jīng)沒有藍(lán)屏( BCD Error)或者PXE -M0F 錯(cuò)誤。當(dāng)前的錯(cuò)誤信息為:
因?yàn)榭蛻舳诵枰騍CCM MP去請(qǐng)求policy,我們檢查MP相關(guān)日志發(fā)現(xiàn):MP 一直無(wú)法正常連接到站點(diǎn)數(shù)據(jù)庫(kù)做查尋, 而且MP 的狀態(tài)不正常;也發(fā)現(xiàn)了mpcontrol.log 中有大量持續(xù)的 DB 無(wú)法連接的錯(cuò)誤和Internal 500 的錯(cuò)誤;我們?cè)赟CCM DP服務(wù)器上去連接站點(diǎn)數(shù)據(jù)庫(kù)的1433 端口, 發(fā)現(xiàn)無(wú)法連接,這就是MP工作異常的問(wèn)題所在。
8. 根據(jù)遠(yuǎn)程會(huì)話中我們發(fā)現(xiàn)的報(bào)錯(cuò),貴方將445以及1433端口做了開放。之后再次進(jìn)行測(cè)試,發(fā)現(xiàn)客戶端依舊在向SCCM MP請(qǐng)求policy。我們建議按照以下步驟將PXE re-enable, 完成之后測(cè)試PXE boot成功。
----------------------
SCCM console --- 管理--- 分發(fā)點(diǎn);
找到20GD 分發(fā)點(diǎn), 打開基屬性, 取消PXE 相關(guān)的設(shè)置, 確認(rèn)應(yīng)用;
等15-20分鐘, 重啟服務(wù)器;
刪除原來(lái)的RemoteInstall 目錄 (確認(rèn)各各分區(qū)下面都沒有這個(gè)目錄, 如果有請(qǐng)刪除或改名);
在SCCM 控制臺(tái)上, 找到20GD 分發(fā)點(diǎn), 再啟用PXE. 系統(tǒng)會(huì)重裝PXE (WDS);
等5-10分鐘后, 確認(rèn) WDS服務(wù)是否裝好(確認(rèn)系統(tǒng)服務(wù)deployment service 和 數(shù)據(jù)分區(qū)中 RemoteInstall 目錄 ),安裝完成后測(cè)試PXE boot。
針對(duì)這兩部分的排查,根據(jù)我的分析和經(jīng)驗(yàn),之前發(fā)生PXE 啟動(dòng)失敗的原因有以下:
a. PXE/WDS 節(jié)點(diǎn)上的啟動(dòng)鏡像異常---我們?cè)诤罄m(xù)的PXE 重裝中, 專門刪除了之前的老的文件夾,確保了重新裝的PXE 不受之前老的文件影響。
b. 部署異常---之前并沒有部署給所有未知計(jì)算機(jī)的任務(wù)序列, 這樣也間接造成了PXE 啟動(dòng)時(shí), 找不到對(duì)應(yīng)的任務(wù)。
c.端口異常關(guān)閉---造成了在PXE啟動(dòng)階段,站點(diǎn)服務(wù)器無(wú)法正常的完成查詢,任務(wù)序列也無(wú)法被檢測(cè)到
第二階段:任務(wù)序列卡死
9. 在解決了PXE 啟動(dòng)問(wèn)題后, 系統(tǒng)已經(jīng)可以成功的從PXE 啟動(dòng)到WinPE 階段,但是在WinPE 階段卻沒有如預(yù)期的看到任務(wù)序列, 一直顯示一個(gè)空白界面如下:
由于無(wú)法從現(xiàn)場(chǎng)機(jī)器上獲取WinPE 階段的日志: smsts.log, 我們嘗試通過(guò)虛擬機(jī)測(cè)試這一問(wèn)題。在這一過(guò)程中, 我們?cè)?/span>DP 上調(diào)整了設(shè)置, 使之可以在WinPE 階段做調(diào)試 (通過(guò)F8 鍵調(diào)出命令控制臺(tái))
10. 在通過(guò)虛擬機(jī)測(cè)試時(shí),我們收到了如下的錯(cuò)誤:
這個(gè)錯(cuò)誤信息是由于損壞或有問(wèn)題的WinPE 鏡像造成的, 我們通過(guò)重新建立Boot鏡像, 并調(diào)整了任務(wù)序列里的Boot鏡像設(shè)置,確保對(duì)應(yīng)任務(wù)序列和操作系統(tǒng)匹配后,這個(gè)錯(cuò)誤消失。但是WinPE階段還是如上圖一樣,不顯示任何任務(wù)序列。
11. 在虛擬機(jī)收集到的smsts.log日志中,我們的發(fā)現(xiàn)了如下的信息。顯示在WinPE 階段, 這臺(tái)客戶端機(jī)器無(wú)法正常的連接到對(duì)應(yīng)的MP 和DP 服務(wù)器。
在網(wǎng)絡(luò)同事調(diào)整DNS 設(shè)置后, 這個(gè)問(wèn)題很快的被解決。 也可以正常的看到任務(wù)序列了。
至此, 系統(tǒng)可以正常的部署, 在虛擬機(jī)上測(cè)試的結(jié)果也為正常。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。