溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PCIe接口中斷驅(qū)動(dòng)寄存器被覆蓋問題的發(fā)現(xiàn)與解決是怎樣的

發(fā)布時(shí)間:2021-12-06 16:54:40 來源:億速云 閱讀:158 作者:柒染 欄目:互聯(lián)網(wǎng)科技

本篇文章給大家分享的是有關(guān)PCIe接口中斷驅(qū)動(dòng)寄存器被覆蓋問題的發(fā)現(xiàn)與解決是怎樣的,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

最近調(diào)試Windows平臺(tái)下的PCIe網(wǎng)絡(luò)驅(qū)動(dòng)程序時(shí),發(fā)現(xiàn)了中斷不被處理的情況,懷疑中斷丟失。隨后在調(diào)試過程中將問題定位在如下兩個(gè)方面。

DMA寫重復(fù)啟動(dòng)

    我們?cè)赪indows下使用WDF框架開發(fā)PCIe驅(qū)動(dòng)的DMA讀寫功能。驅(qū)動(dòng)要啟動(dòng)一次DMA傳輸包括兩個(gè)步驟

  • 初始化DMA傳輸對(duì)象

  • 執(zhí)行DMA傳輸

初始化DMA傳輸對(duì)象時(shí),應(yīng)將本次DMA要傳輸?shù)臄?shù)據(jù)緩沖區(qū)的地址和長度寫入該對(duì)象,并向其注冊(cè)用于配置并啟動(dòng)DMA傳輸?shù)幕卣{(diào)函數(shù)PCIeEvtProgramWriteDma。該回調(diào)函數(shù)會(huì)獲取緩沖區(qū)地址和長度,通過PIO方式配置PCIe Bar空間上的寄存器,以通知硬件啟動(dòng)DMA傳輸。

執(zhí)行DMA傳輸時(shí),驅(qū)動(dòng)僅需調(diào)用WDF框架的WdfDmaTransactionExecute函數(shù),操作系統(tǒng)就會(huì)調(diào)用上一步注冊(cè)的回調(diào)函數(shù)對(duì)硬件進(jìn)行配置并啟動(dòng)DMA傳輸。

正常來講,驅(qū)動(dòng)調(diào)用一次WdfDmaTransactionExecute函數(shù),相應(yīng)地操作系統(tǒng)應(yīng)調(diào)用一次回調(diào)函數(shù)進(jìn)行硬件配置。但我們更換硬件平臺(tái)(CPU+FPGA)后,DMA寫流程出現(xiàn)了嚴(yán)重問題,具體表現(xiàn)為:前者的一次調(diào)用可能會(huì)對(duì)應(yīng)著后者的多次調(diào)用,且每次回調(diào)函數(shù)都會(huì)完整執(zhí)行并觸發(fā)DMA寫完成中斷,從而造成了驅(qū)動(dòng)的中斷狀態(tài)機(jī)被打亂,直接表現(xiàn)是后續(xù)的DMA寫開始中斷丟失,無法正常啟動(dòng)DMA寫。

         如下,圖1是驅(qū)動(dòng)調(diào)用WdfDmaTransactionExecute函數(shù)的次數(shù)與操作系統(tǒng)調(diào)用回調(diào)函數(shù)的次數(shù)不一致的截圖。

PCIe接口中斷驅(qū)動(dòng)寄存器被覆蓋問題的發(fā)現(xiàn)與解決是怎樣的

圖1 DebugMonito監(jiān)測

         其中,5658(5576+82+0)為驅(qū)動(dòng)調(diào)用WdfDmaTransactionExecute函數(shù)的次數(shù),5664為操作系統(tǒng)調(diào)用回調(diào)函數(shù)的次數(shù)。二者之間差6就是操作系統(tǒng)重復(fù)調(diào)用的次數(shù)。

         我們嘗試將操作系統(tǒng)多出來的調(diào)用回調(diào)函數(shù)的次數(shù)跳過,即僅保留第一次調(diào)用。硬件側(cè)可以正常完成這次DMA傳輸,并觸發(fā)DMA寫完成中斷。但驅(qū)動(dòng)去查詢DMA傳輸對(duì)象時(shí),發(fā)現(xiàn)此次DMA傳輸并未處于完成狀態(tài),即無法正常接收數(shù)據(jù)。至此,我們猜測,操作系統(tǒng)多次調(diào)用回調(diào)函數(shù)的原因是其認(rèn)為配置過程出錯(cuò)才重新進(jìn)行配置,直至最后一次成功。而硬件側(cè)并不會(huì)感知到這種錯(cuò)誤,每次都正常啟動(dòng)DMA寫并觸發(fā)DMA寫完成中斷,導(dǎo)致驅(qū)動(dòng)的中斷狀態(tài)機(jī)跑飛。

         問題排查到這里,我們無法深入到閉源的Windows操作系統(tǒng)內(nèi)部去探究錯(cuò)誤原因了。所以思路一轉(zhuǎn),我們嘗試能否為中斷狀態(tài)機(jī)提供一些保障機(jī)制。

 

驅(qū)動(dòng)的中斷狀態(tài)機(jī)

為了方便調(diào)試,我們?cè)谥袛嗵幚沓绦蛑刑砑恿嗽S多關(guān)鍵的調(diào)試日志信息,結(jié)果在其中發(fā)現(xiàn)了端倪。

PCIe接口中斷驅(qū)動(dòng)寄存器被覆蓋問題的發(fā)現(xiàn)與解決是怎樣的

圖2 日志打印記錄

觀察圖2中的日志,發(fā)現(xiàn)兩個(gè)中斷延遲處理函數(shù)MPHandleInterrupt在并行執(zhí)行。在這個(gè)過程中,用于臨時(shí)拷貝中斷寄存的變量Adapter->IsrCode_dpc被覆蓋重寫。覆蓋的直接后果是,前者已讀取到的寄存的中斷,后者覆蓋后就無法由中斷延遲處理程序進(jìn)行處理。

這種現(xiàn)象顯然是不合理的。為了解決這個(gè)問題,我們?yōu)镸PHandleInterrupt函數(shù)內(nèi)部加鎖,防止MPHandleInterrupt并行執(zhí)行。通過這種方式,中斷寄存被覆蓋的現(xiàn)象不再發(fā)生。

以上就是PCIe接口中斷驅(qū)動(dòng)寄存器被覆蓋問題的發(fā)現(xiàn)與解決是怎樣的,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI