溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何深入了解.NET編譯器中CLR加載過程

發(fā)布時(shí)間:2022-01-11 13:41:39 來源:億速云 閱讀:125 作者:柒染 欄目:編程語言

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何深入了解.NET編譯器中CLR加載過程,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

以下說明CLR加載過程所使用的工具是VS2005+sos.dll,示例程序代碼如下:    using System;

using System.Collections.Generic;  using System.Text;   namespace hello  {      class Program      {          static void Main(string[] args)          {              Int32 a = 1;              Int32 b = 2;              b = a + b;              Console.WriteLine(b);               Console.ReadKey();          }      }  }

那么CLR加載過程是怎樣的呢?

1、當(dāng)你雙擊一個(gè).exe文件時(shí),Windows操作系統(tǒng)提供的PE Loader會將該exe文件載入內(nèi)存;

(1)、首先明確一點(diǎn),PE Loader問什么能加載exe文件呢?因?yàn)閑xe文件就是一種PE文件,PE(Portable Execute)文件是微軟Windows操作系統(tǒng)上的程序文件,EXE、DLL、OCX、SYS、COM都是PE文件。

(2)、有必要了解一下PE文件的結(jié)構(gòu):

如何深入了解.NET編譯器中CLR加載過程

圖 1

1) Dos stub

由100個(gè)左右的字節(jié)所組成,用來輸出類似“這個(gè)程序不能在DOS下運(yùn)行!”這樣的錯(cuò)誤信息;

2) PE Signature

DWORD類型,PE文件簽名,用來表示這是個(gè)PE文件,用ASCII碼表示;

3) File Header

包含PE文件最基本信息,通過dumpbin可以看到,如圖2所示 從這里可以看到:CPU類型為14c,是Intel I386、I486或者I586;section的數(shù)量為2;鏈接器產(chǎn)生這個(gè)文件的日期;COFF符號表的文件偏移量,為0;COFF符號表的符號數(shù)目,為0;Optional Header的大小。

如何深入了解.NET編譯器中CLR加載過程

圖2

4) Optional Header

用來存儲除了基本信息以外的其他重要信息,具體含義大家可以查閱PE文件格式的相關(guān)資料,我這里對一些關(guān)心的域根據(jù)圖3進(jìn)行一下說明:

-- entry point,指明這個(gè)PE文件的入口地址,是一個(gè)RVA(相對虛擬地址); -- base of code,代碼塊起始地址的RVA,在內(nèi)存中,代碼塊通常在PE首部之后,數(shù)據(jù)塊之前;

 -- base of data,數(shù)據(jù)塊; -- image base,PE文件被鏈接器重定位后的內(nèi)存地址,可以是鏈接器優(yōu)化,節(jié)省載入時(shí)間和空間;

 -- subsystem,可執(zhí)行文件的用戶界面使用的子系統(tǒng)類型。具體值的含義為:

1 不需要子系統(tǒng)(比如設(shè)備驅(qū)動)

2 在Windows圖形用戶界面子系統(tǒng)下運(yùn)行

3 在Windows字符子系統(tǒng)下運(yùn)行(控制臺程序)

5 在OS/2字符子系統(tǒng)下運(yùn)行(僅對OS/2 1.x)

7 在 Posix 字符子系統(tǒng)下運(yùn)行

所以可以看到我們的程序是一個(gè)控制臺程序。

       -- 最后定義了一些數(shù)據(jù)目錄,具體內(nèi)容不再贅述。

如何深入了解.NET編譯器中CLR加載過程

                                                                     圖 3

5)  section header

Section header可以有一個(gè)或多個(gè),見圖4、圖5、圖6。

-- name,表示這個(gè)section的名字,例如這個(gè)section的名字為.text;

-- virtual address,保存section中數(shù)據(jù)被載入內(nèi)存后的RVA;

-- file pointer to raw data,從文件開頭到section中數(shù)據(jù)的偏移量。


如何深入了解.NET編譯器中CLR加載過程

                                                                     圖 4

-- Section 的原始數(shù)據(jù)

如何深入了解.NET編譯器中CLR加載過程

                                                                     圖 5

如何深入了解.NET編譯器中CLR加載過程

圖 6
-- CLR頭,從圖7可以找到隨托管代碼IL同時(shí)生成的元數(shù)據(jù)表的RVA。

如何深入了解.NET編譯器中CLR加載過程

圖 7

2、PE loader通過查找CLR頭發(fā)現(xiàn)該目錄不為空,則自動將mscoree.dll載入進(jìn)程地址空間中,mscoree.dll一定是唯一的,且總是處于系統(tǒng)目錄的system32下,例如我的機(jī)器為C:\WINDOWS\system32目錄下。.net 2.0的mscoree.dll的大小只有256k左右,這個(gè)dll被叫做shim,它的作用是連接PE文件和CLR之間的一個(gè)橋梁。

3、PE loader接著會找到entry point,例如本例中圖3所示,這個(gè)PE文件的入口點(diǎn)地址為0040251E,然后通過這個(gè)地址來查找.text section的原始數(shù)據(jù)表,由圖6所示,0040251E這個(gè)地址開始的6個(gè)字節(jié)的內(nèi)容為【FF 25 00 20 40 00】,這個(gè)內(nèi)容就是由編譯器寫入PE文件的.text section的重要信息,F(xiàn)F在x86匯編語言與機(jī)器碼對照表中代表無條件轉(zhuǎn)移指令Jmp,這條指令的作用是無條件跳轉(zhuǎn)到00402000地址處,從圖3可以看到image base 是00400000,2000是import address table的RVA地址,由圖7可以看到,此時(shí)程序會跳轉(zhuǎn)到00402000這個(gè)地址所引用的mscoree.dll的_CorExeMain(_CorExeMain為mscoree.dll的入口方法)方法,所有的托管應(yīng)用都會通過上述過程找到并執(zhí)行_CorExeMain方法;

4、_CorExeMain方法會幫助程序找到并載入適當(dāng)?shù)腃LR版本,在.net 2.0以后實(shí)現(xiàn)CLR的程序集為mscorwks.dllmscorsvr.dll,例如,在我的機(jī)器上mscorwks.dll的位置是:C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\;

5、啟動CLR服務(wù),開始初始化工作,這個(gè)初始化工作包括:

-- 分配一塊內(nèi)存空間,建立托管堆及其它必要的堆,由GC監(jiān)控整個(gè)托管堆

-- 創(chuàng)建線程池

-- 創(chuàng)建應(yīng)用程序域(AppDomain):利用sos.dll可以查看CLR創(chuàng)建了哪些AppDomain。

用VS2005打開我們的程序,即時(shí)窗口中敲入:.load sos.dll。

在VS2005的即時(shí)窗口中敲入:后的結(jié)果),但是依然可以說明問題:

如何深入了解.NET編譯器中CLR加載過程

圖 8

由圖8可見,CLR創(chuàng)建了System Domain、Shared Domain和Domain1,這個(gè)Domain1是默認(rèn)Appdomain。

6、接下來就會向默認(rèn)AppDomain中載入mscorlib.dll,由圖八可見,任何托管代碼,CLR在創(chuàng)建好默認(rèn)AppDomain后,第一個(gè)載入的組件一定是mscorlib.dll,實(shí)際上這個(gè)組件定義了System.Object、所有基元類型:如System.Int32等,利用sos.dll可以看到有哪些類被載入,依據(jù)Domain 1里的Module地址,在即時(shí)窗口敲入命令!dumpmodule -mt790c2000,結(jié)果如下,比較長,我只列出部分:


如何深入了解.NET編譯器中CLR加載過程

圖 9

從圖9可以看到System.Object被第一個(gè)加載進(jìn)來,接著是System.ICloneable、System.IEnumerable、System.Collection.ICollection、System.Collection.IList、System.Array……

7、產(chǎn)生主線程后可能會觸發(fā)一些mscorlib.dll里的類型并加載入內(nèi)存,接著,當(dāng)你的PE文件:hello.exe被載入后,默認(rèn)Appdomain的名字被改為你的PE文件的名字,載入過程完成后的結(jié)果可見圖8。

8、包含在mscorwks.dll中的_CorExeMain2方法接管主線程,它將調(diào)用System Domain中的SystemDomain::ExecuteMainMethod方法,然后由此方法調(diào)用類型加載器的ClassLoader::LoadTypeHandleFromToken方法,該方法會讀取程序集中的元數(shù)據(jù)表,并在里面查找包含.entrypoint的類型,并返回由EECLASS結(jié)構(gòu)表示的該類型的實(shí)例,EECLASS結(jié)構(gòu)中包含重要信息有:指向當(dāng)前類型父類的指針、指向方法表的指針、實(shí)例字段和靜態(tài)字段等。

(1)、在即時(shí)窗口敲入命令0097c

如何深入了解.NET編譯器中CLR加載過程

圖 10

從圖10可以看到在當(dāng)前模塊中所定義的類型:hello.Program和所引用的類型:System.Object和System.Console。

(2)、在即時(shí)窗口敲入命令<SPAN lang=EN-US  SPAN mso-bidi-font-family: 0.25pt; LETTER-SPACING: Verdana; FONT-FAMILY: red; COLOR: 12pt; FONT-SIZE: 00971260< Aria!dumpclass>后,有如下結(jié)果:

如何深入了解.NET編譯器中CLR加載過程
圖 11

由圖11可以得到如下信息:為hello.Program類型分配的EECLASS在內(nèi)存中的地址為00971260,通過這個(gè)地址查看其信息,發(fā)現(xiàn)hello.Program的父類地址為: 790f8a18,在即時(shí)窗口敲入命令790f8a

如何深入了解.NET編譯器中CLR加載過程

圖 12

方法表Method Table的地址為00972ff8。

 (3)、方法表里存的是什么呢?其實(shí)是當(dāng)前類型中所有定義和引用到的方法的入口點(diǎn),這個(gè)入口點(diǎn)被叫做Method descriptors,從圖11可以看到。

 (4)、實(shí)際上Method descriptors被分為兩個(gè)部分,第一部分是m_CodeOrIL,在當(dāng)前方法沒有被JIT的時(shí)候,m_CodeOrIL存的是這個(gè)方法的MSIL的RVA,也就是從這個(gè)RVA可以找到當(dāng)前方法的MSIL代碼;第二部分是對JIT編譯器的一個(gè)Stub(存根),當(dāng)方法是第一次被調(diào)用的時(shí)候,CLR會通過這個(gè)Stub調(diào)用mscorjit.dll組件,通過m_CodeOrIL里存儲的RVA,找到這個(gè)方法對應(yīng)的MSIL代碼,然后將其編譯為本地CPU指令,假設(shè)這里存到地址RVA1,最后將m_CodeOrIL和Stub的值都修改為RVA1,那么當(dāng)這個(gè)方法第二次被調(diào)用的時(shí)候?qū)苯油ㄟ^RVA1去尋找本地代碼,換句話說只有當(dāng)方法第一次被調(diào)用的時(shí)候才會被Jit編譯器編譯,之后則直接使用編譯好的本地代碼。同時(shí)這也說明托管代碼被編譯了兩次,第一次編譯是將托管代碼編譯為MSIL代碼,并同時(shí)生成Metadata元數(shù)據(jù)文件,第二次編譯發(fā)生在方法被調(diào)用時(shí)由Jit編譯器完成。

(5)、在即時(shí)窗口敲入命令!dumpmd 00972fe8和!dumpmd 00972f0可以看到已經(jīng)被Jit過的和還沒有被Jit的方法的信息:

<SPAN lang=EN-US  unitname="F" sourcevalue="972" hasspace="False" negative="False" numbertype="1" tcsc="0" w:st="on" mso-bidi-font-family: 0.25pt; LETTER-SPACING: Verdana; FONT-FAMILY: red; COLOR: 12pt; FONT-SIZE:如何深入了解.NET編譯器中CLR加載過程

<SPAN lang=EN-US  unitname="F" sourcevalue="972" hasspace="False" negative="False" numbertype="1" tcsc="0" w:st="on" mso-bidi-font-family: 0.25pt; LETTER-SPACING: Verdana; FONT-FAMILY: red; COLOR: 12pt; FONT-SIZE:圖 13

被Jit過得方法則會修改m_CodeOrIL,如Main方法的m_CodeOrIL被指向地址00e50070,而沒有被Jit的方法m_CodeOrIL的值為ffffffffffffffff。

 (6)、在即時(shí)窗口敲入命令
如何深入了解.NET編譯器中CLR加載過程

圖 14

圖14列出helloProgram.Main方法的本地代碼。而如果在即時(shí)窗口敲入命令!u ffffffffffffffff則顯示Unmanaged code。

9、進(jìn)入Main方法,進(jìn)而執(zhí)行后續(xù)程序。

最后,從上述分析也可以看出,.NET的幾個(gè)核心組件的被調(diào)用順序大致是: mscoree.dll -----> mscorwks.dll(mscorsvr.dll)  -----> mscorlib.dll ----->mscorjit.dll。
一般來說調(diào)試.NET程序使用VS2005就可以了,但是要想得到更詳細(xì)的信息,如內(nèi)存情況等就需要借助其他工具了,個(gè)人覺得sos.dll和Windbg是很好的工具,Windbg可以在http://www.microsoft.com/whdc/devtools/debugging/default.mspx下載,而如果你裝的是VS2005 Team Version,那么自帶sos.dll。

上述就是小編為大家分享的如何深入了解.NET編譯器中CLR加載過程了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

clr
AI