溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Java 中怎么實(shí)現(xiàn)一個(gè)Class解析器

發(fā)布時(shí)間:2021-08-07 11:29:56 來源:億速云 閱讀:166 作者:Leah 欄目:編程語言

Java 中怎么實(shí)現(xiàn)一個(gè)Class解析器,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

Class文件

作為類或者接口信息的載體,每個(gè)Class文件都完整的定義了一個(gè)類。為了使Java程序可以“編寫一次,處處運(yùn)行”,Java虛擬機(jī)規(guī)范對(duì)Class文件進(jìn)行了嚴(yán)格的規(guī)定。構(gòu)成Class文件的基本數(shù)據(jù)單位是字節(jié),這些字節(jié)之間不存在任何分隔符,這使得整個(gè)Class文件中存儲(chǔ)的內(nèi)容幾乎全部是程序運(yùn)行的必要數(shù)據(jù),單個(gè)字節(jié)無法表示的數(shù)據(jù)由多個(gè)連續(xù)的字節(jié)來表示。

根據(jù)Java虛擬機(jī)規(guī)范,Class文件采用一種類似于C語言結(jié)構(gòu)體的偽結(jié)構(gòu)來存儲(chǔ)數(shù)據(jù),這種偽結(jié)構(gòu)中只有兩種數(shù)據(jù)類型:無符號(hào)數(shù)和表。Java虛擬機(jī)規(guī)范定義了u1、u2、u4u8來分別表示1個(gè)字節(jié)、2個(gè)字節(jié)、4個(gè)字節(jié)和8個(gè)字節(jié)的無符號(hào)數(shù),無符號(hào)數(shù)可以用來描述數(shù)字、索引引用、數(shù)量值或者是字符串。表是由多個(gè)無符號(hào)數(shù)或者其它表作為數(shù)據(jù)項(xiàng)構(gòu)成的符合數(shù)據(jù)類型,表用于描述有層次關(guān)系的符合結(jié)構(gòu)的數(shù)據(jù),因此整個(gè)Class文件本質(zhì)上就是一張表。在ClassAnalyzeru1、u2、u4u8分別對(duì)應(yīng)于byteshort、intlongClass文件被描述為如下Java類。

public class ClassFile {public U4 magic;                            // magicpublic U2 minorVersion;                     // minor_versionpublic U2 majorVersion;                     // major_versionpublic U2 constantPoolCount;                // constant_pool_countpublic ConstantPoolInfo[] cpInfo;           // cp_infopublic U2 accessFlags;                      // access_flagspublic U2 thisClass;                        // this_classpublic U2 superClass;                       // super_classpublic U2 interfacesCount;                  // interfaces_countpublic U2[] interfaces;                     // interfacespublic U2 fieldsCount;                      // fields_countpublic FieldInfo[] fields;                  // fieldspublic U2 methodsCount;                     // methods_countpublic MethodInfo[] methods;                // methodspublic U2 attributesCount;                  // attributes_countpublic BasicAttributeInfo[] attributes;     // attributes}

如何解析

組成Class文件的各個(gè)數(shù)據(jù)項(xiàng)中,例如魔數(shù)、Class文件的版本等數(shù)據(jù)項(xiàng)、訪問標(biāo)志、類索引、父類索引,它們?cè)诿總€(gè)Class文件中都占用固定數(shù)量的字節(jié),在解析時(shí)只需要讀取相應(yīng)數(shù)量的字節(jié)。除此之外,需要靈活處理的主要包括4部分:常量池、字段表集合、方法表集合和屬性表集合。字段和方法都可以具備自己的屬性,Class本身也有相應(yīng)的屬性,因此,在解析字段表集合和方法表集合的同時(shí)也包含了屬性表的解析。

常量池占據(jù)了Class文件很大一部分的數(shù)據(jù),用于存儲(chǔ)所有的常量信息,包括數(shù)字和字符串常量、類名、接口名、字段名和方法名等。Java虛擬機(jī)規(guī)范定義了多種常量類型,每一種常量類型都有自己的結(jié)構(gòu)。常量池本身是一個(gè)表,在解析時(shí)有幾點(diǎn)需要注意。

  • 每個(gè)常量類型都通過一個(gè)u1類型的tag來標(biāo)識(shí)。

  • 表頭給出的常量池大小(constantPoolCount)比實(shí)際大1,例如,如果constantPoolCount等于47,那么常量池中有46項(xiàng)常量。

  • 常量池的索引范圍從1開始,例如,如果constantPoolCount等于47,那么常量池的索引范圍為1~46。設(shè)計(jì)者將第0項(xiàng)空出來的目的是用于表達(dá)“不引用任何一個(gè)常量池項(xiàng)目”。

  • CONSTANT_Utf8_info型常量的結(jié)構(gòu)中包含u1類型的tag、u2類型的length和由length個(gè)u1類型組成的bytes,這length字節(jié)的連續(xù)數(shù)據(jù)是一個(gè)使用MUTF-8Modified UTF-8)編碼的字符串。MUTF-8UTF-8并不兼容,主要區(qū)別有兩點(diǎn):一是null字符會(huì)被編碼成2字節(jié)(0xC00x80);二是補(bǔ)充字符是按照UTF-16拆分為代理對(duì)分別編碼的,相關(guān)細(xì)節(jié)可以看這里(變種UTF-8)。

屬性表用于描述某些場(chǎng)景專有的信息,Class文件、字段表和方法表都有相應(yīng)的屬性表集合。Java虛擬機(jī)規(guī)范定義了多種屬性,ClassAnalyzer目前實(shí)現(xiàn)了對(duì)常用屬性的解析。和常量類型的數(shù)據(jù)項(xiàng)不同,屬性并沒有一個(gè)tag來標(biāo)識(shí)屬性的類型,但是每個(gè)屬性都包含有一個(gè)u2類型的attribute_name_indexattribute_name_index指向常量池中的一個(gè)CONSTANT_Utf8_info類型的常量,該常量包含著屬性的名稱。在解析屬性時(shí),ClassAnalyzer正是通過attribute_name_index指向的常量對(duì)應(yīng)的屬性名稱來得知屬性的類型。

字段表用于描述類或者接口中聲明的變量,字段包括類級(jí)變量以及實(shí)例級(jí)變量。字段表的結(jié)構(gòu)包含一個(gè)u2類型的access_flags、一個(gè)u2類型的name_index、一個(gè)u2類型的descriptor_index、一個(gè)u2類型的attributes_countattributes_count個(gè)attribute_info類型的attributes。我們已經(jīng)介紹了屬性表的解析,attributes的解析方式與屬性表的解析方式一致。

Class的文件方法表采用了和字段表相同的存儲(chǔ)格式,只是access_flags對(duì)應(yīng)的含義有所不同。方法表包含著一個(gè)重要的屬性:Code屬性。Code屬性存儲(chǔ)了Java代碼編譯成的字節(jié)碼指令,在ClassAnalyzer中,Code對(duì)應(yīng)的Java類如下所示(僅列出了類屬性)。

public class Code extends BasicAttributeInfo {private short maxStack;private short maxLocals;private long codeLength;private byte[] code;private short exceptionTableLength;private ExceptionInfo[] exceptionTable;private short attributesCount;private BasicAttributeInfo[] attributes;
    ...private class ExceptionInfo {public short startPc;public short endPc;public short handlerPc;public short catchType;
          ...
    }
}

Code屬性中,codeLengthcode分別用于存儲(chǔ)字節(jié)碼長(zhǎng)度和字節(jié)碼指令,每條指令即一個(gè)字節(jié)(u1類型)。在虛擬機(jī)執(zhí)行時(shí),通過讀取code中的一個(gè)個(gè)字節(jié)碼,并將字節(jié)碼翻譯成相應(yīng)的指令。另外,雖然codeLength是一個(gè)u4類型的值,但是實(shí)際上一個(gè)方法不允許超過65535條字節(jié)碼指令。

看完上述內(nèi)容,你們掌握J(rèn)ava 中怎么實(shí)現(xiàn)一個(gè)Class解析器的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI