在路上

 找回密码
 立即注册
在路上 站点首页 学习 查看内容

Java Class文件详解

2016-12-20 13:12| 发布者: zhangjf| 查看: 541| 评论: 0

摘要: 原文出处: 禅楼望月 Java Class文件中包含以下信息: ClassFile {u4 magic; //模数u2 minor_version; ...
原文出处: 禅楼望月

Java Class文件中包含以下信息:

  1. ClassFile {
  2. u4 magic; //模数
  3. u2 minor_version; //次版本号
  4. u2 major_version; //主版本号
  5. u2 constant_pool_count; //常量池大小
  6. cp_info constant_pool[constant_pool_count-1]; //常量池
  7. u2 access_flags; //类和接口层次的访问标志(通过|运算得到)
  8. u2 this_class; //类索引(指向常量池中的类常量)
  9. u2 super_class; //父类索引(指向常量池中的类常量)
  10. u2 interfaces_count; //接口索引计数器
  11. u2 interfaces[interfaces_count]; //接口索引集合
  12. u2 fields_count; //字段数量计数器
  13. field_info fields[fields_count]; //字段表集合
  14. u2 methods_count; //方法数量计数器
  15. method_info methods[methods_count]; //方法表集合
  16. u2 attributes_count; //属性个数
  17. attribute_info attributes[attributes_count]; //属性表
  18. }
复制代码
1. 通过实例来看
  1. public interface InterA {
  2. void interA();
  3. }
  4. public interface InterB {
  5. String interB(int i);
  6. }
  7. public interface InterC {
  8. void interC();
  9. }
  10. public class Base implements InterA {
  11. private int baseInt;
  12. protected String baseString;
  13. public int getBaseInt() {
  14. return baseInt;
  15. }
  16. public void setBaseInt(int baseInt) {
  17. this.baseInt = baseInt;
  18. }
  19. @Override
  20. public void interA() {
  21. System.out.println("the interA in Base");
  22. }
  23. }
  24. public class Sub extends Base implements InterB, InterC {
  25. private int subInt;
  26. private static String subString;
  27. private static Object subObject;
  28. public int getSubInt() {
  29. return subInt;
  30. }
  31. public void setSubInt(int subInt) {
  32. this.subInt = subInt;
  33. }
  34. public static String getSubString() {
  35. return subString;
  36. }
  37. public static void setSubString(String subString) {
  38. Sub.subString = subString;
  39. }
  40. public static Object getSubObject() {
  41. return subObject;
  42. }
  43. public static void setSubObject(Object subObject) {
  44. Sub.subObject = subObject;
  45. }
  46. @Override
  47. public void interC() {
  48. System.out.println("the interC in Sub");
  49. }
  50. @Override
  51. public String interB(int i) {
  52. return "the interB in Sub";
  53. }
  54. }
复制代码

我们使用WinHex查看Sub类的.class文件:

Java Class文件详解

2. 魔数

作用:确定该文件是否是虚拟机可接受的class文件。java的魔数统一为 0xCAFEBABE (来源于一款咖啡)。

区域:文件第0~3字节。

3. 版本号

作用:表示class文件的版本,由minorversion和majorversion组成。

区域:文件第4~7字节。

Java Class文件详解

51代表,jdk为1.7.0

需要注意的是java版本号是从45开始的,大版本发布,主版本号+1.高版本的jdk能向下兼容以前版本的class文件,但不兼容以后版本的class文件。

4. 常量池

常量池的大小是不固定的,根据你的类中的常量的多少而定,所以在常量池的入口,放置了一个u2类型的表示常量池中常量个数的常量池容量计数器。计数器从1开始,第0位有特殊含义,表示指向常量池的索引值数据不引用任何一个常量池项目。池中的数据项就像数组一样是通过索引访问的。

Java Class文件详解

我们可以清楚的看到,我们常量池中有63-1=62个常量。这些常量是什么呢?

要存放字面量Literal和符号引用Symbolic References。

字面量可能是文本字符串,或final的常量值。
符号引用包括以下:

类或接口全限定名 Full Qualified Name 字段名称和描述符 Descriptor 方法名称和描述符

我们使用反编译工具查看一下:

  1. E:programJVMbincomgisskyclazz>javap -v Sub.class
  2. Classfile /E:/program/JVM/bin/com/gissky/clazz/Sub.class
  3. Last modified 2015-2-22; size 1363 bytes
  4. MD5 checksum 2dc77c79e4790422407eb7092085883c
  5. Compiled from "Sub.java"
  6. public class com.gissky.clazz.Sub extends com.gissky.clazz.Base implements com.gissky.clazz.InterB,com.gissky.clazz.InterC
  7. SourceFile: "Sub.java"
  8. minor version: 0
  9. major version: 51
  10. flags: ACC_PUBLIC, ACC_SUPER
  11. Constant pool:
  12. #1 = Class #2 // com/gissky/clazz/Sub →类和接口的全限定名
  13. #2 = Utf8 com/gissky/clazz/Sub
  14. #3 = Class #4 // com/gissky/clazz/Base
  15. #4 = Utf8 com/gissky/clazz/Base
  16. #5 = Class #6 // com/gissky/clazz/InterB
  17. #6 = Utf8 com/gissky/clazz/InterB
  18. #7 = Class #8 // com/gissky/clazz/InterC
  19. #8 = Utf8 com/gissky/clazz/InterC
  20. #9 = Utf8 subInt
  21. #10 = Utf8 I
  22. #11 = Utf8 subString
  23. #12 = Utf8 Ljava/lang/String;
  24. #13 = Utf8 subObject
  25. #14 = Utf8 Ljava/lang/Object;
  26. #15 = Utf8 <init>
  27. #16 = Utf8 ()V
  28. #17 = Utf8 Code
  29. #18 = Methodref #3.#19 // com/gissky/clazz/Base."<init>":()V
  30. #19 = NameAndType #15:#16 // "<init>":()V
  31. #20 = Utf8 LineNumberTable
  32. #21 = Utf8 LocalVariableTable
  33. #22 = Utf8 this
  34. #23 = Utf8 Lcom/gissky/clazz/Sub;
  35. #24 = Utf8 getSubInt
  36. #25 = Utf8 ()I
  37. #26 = Fieldref #1.#27 // com/gissky/clazz/Sub.subInt:I → 类中字段的符号引用
  38. #27 = NameAndType #9:#10 // subInt:I → 类中字段的部分符号引用之名称和类型
  39. #28 = Utf8 setSubInt
  40. #29 = Utf8 (I)V
  41. #30 = Utf8 getSubString
  42. #31 = Utf8 ()Ljava/lang/String;
  43. #32 = Fieldref #1.#33 // com/gissky/clazz/Sub.subString:Ljava/lang/String;
  44. #33 = NameAndType #11:#12 // subString:Ljava/lang/String;
  45. #34 = Utf8 setSubString
  46. #35 = Utf8 (Ljava/lang/String;)V
  47. #36 = Utf8 getSubObject
  48. #37 = Utf8 ()Ljava/lang/Object;
  49. #38 = Fieldref #1.#39 // com/gissky/clazz/Sub.subObject:Ljava/lang/Object;
  50. #39 = NameAndType #13:#14 // subObject:Ljava/lang/Object;
  51. #40 = Utf8 setSubObject
  52. #41 = Utf8 (Ljava/lang/Object;)V
  53. #42 = Utf8 interC
  54. #43 = Fieldref #44.#46 // java/lang/System.out:Ljava/io/PrintStream;
  55. #44 = Class #45 // java/lang/System
  56. #45 = Utf8 java/lang/System
  57. #46 = NameAndType #47:#48 // out:Ljava/io/PrintStream;
  58. #47 = Utf8 out
  59. #48 = Utf8 Ljava/io/PrintStream;
  60. #49 = String #50 // the interC in Sub
  61. #50 = Utf8 the interC in Sub
  62. #51 = Methodref #52.#54 // java/io/PrintStream.println:(Ljava/lang/String;)V
  63. #52 = Class #53 // java/io/PrintStream
  64. #53 = Utf8 java/io/PrintStream
  65. #54 = NameAndType #55:#35 // println:(Ljava/lang/String;)V
  66. #55 = Utf8 println
  67. #56 = Utf8 interB
  68. #57 = Utf8 (I)Ljava/lang/String;
  69. #58 = String #59 // the interB in Sub →方法中用到的String常量
  70. #59 = Utf8 the interB in Sub
  71. #60 = Utf8 i
  72. #61 = Utf8 SourceFile
  73. #62 = Utf8 Sub.java
复制代码

常量池中的项目类型如下:

CONSTANT_Utf8_info tag标志位为1, UTF-8编码的字符串 CONSTANT_Integer_info tag标志位为3, 整形字面量 CONSTANT_Float_info tag标志位为4, 浮点型字面量 CONSTANT_Long_info tag标志位为5, 长整形字面量 CONSTANT_Double_info tag标志位为6, 双精度字面量 CONSTANT_Class_info tag标志位为7, 类或接口的符号引用 CONSTANT_String_info tag标志位为8,字符串类型的字面量 CONSTANT_Fieldref_info tag标志位为9, 字段的符号引用 CONSTANT_Methodref_info tag标志位为10,类中方法的符号引用 CONSTANT_InterfaceMethodref_info tag标志位为11, 接口中方法的符号引用 CONSTANT_NameAndType_info tag 标志位为12,字段和方法的名称以及类型的符号引用 5. 类或接口访问标志

表示类或者接口方面的访问信息,比如Class表示的是类还是接口,是否为public、static、final等。,下面我们就来看看TestClass的访问标示。Class的访问标志值为0×0021:

Java Class文件详解

根据前面说的各种访问标示的标志位,我们可以知道:0×0021=0×0001|0×0020 也即ACC_PUBLIC 和 ACC_SUPER为真,其中ACC_PUBLIC大家好理解,ACC_SUPER是jdk1.2之后编译的类都会带有的标志。

Java Class文件详解

6. 类索引、父类索引与接口索引集合

Class文件中由这3项数据来确定类的继承关系。

类索引和父类索引都是指向常量池中的常量索引:

Java Class文件详解

紧接着后面是一个接口的计数器和接口描述符:

Java Class文件详解

7. 字段表集合

作用:描述接口或者类中声明的类变量以及实例变量,不包括方法中的局部变量。

紧接着接口索引集合之后的2字节是字段计数器:

Java Class文件详解

表示我们类中有3个字段,这里便是subInt、subString、subObject 3个字段。紧接其后的是字段表,字段表结构为:

  1. field_info
  2. {
  3. u2 access_flags;
  4. u2 name_index;
  5. u2 descriptor_index;
  6. u2 attributes_count;
  7. attribute_info attributes[attributes_count];
  8. }
复制代码

Java Class文件详解

access_flags项的值是用于定义字段被访问权限和基础属性的掩码标志。取值范围如下表:

Java Class文件详解

描述符标识字符含义:

Java Class文件详解

V 表示特殊类型void。

对于数组类型,每一个维度将使用一个前置的”["字符来描述,如一个定义的"java.lang.String[][]“类型的二维数组,将被记录为:”[[Ljava/lang/String;",一个整型数组"int[]“将被记录为”[I"

父类中的字段不会出现在子类的字段表中。

8. 方法表集合

字段表集合结束后便是方法表集合。

作用:描述该类中的方法。

和字段表一样,使用一个u2类型的方法计数器,记录该类中方法的个数。

Java Class文件详解

表示我们的类中有9个方法。

方法表的结构如下图所示

Java Class文件详解

其中name_index和descriptor_index表示的是方法的名称和描述符,他们分别是指向常量池的索引。这里需要结解释一下方法的描述符,方法的描述符的结构为:(参数列表)返回值,比如public int instanceMethod(int param)的描述符为:(I)I,表示带有一个int类型参数且返回值也为int类型的方法,方法java.lang.String.toString()的描述符为"()Ljava/lang/String;",int IndexOf(char[] source,int sourceOffset,int sourceCount,char[] target int targetOffset,int targetCount,int fromIndex) 表示为([CII[CII)I。接下来就是属性数量以及属性表了,方法表和字段表虽然都有 属性数量和属性表,但是他们里面所包含的属性是不同。

Java Class文件详解

如果父类方法在子类中没有被重写(@Override),方法表中就不会出现来自父类的方法信息。

9. 属性表集合

上面的方法表中我们就看到方法有一个Code的属性。在本节我们将阐述这些属性:

Code属性:

该属性里主要存放由javac编译器处理后得到的字节码指令。

Java Class文件详解

其中attribute_name_index指向常量池中值为Code的常量,attribute_length的长度表示Code属性表的长度(这里 需要注意的时候长度不包括attribute_name_index和attribute_length的6个字节的长度)。

max_stack表示最大栈深度,虚拟机在运行时根据这个值来分配栈帧中操作数的深度,而max_locals代表了局部变量表所需的存储空间。

max_locals的单位为slot,slot是虚拟机为局部变量分配内存的最小单元,在运行时,对于不超过32位类型的数据类型,比如 byte,char,int等占用1个slot,而double和Long这种64位的数据类型则需要分配2个slot,另外max_locals的值并不是所有局部变量所需要的内存数量之和,因为slot是可以重用的,当局部变量超过了它的作用域以后,局部变量所占用的slot就会被重用。方法参数、显示异常处理器的参数、方法体中定义的局部变量都要使用局部变量表来存放。

code_length代表了字节码指令的数量,而code表示的是字节码指令,从上图可以知道code的类型为u1,一个u1类型的取值为0x00-0xFF,对应的十进制为0-255,目前虚拟机规范已经定义了200多条指令。

exception_table_length以及exception_table分别代表方法对应的异常信息。

attributes_count和attribute_info分别表示了Code属性中的属性数量和属性表,从这里可以看出Class的文件结构中,属性表是很灵活的,它可以存在于Class文件,方法表,字段表以及Code属性中。

修改一下Sub中的InterB方法:

  1. @Override
  2. public int interB(int i){
  3. int x=0;
  4. try{
  5. x+=i;
  6. return x;
  7. }catch(Exception e){
  8. x=-1;
  9. return x;
  10. }finally{
  11. x=3;
  12. }
  13. }
复制代码

大家不妨先猜一下这个函数的结果是什么?假如在try块中发生异常,结构又是什么?我相信对java语言熟悉的朋友,肯定知道答案。Java Class文件详解

使用反编译工具查看:

  1. public int interB(int);
  2. flags: ACC_PUBLIC
  3. Code:
  4. stack=2, locals=6, args_size=2
  5. 0: iconst_0
  6. 1: istore_2
  7. 2: iload_2
  8. 3: iload_1
  9. 4: iadd
  10. 5: istore_2
  11. 6: iload_2
  12. 7: istore 5
  13. 9: iconst_3
  14. 10: istore_2
  15. 11: iload 5
  16. 13: ireturn
  17. 14: astore_3
  18. 15: iconst_m1
  19. 16: istore_2
  20. 17: iload_2
  21. 18: istore 5
  22. 20: iconst_3
  23. 21: istore_2
  24. 22: iload 5
  25. 24: ireturn
  26. 25: astore 4
  27. 27: iconst_3
  28. 28: istore_2
  29. 29: aload 4
  30. 31: athrow
  31. Exception table:
  32. from to target type
  33. 2 9 14 Class java/lang/Exception
  34. 2 9 25 any
  35. 14 20 25 any
  36. LineNumberTable:
  37. line 35: 0
  38. line 37: 2
  39. line 38: 6
  40. line 43: 9
  41. line 38: 11
  42. line 39: 14
  43. line 40: 15
  44. line 41: 17
  45. line 43: 20
  46. line 41: 22
  47. line 42: 25
  48. line 43: 27
  49. line 44: 29
  50. LocalVariableTable:
  51. Start Length Slot Name Signature
  52. 0 32 0 this Lcom/gissky/clazz/Sub;
  53. 0 32 1 i I
  54. 2 30 2 x I
  55. 15 10 3 e Ljava/lang/Exception;
  56. StackMapTable: number_of_entries = 2
  57. frame_type = 255 /* full_frame */
  58. offset_delta = 14
  59. locals = [ class com/gissky/clazz/Sub, int, int ]
  60. stack = [ class java/lang/Exception ]
  61. frame_type = 74 /* same_locals_1_stack_item */
  62. stack = [ class java/lang/Throwable ]
  63. }
复制代码

从 args_size=2这条反编译代码,我们可以知道,在public int interB(int i)这个方法中有6个局部变量,2个参数,可是我们的函数中明明只有一个参数么……这是因为编译器会为每一个实例函数包括构造器添加一个参数this,在JVM调用该方法的时候会该形参传递一个实参—方法所在对象的自身。

Exception table:

from to target type

2 9 14 Class java/lang/Exception

2 9 25 any

14 20 25 any

上表表头表示,当字节码在form行到to行(不包括to行)出现类型为type的异常,则转到第target行继续处理。

从方法的异常表中,我们可以看到这个函数有3条执行路径:

这里我们插入阐述一下LineNumberTable表的含义:它表示Java源码行号与字节码行号之间的对应关系。

Java Class文件详解

对照上图,我们能清晰的看出这3条路径。

知道了该方法执行的3条路径,我们也就知道刚才我们的那个问题有3个答案:没有异常是为x+i;try块中出现Exception类型的错误时,返回-1;出现Exception以外的任何异常方法非正常结束,没有返回值。

LocalVariableTable:

Start Length Slot Name Signature

0 32 0 this Lcom/gissky/clazz/Sub;

0 32 1 i I

2 30 2 x I

15 10 3 e Ljava/lang/Exception;

LocalVariableTable表示局部变量表,描述方法中局部变量。

如果你对返回的答案能理解的话,那么我相信你也肯定知道,我们函数中只有4个参数,但max_locals却等于6。不懂的话仔细看一下Code中字节码的执行过程变可以理解了。

一个方法在执行时需要多大的局部变量空间在编译时期就知道了,方法执行期间不会改变局部变量表的大小。

Signature 属性:

该属性是在JDK1.5新增的。该属性可用于类、属性表和方法表结构的属性表中。使用泛型签名如果包含了类型变量(Type Variables)或参数化类型(Parameterized Types),则Signature 属性会为它记录泛型签名信息。当我们要泛型类中拿到泛型的实际类型的时候非常有用。

Java Class文件详解

实例:

在使用Hibernate时,我习惯将为Dao层封装一个泛型基类,来放置一些通用的方法,而Hibernate有很多方法都要传递一个POJO的类型,然后进行查询,如load方法。我们构建这样的一个基类:

public abstract class BaseDaoImpl extends HibernateDaoSupport implements BaseDao

那么load中要使用的POJO类型便是T的实际类型。怎么来那倒这个属性呢?这里边要使用到Signature属性了。

  1. public abstract class BaseDaoImpl<T, PK extends Serializable> extends HibernateDaoSupport implements BaseDao<T, PK> {
  2. private Class<T> entityClass;
  3. @SuppressWarnings("unchecked")
  4. public BaseDaoImpl() {
  5. //class OrgDao extends BaseDaoImpl<Organization, String> implements OrgDao {}
  6. Class c = this.getClass(); //返回的是使用new创建的泛型类对应的对象的class对象。
  7. Type type = c.getGenericSuperclass(); //取得该对象的泛型类
  8. //取得泛型对应的真正的class,并放到数组中
  9. Type[] types = ((ParameterizedType)type).getActualTypeArguments();
  10. entityClass = (Class<T>) types[0];
  11. }
复制代码

这时,getById中就可以直接使用了:

  1. public T getById(PK id) {
  2. return (T) getHibernateTemplate().load(entityClass, id);
  3. }
复制代码

最新评论

小黑屋|在路上 ( 蜀ICP备15035742号-1 

;

GMT+8, 2025-7-7 19:41

Copyright 2015-2025 djqfx

返回顶部