Java执行引擎工作原理——方法调用

前言

JVM作为一款虚拟机,必然要涉及计算机核心的3大功能。

  • 方法调用

    方法作为程序组成的基本单元,作为原子指令的初步封装,计算机必须能够支持方法的调用。同样,Java语言的原子指令是字节码,Java方法是对字节码的封装,因此,JVM必须支持对Java方法的调用。

  • 取指

    计算机进入方法后,最终需要逐条取出指令并逐条执行。Java方法也不例外,因此JVM进入方法后,也要模拟硬件CPU,能够从Java方法中逐条去除字节码指令。

  • 运算

    计算机取出指令后,就要根据指令进行相应的逻辑运算,实现指令的功能。JVM作为虚拟机,也需要具备对Java字节码的运算能力。

方法调用

Java程序最基本的组成单元是类,Java类是由一个个方法所组成。JVM作为一款虚拟机,要想具备执行一个完整的Java程序的能力,就必定得具备执行单个Java方法的能力。而具备执行Java方法的能力,首先必须要能执行方法调用。

物理机器在调用函数时,需要进行下面一系列操作:

  • 保存调用者栈基地址(即当前栈基地址入栈),当前IP寄存器入栈(即调用者中的下一条指令地址入栈)。
  • 参数入栈。
  • 代码指针(eip)入栈,使得被调用函数执行完后物理机器可以回来继续执行原来的函数指令。
  • 调用函数的栈基地址入栈。
  • 为被调用方分配方法栈空间。一个方法所分配的栈空间大小,取决于该方法内部的局部变量空间、为被调用者所传递的入参大小。
  • 被调用者在接收入参时,从8(%ebp)处开始,往上逐个获取每一个入参参数。
  • 被调用者将返回结果保存在eax寄存器中,调用者从该寄存器中获取返回值。

物理机器在执行程序时,将程序划分为若干个函数,每个函数都对应有一段机器码。一段程序的机器码存放在一块连续的内存中,这块内存叫做代码段。物理机器为每一个函数分配一个方法栈,当物理机器执行到某个函数时,才会为其分别方法栈,函数通过自身的机器指令遥控其对应的方法栈,可以往里面放入数值,也可以将数值移动到其他地方,也可以需哦那个里面读取数据,也可以从调用者的方法栈里取值。通过一条条指令和一个个栈,物理机器得以运行完一整个程序。

JVM是用C和C++语言编写的一款软件,当JVM执行Java函数时,实际上是执行了一段汇编代码,这中间存在一个边界,边界的一边是C程序,边界的另一边直接是机器指令,C语言要能够直接执行机器指令。

Java字节码指令直接对应一段特定逻辑的本地机器码,而JVM在解释执行Java字节码指令时,会直接调用字节码指令所对应的本地机器码。JVM是使用C/C++编写而成的,因此JVM要直接执行本地机器码,便意味着必须能够从C/C++程序中直接进入机器指令。这种技术实现的关键便是使用C语言所提供的一种高级功能——函数指针。通过函数指针能够直接用C程序触发一段机器指令。在JVM内部,call_stub便是实现C程序调用字节码的第一步——例如Java主函数的调用。在JVM执行Java主函数所对应的第一条字节码指令之前,必须经过call_stub函数指针进入对应的例程,然后在目标程序中触发对Java主函数第一条字节码指令的调用。

函数指针

函数指针是C/C++语言里一种高级的变量和应用,是实现C/C++语言动态扩展能力的关键技术之一,如同Java中的反射与类动态加载技术。

  • 函数指针与指针函数

    函数指针定义示例:

    1
    void (*fun) (int a, int b);

    函数指针声明的是一个指针,指向一个函数的首地址。

    指针函数定义示例:

    1
    void *fun (int a, int b);

    指针函数声明的是一个函数,返回类型是一个指针。

  • 函数指针的定义方式

    • 直接声明

      1
      return_type (*func_pointer) (data_type arg1, data_type arg2, ..., data_type argn);
    • 通过类型声明

      1
      typedef (*func_pointer) (data_type arg1, data_type arg2, ..., data_type argn);
  • 函数指针的调用方式

    • (*funcPointer)(参数列表)
    • funcPointer(参数列表)

函数指针本质上是一种指针,不是函数,但是由于这种指针指向的并不是某个变量的内存地址,而是某个函数的内存首地址,因此C语言允许像函数一样调用函数指针。

CallStub函数指针定义

call_stub是JVM内部的一个函数指针,对于JVM执行引擎而言,该函数指针至关重要。call_stub函数指针原型定义在stubRoutines.hpp文件中,定义如下:

1
2
3
4
static CallStub call_stub()
{
return CAST_TO_FN_PTR(CallStub, _call_stub_entry);
}

CAST_TO_FN_PTR是一个宏,进行宏替换后可以得到下面这行展开式:

1
return (CallStub) (castable_address(_call_stub_entry));

这里的CallStub是一种自定义类型。其定义在stubRoutines.hpp文件中,定义如下:

1
2
3
4
5
6
7
8
9
10
typedef void (*CallStub) (
address link,
intptr_t* result,
BasicType result_type,
methodOopDesc* method,
address entry_pointt,
intptr_t* parameters,
int size_of_parameters,
TRAPS
);

由该定义可知,CallStub是这样一种函数指针类型:其指向的函数,返回值类型是void,并且有8个入参。

JVM内部在javaCalls::call_helper()中执行了call_stub()函数调用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
void JavaCalls::call_helper(JavaValue* result, methodHandle* m, JavaCallArguments* args, TRAPS)
{
...
// call_stub()调用开始
{
JavaCallWrapper link(method, receiver, result, CHECK);
{
HandleMark hm(thread);
StubRoutines::call_stub()(
(address)&link,
result_val_address,
result_type,
method(),
entry_point,
args->parameters(),
args->size_of_parameters(),
CHECK);
result = link.result();
if (oop_result_flag) {
thread->set_vm_result((oop)result->get_jobject());
}
}
}
// call_stub()调用结束
...
}

这里JVM隐式调用了函数指针。call_stub()函数最终返回的是一个函数指针的实例变量,这个函数指针变量的类型是CallStub,但是物理机器并不理解这种隐式调用,所以最终还是要靠编译器来实现隐式调用到显式调用的转变。编译器处理后得到显式调用可以用下面这段逻辑表达:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
void JavaCalls::call_helper(JavaValue* result, methodHandle* m, JavaCallArguments* args, TRAPS)
{
...
// call_stub()调用开始
{
JavaCallWrapper link(method, receiver, result, CHECK);
{
HandleMark hm(thread);
// 编译器的处理结果
CallStub funcPointer;
funcPointer = StubRoutines::call_stub();
funcPointer(
(address)&link,
result_val_address,
result_type,
method(),
entry_point,
args->parameters(),
args->size_of_parameters(),
CHECK);
result = link.result();
if (oop_result_flag) {
thread->set_vm_result((oop)result->get_jobject());
}
}
}
// call_stub()调用结束
...
}

JVM实现call_stub()的机制实际上调用的是call_stub()函数所返回的函数指针变量,由于JVM在使用typedef定义CallStub类型时,就规定这种函数指针类型有8个入参,因此JVM最终在调用这种类型的函数指针时,也必须传入8个类型完全相同的参数。

castable_address()

castable_address()是一个函数,定义在globalDefinitions.hpp文件中,其定义如下:

1
2
3
4
inline address_word castable_address(address x)
{
return address_word(x);
}

这里的address_word也是一种自定义类型,它表示的是一种地址类型,定义在globalDefinitions.hpp文件中,其定义如下:

1
typedef uintptr_t address_word;

由此可知,address_word类型其实是uintptr_t,而后一种类型也是JVM自定义的类型,但是这种类型是平台相关的,所以在JVM内部有3处定义了这种类型,分别是:

1
2
3
globalDefinitions_gcc.hpp
globalDefinitions_sparcWords.hpp
globalDefinitions_visCPP.hpp

在特定的平台上编译JVM时,编译器会自动根据平台类型,编译不同的hpp头文件,上面列出的三种头文件,分别对应Linux、Macintosh和Windows这三种主流的操作系统。

在Linux平台上,uintprt_t类型的定义如下:

1
typedef unsigned int uintprt_t;

综上可以知道address_word这种类型实际上是无符号整数类型。

转回call_stub()函数,将address_word类型进行替换,得到如下代码:

1
2
3
4
static CallStub call_stub()
{
return (CallStub)(unsigned int (_call_stub_entry));
}

到这里,call_stub()函数的逻辑基本上全部还原出来了,将_call_stub_entry变量转换为unsigned int基本类型,再转换为CallStub这一自定义类型,该类型是函数指针类型。 _call_stub_entry类型定义在StubRoutines.hpp中,定义如下:

1
static address _call_stub_entry;

由此可知,_call_stub_entry本身就是address类型,而该类型的原型是unsigned int。

在JVM初始化的过程中,便将_call_stub_entry这一变量指向了某个内存地址。在 x86 32位Linux平台下,JVM在初始化过程中,存在这样一条链路:

1
2
3
4
5
6
7
8
9
10
java.c:main()
java_md.c:LoadJavaVM()
jni.c:JNI_CreateJavaVM()
Threads.c:create_vm()
init.c:init_globals()
StubRoutines.cpp:stubRoutines_init1()
StubRoutines.cpp:initialzel()
stubGenerator_x86_x32.cpp:StubGenerator_generate()
stubGenerator_x86_x32.cpp:StubCodeGenerator()
stubGenerator_x86_x32.cpp:generate_initial()

这条链路从JVM的main()函数开始,调用到init_globals()这个全局数据初始化模块,最后再调用到StubRoutines这个例程生成模块,最终在stubGenerator_x86_x32.cpp:generate_initial()函数会执行如下代码对_call_stub_entry变量进行初始化。

1
2
3
4
5
6
void generate_initial(){
...
StubRoutines::_call_stub_entry =
generate_call_stub(StubRoutines::_call_stub_return_address);
...
}

最终,JVM调用generate_call_stub(StubRoutines::_call_stub_return_address)函数返回一个值赋值给 _call_stub_entry。

CallStub()入参

JVM一共传入8个参数,其含义如表所示:

参数名 含义
link 连接器
result_val_address 函数返回地址
result_type 函数返回类型
method() JVM内部所表示的Java方法对象
entry_point JVM调用Java方法的例程入口。JVM内部的每一段例程都是在JVM启动过程中预先生成好的一段机器指令。要调用Java方法,都必须经过本例程,即需要先执行这段机器指令,然后才能跳转到Java方法字节码所对应的机器指令去执行
parameters() Java方法的入参集合
size_of_parameters() Java方法的入参数量
CHECK 当前线程对象

这里先简单介绍5个参数:link、method()、entry_point、parameters()和size_of_parameters()。

  • 连接器link

    连接器link的作用就是起到连接、桥梁的作用,其所属类型是JavaCallWrapper,该类型定义在javaCalls.cpp文件中,定义如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    class JavaCallWrapper: StackObj {
    friend class VMStructs;
    private:
    JavaThread* _thread; // 当前Java线程所在线程
    JNIHandleBlock* _handles; // 本地调用句柄
    methodOop _callee_method; // 调用者方法对象
    oop _receiver; // 被调用者
    JavaFrameAnchor _anchor; // Java线程堆栈对象
    JavaValue* _result; // Java方法所返回的值
    }

    通过这些变量可知,link其实在Java函数的调用者与被调用者之间搭建了一座桥梁,通过这座桥梁,可以实现堆栈追踪,可以得到整个方法的调用链路。在Java函数调用时,link指针将被保存在当前方法的堆栈中。

  • method()

    method()是当前Java方法在JVM内部的表示对象。

    每一个Java方法在被JVM加载时,JVM都会在内部为这个Java方法建立函数模型,也就是保存一份Java方法的全部原始描述信息。JVM为Java方法所建立的模型中至少包含以下信息:

    • Java函数的名称、所属的Java类
    • Java函数的入参信息,包括入参类型、入参参数名、入参数量、入参顺序等
    • Java函数编译后的字节码信息,包括对应的字节码指令‘、所占用的总字节码数等
    • Java函数的注解信息
    • Java函数的继承信息
    • Java函数的返回信息

    JVM在调用CallStub()函数指针时,将method()对象传递进去,最终就是为了从method()对象中获取了Java函数编译后的字节码信息,JVM拿到字节码信息之后,就能对字节码进行解释执行了。

  • entry_point

    entry_point是继 _call_stub_entry这一JVM最核心例程之后的又一个最主要的例程入口。前面对 _call_stub_entry进行了简单的分析,JVM每次从JVM内部调用Java函数时,必定调用CallStub函数指针,而该函数指针的值就是 _call_stub_entry。JVM通过 _call_stub_entry所指向的函数地址,最终调用到Java函数。在JVM通过 _call_stub_entry所指向的函数调用Java函数之前,必须要先通过entry_point例程。事实上,在entry_point例程里面会真正从method()对象上拿到Java函数编译后的字节码,JVM通过entry_point可以得到Java函数所对应的第一个字节码指令,然后开始调用Java函数。

    JVM调用Java程序main()主函数的路线图

  • parameters()

    这个参数是描述Java函数的入参信息的。在JVM真正调用Java函数的第一个字节码指令之前,JVM会在CallStub()函数中解析Java函数的入参,解析后,JVM会为Java函数分配堆栈,并将Java函数的入参逐个入栈。这样,JVM就为高层次的编程语言建立了方法栈模型。

    因为Java是运行在虚拟机上的,所以不能直接使用物理机器的方法栈,必须在虚拟机层面为每一个Java函数都建立堆栈模型,这种堆栈模型中的局部变量都是Java语言的变量类型。所以,JVM在正式调用Java函数之前,必须要能够获取到Java语言层面上的参数类型、参数对象、参数顺序等信息,惟其如此,JVM才能正确调用并执行Java函数。

    Java语言是一门面向对象的语言,在内存模型上,Java类的实例对象分配早堆中,而堆栈中只保存了引用。所谓引用,在JVM内部,实际上就是一个指针。JVM做出这种内存分配模型策略的原因是,堆栈空间通常比较少,放不下那么大的对象。在物理机器上直接跑的程序,堆栈空间一般最大为64MB,而Java堆栈一般为1MB,或者8MB等。如果每一个函数都设置那么大的堆栈空间,那么函数的调用深度稍微一大,整个物理机器的内存就会溢出。正因如此,JVM只能将类对象实例保存在堆中。

  • size_of_parameters()

    这个入参的含义是Java函数的入参个数。parameters()参数保存了Java函数的所有入参信息,但是parameters()里面其实是使用指针建立起来的数组模型,JVM在后面调用Java函数时,直接通过parameters()内部的指针,无法得知结束位置,因此这里需要将Java函数的入参数量传递进去,JVM在为Java函数分配堆栈空间时,会根据这个值,计算出Java堆栈空间的大小。

_call_stub_entry例程

_call_stub_entry变量的值是generate_call_stub()函数返回赋上去的,函数定义如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
address generate_call_stub(address& return_address) {
StubCodeMark mark(this, "StubRoutines", "call_stub");
// 这里先得到当前入口的内存地址,因为本函数后续流程会继续往代码空间中写入call_stub()的指令,而外面却只需要拿到这部分指令的首地址,而这里start就是首地址,因此这里先拿到,最后直接将其返回去即可
address start = __pc();
assert(frame::entry_frame_call_wrapper_offset == 2, "adjust this code");
bool sse_save = false;
const Address rsp_after_call(rbp, -4 * wordSize);
const int locals_count_in_bytes(4 * wordSize);
const Address mxcsr_save(rbp, -4 * wordSize);
const Address saved_rbx(rbp, -3 * wordSize);
const Address saved_rsi(rbp, -2 * wordSize);
const Address saved_rdi(rbp, -1 * wordSize);
const Address result(rbp, 3 * wordSize);
const Address result_type(rbp, 4 * wordSize);
const Address method(rbp, 5 * wordSize);
const Address entry_point(rbp, 6 * wordSize);
const Address parameters(rbp, 7 * wordSize);
const Address parameters_size(rbp, 8 * wordSize);
const Address thread(rbp, 9 * wordSize);
sse_save = UseSSE > 0;
__enter();
__movptr(rcx, parameter_size);
__shlptr(rcx, Interpreter::logStackElementSize);
__addptr(rcx, locals_count_int_bytes);
__subptr(rsp, rcx);
__andptr(rsp, - (StackAlignmentInBytes));
__movptr(saved_rdi, rdi);
__movptr(saved_rsi, rsi);
__movptr(saved_rbx, rbx);
...
__BIND(is_double);
if (UseSSE >= 2) {
__movdbl(Address(rdi, 0), xmm0);
} else {
__fstp_d(Address(rdi, 0));
}
__jmp(exit);
return start;
}

这段代码最主要的作用就是生成机器码,使用C语言动态生成。

  • pc()函数

    首先看第一行代码。

    1
    address start = __pc();

    这行代码保存当前例程所对应的一段机器码的起始位置。pc()函数定义如下:

    1
    2
    3
    address pc() const {
    return _code_pos;
    }

    这函数特别简单,返回_code_pos变量,该变量是一个address类型的变量。

    在JVM启动过程中,JVM会生成很多例程(即一段固定的机器指令,能够实现一种特定的功能逻辑),例如函数调用、字节码例程、异常处理、函数返回等。每一个例程,一开始都有这么一行代码(即address start = _pc()),代码完全相同。事实上,JVM的所有例程都在一段连续的内存中,我们可以将这段内存想象成一根直线,当JVM刚启动时,这根直线长度为0,没有生成任何例程。第一个例程生成时,pc()返回0,因此此时是从这根直线的零点位置开始。例如第一个例程占20字节,则当JVM生成第一个例程时,第二个例程执行start = pc()时,将返回20。JVM每一个例程都有一个对应的generate()函数(具体的函数名不同,但是基本上都以generate 开头),假设第一个例程占20字节,则当第一个例程多对应的generate()函数执行完成后, _code_pos会自动累加到20,于是当JVM生成第二个例程时,pc()函数就会返回20。

    JVM每生成一个例程,就会将例程起始位置增加,每一个例程都会占用JVM堆内存的一块连续区域,相邻例程之间的内存区域相连,所有的例程最后连成一块连续的区域。

  • 定义入参

    generate_call_stub()接下来执行下面一段代码:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    assert(frame::entry_frame_call_wrapper_offset == 2, "adjust this code");
    bool sse_save = false;
    const Address rsp_after_call(rbp, -4 * wordSize);
    const int locals_count_in_bytes(4 * wordSize);
    const Address mxcsr_save(rbp, -4 * wordSize);
    const Address saved_rbx(rbp, -3 * wordSize);
    const Address saved_rsi(rbp, -2 * wordSize);
    const Address saved_rdi(rbp, -1 * wordSize);
    const Address result(rbp, 3 * wordSize);
    const Address result_type(rbp, 4 * wordSize);
    const Address method(rbp, 5 * wordSize);
    const Address entry_point(rbp, 6 * wordSize);
    const Address parameters(rbp, 7 * wordSize);
    const Address parameters_size(rbp, 8 * wordSize);
    const Address thread(rbp, 9 * wordSize);

    首先回顾一下机器调用时的调用者和被调用者堆栈模型。一个函数的堆栈空间大体上可以分为3部分。

    ①堆栈变量区

    保存方法的局部变量,或者对数据的地址引用(指针)。

    如果一个方法中并没有局部变量,则编译器不会为该方法分配堆栈变量区。

    ②入参区域

    如果当前方法调用了其他方法,并且给其他方法传递了参数,那么这些参数会保存在调用者的堆栈中,即所谓的“压栈”。

    至少在x86平台上,入参区域相对于方法的堆栈变量区,在内存上位于低位置,即堆栈变量区在高位置方向,而入参区域在低位置方向。x86在分配堆栈空间时,本来就是按照由高地址向低地址的方向分配的。

    ③ip和bp区

    ip和bp,一个是代码段寄存器,一个是堆栈栈基寄存器。这两个寄存器,一个用于回复调用者方法的代码位置,一个用于回复调用方法的堆栈位置,是完成物理机器函数调用机制的最主要的2个寄存器。

    函数堆栈空间的一般布局如下图所示。

    函数堆栈空间布局通用模型

    其实,物理机器在执行函数调用时,存在一定的空间浪费。入参往往是当前方法的局部变量,编译器会将局部变量分配在局部变量区域,而在入参时,会将局部变量再次复制一份放在压栈区域,同一份数据被分配了两次堆栈空间,其实依靠编译器的智能性,完全可以将堆栈空间中的入参区域去掉,但正因为编译器规定了入参空间分配的原则,并使入参按照从左到右或从右到左的顺序压栈,这种规范不仅仅让调用者函数在访问入参时享受到了极大的便利,也让JVM设计者在设计Java函数调用机制时,能够基于这一规范,随心所欲地发挥。基于这一规范,在被调用者方法中,访问入参,就变得有规律可循。

    完成入参压栈后,接着物理机器将ip和bp这两个寄存器入栈,,之后物理机器就开始为被调用函数分配堆栈空间了。物理机器对堆栈内存寻址方式为相对偏移,可以通过相对栈底bp或栈顶sp的位置类绝对定位堆栈内存位置。入参寻址公式为:Pn = (n + 1) * 4(%ebp)。在该公式中,n表示第n个入参(按从左至右的顺序),Pn表示第n个入参的位置。

    诸如m(%ebp)这种标记方法,属于汇编语言,而JVM是使用C/C++写成的,于是JVM大神对汇编语法进行了抽象,使用C++类来表示一个堆栈位置。汇编语言通过寄存器和偏移量唯一定位了一个堆栈内存。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    class Address {
    private:
    // 表示一个物理寄存器,寄存器的作用是标记基址
    Register _base;
    // 表示偏移量,是个整形数
    int _disp;
    public:
    // 构造函数
    Address()
    :_base(noreg),
    _disp(0)
    { }
    }

    使用C++类对汇编堆栈寻址进行抽象后,便可以直接用该类进行堆栈寻址了,使用方法为:

    1
    Address position(rbp, n * wordsize);
  • CallStub:保存调用者堆栈

    generate_call_stub()函数的逻辑部分从下面这行代码开始:

    1
    __enter();

    这行代码在不同平台上对应不同的机器指令。在x86平台上,其函数定义如下:

    1
    2
    3
    4
    void MacroAssembler::enter() {
    push(rbp);
    mov(rbp, rsp);
    }

    这两条指令最终会在JVM运行期翻译为如下所示的机器指令。

    1
    2
    push %bp
    mov %sp, %bp

    push %ebp指令的含义是保存调用者函数的栈基地址,mov%sp,%bp指令的含义是重新指定栈基地址。由于即将开始新的函数,因此需要将栈基指向调用者函数的栈顶地址,调用者函数的栈顶位置就是被调用者函数的栈基位置。

  • CallStub:动态分配堆栈

    JVM之所以能够在物理机器上分配Java语言变量类型的堆栈,完全得益于机器级别对堆栈空间分配的指令支持。JVM充分利用了这一点,通过重新分配堆栈空间,从而为JVM调用Java函数奠定基石。

    正常编写一段C程序,编译器会根据调用函数中的变量声明,自动计算出被调用函数要多大的堆栈空间。最终物理机器在执行这个C程序时,将按照编译器所计算出的大小为被调用函数分配堆栈空间。

    而Java程序由于无法直接被编译成机器指令,因此Java编译器无法直接计算一个Java函数需要多大的堆栈空间,但是如果仅仅解决Java函数的1堆栈空间的自动计算,还是无法实现Java函数的调用,因为Java有自己的变量类型,这些变量类型不像C语言的变量,Java变量类型并不能直接被编译成物理机器所识别的数据类型,而C语言变量最终完全被编译成物理机器所识别的类型。所以,即使Java程序编译器能够自动计算出Java函数所需要的堆栈空间大小,物理机器也是无法对这段堆栈内存进行读写,因为物理机器完全不识别Java的变量类型。当然,从技术层面上,对于强类型的Java语言,是完全可以做到直接将Java语言编译为机器指令的,JVM的JIT编译器就是这种实现方式,不过由于将Java程序直接编译成机器指令,既要高级语言到原始语言的转换,还要能够确保Java程序的逻辑在编译后保持完全一致。所以JIT提供了对哦中选项,有些选项不进行任何优化就编译,有些选项可以对Java程序进行激进式的编译。不经过优化的编译,与解释型运行时所动态生成的机器指令的数量、质量基本相差不大。但是如果进行激进式的编译,可能会破坏原本Java的程序逻辑。

    JVM为了能够调用Java函数,需要在运行期就知道一个Java函数的入参大小,然后动态计算出所需要的堆栈空间。这就是JVM能够调用Java函数的核心机制。这里的关键问题是,CallStub()作为被javaCalls::call_helper()调用的函数,JVM通过javaCalls::call_helper()最终调用到Java函数,JVM作为一款使用C/C++编写而成的程序,被编译后,C/C++编译器自然会计算出javaCalls::call_helper()传递给CallStub()的入参空间大小,但是C/C++编译器并不会因此就自动计算出Java函数的入参数量以及所需内存的空间大小,因此C/C++编译器并不识别Java程序,并且在JVM被编译期间,JVM尚未加载任何Java程序,因此JVM对Java程序完全无感。等到JVM程序运行起来后,JVM会加载Java程序,并通过javaCalls::call_helper()调用Java主函数。JVM在执行Java函数调用时,仍然沿用了物理机器苏坡使用的“堆栈”这一算法数据结构,因此JVM仍然需要为Java被调用通过函数分配堆栈内存,保存被调用函数的局部变量以及相关上下文数据。因此,JVM必然需要在运行期动态计算Java被调用函数的空间大小,并动态为其分配堆栈空间。而物理机器提供了这种动态分配堆栈空间的能力。

    由于物理机器不能识别Java程序,也不能直接执行Java程序,因此JVM必然要通过自己作为一座桥梁连接到Java程序,并让Java被调用的函数的堆栈能够“寄生”在JVM的某个函数的堆栈空间中,否则物理机器不会自动为Java方法分配堆栈。JVM选择CallStub这一函数指针作为JVM内部的C/C++程序与Java程序的分水岭,或者桥梁,通过这座桥梁,当JVM启动后,执行完JVM自身的一系列指令后,能够跳转到执行Java程序经翻译后所对应的二进制机器指令,CallStub能够实现机器逻辑指令上的联接,同时,在分水岭之后,JVM需要为主函数分配堆栈空间,以在主函数中读取入参数据。很自然的,JVM将Java函数堆栈空间“寄生”在了CallStub()函数堆栈中。这就需要依靠物理机器提供的指令,对CallStub()堆栈进行扩展。物理机器提供了扩展堆栈空间的简单指令,如下(下述指令基于x86平台):

    1
    sub operand, &sp

    JVM实现堆栈“寄生”的机制是,扩展别人的堆栈,存储自己所需要的数据。

    CallStub()作为JVM内部C/C++与Java程序的分水岭,CallStub()调用者javaCalls::call_helper()并没有直接将Java函数的入参传递给CallStub(),因为这个调用者并不直接是Java函数自己,因此在JVM的编译阶段,并没有将Java函数压栈。JVM内部通过CallStub()函数调用Java主函数main(),在CallStub()函数中必然要将Java程序主函数main()所需的入参信息String[] args进行压栈,否则Java主函数main()内部无法对入参进行寻址。但是在JVM编译期间,C/C++根本不知道Java程序的任何信息,这就需要使用动态分配堆栈的方式了,或者“寄生”。CallStub()函数所对应的机器指令是在JVM启动过程中动态生成的,而非编译期间生成,在CallStub()内部需要知道被调用的Java函数的入参数量,并依此计算入参所需空间大小,最终将其压栈,这样当JVM在执行Java函数时,在被调用的Java函数中就能对入参进行寻址。在CallStub()函数中,通过如下指令计算出被调用Java函数的入参数量,并保存调用者数据段现场。

    1
    2
    3
    4
    5
    6
    7
    8
    __movptr(rcx, parameter_size);
    __shlptr(rcx, Interpreter::logStackElementSize);
    __addptr(rcx, locals_count_int_bytes);
    __subptr(rsp, rcx);
    __andptr(rsp, - (StackAlignmentInBytes));
    __movptr(saved_rdi, rdi);
    __movptr(saved_rsi, rsi);
    __movptr(saved_rbx, rbx);

    以上这段代码就是JVM在对被调用的Java函数的入参进行计算。javaCalls::call_helper()在调用Java函数之前,会读取Java函数的入参大小,Java函数的入参大小由Java编译器在编译期间计算出来,因此JVM在执行Java函数之前,可以将其直接读取出来。JVM得到Java函数所需要的入参数量后,便可以直接计算出入参压栈所需要的堆栈空间。JVM在内存上建立了一套Java面向对象的标准模型,在JVM内部,一切对Java对象实例及其成员变量和成员方法的访问,最终都是通过指针得以寻址。同理,JVM在传递函数参数时,所传递的也只不过是Java入参对象实例的指针而已。正因为Java函数传参,实际所传递的只是指针,而在物理机器层面,不管何种数据类型的指针,其宽度都是相同的,指针的宽度仅与物理机器的数据总线宽度有关,而与具体某种编程语言中的具体数据类型无关。因此,JCVM在为Java函数计算入参所需要的堆栈空间时,只需要入参的数量即可。

    完成了Java函数入参空间计算后,接下来就需要执行最主要的一步:动态分配堆栈内存,直接执行sub operand, &esp即可实现,operand就表示刚才计算出来的堆栈大小。在CallStub()中使用下面C代码实现:

    1
    __subptr(rsp, rcx);

    这行代码最终会生成下面这条机器指令:

    1
    sub %ecx, %esp

    在这条指令之前,JVM所计算出的堆栈空间大小保存在ecx寄存器中,因此这里直接将esp减去ecx寄存器的值,就完成堆栈空间的分配。

    至此,JVM完成了动态堆栈内存分配。

  • CallStub:调用者保存

    JVM为即将被调用的Java方法分配了堆栈空间,调用者是CallStub()所指向的函数,其实就是generate_call_stub()。接下来JVM就要将CPU的控制权转交给被调用者的Java方法,但是在转交之前,调用者需要保存自己的寄存器数据,这些寄存器主要包括:edi、esi、edx。

    每次在执行函数调用时,CS:IP寄存器就会从当前调用者函数的机器指令出跳转到被调用函数,这样CPU才能执行被调用的函数。但是当被调用函数执行完之后,CPU需要跳转到调用者函数中继续执行调用者函数的机器指令,换言之,需要恢复CS:IP的值,使之重新指向调用者函数中执行被调用函数的下一条指令。前文讲过,每次发生函数调用时,机器会将调用者函数的CS:IP压入栈中,而在函数调用结束后,再次将调用者函数的CS:IP从栈弹出来进行恢复。

    物理机器通过CS:IP来区分一个内存中的数据到底是真实的数据还是机器指令,而对于数据,物理机器一般会用edi和esi分别保存目的偏移地址和原偏移地址。而在JVM中,edi和esi被赋予更多职责,例如在Java函数调用过程中,esi会用于Java字节码寻址。每当JVM开始执行Java函数的某个字节码指令时,JVM会首先将esi寄存器指向目标字节码指令的偏移地址,然后JVM跳转到该字节码所对应的第一个机器指令开始执行。所以edi和esi在JVM中是与调用者函数紧密关联的寄存器,是调用者函数的私有数据。ebx是一个通用的寄存器,但是也经常被用来作为一段数据的基地址,在JVM中,在执行Java函数调用时,ebx会用来存放Java函数中即将被执行的字节码指令的基地址,然后通过jmp指令跳转到该字节码位置进行字节码解释执行。因此,ebx与edi和esi一样,与调用者函数息息相关,也是调用者函数的私有数据。由于esi、edi和ebx可以被看作是调用者函数的私有数据,因此JVM直接将其保存到了被调用者函数的堆栈中。

    以上过程有一个专业术语,叫做“现场保存”。当调用者函数的现场全部保存完之后,CPU的控制权马上就要移交给被调用者函数了。

  • CallStub:参数压栈

    在动态分配堆栈时,CallStub函数指针为即将调用的函数分配的堆栈空间大小为:Java函数入参数量 4 + 4 4,4 4就是最后rdi、rsi、rbx、mxcsr这4个寄存器所占用的堆栈空间大小。CallStub为被调用者函数所分配的堆栈空间大小完全取决于Java函数的入参数量,接下来JVM要做的就是将即将被调用的Java函数的入参复制到这剩余的堆栈空间里去。由于不同的Java函数的入参数量是不同的,因此CallStub使用了循环进行处理,而这种循环直接是基于机器指令的。在机器层面进行循环,一个约定俗成的做法就是将循环次数暂存到ecx寄存器,因此CallStub必然要先将Java函数的入参数量传送到ecx寄存器中。同时,由于Java函数的多个入参在内存中实际上是一个队列,是一个“串”,而对于串的寻址通常使用基址+变址的偏移寻址指令,因此在CallStub中将以edx寄存器存储基址,以ecx存储变址。对于Java函数的入参队列而言,所谓基址,实际上就是第一个入参的内存地址,每一个指针指向不同的入参实例。 由于Java语言是面向对象的,因此其入参队列在JVM里实际上是指针的队列,每一个指针指向不同的入参实例。指针的宽度是相同的,因此只要知道了第一个入参的位置,便可以知道其后续所有入参的位置,只需要基于第一个位置进行偏移即可。假设第一个入参记为P1,则其后面第N个入参的位置是:P1 + (N -1) 4。根据这个简单的原理,CallStub只要将P1作为基址,将N作为变址就能对Java函数的全部入参进行寻址。所以CallStub将Java函数的参数进行逃入栈的第一步就是分别获取基址和变址。一切准备就绪后,开始循环将Java函数参数压栈。在机器层面进行循环,一般有两种方式:一种是使用loop指令,另一种就是使用跳转。CallStub使用的是跳转,并且其对Java函数的入参采用的是逆向遍历,也就是从后往前遍历参数,将读取到的入参传送到堆栈中。

  • CallStub:调用entry_point例程

    前面经过调用者框架栈帧保存栈基、堆栈动态扩展、现场保存、Java函数参数压栈这一系列的逻辑处理,JVM终于为Java函数的调用演完前奏,一切就绪后,负责吹响号角的就是entry_point例程了。在JVM调用CallStub所指向的函数时,已经将entry_point例程的首地址传递给CallStub函数了,作为其第5个入参。entry_point其实也是一个指向函数的指针,对于CPU而言,只要能够拿到函数的入口地址,就能执行函数调用。

  • CallStub:获取返回值

    CallStub执行entry_point例程调用时,使用的是call指令,而非jmp,因此最终entry_point例程执行完毕之后,CPU的控制权还是会回到CallStub,继续执行entry_point例程调用之后的指令。调用完entry_point例程之后,会有返回值,CallStub会获取返回值并继续处理。CallStub通过下面两条指令分别读取被调用函数所返回的值result和数据类型result_type。

    1
    2
    mov 0xc(%ebp), %edi
    mov 0x10(%ebp), %esi

    0xc(%ebp)和0x10(%ebp)这2个堆栈位置所保存的正是resultAddress与result_type。JVM将这2个值分别存储进edi和esi这2个寄存器中,调用方法在获取被调用函数的返回值与返回类型时,也会从这2个寄存器中读取。

  • CallStub:汇编指令总览

    所谓例程,就是一段预先写好的函数,JVM通过例程函数在启动过程中生成机器指令,当执行Java函数调用时,JVM直接跳转到例程所生成的这段机器指令去执行。CallStub例程最终生成的机器指令如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    // 保存调用者栈帧
    push %ebp
    mov %esp, %ebp
    // 动态分配堆栈
    mov 0x20(%ebp),%ecx
    shl $0x2,%ecx
    add $0x10],%ecx
    sub %ecx,%esp
    and $0xfffffff0,%esp
    // 保存edi、esi、ebx这3个寄存器
    mov %edi,-0x4(%ebp)
    mov %esi,-0x8(%ebp)
    mov %ebx,-0xc(%ebp)
    // 保存mscsr寄存器的值,属于SSE,在VS中的寄存器窗口右击,然后选择SSE就可以看到了
    stmxcsr -0x10(%ebp)
    // 循环遍历Java函数入参,并传送到CallStub堆栈中
    mov 0x20(%ebp),%ecx
    test %ecx,%ecx
    je 0xb370b68b
    mov 0x1c(%ebp),%edx
    xor %ebx,%ebx
    // 开始循环
    mov -0x4(%edx,%edx,4),%eax
    mov %eax,(%esp,%ebx,4)
    inc %ebx
    dec %ecx
    jne 0xb370b96
    // 开始entry_point例程调用
    mov 0x14(%ebp),%ebx
    mov 0x18(%ebp),%eax
    call *%eax
    // call_stub_return_address
    mov 0xc(%ebp),%edi // result
    mov 0x10(%ebp),%esi // result_type