编译的一些事

Posted on Jan 22, 2021

一次交叉编译体验

有一个项目使用高级编程语言创建原生进程（native process）来执行 Shell 脚本，其中有一段用于编辑特定配置文件的代码片段。

for name in $names; do
    eval expr='$'"$name"
    sed -i -e "s/<@${name}@>/${expr}/g" ${file%.*}.${component_instance}
done

sed（stream editor）是一个用于过滤和转换文本的 Unix 程序。

# 将 file.txt 中的 before 就地替换为 after
sed -i -e 's/before/after/g' file.txt

用法还算简单，但是，如果 after 包含特殊字符，比如传递包含正则表达式的多行代码（想象一下 Logstash 配置），运行时将极有可能发生类似错误：unknown option to s'。如果要对特殊字符进行转义，这种方案不仅复杂还易错，甚至可能会更改“间接调用” Shell 脚本的应用程序代码。换个角度，sed 是否有更好的替代品？

感谢使用 Rust 重写一切的开源软件作者们，sd 完全可以代替 sed，而且能识别特殊字符。

sd -s before after file.txt

兴致勃勃从 releases 下载可执行文件，却遇到因为开发/测试环境的 glibc 版本不符合 sd 的要求从而导致无法正常执行。

$ ./sd-v0.7.6-x86_64-unknown-linux-musl --help
./sd-v0.7.6-x86_64-unknown-linux-musl: /lib64/libc.so.6: version `GLIBC_2.18' not found (required by ./sd-v0.7.6-x86_64-unknown-linux-musl)

升级 glibc 有一定风险，管理员不一定允许升级，而且客户/用户也不一定允许在线安装 sd。理想情况下，只需要提前在本地将 sd 源代码编译成目标服务器的可执行代码，那么目标服务器就无需安装 Rust 或其它东西了。得益于 Cross-compile and link a static binary on macOS for Linux with cargo and rust，成功在 macOS Big Sur 上将 sd 源代码编译成开发/测试环境的可执行文件。

$ file sd
sd: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, not stripped

所谓交叉编译，即将源文件从运行编译器的平台生成可在其它平台执行的文件。除了 Rust 天然支持交叉编译，其它主流语言做得到吗？Go 开箱即支持交叉编译。

AOT 和 JIT

Java 就麻烦得多了。Oracle Java 编译器（javac）并不能将 Java 源代码（Source Code）编译成原生可执行代码，而只能编译成 Java 字节码（Bytecode）。

Java 字节码通常与平台无关（platform-independent），由 Java 虚拟机的解释器（Bytecode Interpreter）执行（如果有的话）。很久很久以前，Sun 用“编写一次，到处运行”的口号来说明 Java 的跨平台优势，Java 跨平台是因为 Java 虚拟机不跨平台，不同的平台安装不同的 Java 虚拟机才可能运行相同的 Java 程序（不同平台的 Java 字节码解释器可以执行相同的字节码）。

bytecode-interpreter_jit-compiler

当 Java 字节码由解释器执行时，总是比编译为原生机器码的同一程序执行慢。JIT 编译器（JIT Compiler）专门缓解此问题，JIT 编译器通常在运行时将 Java 字节码编译成原生机器码（Native/Machine Code），又称动态编译。相对地说，静态编译又名 AOT 编译（Ahead-of-time compilation），AOT 编译器的编译过程（从源代码到原生机器码）发生在程序运行之前。

#include <stdio.h>

int main() 
{
    printf("hello, world\n");
}

一个表面上非常简单的 C 语言程序（hello.c），使用 GCC 编译后输出可执行的目标程序（hello），这个过程包括了 AOT 编译。

% gcc -o hello hello.c

可执行至少意味着可通过 ./ 执行。

% ./hello 
hello, world

发生了什么事？了解编译系统如何工作，对将来优化程序性能有益处。

编译系统

（深入理解计算机系统（原书第3版）1.2 程序被其他程序翻译成不同的格式）

% file hello
hello: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for GNU/Linux 2.6.32, BuildID[sha1]=dd72445243a497f2f62a1e5d19185ca41181e4b5, not stripped

JIT 编译器通常在预热（warmup）期工作，虽然 Java 程序启动速度会受到影响，但是方法调用（Method Invocation）发生时，Java 虚拟机将通过分析数据（Profiling）积极应用优化。例如，将调用次数已达阈值的方法（热点代码）编译成原生机器码并写入代码缓存（Code Cache），代码缓存的容量可以通过选项 -XX:ReservedCodeCacheSize 设置；将来调用同一方法时，不是解释执行（基于 Stack Machine），而是从缓存读取原生机器码直接执行（基于 Register Machine）。

jvm-lifecycle

在生成原生机器码之前，JIT 编译器会先积极优化字节码。例如，方法内联（Method Inlining）、逃逸分析（Escape Analysis）、循环展开（Loop unrolling）、锁粗化（Lock Coarsening）、锁清除（Lock Elision） 等等。

由于 Java 虚拟机隐藏了操作系统具体实现的复杂性，并给应用程序提供了简单或统一的接口，随着 Java 虚拟机的迭代升级，即使运行同一程序，也能实现更高的性能。Oracle 的 Java 默认虚拟机是 HotSpot JVM，HotSpot JVM 用 C++ 编写而成，它有两个 JIT 编译器，C1 和 C2。

jvm_compiler_threads

C1 适用于 Client（java –client），启动快，但峰值性能受损；C2 适用于 Server（java –server），非常适合编译热点方法，但启动慢（热身）。权衡利弊的结果可能是组合使用 C1 和 C2，Java 8 后默认开启多层编译（-XX:+TieredCompilation），先以 C1 编译，采样足够后以 C2 编译。

所谓的 JVM 性能调优，通常聚焦在内存与 GC，若不考虑应用程序可能包含低效的部分，那不妨调参（选项或标记）之后测试是否符合预期。真遇到了需要监视 JIT 的场景，换言之是为了性能优化或故障排查的目的分析 JIT 日志，发觉日志难读，但好在发现一款 JIT 日志分析与可视化工具——jitwatch。

GraalVM 和 LLVM

退一步来说，借助虚拟机可以在编译时将 Java 程序编译成可执行文件。Oracle 的 GraalVM 的附加组件包括了一种将 Java 应用程序 AOT 编译为原生可执行文件的技术，名为 Native Image。

GraalVM 是用于运行以 JavaScript、Python、Ruby、R、基于 JVM 的语言（例如 Java、Scala，Clojure，Kotlin）、基于 LLVM 的语言（例如 C 和 C ++）编写的应用程序的通用虚拟机。

GraalVM Native Image 技术存在不容忽视的限制，原因之一是 AOT 编译参考的静态信息有时是不够的，并且很难猜测应用程序的实际行为。为了能够构建高度优化的原生可执行文件，GraalVM 会运行积极的静态分析，在编译时必须知道所有可访问的类和字节码，否则 Java 的动态特性（例如动态类加载、反射、动态代理等等）严重受限，甚至不可用。因此，GraalVM Native Image 兼容和优化指南建议用户编写配置文件“提示” GraalVM 做正确的事情。

GraalVM Native Image 暂不支持交叉编译，但不意味不能在一个平台构建出其它平台的可执行文件。运用操作系统级别的虚拟化即可，例如在本地下载各个平台的 GraalVM Docker 镜像，以此为基础构建可执行文件的镜像。

GraalVM 之所以能运行不同种类的语言编写而成的应用程序的原因之一是 GraalVM 的核心组件与附加组件包含了多种运行时（Runtime）。比如运行 Java、JavaScript/Node.js、C/C++ 程序所需的环境：

Java HotSpot VM
Node.js JavaScript runtime
LLVM runtime

LLVM 是模块化和可重用的编译器与工具链技术的集合。

LLVM 不是通用虚拟机（VM），但使用 LLVM 的编程语言非常之多（从LLVM 的维基百科词条第二段可以体会到）。

llvm_compiler_pipeline

LLVM 编译器通常分为三部分：前端（frond-end）、中端（middle-end）、后端（back-end）。

前端：将源码编译为 IR。
中端：优化 IR。
后端：将 IR 编译为机器码。

IR 是中间表示（Intermediate representation）的简称，它是一种与平台无关（platform-independent）的代码/指令。

% clang-11 hello.c -o hello

例如，使用 Clang 编译简单的 C 语言程序（hello.c），最终得到其可执行文件（hello，如果想观看 LLVM IR 的模样，不妨试试在浏览器编译 C 语言程序）。

% file hello
hello: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for GNU/Linux 2.6.32, BuildID[sha1]=bf54bb50604533e477e6e42d576c573f88f2a986, not stripped

当我们想创建新的编程语言时，可以不必花费时间和精力去重新发明那些特定的轮子（例如用于编译与优化的工具），而是直接使用 LLVM 实现语言。

从编译时开始重用

程序员们日常使用的各种库（Library）或框架（Framework）总是从编译时开始重用（Reuse），那时，彷佛站在了巨人的肩膀上。

本文首发于 https://h2cone.github.io/

编译的一些事

一次交叉编译体验

AOT 和 JIT

GraalVM 和 LLVM

从编译时开始重用

参考资料