5.2. 工具链技术说明

本节阐述了整个构建方法的一些基本原理和技术细节, 您不必马上就理解本节中的所有内容。 在您实际操作之后,就会了解大多数的东西,您可以在任何时候回顾本节。

Chapter 5 的总体目标是提供一个临时环境,它包含一组已知良好的脱离宿主系统的工具。 为创建一个干净、 没有问题的目标LFS系统,通过使用 chroot, 剩下章节中的命令将包含在这个环境中。这个创建过程被设计为尽量减少新手犯错误的可能, 同时尽可能多的提供教育价值。

[Important]

重要

在继续之前,要先知道工作平台的名称,就是所谓的"target triplet"(目标三元组), 要确定 target triplet 的名称, 有一个简单的方法, 就是运行许多源码包里都有的 config.guess 脚本。解开 Binutils 的源码包,然后运行脚本 ./config.guess并注意输出的内容。例如, 最新的32位Intel 处理器的输出类似于 i686-pc-linux-gnu

工作平台的动态连接器名称也需要知道,这里指的是动态加载器(不要与 Binutils 里的 标准连接器 ld 混淆了)。动态连接器由 Glibc 提供, 用来找到并加载一个 程序运行时 所需的共享库, 在做好程序运行的准备之后,运行这个程序。32位Intel电脑的动态连 接器的名称通常是 ld-linux.so.2。确定这个名称还有一个必杀技, 就是在宿主系统 上随便找一个二进制文件,运行 readelf -l <二进制文件名> | grep interpreter并查看输出的内容。涵盖所有平台的权威参考请查看 Glibc 源码根目录里的 shlib-versions 文件。

关于 Chapter 5 中构建方法如何工作的一些技术要点:

首先安装的是 Binutils, 因为 GCC 和 Glibc 运行的 configure 文件要在汇编器和联接器上执行各种各样的特性测试, 以确定软件的哪些功能要启用, 哪些功能要禁用。 这样做比你想像的还要重要,配置不正 确的 GCC 或者 Glibc 会导致工具链出现微妙的错误,这样的错误造成的影响可能直到整个系统快要编译 完成的时候才显现出来。 测试程序通常会在其它的许多工作进行之前给出错误警告 。

Binutils 将它的汇编器和连接器安装在两个位置: /tools/bin/tools/$LFS_TGT/bin。 一个位置的工具是另外一个位置的硬链接。 连接器的一个重要用途是它的库搜索顺序,将 --verbose 参数传递给 ld 可以获得详细的信息。比如,输入 ld --verbose | grep SEARCH 将显示当前搜索路径和顺序。要显示 ld 连接的是哪些文件,可以编译一个伪(dummy)程序并把 --verbose 参数传递给连接器。例如,输入 gcc dummy.c -Wl,--verbose 2>&1 | grep succeeded 将显示所有连接过程中成功打开的文件。

第二个安装的软件包是 GCC。 下面是运行 configure 脚本时,输出内容的一个示例:

checking what assembler to use... /tools/i686-lfs-linux-gnu/bin/as
checking what linker to use... /tools/i686-lfs-linux-gnu/bin/ld

基于上面提到过的原因,这是重要的步骤,它同时证明了 GCC 的配置脚本并不是搜索 PATH 里的目录来寻找要使用哪个工具的,而且,在 gcc 的实际操作中, 不必使用相同的搜索路径。 要知道 gcc会使用哪个标准连接器,请运行命令:gcc -print-prog-name=ld

在编译一个伪程序的时候,给 gcc 命令传递 -v 选项可以获得详细的信息。举个例子: gcc -v dummy.c 将显示在预处理、编译和汇编各个阶段的详细信息,包括 gcc文件包含的搜索路径及其顺序。

接下来安装的软件包是 Glibc。编译 Glibc 的时候, 最需要注意的地方是编译器、 二进制工具(Binutils)和内核头文件。编译器一般不是问题, 因为 Glibc 总是将与编译器相关的 --host 参数传递给它的配置脚本,在我们的例子里就是 i686-lfs-linux-gnu-gcc, 而二进制工具和内核头文件可能有点复杂。因此, 为慎重起见, 要使用可用的配置开关(选项)来强制进行正确的选择。在运行 configure 之后,请检查 glibc-build 目录下的 config.make 文件的内容,查看所有重要的细节。 注意 CC="i686-lfs-gnu-gcc"的作用是控制要使用哪个二进制工具; 而 -nostdinc-isystem 参数则是用来控制编译器的 include 搜索路径。 这些选项表明了 Glibc 软件包的一个重要特征:根据其编译机器的情况, 它是非常自给自足的, 而且一般不依赖于工具链的默认值。

安装完 Glibc 以后, 要更改 gcc 的 specs 文件,以便指向 /tools/lib 里新的动态连接器。 最后一步是至关重要的,要确保搜索和链接只在预设的 /tools 目录内进行。 指向动态链接器的固化路径被嵌入到每个共享的可执行和链接格式 (ELF)文件里。 这可以通过运行: readelf -l <name of binary> | grep interpreter 来检查。修改 gcc 的specs 文件,确保从现在到本章结束,编译的每个程序都使用 /tools/lib

对于第二遍编译 GCC,为了告诉GCC使用新的动态连接器,它的源代码也需要改变。 不这样做的 结果是 GCC 会把宿主系统 /lib 目录下动态连接器的名字嵌入进来, 这样有悖于与宿主系统隔离的目标。

第二遍编译 Binutils 的过程中,我们利用 --with-lib-path 选项来控制 ld 的库搜索路径。 如前面所指出的,核心工具链是自包含和自依赖的,所以 Chapter 5 余下的软件包的编译将依赖于 /tools 下新的 Glibc 。

Chapter 6 中进入 chroot 环境后,第一个安装的主要软件包就是 Glibc, 原因是上面所提 到的 Glibc 自给自足的特性。 一旦 Glibc 安装到 /usr 目录后, 我们会马上改变工具链的默认 值, 然后构建目标 LFS 系统的其它部分。