iOS——编译链接

🕗 发布于 2024-07-18 08:25 ios macos

编译连接的过程

预处理
编译
汇编
链接

预处理

clang -E main.m -o main.i

“#define"删除并展开对应宏定义。
处理所有的条件预编译指令。如#if/#ifdef/#else/#endif。
”#include/#import"包含的文件递归插入到此处。
删除所有的注释"//或/**/"。
添加行号和文件名标识，编译调试会用到。

编译

clang -S main.i -o main.s

这个过程就是把上面的main.i文件进行：词法分析、语法分析、静态分析，优化生成相应的汇编代码，最终生成main.s文件。

词法分析：把源代码的字符序列分割成一个个token（关键字、表示符、字面量、特殊符号），比如把标识符放到符号表里面。
语法分析：生成抽象语法树AST，此时运算符号的优先级确定了；有些符号具有多重含义也确定了，比如：*是乘号还是对指针取内容；表达式不合法、括号不匹配等等，都会报错。
静态分析：分析类型声明和匹配问题。比如整型和字符串相加，肯定会报错。
中间语法生成：CodeGen根据AST自上向下逐步翻译成LLVM IR，并且对在编译期就可以确定的表达式进行优化，比如代码里面的a=1+3，可以优化成a=4。（假如开启了bitcode）
目标代码生成与优化：根据中间语法生成依赖具体机器的汇编语言；并优化汇编语言。这个过程中，假如有变量且定义在同一个编译单元里，那么就给这个变量分配空间，确定变量的地址。假如变量或者函数不定义在这个编译单元里面，那就等到链接的时候才能确定地址。

汇编

clang -c main.s -o main.o

将main.s文件编译成main.o文件。(也就是我们常说的目标文件)

这个过程就是把上面得到的main.s文件里面的汇编指令翻译成机器指令，最终生成等到main.o。

链接

clang main.o -o main

这个过程就是将main.o编译成对应的Mach-O文件，也就是我们常说的可执行文件。链接的本质就是把一个或多个目标文件和需要的库（静态库/动态库，如果需要的话）组合成一个文件（Mach-O可执行文件）。

动静态库

什么是静态库和动态库？

库是已经编译完成的二进制文件。
代码需要提供给外部使用又不想代码被更改，就可以把代码封装成库，只暴露头文件以供调用。
希望提高编译速度，可以把部分代码封装成库，编译时只需要链接。
库都是需要链接的，链接库的方式有静态和动态，所以就产生了静态库和动态库。

静态库

静态库是静态链接库；是多个目标文件经过压缩打包后形成的文件包。这些目标文件在编译时被链接到应用程序中。静态库通常以 .a（Unix、Linux）或 .lib（Windows）以及MacOS 独有的 .framework为扩展名。

在编译阶段，静态库的代码被直接链接到生成的可执行文件中。这个过程将库的代码和应用程序的代码合并成一个单一的可执行文件。

由于静态库的代码被嵌入到可执行文件中，生成的可执行文件在运行时不依赖于外部的库文件。这意味着可以在没有静态库的环境中运行该应用程序。

如果静态库被更新，需要重新编译和链接应用程序，以确保应用程序包含最新的库代码。

动态库

动态库是动态链接库，是实现共享函数库的一种方式。动态库在编译的时候不会被拷贝到目标程序中，目标程序只会存储下动态库的引用。
真正用到动态库内的函数时才会去查找 - 绑定 - 使用函数。
动态库的格式有：.framework、.dylib、.tbd……

动态库的代码在运行时被加载到内存中，应用程序通过链接器解析符号，并在需要时调用库中的代码。

多个应用程序可以共享同一个动态库的实例，减少内存占用。

动态库可以在应用程序启动时加载，也可以在运行过程中按需加载，提供更灵活的加载方式。

如何区分framework是静态库还是动态库

众所周知，framework其实是一种文件的打包方式，把头文件、二进制文件、资源文件封装在一起，方便管理和分发。所以动态库和静态库的文件格式都会有.framework。那么我们手头上有个framework，如何区分它的类型呢？
在这里插入图片描述

方法：命令行进入动态库文件，使用file命令查看输出内容可以看到区别。以静态库文件-MAMapKit.framework与动态库文件-AFNetworking.framework为例。

静态库文件-MAMapKit.framework

cd /Users/***/Desktop/Framework/MAMapKit.framework
file MAMapKit

输出

MAMapKit: Mach-O universal binary with 4 architectures: [arm_v7:current ar archive random library] [arm64]
MAMapKit (for architecture armv7):  current ar archive random library
MAMapKit (for architecture i386):   current ar archive random library
MAMapKit (for architecture x86_64): current ar archive random library
MAMapKit (for architecture arm64):  current ar archive random library

archive表明这是一个静态库

动态库文件-AFNetworking.framework

cd /Users/***/Desktop/Framework/AFNetworking.framework
file AFNetworking

输出

AFNetworking: Mach-O universal binary with 2 architectures: [arm_v7:Mach-O dynamically linked shared library arm_v7] [arm64:Mach-O 64-bit dynamically linked shared library arm64]
AFNetworking (for architecture armv7):  Mach-O dynamically linked shared library arm_v7
AFNetworking (for architecture arm64):  Mach-O 64-bit dynamically linked shared library arm64

dynamically linked shared library表明这是一个动态库

动态库和静态库的区别

静态库

在编译时加载
优点：代码装载和执行速度比动态库快。
缺点：浪费内存和磁盘空间，模块更新困难。

动态库

在运行时加载
优点：体积比静态库小很多，更加节省内存。
缺点：代码装载和执行速度比静态库慢。

注：
体积小于最小单位16k的静态库编译出来的动态库体积会等于16k。
换成动态库会导致⼀些速度变低，但是会通过延迟绑定（Lazy Binding)技术优化。

延迟绑定：首次使用的时候查找并记录方法的内存地址，后续调用就可以省略查找流程。

动态库和静态库链接到主程序以后放在什么位置？

在这里插入图片描述

静态库链接后的位置

静态库中的可执行代码会被链接到可执行文件的代码段中，与主程序的代码一起存储在这个段中。
静态库中的初始化数据会被链接到可执行文件的数据段中。
静态库中的未初始化数据会被链接到 BSS 段中。

动态库链接后的位置

动态库的链接过程不同于静态库，它在编译时并不会被包含到可执行文件中，而是在运行时由操作系统的动态链接器加载。

当主程序运行时，动态链接器（如 macOS 上的 dyld，Linux 上的 ld.so，Windows 上的 LoadLibrary）会将动态库加载到一个随机的内存地址（使用地址空间布局随机化，ASLR），以提高安全性。

dyld动态链接器

dyld（the dynamic link editor）是苹果的动态链接器，是苹果操作系统一个重要组成部分，在系统内核 XNU 完成 Mach-O 文件的加载，做好程序准备工作之后，交由 dyld 负责余下的工作。在 macOS 系统中，dyld 位于 D/usr/lib/dyld。

dyld2

dyld 2具有对 C++ 初始化程序语义的正确支持，扩展了 Mach-O 格式，并更新了 dyld ，以便有效支持的 C++ 库。
dyld 2 具有完整的 dlopen 和 dlsym 实现，此时弃用了旧版 API。

支持更多的架构及平台

自从Power PC上发布 dyld 2.0 以来，添加了 x86，x86 64 arm，arm64 等架构，支持了 iOS, tvOS, 和 watchOS 平台

通过多种方式提高了安全性

Codesigning ：代码签名
ASLR ：Address space layout randomization 地址空间配置随机加载
bounds checking：对 Mach-O Header 中的许多内容添加了重要的边界检查功能，从而可以避免恶意二进制数据的注入

提升性能

使用 shared cache 技术完全替代了预绑定 prebinding；

执行流程：

在这里插入图片描述

dyld 的初始化，主要代码在 dyldbootstrap::start，接着执行 dyld::_main ，dyld::_main 代码较多，是 dyld 加载的核心部分；
检查并准备环境，比如获取二进制路径，检查环境变量，解析主二进制的 image header 等信息；
实例化主二进制的 image loader ，校验主二进制和 dyld 的版本是否匹配；
检查 shared cache 是否已经 map ，没有的话则先执行 map shared cache 操作；
检查 DYLD_INSERT_LIBRARIES，有的话则加载插入的动态库（实例化 image loader）;
执行 link 操作。这个过程比较复杂，会先递归加载依赖的所有动态库（会对依赖库进行排序，被依赖的总是在前面），同时在这阶段将执行符号绑定，以及rebase，binding 操作；
执行初始化方法。Objective-C 的 +load 以及 C 的 constructor方法都会在这个阶段执行；
读取 Mach-O 的 LC_MAIN段获取程序的入口地址，调用 main 方法。

dyld3

dyld 3是全新的动态链接器，它完全改变了动态链接概念。dyld 3 完全兼容 dyld 2，API 接口是一样的，所以在大部分情况下，开发者不需要做额外的适配就能平滑过渡。

执行流程
在这里插入图片描述

dyld 3 包含这三个部分:

进程外 Mach-O 分析器和编译器（out-of-process mach-o parser）
由于 dyld 2 存在的问题，dyld 3 中将采用提前写入把结果数据缓存成文件的方式构成一个 lauch closure（可以理解为缓存文件）
进程内引擎执行 launch closure 处理 (in-process engine)
验证”lauch closures“是否正确，映射dylib，执行main函数。此时，它不再需要分析mach-o header和执行符号查找，节省了不少时间。
launch closure 缓存服务 (launch closure cache )
系统程序的 lauch closure 直接内置在 shared cache 中，而对于第三方APP，将在APP安装或更新时生成，这样就能保证 launch closure 总是在 APP 打开之前准备好。

大多数程序启动会使用缓存，而不需要调用进程外 mach-o分析器或编译器；并且 launch closure 比 Mach-O 更简单，它们是内存映射文件，不需要用复杂的方法进行分析，我们可以简单地验证它们，其作用是为了提高速度

原文地址：https://blog.csdn.net/m0_73348697/article/details/140488855

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：响应“一机两用”政策号召提高政务内外网安全
下一篇：VScode+latex+Sumatra 环境配置

Linux系统下svn新建目录
Linux安装svn自行查找。
阅读更多2024-11-14
Scala的不可变Map常用操作
/3.1 get方法：输入key，如果找到，就返回包装数据，如果没有找到，就返回None。val map1 = Map("鄂"->"湖北省","
阅读更多2024-11-14
mqtt学习笔记（一）
mqtt相关笔记（一）之mqtt初探，以提出、解决问题的方式来逐步学习
阅读更多2024-11-14
Ken和Bwk趣说UNIX
[肯汤普森和布莱恩(AWK作者之一)趣说UNIX](https://www.bilibili.com/video/BV1nP411t7gt/ “肯汤普森和布莱恩(AWK作者之一 “肯汤普森和布莱恩(A
阅读更多2024-11-14
【CentOS】中的Firewalld：全面介绍与实战应用（上）
本文深入探讨了CentOS操作系统中Firewalld防火墙的全面功能与实战应用。首先，文章概述了Firewalld的基本概念，强调了它在现代Linux系统中作为动态管理防火墙规则的重要工具的地位。与
阅读更多2024-11-14
新手小白学习docker第七弹------安装redis集群大厂面试
新手小白学习docker第七弹----安装redis集群大厂面试
阅读更多2024-11-14
/// ts中的三斜线指令 | 前端
包），你需要在你的项目中以某种方式告诉TypeScript编译器这些类型定义的存在。三斜线指令是一种在单个文件中这样做的方式，虽然在实际项目中，更常见的是通过。1. 这行代码是TypeScript中
阅读更多2024-11-14
快速掌握——python类封装[私有属性方法]、继承【python进阶】(内附代码)
python类的封装【私有属性、私有方法、属性装饰器】类的继承
阅读更多2024-11-14
2024年5款大屏可视化工具多维分析对比
经过对市场上多款大屏可视化工具的深入研究和对比，强烈推荐FineVis作为您的首选。无论您是希望快速搭建大屏项目、展示复杂3D模型还是实现多屏适应和实时数据分析，FineVis都能满足您的需求。文章中
阅读更多2024-11-14
计算机网络-mac地址与ip地址的区别总结
mac地址在OSI模型中的第二层数据链路层工作，数据链路层基于mac地址进行转发数据帧【交换机基于mac地址表转发数据】ip地址在OSI模型中的第三层网络层工作，网络层基于ip地址转发报文【路由器
阅读更多2024-11-14