为了账号安全,请及时绑定邮箱和手机立即绑定

iOS调优 | 深入理解Link Map File

标签:
iOS

Link Map File初识

我们编写的源码需要经过编译、链接,最终生成一个可执行文件。在编译阶段,每个类会生成对应的.o文件(目标文件)。在链接阶段,会把.o文件和动态库链接在一起。Link Map File就是这样一个记录链接相关信息的纯文本文件,里面记录了可执行文件的路径、CPU架构、目标文件、符号等信息。

为什么要理解Link Map File

理解Link Map File,可以帮助我们:

  • 理解链接过程

  • 理解Crash时,通过Symbols还原出源码的机制

  • 理解内存分段、分区

  • 分析可执行文件中哪个类或库占用比较大,进行安装包瘦身

Link Map File配置

点击工程,选择Build Setting选项,搜索map,可以看到如下界面。将Write Link Map File设置为Yes后,Build结束后,会在默认路径下生成一个Link Map File文件,该文件是txt格式的。点击Path to Link Map File,可以设置Debug或Release模式下的生成路径。


配置

Path & Arch

# Path: /Users/shanggaolin/Library/Developer/Xcode/DerivedData/xxxxxx.app-hjsjojqpqxstlzceepeqbvxqzcrh/Build/Products/Debug-iphonesimulator/xxxxxx.app/xxxxxx# Arch: x86_64

Path是可执行文件的路径,Arch是架构类型。

Object files

# Object files:[  0] linker synthesized
[  1] /Users/shanggaolin/Library/Developer/Xcode/DerivedData/NewMissFresh-hjsjojqpqxstlzceepeqbvxqzcrh/Build/Intermediates.noindex/NewMissFresh.build/Debug-iphonesimulator/NewMissFresh.build/NewMissFresh.app-Simulated.xcent
[  2] /Users/shanggaolin/Library/Developer/Xcode/DerivedData/NewMissFresh-hjsjojqpqxstlzceepeqbvxqzcrh/Build/Intermediates.noindex/NewMissFresh.build/Debug-iphonesimulator/NewMissFresh.build/Objects-normal/x86_64/UIButton+SSEdgeInsets.o
[  3] /Users/shanggaolin/Library/Developer/Xcode/DerivedData/NewMissFresh-hjsjojqpqxstlzceepeqbvxqzcrh/Build/Intermediates.noindex/NewMissFresh.build/Debug-iphonesimulator/NewMissFresh.build/Objects-normal/x86_64/MFRankListTableViewDelegate.o

在编译成目标文件后,通过链接器进行链接,最终合成可执行文件。这里展示的信息是链接时用到的文件,包括.o文件和dylib库。第一列的序号是类的编号,通过该编号可以对应到具体的类。

在后面的Symbols部分,我们会用到类的编号。

Section区

# Sections:# Address   Size        Segment Section0x100002780 0x0129617D  __TEXT  __text0x1012988FE 0x000015E4  __TEXT  __stubs0x101299EE4 0x0000207C  __TEXT  __stub_helper0x10129BF60 0x0002BE10  __TEXT  __const0x1012C7D70 0x00097A6D  __TEXT  __objc_methname0x10135F7DD 0x00010CD5  __TEXT  __objc_classname0x1013704B2 0x00015F47  __TEXT  __objc_methtype0x101386400 0x000B6CB2  __TEXT  __cstring0x10143D0B2 0x00007D60  __TEXT  __ustring0x101444E14 0x00054EA8  __TEXT  __gcc_except_tab0x101499CBC 0x000002B0  __TEXT  __entitlements0x101499F6C 0x00014CA8  __TEXT  __unwind_info0x1014AEC18 0x0003B3E8  __TEXT  __eh_frame0x1014EA000 0x00000010  __DATA  __nl_symbol_ptr0x1014EA010 0x00000BD8  __DATA  __got0x1014EABE8 0x00001D30  __DATA  __la_symbol_ptr0x1014EC918 0x00000028  __DATA  __mod_init_func0x1014EC940 0x00073BB0  __DATA  __const0x1015604F0 0x00062700  __DATA  __cfstring0x1015C2BF0 0x00004BD0  __DATA  __objc_classlist0x1015C77C0 0x00000058  __DATA  __objc_nlclslist0x1015C7818 0x00000640  __DATA  __objc_catlist0x1015C7E58 0x00000088  __DATA  __objc_nlcatlist0x1015C7EE0 0x00001018  __DATA  __objc_protolist0x1015C8EF8 0x00000008  __DATA  __objc_imageinfo0x1015C8F00 0x001EE0A0  __DATA  __objc_const0x1017B6FA0 0x00024A08  __DATA  __objc_selrefs0x1017DB9A8 0x000000B8  __DATA  __objc_protorefs0x1017DBA60 0x00004AD8  __DATA  __objc_classrefs0x1017E0538 0x00002F08  __DATA  __objc_superrefs0x1017E3440 0x00015A38  __DATA  __objc_ivar0x1017F8E78 0x0002F670  __DATA  __objc_data0x1018284F0 0x00024D18  __DATA  __data0x10184D210 0x00006C74  __DATA  __bss0x101853E90 0x00000E90  __DATA  __common

第一列是起始位置,第二列是Section占用内存大小,第三列是Segment类型,第四列是Section类型。
为了理解上面的信息,我们需要先补充一点Mach-O知识。
Mach-O 文件中的虚拟地址最终会映射到物理地址上。这些地址被分成不同的Segement: __TEXT段、__DATA段 和 __LINKEDIT段。
(1)__TEXT 包含 Mach header,被执行的代码和只读常量(如C 字符串),只读可执行(r-x)。
(2)__DATA 包含全局变量,静态变量等,可读写(rw-)。
(3)__LINKEDIT 包含了加载程序的『元数据』,比如函数的名称和地址,只读(r–)。

Segement划分成了不同的Section,不同的Section存储着不同的信息,下面是一些常用的Section的介绍。

//  __TEXT段中的一些Section1. __text: 代码节,存放机器编译后的代码2. __stubs: 用于辅助做动态链接代码(dyld).3. __stub_helper:用于辅助做动态链接(dyld).4. __objc_methname:objc的方法名称5. __cstring:代码运行中包含的字符串常量,比如代码中定义`#define kGeTuiPushAESKey        @"DWE2#@e2!"`,那DWE2#@e2!会存在这个区里。6. __objc_classname:objc类名7. __objc_methtype:objc方法类型8. __ustring:9. __gcc_except_tab:10. __const:存储const修饰的常量11. __dof_RACSignal:12. __dof_RACCompou:13. __unwind_info:// __DATA段中的一些Section1. __got:存储引用符号的实际地址,类似于动态符号表2. __la_symbol_ptr:lazy symbol pointers。懒加载的函数指针地址。和__stubs和stub_helper配合使用。具体原理暂留。3. __mod_init_func:模块初始化的方法。4. __const:存储constant常量的数据。比如使用extern导出的const修饰的常量。5. __cfstring:使用Core Foundation字符串6. __objc_classlist:objc类列表,保存类信息,映射了__objc_data的地址7. __objc_nlclslist:Objective-C 的 +load 函数列表,比 __mod_init_func 更早执行。8. __objc_catlist: categories9. __objc_nlcatlist:Objective-C 的categories的 +load函数列表。10. __objc_protolist:objc协议列表11. __objc_imageinfo:objc镜像信息12. __objc_const:objc常量。保存objc_classdata结构体数据。用于映射类相关数据的地址,比如类名,方法名等。13. __objc_selrefs:引用到的objc方法14. __objc_protorefs:引用到的objc协议15. __objc_classrefs:引用到的objc类16. __objc_superrefs:objc超类引用17. __objc_ivar:objc ivar指针,存储属性。18. __objc_data:objc的数据。用于保存类需要的数据。最主要的内容是映射__objc_const地址,用于找到类的相关数据。19. __data:暂时没理解,从日志看存放了协议和一些固定了地址(已经初始化)的静态量。20. __bss:存储未初始化的静态量。比如:`static NSThread *_networkRequestThread = nil;`其中这里面的size表示应用运行占用的内存,不是实际的占用空间。所以计算大小的时候应该去掉这部分数据。21. __common:存储导出的全局的数据。类似于static,但是没有用static修饰。比如KSCrash里面`NSDictionary* g_registerOrders;`, g_registerOrders就存储在__common里面

虚拟内存最终会映射到物理内存,通过上面的介绍,我们就可以知道代码和数据在内存中是如何存储的。

Symbols

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

# Symbols:// __text代码区# Address   Size        File  Name0x100002780 0x00000450  [  2] -[UIButton(SSEdgeInsets) setImageUpTitleDownWithSpacing:]0x100002BD0 0x00000070  [  2] _UIEdgeInsetsMake0x100002C40 0x000004B0  [  2] -[UIButton(SSEdgeInsets) setImageRightTitleLeftWithSpacing:]0x1000030F0 0x000001B0  [  2] -[UIButton(SSEdgeInsets) setDefaultImageTitleStyleWithSpacing:]0x1000032A0 0x000006F0  [  2] -[UIButton(SSEdgeInsets) setEdgeInsetsWithType:marginType:margin:]0x100003990 0x000000B0  [  3] -[MFRankListTableViewDelegate removeAllCellModels]0x100003A40 0x000002A0  [  3] -[MFRankListTableViewDelegate appendCellModels:]0x100003CE0 0x00000050  [  3] -[MFRankListTableViewDelegate numberOfSectionsInTableView:]0x100003D30 0x000000C0  [  3] -[MFRankListTableViewDelegate tableView:numberOfRowsInSection:]

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<// __objc_methname方法名区0x1012C7D70 0x0000000F  [  2] literal string: imageForState:0x1012C7D7F 0x00000005  [  2] literal string: size0x1012C7D84 0x00000014  [  2] literal string: setTitleEdgeInsets:0x1012C7D98 0x0000000F  [  2] literal string: titleForState:0x1012C7DA7 0x00000007  [  2] literal string: length0x1012C7DAE 0x0000000B  [  2] literal string: titleLabel0x1012C7DB9 0x00000005  [  2] literal string: font0x1012C7DBE 0x00000025  [  2] literal string: dictionaryWithObjects:forKeys:count:0x1012C7DE3 0x00000014  [  2] literal string: sizeWithAttributes:0x1012C7DF7 0x00000014  [  2] literal string: setImageEdgeInsets:0x1012C7E0B 0x00000019  [  2] literal string: attributedTitleForState:0x1012C7E24 0x00000006  [  2] literal string: frame0x1012C7E2A 0x00000020  [  2] literal string: setImageUpTitleDownWithSpacing:0x1012C7E4A 0x00000023  [  2] literal string: setImageRightTitleLeftWithSpacing:0x1012C7E6D 0x00000026  [  2] literal string: setDefaultImageTitleStyleWithSpacing:0x1012C7E93 0x00000029  [  2] literal string: setEdgeInsetsWithType:marginType:margin:0x1012C7EBC 0x0000000E  [  3] literal string: setIsLoading:

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<// __objc_classlist类列表区0x1015C2BF0 0x00000008  [  3] anon0x1015C2BF8 0x00000008  [  4] anon0x1015C2C00 0x00000008  [  5] anon0x1015C2C08 0x00000008  [  6] anon0x1015C2C10 0x00000008  [  7] anon
1、__text代码区

通过地址0x100002780,可以知道它位于__TEXT段的__text区,这段区域存储着代码,通过符号表,根据地址可以对应出源代码,如-[UIButton(SSEdgeInsets) setImageUpTitleDownWithSpacing:]。通过第三列的类编号,可以知道该代码属于UIButton+SSEdgeInsets分类。

2、__objc_methname方法名区

通过地址0x1012C7D70,可以知道它位于__TEXT段的__objc_methname区,这段区域存储着方法名,通过符号表,根据地址可以对应出具体的方法名,如imageForState
由上面的信息,可以看出方法名越长,最终占用的内存也越大。

3、__objc_classlist类列表区

__objc_classlist区的size值都是8,区域里存储的值都是一个指针,指向了类的虚拟地址(__objc_data区中地址)。
objc_class的数据结构为:

typedef struct objc_class {
        unsigned long long isa;        unsigned long long wuperclass;        unsigned long long cache;        unsigned long long vtable;        unsigned long long data;        unsigned long long reserved1;        unsigned long long reserved2;        unsigned long long reserved3;
}objc_class;

上面的data字段保存了_objc_const区对应的数据地址(objc_classdata地址)。
objc_classdata数据结构为:

typedef struct objc_classdata {
    long long flags;    long long instanceStart;    long long instanceSize;    long long reserved;    unsigned long long ivarlayout;    unsigned long long name;    unsigned long long baseMethod;    unsigned long long baseProtocol;    unsigned long long ivars;    unsigned long long weakIvarLayout;    unsigned long long baseProperties;
}

objc_classdata结构体中保存了类名,方法名,协议名,ivar指针和属性对应的地址。通过地址,可以找到对应的段和分区,进而找到对应类的各种信息。

查找未使用的类和方法

__objc_classrefs是引用到的类,_objc_classname是所有类名,通过分析两者之间的差别,就可以知道哪些类没有用到。
同理,分析__objc_selrefs和_objc_methname的差别,也可知道哪些方法没用到。
由于OC是动态语言,中间可能会出现判断失误的情况。

分析大文件

在Symbols部分,我们可以把类编号相同的size加起来,算出每个类或库占用的大小。在Object files部分根据类的编号可以查出对应的类。分析的结果对App安装包瘦身会有一些帮助。github上有很多实现了这样功能的开源工具,实现原理很简单,如有需要可自行查找。

参考文献

优化 App 的启动时间



作者:Mrshang110
链接:https://www.jianshu.com/p/52e0dee35830
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消