CPU & GPU
在屏幕成像的过程中CPU(Central Processing Unit,中央处理器)和GPU(Graphics Processing Unit,图形处理器)起到了至关重要的作用,简言之,CPU负责计算包括:对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片格式的转换和解码、图像的绘制(Core Graphics)。而GPU的话主要负责绘制:纹理的渲染。
两者协作的原理是这样的:
卡顿优化
卡顿产生的原因
屏幕显示的原理是通过两个信号:水平同步信号和垂直同步信号,每当有垂直同步信号过来的时候就会显示一帧的数据;
我们知道这每一帧的数据是通过CPU和GPU共同协作来完成的,也就是说需要在垂直同步信号到来之前CPU和GPU必须准备好要显示的这一帧的数据,那么如果没有准备完毕就会导致显示延迟也就是卡顿;
可以看下这个示意图:
红色的箭头表示CPU的工作时间,蓝色的箭头表示GPU的工作时间,如果两者的工作时间超过了垂直同步信号到来的时间,就不能正常显示这一帧的图像了。那么垂直同步信号多久来一次呢?按照60FPS的刷新频率,每隔16ms就会有一个垂直同步信号过来,也就是说每一帧图像的计算和绘制要小于等于16ms,这样才不会卡;
卡顿问题如何解决
OK,既然我们知道了卡顿的原因,那么我们如何避免卡顿是不是就有方向了呢?
很显然我们要从CPU和GPU这两个方向来处理,前面已经分别讲过了二者的工作内容,那么也就是想办法降低CPU的计算时间和GPU的绘制时间。下面分别就二者的特点来总结:
CPU
尽量要用轻量级对象,比如用不到事件处理的地方,可以考虑用CALayer来代替UIView
尽量不要频繁的调用UIView的相关属性,比如frame、transform、bouds等属性,尽量减少不必要的修改,降低CPU对View大小重新计算的频率;
尽量提前计算好布局,在有需要的时一次性调整对应的属性,不要多次修改属性
autolayout会比直接设置frame消耗更多的CPU资源,能用frame就不用autolayout
图片的size最好和UIImageView的size保持一致,减少CPU的计算
控制线程的最大并发数量
尽量把耗时的操作放在子线程处理:文本处理(尺寸的计算以及绘制)、图片处理(编码和绘制)
GPU
尽量避免短时间内大量图片显示,尽可能的讲多张图片合并成一张来显示
GPU能处理的最大纹理尺寸是4096 * 4096,一旦超过这个尺寸就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
尽量减少视图的数量和层级
减少透明的视图(alpha < 1),不透明的就设置opaque为YES
尽量避免离屏渲染
离屏渲染
在OpenGL中GPU有2种渲染方式
On-Screen Rendering : 当前屏幕渲染,在当前用于显示屏幕缓冲区进行渲染操作
Off-Screen Rendering : 离屏渲染,在当前屏幕缓冲区以为新开辟一个缓冲区进行渲染操作
离屏渲染消耗性能的原因
- 需要开辟新的缓冲区
- 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕
哪些操作会触发离屏渲染?
- 光栅化,layer.shouldRasterize = YES
- 遮罩,layer.mask
- 圆角,同时设置layer.maskToBounds = YES、layer.cornerRadius大于0;可以考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片
- 阴影,layer.shadowXXX;如果设置了layer.shaowPath就不会产生离屏渲染
卡顿检测
- 平时所说的“卡顿”主要是因为在主线程执行了比较耗时的操作
- 可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的
耗电优化
耗电的主要来源
- CPU处理,Processing
- 网络,Networking
- 定位,Location
- 图像,Graphics
如何降低设备耗电
- 尽可能降低CPU、GPU的功耗
- 少用定时器
- 优化I/O操作:
- 尽量不要频繁写入小数据,最好批量一次性写入
- 读写大量数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问。
- 数据量比较大的,建议使用数据库(SQLite、CoreData)
- 网络优化
- 减少、压缩网络数据
- 如果多次请求的结果是相同的,尽量使用缓存
- 使用断点续传,否则网络不稳定时可能多次传输相同的内容
- 网络不可用时,不要尝试网络请求
- 让用户可以取消长时间运行或者速度很慢的网络操作,设置合理的超时时间
- 批量传输,比如,下载视频时,不要传输很小的数据包,直接下载整个文件或者一大块一大块的下载。如果下载广告一次性多下载些,然后再慢慢展示;比如下载电子邮件一次性下载多封,不要一封一封的下载;
- 定位优化
- 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电
- 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
- 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
- 需要后台定位时,尽量设置pauseLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新
- 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
- 硬件检测优化
- 用户移动、摇晃、倾斜设备时,会产生动作事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件。
启动优化
App 的启动可以分为两种
- 冷启动(Cold Launch) :从零开始启动App
- 热启动(Warm Launch) :App 已经在内存中,在后台存活着,再次点击图标启动App
App启动时间的优化,主要是针对冷启动来进行优化
通过添加环境变量可以打印出App的启动时间分析(Edit scheme-> Run -> Arguments)
- DYLY_PRINT_STATISTICS设置为1
- 如果需要更详细的信息,可以将DYLD_PRINT_STATISTICS_DETAILS设置为1
App的冷启动可以概括为3大阶段
- dyld
- runtime
- main
dyld(dynamic link editor), Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)
启动App时,dyld所做的事情:
- 装载App的可执行文件,同时会递归加载所有依赖的动态库
- 当dyld把可执行文件、动态库都装载完毕后,会通知runtime进行下一步的处理
启动App时,runtime所做的事情:
- 调用map_images进行可执行文内容的解析和处理
- 在load_images中调用call_load_methods,调用所有Class和Category的+load方法
- 进行各种objc结构的初始化(注册Objc类、初始化类对象等等)
- 调用C++ 静态初始化器和attribute((constructor))修饰的函数
到此为止,可执行文件和动态库中所有的符号(Class, Protocol, Selector,IMP,…)都已经按格式成功加载到内存中,被runtime所管理。
总结一把
- App启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库
- 并由runtime负责加载成objc定义的结构
- 所有初始化工作结束后,dyld就会调用main函数
- 然后是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法
App的启动优化
dyld
- 减少动态库、合并一些动态库(定期清理不必要的动态库)
- 减少Objc类、分类的数量、减少Selector的数量(定期清理不必要的类、分类)
- 减少C++虚函数数量
- Swift尽量使用struct
runtime
- 用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、ObjC的+load
main
- 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
- 按需加载
安装包瘦身
安装包(IPA)主要由可执行文件、资源文件构成
资源(图片、音频、视频等)
- 采取无损压缩
- 去除没有用的资源:https://github.com/tinymind/LSUnusedResources
可执行文件瘦身
- 编译器优化:
Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES
去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other C Flags添加-fno-exceptions - 利用AppCode ( https://www.jetbrains.com/objc/ ) 检测未使用的代码:菜单栏->Code->Inspect Code
- 编写LLVM插件检测出重复代码、未被调用的代码