ReactNative(下文简称RN)开源已经一年多时间,国内各大互联网公司都在使用,携程也在今年5月份投入资源开始引入,并推广给多个业务团队使用,本文将会分享我们遇到的一些问题以及我们的优化方案。
一、背景和使用情况介绍
为什么会引入ReactNative?
1. AppSize占用
携程旅行App从11年开始开发,至今已有5年多时间,随着各项业务功能的全面移动化,以及公司mobile first策略的指引下,App功能越来越多,越来越臃肿,Size达到将近100MB,而同样功能,使用RN开发,Size远远小于Native开发,RN的引入,可以支持我们App的可持续健康的发展。
2. 用户体验佳
RN通过JavascriptCore解析Javascript模块,转换成原生native组件渲染,相比H5页面不再局限于WebView、渲染性能长足提升,运行用户体验可以媲美native。
3. 相对成熟
Android和iOS的RN都已经开源,原生提供的组件和API相对丰富,且跨平台基本一致,对外接口也趋于稳定,适合业务开发。
4. 支持动态更新
纯原生的开发,android上通过插件化框架,可以实现动态加载远端代码。但是在iOS上,因为系统限制,不能动态执行远端下载的Native代码,而RN完全满足该需求。
5. 跨平台
RN提供的API和组件,大多能跨平台使用,对少数不支持的组件,我们再做二次封装抹平,可以让业务开发人员开发一份代码,运行在iOS&Android 两个平台上。这样能够大大提供开发效率,降低开发维护成本。
如何引入?
基于RN 0.30版本,开发了支持携程业务团队快速便捷开发的CRN框架,框架主要从以下几个方面着手。
1. 工具
- cli工具,负责CRN工程创建,运行;
- pack工具,负责打包;
2. 控件
- 对RN官方提供的API和组件,实现跨平台支持;
- 新增携程业务相关的API和组件,方便业务接入;
4. 稳定性、性能优化
- RN页面加载提速,实现秒开;
- 稳定性提升,消除RN导致的crash;
3. 发布
除此之外,我们还从文档以及技术支持等方面,支撑其作为一个完整的产品开发框架。
业务的使用
下面一幅图说明了RN在携程业务中的使用情况,总共4个版本的开发时间,每个版本大约1个月时间。
前面2个版本主要是CRN基础功能完成和线上验证,后面2个版本稳定性优化和API跨平台抹平基本完成,业务数和页面数量猛增。
二、遇到的问题和优化
RN常见问题介绍
所有做ReactNative开发的团队,或多或少都面临着以下4个问题需要解决。
1. 打包出来的JSBundle过大;
2. 首次进入RN页面加载缓慢;
3. 稳定性不够,有大量因为RN导致的crash;
4. 大数据量时候listview加载卡顿;
接下来,我们就这四个问题来一一探讨。
从这张图中可以看出,最大的瓶颈在JS init+Require,这块时间就是JSBundle的执行时间,为了提升页面加载速度,这块时间我们需要想办法优化。
JSBundle文件过大&页面加载慢
先来说一组数据,一个Helloorld的App,如果使用0.30 RN 官方命令react-native bundle打包出来的JSBundle文件大小大约为531KB,RN框架JavaScript本身占了530KB, zip压缩之后也有148KB。
如果只有一两个业务使用,这点大小算不了什么,但是对于我们这种动辄几十个业务的场景,如果每个业务的JSBundle都需要这么大的一个RN框架本身,那将是不可接受的。
因此,我们需要对RN官方的打包脚本做改造,将框架代码拆分出来,让所有业务使用一份框架代码。
开始拆分之前,我们先以HelloWorld的RNApp为基础介绍几个背景知识。
上述是一个HelloWorld RNApp代码的结构,基本分为3部分
头部:各依赖模块引用部分;
中间:入口模块和各业务模块定义部分;
尾部:入口模块注册部分;
__d是RN自定义的define,符合CommonJS规范,__d后面的数字是模块的id,是在RN打包过程中,解析依赖关系,自增长生成的。
如果所有业务代码,都遵照一个规则:入口JS文件首先require的都是react/react-native,则打包生成的JSBundle里面react/react-native相关的模块id都是固定的。
拆分方案一
基于上面2点背景知识介绍,我们很容易发现,如果将打包之后的JSBundle文件,拆分成2部分(框架部分+业务模块部分),使用的时候合并起来,然后去加载,即可实现拆分功能。
具体实现步骤:
- 创建一个空工程,入口文件只需要2行代码,require react/react-native即可;
- 使用react-native bundle命令,打包该入口文件,生成common.js;
- 使用react-native bundle打包业务工程(有一点要保证,业务工程入口文件前面2行代码也是require react/react-native),生成business_all.js;
- 开发工具,从business_all.js里面删除common.js的内容,剩下的就是business.js;
- App加载的时候将common.js和business.js合并在一起,然后加载;
貌似功能完成,可是回到Dive into React Native performance, 这么做还是优化不了JSBundle的执行时间,因为我们不能把拆分开的2个文件分别执行,因为加载common.js会提示找不到RNApp的入口,先执行business.js,会提示一堆依赖的RN模块找不到。
显然,这种拆分方式不能满足我们这种需要。
那这个方案就完全没有价值吗?不是的,如果你做的是一个纯RNApp,native只是一个壳,里面业务全是RN开发的,完全可以使用这种方式做拆分,这种方案简单,无侵入,实现成本低,不需要修改任何RN打包代码和RN Runtime代码。
拆分方案二
RN框架部分文件(common.js)大小530KB,如此大的js文件,占用了绝大部分的JS执行时间,这块时间如果能放到后台预先做完,进入业务也只需执行业务页面的几个JS文件,将可以大大提升页面加载速度,参考上面的RN性能瓶颈图,预估可以提升100%。
按照这个思路,能后台加载的JS文件,实际上是就是一个RNApp,因此 我们设计了一个空白页面的FakeApp,这个FakeApp做一件事情,就是监听要显示的真实的业务JS模块,收到监听之后,渲染业务模块,显示页面。
FakeApp设计如下:
为了实现该拆包方案,需要改造react-native的打包命令;
- 基于FakeApp打common.js包的时候, 需要记录RN各个模块名和模块id之间的mapping关系;
- 打业务模块包的时候,判断,如果已经在mapping文件里面的模块,不要打包到业务包中
改造页面加载流程:
- 因为要能够后台加载,所以需分离UI和JS加载引擎<iOS-RCTBridge,Android-ReactInstanceManager>;
- 进入业务RN页面时候,获取预加载好的JS引擎,然后发送消息给FakeApp,告知该渲染的业务JS模块;
通过后台预加载,省去了绝大部分的JS加载时间,似乎问题已经完美解决。
但是,如果随着业务不断膨胀,一个RN业务JS代码也达到500KB,进入这个业务页面,500多KB JS文件读取出来,执行,整个JS执行的时间瓶颈会再次出现。
拆分方案三
正在此时,我们研究RN在Facebook App里面的使用情况,发现了Unbundle,简单点说,就是将所有的JS模块都拆分成独立的文件。
下面截图就是unbundle打包的文件格式:
- entry.js就是global部分定义+RNApp入口;
- UNBUNDLE文件是用于标识这是一个unbundle包的flag;
- 12.js,13.js就是各个模块,文件名就是模块id;
- 在业务执行,需要加载模块(require)的时候,就去磁盘查找该文件,读取、执行。
RN里面加载模块流程说明,以require(66666)模块为例:
- 首先从__d<就是前文提到的define>的缓存列表里面查找是否有定义过模块66666,如果有,直接返回,如果没有走到下面第二步的nativeRequire;
- nativeRequire根据模块id,查找文件所在路径,读取文件内容;
- 定义模块,_d(66666)=eval(JS文件内容),会将这个模块ID和JS代码执行结果记录在define的缓存列表里面;
打包通过react-native unbundle 命令,可以给android平台打出这样的unbundle包。
顺便提一下,这个unbundle方案,只在android上有效,打ios平台的unbundle包,是打不出来的,在RN的打包脚本上有一行注释,大致意思是在iOS上众多小文件读取,文件IO效率不够高,android上没这样的问题,然后判断如果是打iOS的unbundle包的时候,直接return了。
相对应的,iOS开发了一个prepack的打包模式,简单点说,就是把所有的JS模块打包到一个文件里面,打包成一个二进制文件,并固定0xFB0BD1E5为文件开始,这个二进制文件里面有个Meta-table,记录各个模块在文件中的相对位置,在加载模块(require)的时候,通过fseek,找到相应的文件开始,读取,执行。
在Unbundle的启发下,我们修改打包工具,开发了CRNUnbunle,做了简单的优化,把众多零散的JS文件做了简单的合并。
将common部分的JS文件,合并成一个common_ios(android).js.
_crn_config记录了这个RNApp的入口模块ID以及其他配置信息,详见下图:
- main_module为当前业务模块入口模块ID;
- module_path为业务模块JS文件所在当前包的相对路径;
- 666666=0.js,说明666666这个模块在0.js文件里面;
做完这个拆包和加载优化之后,我们用自己的几个业务做了下测试,下图是当时的测试验证数据。
可以看出,iOS和android基本都比官方打包方式的加载时间,减少了50%。
这是自己单机测试的数据,那上线之后,数据如何呢?
下图,是我们分析一天的数据,得出的平均值<排除掉了5s以上的异常数据,后面实测下来5s以上数据极少>;
看到这个数据,发现和我们自己测试的基本一致,但是还有一个疑问,加载的时间分布,是否服从正态分布,会不会很离散,快的设备很快,慢的设备很慢呢?
然后我又进一步分析这一天的数据,按照页面加载时间区间分布统计。
看图上数据,很明显,iOS&Android基本一致,将近98%的用户都能在1s内加载完成页面,符合我们期望的正态分布,所以bundle拆分到此基本完成。
关于这个数据,补充一下,先前看业到一篇58同城同学分享的RN实践的文章,里面也曾提到他们业务页面加载时间的数据,有兴趣的同学可以去比较下。
页面加载优化
按照上述的拆包方案实现后,我们的RN页面加载流程大致是这样的。
缓存,还是缓存,不要立即释放,等符合一定条件之后,再释放。
对JS执行引擎,我们定义了以下的一些生命周期状态。
错误处理 RN刚上线的前2个版本,我们发现有大量因为RN导致的crash,常见的错误有以下几种。 iOS的crash问题处理 iOS的crash,基本都来自RCTFatalException,都是RCTFatal抛出错误信息所知, 处理也相对简单,设置自己的Error Handler即可。 void RCTSetFatalHandler(RCTFatalHandler fatalHandler); 一般初次开发RN应用的开发人员,都没有留意这一点,其实查阅下RN的源代码,RCTFatal的注释写的还比较清楚,分析源码也可以发现在生产环境的时候,RCTFatal会直接Raise Exception,然后crash。 Android的crash点相对较多,大致会出现在以下几个场景。 对于第一点提到的RuntimeException,我们收集到的日志如下: 不能连接到dev server,看到之后很不明白,明明是生产环境,怎么会报这样的错误呢? 偶现的Javascript执行出错,怎么会走到RuntimeException呢? 问题的解决很简单,这些RuntimeException,都是从ReactInstanceManagerImp.java的createReactContext抛出来的,处理掉就可以了。 再补充一点,这些错误处理之后,都需要一层一层的传递到最上层的UI界面,这样才能友好的给用户提示。 ListView性能问题 先来看一张截图,是从RN提供的UIExplore demo跑出来的。 可以清楚的看到,超出屏幕的条目,依然被渲染了。没有实现cell重用,导致数据量大时候,卡顿。 为适应大数据量listview的场景,我们专门安排资源,开发了可重用cell的CRNListView,iOS借鉴了第三方的ReactNativeTableView的实现,开发了可重用cell的listview,接口和官方原生的基本一致,Android借鉴iOS的方案,采用RecyclerView实现了类似的可重用cell的listview,同时我们还做了一些扩展,把常用的下拉刷新,载入更多,右侧字母索引栏等功能,都增加了进去。 实际测试下来,数据量少时候,和RN提供的listview,性能基本一致,但当数据量大时候,CRNListView优势明显,下面这张图,是我们在android上的测试数据。 1. CRN-Web的开发 同样的功能,CRN一套代码可以在iOS和android 2个平台运行。但对于业务开发团队,他们还需要维护H5平台同样的功能,如果我们能够将CRN代码,通过类似webpack这样的工具,直接转换过去就能在H5平台上运行起来,就可以做到一套代码,三端运行,可以大大降低业务团队的开发维护成本。 目前,我们已经再拿一些业务的CRN代码做转换验证,初步验证可行,还在持续优化完善中。 2. 单JS执行引擎的实现 RN还有一个比较大的性能瓶颈在于内存耗用大.做过这样的测试,在一个HelloWorld的RN工程里面,打开一个Native/RN/H5 Hybrid的HelloWorld页面,native显示页面内存占用0.2MB,RN占用10MB,H5 Hybrid占用20MB。如果大量业务都使用RN开发,JS执行引擎大量创建,会耗费大量内存,但是从JS执行引擎的执行过程,运行逻辑来说,只要做好业务隔离,完全是可以在一个执行引擎里面运行多个业务功能的JS代码的。我们正在做相关尝试,相信在未来1-2个版本时间,可以完成线上验证。 3. AMD模式的加载尝试 RN打包默认是CommonJS规范,整个JSBundle一次读入内存,一次全部执行完成,所以耗费大量时间。如果能够用AMD模式改造,JSBundle读取到内存,但是只执行用到的模块,真正做到按需加载,相信对页面加载效率,会有更近一步的提升。
三、下一阶段的规划