网站首页 > 技术文章 正文
前情提要
我们在开发中经常碰到这样的场景,查出两个 list 集合数据,需要根据他们相同的某个属性为连接点,进行聚合。但是平时我们使用的时候关注过性能吗?下面让我们一起来看看它的表现如何。
来个例子
我们现在有两个 List集合,需要根据他们相同的 personId 进行聚合处理,我们很容易想到的写法是这样的:
private static void test1(List<Person> list1, List<Person> list2) {
for (Person before:list1){
for (Person after:list2){
if(before.getPersonId().equals(after.getPersonId())){
//TODO 业务逻辑
break;
}
}
}
}
这样的代码是我们开发中最常用的一种方式,数据少的话没问题。如果数据量大的会很慢,接下来我做一个实验。看看在 1w 和 10w 的数据量下他的性能如何?
测试代码如下:
public static void main(String[] args) {
List<Person> list1= new ArrayList<>();
List<Person> list2= new ArrayList<>();
for (int i = 0; i < 10_0000; i++) {
list1.add(Person.builder().personId(Long.valueOf(i+"")).build());
list2.add(Person.builder().personId(Long.valueOf(i+"")).build());
}
long start = System.currentTimeMillis();
test1(list1, list2);
System.out.println("for循环耗时:"+(System.currentTimeMillis()-start));
1w 耗时:343
10w 耗时:64285
仅仅 10w 的数据竟然达到了 64 秒多,可以看出它的性能是多么差了吧。
那怎么优化呢?我们可以把第二个 list 转为 map 的方式来做,示例如下:
代码如下:
private static void test2(List<Person> list1, List<Person> list2) {
Map<Long, Person> baseMap =
list2.stream().collect(Collectors.toMap(Person::getPersonId, Function.identity()));
for (Person before:list1){
Person after = baseMap.get(before.getPersonId());
}
}
接下来我们再进行下性能测试。
1w 耗时:88
10w 耗时:95
可以看出速度快了上百倍不止,如果还有小伙伴用第一种方式的话就赶紧优化了吧。
思考
我们想想第一种为什么会慢呢?
在第二个循环里他需要从 0 开始遍历所有的元素来进行比对,数据量越大,它需要遍历的数就越多,所以很慢。
所以如果我们业务上两个集合的大小和顺序一致(即能知道应该第二个循环能匹配上的元素在第几个),那么就能避免掉大量的循环。
示例如下:
我们直接在第二层循环的时候,将下标先指定为和第一层循环的一致,如果他们俩属性相同,立马跳出;进行第二次循环。
private static void test3(List<Person> list1, List<Person> list2) {
for (int i=0;i<list1.size();i++){
int jj = 0;
for (int j = i; j < list2.size(); j++) {
if (jj == list2.size()) {
break;
}
if(list1.get(i).getPersonId().equals(list2.get(j).getPersonId())){
// 编写具体的逻辑
break;
}
if (j == list2.size() - 1) j = -1;
jj += 1;
}
}
}
性能测试如下:
1w 耗时:2
10w 耗时:13
我们发现又更加快了。
下面是总体的测试数据:
数据量 | 双层 for 循环 | 循环+map | 改良版 for 循环 |
100 条数据 | 1 毫秒 | 70 毫秒 | <1 毫秒 |
1000 条数据 | 16 毫秒 | 91 毫秒 | 1 毫秒 |
5000 条数据 | 66 毫秒 | 66 毫秒 | 3 毫秒 |
1w 条数据 | 208 毫秒 | 64 毫秒 | 4 毫秒 |
10w 条数据 | 62887 毫秒 | 84 毫秒 | 17 毫秒 |
100w 条数据 | 很久 | 155 毫秒 | 24毫秒 |
总结:如果数据量小于 5000,推荐就用双层 for 循环,如果大于 5000,则使用循环+map 的方式。
如果两个集合顺序一致,则可以用改良版的 for 循环
- 上一篇: for循环一个不够?那就再来一个
- 下一篇: JavaScript For 循环
猜你喜欢
- 2024-11-27 用for循环写一个九九乘法表
- 2024-11-27 三菱plc编程,FOR循环指令详解
- 2024-11-27 通过几个事例,就可以说明 for...of 循环在 JS 是不可或缺
- 2024-11-27 年近半百自学Python之流程控制break和continue
- 2024-11-27 C语言程序设计(谭浩强第五版) 第5章 循环结构程序设计 习题解析答案
- 2024-11-27 C语言for循环语句使用形式总结
- 2024-11-27 C# break和continue区别
- 2024-11-27 VBA基本语法之For循环结构,都有什么含义,具体该怎么使用?
- 2024-11-27 C语言(五):for,break,continue
- 2024-11-27 C语言for循环小例子
- 标签列表
-
- content-disposition (47)
- nth-child (56)
- math.pow (44)
- 原型和原型链 (63)
- canvas mdn (36)
- css @media (49)
- promise mdn (39)
- readasdataurl (52)
- if-modified-since (49)
- css ::after (50)
- border-image-slice (40)
- flex mdn (37)
- .join (41)
- function.apply (60)
- input type number (64)
- weakmap (62)
- js arguments (45)
- js delete方法 (61)
- blob type (44)
- math.max.apply (51)
- js (44)
- firefox 3 (47)
- cssbox-sizing (52)
- js删除 (49)
- js for continue (56)
- 最新留言
-