噢,他明白了,河水既没有牛伯伯说的那么浅,也没有小松鼠说的那么深,只有自己亲自试过才知道。
——寓言故事《小马过河》
数据集处理是每种语言必备的功能,Java更甚之,数据集可以允许重复,也可以不允许重复,可以允许null存在,也可以不允许null存在,可以自动排序,也可以不自动排序,可以是阻塞式的,也可以是非阻塞式的,可以是栈,也可以是队列……
本章将围绕我们使用最多的三个数据集合(数组、ArrayList和HashMap)来阐述在开发过程中要注意的事项,并由此延伸至Set、Queue、Stack等集合。
建议60:性能考虑,数组是首选
数组在实际的系统开发中用得越来越少了,我们通常只有在阅读一些开源项目时才会看到它们的身影,在Java中它确实没有List、Set、Map这些集合类用起来方便,但是在基本类型处理方面,数组还是占优势的,而且集合类的底层也都是通过数组实现的,比如对一个数据集求和这样的计算:
//对数组求和
public static int sum(intdatas){
int sum=0;
for(int i=0;i<datas.length;i++){
sum+=datas[i];
}
return sum;
}
对一个int类型的数组求和,取出所有的数组元素并相加,此算法中如果是基本类型则使用数组效率是最高的,使用集合则效率次之。再看使用List求和:
//对列表求和计算
public static int sum(List<Integer>datas){
int sum=0;
for(int i=0;i<datas.size();i++){
sum+=datas.get(i);
}
return sum;
}
注意看加粗字体,这里其实已经做了一个拆箱动作,Integer对象通过intValue方法自动转换成了一个int基本类型,对于性能濒于临界的系统来说该方案是比较危险的,特别是大数量的时候,首先,在初始化List数组时要进行装箱动作,把一个int类型包装成一个Integer对象,虽然有整型池在,但不在整型池范围内的都会产生一个新的Integer对象,而且众所周知,基本类型是在栈内存中操作的,而对象则是在堆内存中操作的,栈内存的特点是速度快,容量小,堆内存的特点是速度慢,容量大(从性能上来讲,基本类型的处理占优势)。其次,在进行求和计算(或者其他遍历计算)时要做拆箱动作,因此无谓的性能消耗也就产生了。
在实际测试中发现:对基本类型进行求和计算时,数组的效率是集合的10倍。
注意 性能要求较高的场景中使用数组替代集合。