Android内存优化(使用SparseArray和ArrayMap取代HashMap)

 

在Android开发时,我们使用的大部分都是Java的api,比方HashMap这个api,使用率非常高,可是对于Android这样的对内存非常敏感的移动平台,非常多时候使用一些java的api并不能达到更好的性能,相反反而更消耗内存,所以针对Android这样的移动平台,也推出了更符合自己的api,比方SparseArray、ArrayMap用来取代HashMap在有些情况下能带来更好的性能提升。

 

介绍它们之前先来介绍一下HashMap的内部存储结构。就明确为什么推荐使用SparseArray和ArrayMap

HashMap

HashMap内部是使用一个默认容量为16的数组来存储数据的,而数组中每个元素却又是一个链表的头结点。所以,更准确的来说,HashMap内部存储结构是使用哈希表的拉链结构(数组+链表),如图: 
这样的存储数据的方法叫做拉链法 
Android内存优化(使用SparseArray和ArrayMap取代HashMap) 
且每个结点都是Entry类型,那么Entry是什么呢?我们来看看HashMap中Entry的属性:

final K key;
V value;
final int hash;
HashMapEntry<K, V> next;

从中我们得知Entry存储的内容有key、value、hash值、和next下一个Entry。那么。这些Entry数据是按什么规则进行存储的呢?就是通过计算元素key的hash值,然后对HashMap中数组长度取余得到该元素存储的位置。计算公式为hash(key)%len,比方:假设hash(14)=14,hash(30)=30,hash(46)=46,我们分别对len取余,得到 
hash(14)%16=14,hash(30)%16=14,hash(46)%16=14,所以key为14、30、46的这三个元素存储在数组下标为14的位置,如: 
Android内存优化(使用SparseArray和ArrayMap取代HashMap) 
从中能够看出。假设有多个元素key的hash值相同的话。后一个元素并不会覆盖上一个元素。而是採取链表的方式,把之后加进来的元素加入链表末尾。从而攻克了hash冲突的问题。由此我们知道HashMap中处理hash冲突的方法是链地址法,在此补充一个知识点,处理hash冲突的方法有下面几种:

  1. 开放地址法
  2. 再哈希法
  3. 链地址法
  4. 建立公共溢出区

说到这里,重点来了,我们知道HashMap中默认的存储大小就是一个容量为16的数组,所以当我们创建出一个HashMap对象时,即使里面没有不论什么元素。也要分别一块内存空间给它,并且,我们再不断的向HashMap里put数据时,当达到一定的容量限制时(这个容量满足这样的一个关系时候将会扩容:HashMap中的数据量>容量*载入因子,而HashMap中默认的载入因子是0.75),HashMap的空间将会扩大,并且扩大后新的空间一定是原来的2倍,我们能够看put()方法中有这样的一行代码:

int newCapacity = oldCapacity * 2;

所以,重点就是这个,仅仅要一满足扩容条件,HashMap的空间将会以2倍的规律进行增大。

假如我们有几十万、几百万条数据,那么HashMap要存储完这些数据将要不断的扩容,并且在此过程中也须要不断的做hash运算,这将对我们的内存空间造成非常大消耗和浪费。并且HashMap获取数据是通过遍历Entry[]数组来得到相应的元素,在数据量非常大时候会比較慢,所以在Android中,HashMap是比較费内存的,我们在一些情况下能够使用SparseArray和ArrayMap来取代HashMap。

 

SparseArray

SparseArray比HashMap更省内存,在某些条件下性能更好,主要是由于它避免了对key的自己主动装箱(int转为Integer类型),它内部则是通过两个数组来进行数据存储的。一个存储key,另外一个存储value,为了优化性能,它内部对数据还採取了压缩的方式来表示稀疏数组的数据,从而节约内存空间。我们从源代码中能够看到key和value各自是用数组表示:

    private int[] mKeys;
    private Object[] mValues;

我们能够看到,SparseArray仅仅能存储key为int类型的数据。同一时候,SparseArray在存储和读取数据时候,使用的是二分查找法,我们能够看看:

 public void put(int key, E value) {
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
        ...
        }
 public E get(int key, E valueIfKeyNotFound) {
        int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
        ...
        }

也就是在put加入数据的时候。会使用二分查找法和之前的key比較当前我们加入的元素的key的大小,然后依照从小到大的顺序排列好,所以,SparseArray存储的元素都是按元素的key值从小到大排列好的。 
而在获取数据的时候,也是使用二分查找法推断元素的位置,所以,在获取数据的时候非常快,比HashMap快的多,由于HashMap获取数据是通过遍历Entry[]数组来得到相应的元素。

 

加入数据

public void put(int key, E value)

删除数据

 public void remove(int key)

or

public void delete(int key)

事实上remove内部还是通过调用delete来删除数据的

获取数据

public E get(int key)

or

public E get(int key, E valueIfKeyNotFound)

该方法可设置假设key不存在的情况下默认返回的value

特有方法

在此之外,SparseArray还提供了两个特有方法。更方便数据的查询: 
获取相应的key:

public int keyAt(int index)

获取相应的value:

public E valueAt(int index)

SparseArray应用场景:

虽说SparseArray性能比較好,可是由于其加入、查找、删除数据都须要先进行一次二分查找。所以在数据量大的情况下性能并不明显,将减少至少50%。

满足下面两个条件我们能够使用SparseArray取代HashMap:

  • 数据量不大,最好在千级以内
  • key必须为int类型,这中情况下的HashMap能够用SparseArray取代:
HashMap<Integer, Object> map = new HashMap<>();
用SparseArray取代:
SparseArray<Object> array = new SparseArray<>();

ArrayMap

这个api的资料在网上能够说差点儿没有,然并卵,仅仅能看文档了 
ArrayMap是一个<key,value>映射的数据结构,它设计上很多其他的是考虑内存的优化,内部是使用两个数组进行数据存储,一个数组记录key的hash值。另外一个数组记录Value值。它和SparseArray一样。也会对key使用二分法进行从小到大排序,在加入、删除、查找数据的时候都是先使用二分查找法得到相应的index,然后通过index来进行加入、查找、删除等操作,所以,应用场景和SparseArray的一样,假设在数据量比較大的情况下,那么它的性能将退化至少50%。

加入数据

public V put(K key, V value)

获取数据

public V get(Object key)

删除数据

public V remove(Object key)

特有方法

它和SparseArray一样相同也有两个更方便的获取数据方法:

public K keyAt(int index)
public V valueAt(int index)

ArrayMap应用场景

  • 数据量不大,最好在千级以内
  • 数据结构类型为Map类型
ArrayMap<Key, Value> arrayMap = new ArrayMap<>();

【注】:假设我们要兼容aip19下面版本号的话,那么导入的包须要为v4包

import android.support.v4.util.ArrayMap;

总结

SparseArray和ArrayMap都差点儿相同,使用哪个呢? 
假设数据量都在千级以内的情况下:

1、假设key的类型已经确定为int类型。那么使用SparseArray,由于它避免了自己主动装箱的过程,假设key为long类型,它还提供了一个LongSparseArray来确保key为long类型时的使用

2、假设key类型为其他的类型,则使用ArrayMap