簡介
ArrayList是我們開發中非常常用的數據存儲容器之一,其底層是數組實現的,我們可以在集合中存儲任意類型的數據,ArrayList是線程不安全的,非常適合用于對元素進行查找,效率非常高。
線程安全性
對ArrayList的操作一般分為兩個步驟,改變位置(size)和操作元素(e)。所以這個過程在多線程的環境下是不能保證具有原子性的,因此ArrayList在多線程的環境下是線程不安全的。
源碼分析
1. 屬性分析
/**
* 默認初始化容量
*/
private static final int DEFAULT_CAPACITY = 10;
/**
* 如果自定義容量為0,則會默認用它來初始化ArrayList。或者用于空數組替換。
*/
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
* 如果沒有自定義容量,則會使用它來初始化ArrayList。或者用于空數組比對。
*/
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
* 這就是ArrayList底層用到的數組
* 非私有,以簡化嵌套類訪問
* transient 在已經實現序列化的類中,不允許某變量序列化
*/
transient Object[] elementData;
/**
* 實際ArrayList集合大小
*/
private int size;
/**
* 可分配的最大容量
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
擴展:什么是序列化
序列化是指:將對象轉換成以字節序列的形式來表示,以便用于持久化和傳輸。
實現方法:實現Serializable接口。
然后用的時候拿出來進行反序列化即可又變成JAVA對象。
transient關鍵字解析
Java中transient關鍵字的作用,簡單地說,就是讓某些被修飾的成員屬性變量不被序列化。
有了transient關鍵字聲明,則這個變量不會參與序列化操作,即使所在類實現了Serializable接口,反序列化后該變量為空值。
那么問題來了:ArrayList中數組聲明:transient Object[] elementData;,事實上我們使用ArrayList在網絡傳輸用的很正常,并沒有出現空值。
原來:ArrayList在序列化的時候會調用writeObject()方法,將size和element寫入ObjectOutputStream;反序列化時調用readObject(),從ObjectInputStream獲取size和element,再恢復到elementData。
那為什么不直接用elementData來序列化,而采用上訴的方式來實現序列化呢?
原因在于elementData是一個緩存數組,它通常會預留一些容量,等容量不足時再擴充容量,那么有些空間可能就沒有實際存儲元素,采用上訴的方式來實現序列化時,就可以保證只序列化實際存儲的那些元素,而不是整個數組,從而節省空間和時間。
2. 構造方法分析
根據initialCapacity 初始化一個空數組,如果值為0,則初始化一個空數組:
/**
* 根據initialCapacity 初始化一個空數組
*/
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
不帶參數初始化,默認容量為10:
/**
* 不帶參數初始化,默認容量為10
*/
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
通過集合做參數的形式初始化:如果集合為空,則初始化為空數組:
/**
* 通過集合做參數的形式初始化
*/
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
3. 主干方法
trimToSize()方法:
用來最小化實例存儲,將容器大小調整為當前元素所占用的容量大小。
/**
* 這個方法用來最小化實例存儲。
*/
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
clone()方法
用來克隆出一個新數組。
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
// this shouldn't hAppen, since we are Cloneable
throw new InternalError(e);
}
}
通過調用Object的clone()方法來得到一個新的ArrayList對象,然后將elementData復制給該對象并返回。
add(E e)方法
在數組末尾添加元素
/**
* 在數組末尾添加元素
*/
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
看到它首先調用了ensureCapacityInternal()方法.注意參數是size+1,這是個面試考點。
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
這個方法里又嵌套調用了兩個方法:計算容量+確保容量
計算容量:如果elementData是空,則返回默認容量10和size+1的最大值,否則返回size+1
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
計算完容量后,進行確保容量可用:(modCount不用理它,它用來計算修改次數)
如果size+1 > elementData.length證明數組已經放滿,則增加容量,調用grow()。
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
增加容量:默認1.5倍擴容。
- 獲取當前數組長度=>oldCapacity
- oldCapacity>>1 表示將oldCapacity右移一位(位運算),相當于除2。再加上1,相當于新容量擴容1.5倍。
- 如果newCapacity<minCapacity,則newCapacity = minCapacity。看例子更明白一點:假設size為1,則minCapacity=size+1=2,而elementData.length=1,newCapacity=1+1>>1=1,1<2所以如果不處理該情況,擴容將不能正確完成。
- 如果新容量比最大值還要大,則將新容量賦值為VM要求最大值。
- 將elementData拷貝到一個新的容量中。
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
size+1的問題
好了,那到這里可以說一下為什么要size+1。
size+1代表的含義是:
- 如果集合添加元素成功后,集合中的實際元素個數。
- 為了確保擴容不會出現錯誤。
假如不加一處理,如果默認size是0,則0+0>>1還是0。
如果size是1,則1+1>>1還是1。有人問:不是默認容量大小是10嗎?事實上,jdk1.8版本以后,ArrayList的擴容放在add()方法中。之前放在構造方法中。我用的是1.8版本,所以默認 ArrayList arrayList = new ArrayList();后,size應該是0.所以,size+1對擴容來講很必要.
public static void mAIn(String[] args) {
ArrayList arrayList = new ArrayList();
System.out.println(arrayList.size());
}
輸出:0
事實上上面的代碼是證明不了容量大小的,因為size只會在調用add()方法時才會自增。有辦法的小伙伴可以在評論區大顯神通。
add(int index, E element)方法
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
rangeCheckForAdd()是越界異常檢測方法。ensureCapacityInternal()之前有講,著重說一下System.arrayCopy方法:
public static void arraycopy(Object src, int srcPos, Object dest, int destPos, int length)
代碼解釋:
Object src : 原數組
int srcPos : 從元數據的起始位置開始
Object dest : 目標數組
int destPos : 目標數組的開始起始位置
int length : 要copy的數組的長度
示例:size為6,我們調用add(2,element)方法,則會從index=2+1=3的位置開始,將數組元素替換為從index起始位置為index=2,長度為6-2=4的數據。
異常處理:
private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
set(int index,E element)方法
public E set(int index, E element) {
rangeCheck(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
E elementData(int index) {
return (E) elementData[index];
}
邏輯很簡單,覆蓋舊值并返回。
indexOf(Object o)方法
根據Object對象獲取數組中的索引值。
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
如果o為空,則返回數組中第一個為空的索引;不為空也類似。
注意:通過源碼可以看到,該方法是允許傳空值進來的。
get(int index)方法
返回指定下標處的元素的值。
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
rangeCheck(index)會檢測index值是否合法,如果合法則返回索引對應的值。
remove(int index)方法
刪除指定下標的元素。
public E remove(int index) {
// 檢測index是否合法
rangeCheck(index);
// 數據結構修改次數
modCount++;
E oldValue = elementData(index);
// 記住這個算法
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
這里又碰到了System.arraycopy()方法,詳情請查閱上文。
大概思路:將該元素后面的元素前移,最后一個元素置空。
ArrayList優缺點
優點:
- 因為其底層是數組,所以修改和查詢效率高。
- 可自動擴容(1.5倍)。
缺點:
- 插入和刪除效率不高。
- 線程不安全。
那面試手寫ArrayList應該就不是問題了。