ArrayList源码解析
ArrayList的常见问题
ArrayList是什么,可以用来干嘛?
ArrayList就是数组列表,主要用来装载数据,当我们装载的是基本类型的数据int,long,boolean,short,byte…的时候我们只能存储他们对应的包装类,它的主要底层实现是数组Object[] elementData
。
与它类似的是LinkedList,和LinkedList相比,它的查找和访问元素的速度较快,但新增,删除的速度较慢。
小结:ArrayList底层是用数组实现的存储。
特点:查询效率高,增删效率低,线程不安全。使用频率很高。
为啥线程 不安全还使用它呢?
因为我们正常使用的场景中,都是用来查询,不会涉及太频繁的增删,如果涉及频繁的增删,可以使用LinkedList,如果你需要线程安全就使用Vector,这就是三者的区别了,实际开发过程中还是ArrayList使用最多的。
不存在一个集合工具是查询效率又高,增删效率也高的,还线程安全的,至于为啥大家看代码就知道了,因为数据结构的特性就是优劣共存的,想找个平衡点很难,牺牲了性能,那就安全,牺牲了安全那就快速。
⚠️:这里还是强调下大家不要为了用而用,我记得我以前最开始工作就有这个毛病。就是不管三七二十一,就是为了用而用,别人用我也用,也不管他的性能啊,是否线程安全啥的,所幸最开始公司接触的,都是线下的系统,而且没啥并发。
您说它的底层实现是数组,但是数组的大小是定长的,如果我们不断的往里面添加数据的话,不会有问题吗?
ArrayList可以通过构造方法在初始化的时候指定底层数组的大小。
通过无参构造方法的方式ArrayList()
初始化,则赋值底层数Object[] elementData
为一个默认空数组
Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}
所以数组容量为0,只有真正对数据进行添加add
时,才分配默认DEFAULT_CAPACITY = 10
的初始容量。
大家可以分别看下他的无参构造器和有参构造器,无参就是默认大小,有参会判断参数。
数组的长度是有限制的,而ArrayList是可以存放任意数量对象,长度不受限制,那么他是怎么实现的呢?
其实实现方式比较简单,他就是通过数组扩容的方式去实现的。
就比如我们现在有一个长度为10的数组,现在我们要新增一个元素,发现已经满了,那ArrayList会怎么做呢?
第一步他会重新定义一个长度为10+10/2的数组也就是新增一个长度为15的数组。
然后把原数组的数据,原封不动的复制到新数组中,这个时候再把指向原数组的地址换到新数组,ArrayList就这样完成了一次改头换面。
⚠️:因为我们在使用ArrayList的时候一般不会设置初始值的大小,ArrayList默认的大小就刚好是10。
然后你们也可以看到,他的构造方法,如果你传入了初始值大小,那就使用你传入的参数,如果没,那就使用默认的,一切都是有迹可循的。
ArrayList的默认数组大小为什么是10?
据说是因为sun的程序员对一系列广泛使用的程序代码进行了调研,结果就是10这个长度的数组是最常用的最有效率的。也有说就是随便起的一个数字,8个12个都没什么区别,只是因为10这个数组比较的圆满而已。
我记得你说到了,他增删很慢,你能说一下ArrayList在增删的时候是怎么做的么?主要说一下他为啥慢。
他有指定index新增,也有直接新增的,在这之前他会有一步校验长度的判断ensureCapacityInternal,就是说如果长度不够,是需要扩容的。
在扩容的时候,老版本的jdk和8以后的版本是有区别的,8之后的效率更高了,采用了位运算,右移一位,其实就是除以2这个操作。
指定位置新增的时候,在校验之后的操作很简单,就是数组的copy,大家可以看下代码:
不知道大家看懂arraycopy的代码没有,我画个图解释下,你可能就明白一点:
比如有下面这样一个数组我需要在index 5的位置去新增一个元素A
那从代码里面我们可以看到,他复制了一个数组,是从index 5的位置开始的,然后把它放在了index 5+1的位置
给我们要新增的元素腾出了位置,然后在index的位置放入元素A就完成了新增的操作了
至于为啥说他效率低,我想我不说你也应该知道了,我这只是在一个这么小的List里面操作,要是我去一个几百几千几万大小的List新增一个元素,那就需要后面所有的元素都复制,然后如果再涉及到扩容啥的就更慢了不是嘛。
⭐️ 真实的场景题:ArrayList(int initialCapacity) 会不会初始化数组大小?
***不会初始化数组大小!***
而且将构造函数与initialCapacity
结合使用,然后使用set()会抛出异常,尽管该数组已创建,但是大小设置不正确。
使用sureCapacity()
也不起作用,因为它基于elementData
数组而不是大小。
还有其他副作用,这是因为带有sureCapacity()
的静态DEFAULT_CAPACITY
。
进行此工作的唯一方法是在使用构造函数后,根据需要使用add()
多次。
大家可能有点懵,我直接操作一下代码,大家会发现我们虽然对ArrayList
设置了初始大小,但是我们打印List大小的时候还是0,我们操作下标set值的时候也会报错,数组下标越界。
再结合源码,大家仔细品读一下,这是Java Bug里面的一个经典问题了,还是很有意思的,大家平时可能也不会注意这个点。
ArrayList插入删除一定慢么?
取决于你删除的元素离数组末端有多远,ArrayList拿来作为堆栈来用还是挺合适的,push和pop操作完全不涉及数据移动操作。
那他的删除怎么实现的呢?
删除其实跟新增是一样的,不过叫是叫删除,但是在代码里面我们发现,他还是在copy一个数组。
为啥是copy数组呢?
继续打个比方,我们现在要删除下面这个数组中的index5这个位置
那代码他就复制一个index5+1开始到最后的数组,然后把它放到index开始的位置
index5的位置就成功被”删除“了其实就是被覆盖了,给了你被删除的感觉。
同理他的效率也低,因为数组如果很大的话,一样需要复制和移动的位置就大了。
ArrayList是线程安全的么?
当然不是,线程安全版本的数组容器是Vector。
Vector的实现很简单,就是把所有的方法统统加上synchronized就完事了。
你也可以不使用Vector,用Collections.synchronizedList
把一个普通ArrayList包装成一个线程安全版本的数组容器也可以,原理同Vector是一样的,就是给所有的方法套上一层synchronized。
ArrayList用来做队列合适么?
队列一般是FIFO(先入先出)的,如果用ArrayList做队列,就需要在数组尾部追加数据,数组头部删除数组,反过来也可以。
但是无论如何总会有一个操作会涉及到数组的数据搬迁,这个是比较耗费性能的。
结论:ArrayList不适合做队列。
那数组适合用来做队列么?
数组是非常合适的。
比如ArrayBlockingQueue
内部实现就是一个环形队列,它是一个定长队列,内部是用一个定长数组来实现的。
另外著名的Disruptor开源Library也是用环形数组来实现的超高性能队列,具体原理不做解释,比较复杂。
简单点说就是使用两个偏移量来标记数组的读位置和写位置,如果超过长度就折回到数组开头,前提是它们是定长数组。
以数组作为底层数据结构时,一般讲队列实现为循环队列。这是因为队列在顺序存储上的不足:每次从数组头部删除元素(出队)后,需要将头部以后的所有元素往前移动一个位置,这是一个时间复杂度为O(n)的操作:
可能有人说,把队首标志往后移动不就不用移动元素了吗?的确,但那样会造成数组空间的“流失”。
我们希望队列的插入与删除操作都是O(1)的时间复杂度,同时不会造成数组空间的浪费,我们应该使用循环队列。
所谓的循环队列,可以把数组看出一个首尾相连的圆环,删除元素时将队首标志往后移动,添加元素时若数组尾部已经没有空间,则考虑数组头部的空间是否空闲,如果是,则在数组头部进行插入。
那么我们如何判断队列是空队列还是已满呢?
- 栈空: 队首标志=队尾标志时,表示栈空,即红绿两个标志在图中重叠时为栈空。
- 栈满 : 队尾+1 = 队首时,表示栈空。图三最下面的队列即为一个满队列。尽管还有一个空位,我们不存储元素。
ArrayList的遍历和LinkedList遍历性能比较如何?
论遍历ArrayList要比LinkedList快得多,ArrayList遍历最大的优势在于内存的连续性,CPU的内部缓存结构会缓存连续的内存片段,可以大幅降低读取内存的性能开销。
ArrayList常用的方法总结
-
boolean add(E e)
将指定的元素添加到此列表的尾部。 -
void add(int index, E element)
将指定的元素插入此列表中的指定位置。 -
boolean addAll(Collection c)
按照指定 collection 的迭代器所返回的元素顺序,将该 collection 中的所有元素添加到此列表的尾部。 -
boolean addAll(int index, Collection c)
从指定的位置开始,将指定 collection 中的所有元素插入到此列表中。 -
void clear()
移除此列表中的所有元素。 -
Object clone()
返回此 ArrayList 实例的浅表副本。 -
boolean contains(Object o)
如果此列表中包含指定的元素,则返回 true。 -
void ensureCapacity(int minCapacity)
如有必要,增加此 ArrayList 实例的容量,以确保它至少能够容纳最小容量参数所指定的元素数。 -
E get(int index)
返回此列表中指定位置上的元素。 -
int indexOf(Object o)
返回此列表中首次出现的指定元素的索引,或如果此列表不包含元素,则返回 -1。 -
boolean isEmpty()
如果此列表中没有元素,则返回 true -
int lastIndexOf(Object o)
返回此列表中最后一次出现的指定元素的索引,或如果此列表不包含索引,则返回 -1。 -
E remove(int index)
移除此列表中指定位置上的元素。 -
boolean remove(Object o)
移除此列表中首次出现的指定元素(如果存在)。 -
protected void removeRange(int fromIndex, int toIndex)
移除列表中索引在 fromIndex(包括)和 toIndex(不包括)之间的所有元素。 -
E set(int index, E element)
用指定的元素替代此列表中指定位置上的元素。 -
int size()
返回此列表中的元素数。 -
Object[] toArray()
按适当顺序(从第一个到最后一个元素)返回包含此列表中所有元素的数组。 -
T[] toArray(T[] a)
按适当顺序(从第一个到最后一个元素)返回包含此列表中所有元素的数组;返回数组的运行时类型是指定数组的运行时类型。 -
void trimToSize()
将此 ArrayList 实例的容量调整为列表的当前大小。
ArrayList源码解析
类图
- 实现了
RandomAccess
接口,可以随机访问 - 实现了
Cloneable
接口,可以克隆 - 实现了
Serializable
接口,可以序列化、反序列化 - 实现了
List
接口,是List
的实现类之一 - 实现了
Collection
接口,是Java Collections Framework
成员之一 - 实现了
Iterable
接口,可以使用for-each
迭代
ArrayList类注释翻译
类注释还是要看的,能给我们一个整体的了解这个类。我将ArrayList的类注释大概翻译整理了一下:
- ArrayList是实现
List
接口的可自动扩容的数组。实现了所有的List
操作,允许所有的元素,包括null
值。 - ArrayList大致和Vector相同,除了ArrayList是非同步的。
size
isEmpty
get
set
iterator
和listIterator
方法时间复杂度是O(1)
,常量时间。其他方法是O(n)
,线性时间。- 每一个ArrayList实例都有一个
capacity
(容量)。capacity
是用于存储列表中元素的数组的大小。capacity
至少和列表的大小一样大。 - 如果多个线程同时访问ArrayList的实例,并且至少一个线程会修改,必须在外部保证ArrayList的同步。修改包括添加删除扩容等操作,仅仅设置值不包括。这种场景可以用其他的一些封装好的同步的
list
。如果不存在这样的Object
,ArrayList应该用Collections.synchronizedList
包装起来最好在创建的时候就包装起来,来保证同步访问。 iterator()
和listIterator(int)
方法是fail-fast
的,如果在迭代器创建之后,列表进行结构化修改,迭代器会抛出ConcurrentModificationException
。- 面对并发修改,迭代器快速失败、清理,而不是在未知的时间不确定的情况下冒险。请注意,快速失败行为不能被保证。通常来讲,不能同步进行的并发修改几乎不可能做任何保证。因此,写依赖这个异常的程序的代码是错误的,快速失败行为应该仅仅用于防止
bug
。
属性 🤔
- 为什么空实例默认数组有的时候是
EMPTY_ELEMENTDATA
,而又有的时候是DEFAULTCAPACITY_EMPTY_ELEMENTDATA
- 为什么
elementData
要被transient
修饰 - 为什么
elementData
没有被private
修饰?难道正如注释所写的non-private to simplify nested class access
// 序列化版本UID
private static final long
serialVersionUID = 8683452581122892189L;
/**
* 默认的初始容量
*/
private static final int
DEFAULT_CAPACITY = 10;
/**
* 用于空实例的共享空数组实例
* new ArrayList(0);
*/
private static final Object[]
EMPTY_ELEMENTDATA = {};
/**
* 用于提供默认大小的实例的共享空数组实例
* new ArrayList();
*/
private static final Object[]
DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
* 存储ArrayList元素的数组缓冲区
* ArrayList的容量,是数组的长度
*
* non-private to simplify nested class access
*/
transient Object[] elementData;
/**
* ArrayList中元素的数量
*/
private int size;
构造方法
带初始容量的构造方法
- 如果
initialCapacity < 0
,就创建一个新的长度是initialCapacity
的数组 - 如果
initialCapacity == 0
,就使用EMPTY_ELEMENTDATA - 其他情况,
initialCapacity
不合法,抛出异常
/**
* 带一个初始容量参数的构造方法
*
* @param initialCapacity 初始容量
* @throws 如果初始容量非法就抛出
* IllegalArgumentException
*/
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData =
new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException(
"Illegal Capacity: "+ initialCapacity);
}
}
无参构造方法
/**
* 无参构造方法 将elementData 赋值为
* DEFAULTCAPACITY_EMPTY_ELEMENTDATA
*/
public ArrayList() {
this.elementData =
DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
带一个集合参数的构造方法 🤔
- 使用将集合转换为数组的方法
- 为了防止
c.toArray()
方法不正确的执行,导致没有返回Object[]
,特殊做了处理 - 如果数组大小等于
0
,则使用EMPTY_ELEMENTDATA
/**
* 带一个集合参数的构造方法
*
* @param c 集合,代表集合中的元素会被放到list中
* @throws 如果集合为空,抛出NullPointerException
*/
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
// 如果 size != 0
if ((size = elementData.length) != 0) {
// c.toArray 可能不正确的,不返回 Object[]
// https://bugs.openjdk.java.net/browse/JDK-6260652
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(
elementData, size, Object[].class);
} else {
// size == 0
// 将EMPTY_ELEMENTDATA 赋值给 elementData
this.elementData = EMPTY_ELEMENTDATA;
}
}
那么问题来了,什么情况下
c.toArray()
会不返回Object[]
呢?
public static void main(String[] args) {
// 方式一:java.util.ArrayList
List<String> list = new ArrayList<>(Arrays.asList("list"));
System.out.println(list.getClass());// class java.util.ArrayList
Object[] listArray = list.toArray();
System.out.println(listArray.getClass()); // class [Ljava.lang.Object;
listArray[0] = new Object();
System.out.println("----------------------");
// 方式二:java.util.Arrays 的私有内部类ArrayList
List<String> asList = Arrays.asList("asList");
System.out.println(asList.getClass()); // class java.util.Arrays$ArrayList
Object[] asListArray = asList.toArray(); // class [Ljava.lang.String;
System.out.println(asListArray.getClass());
asListArray[0] = new Object(); // ⚠️ java.lang.ArrayStoreException
}
我们通过这个例子可以看出来,java.util.ArrayList.toArray()
方法会返回Object[]
没有问题。
而java.util.Arrays
的私有内部类ArrayList的toArray()
方法可能不返回Object[]
。
原因:
我们看ArrayList的toArray()
方法源码:
public Object[] toArray() {
// ArrayLisy中 elementData是这样定义的
// transient Object[] elementData;
return Arrays.copyOf(elementData, size);
}
使用了Arrays.copyOf()
方法:
public static <T> T[] copyOf(T[] original, int newLength) {
// original.getClass() 是 class [Ljava.lang.Object
return (T[]) copyOf(original, newLength, original.getClass());
}
copyOf()
的具体实现:
public static <T,U> T[] copyOf(U[] original,
int newLength, Class<? extends T[]> newType) {
@SuppressWarnings("unchecked")
/**
* 如果newType是Object[] copy 数组 类型就是 Object
* 否则就是 newType 类型
*/
T[] copy = ((Object)newType == (Object)Object[].class)
? (T[]) new Object[newLength]
: (T[]) Array.newInstance(newType.getComponentType(), newLength);
System.arraycopy(original, 0, copy, 0,
Math.min(original.length, newLength));
return copy;
}
我们知道ArrayList中elementData
就是Object[]
类型,所以ArrayList的toArray()
方法必然会返回Object[]
。
我们再看一下java.util.Arrays
的内部ArrayList源码(截取的部分源码):
private static class ArrayList<E> extends AbstractList<E>
implements RandomAccess, java.io.Serializable {
// 存储元素的数组
private final E[] a;
ArrayList(E[] array) {
// 直接把接收的数组 赋值 给 a
a = Objects.requireNonNull(array);
}
/**
* obj 为空抛出异常
* 不为空 返回 obj
*/
public static <T> T requireNonNull(T obj) {
if (obj == null)
throw new NullPointerException();
return obj;
}
@Override
public Object[] toArray() {
// 返回 a 的克隆对象
return a.clone();
}
}
这是Arrays.asList()
方法源码
public static <T> List<T> asList(T... a) {
return new ArrayList<>(a);
}
不难看出来java.util.Arrays
的内部ArrayList的toArray()
方法,是构造方法接收什么类型的数组,就返回什么类型的数组。
所以,在我们上面的例子中,实际上返回的是String类型的数组,再将其中的元素赋值成Object
类型的,自然报错。
扯远了,我们还是继续看ArrayList吧…
插入方法
在列表最后添加指定元素
- 在父类
AbstractList
上,定义了modCount
属性,用于记录数组修改的次数。
/**
* 在列表最后添加指定元素
*
* @param e 要添加的指定元素
* @return true
*/
public boolean add(E e) {
// ⚠️ 增加 modCount !!
ensureCapacityInternal(size + 1);
elementData[size++] = e;
return true;
}
在指定位置添加指定元素
/**
* 在指定位置添加指定元素
* 如果指定位置已经有元素,就将该元素和随后的元素移动到右面一位
*
* @param index 待插入元素的下标
* @param element 待插入的元素
* @throws 可能抛出 IndexOutOfBoundsException
*/
public void add(int index, E element) {
rangeCheckForAdd(index);
// 增加 modCount !!
ensureCapacityInternal(size + 1);
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
插入方法调用的其他私有方法
/**
* 计算容量
*/
private static int calculateCapacity(
Object[] elementData, int minCapacity) {
if (elementData ==
DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(
calculateCapacity(elementData, minCapacity)
);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
扩容方法
- 通常情况新容量是原来容量的1.5倍
- 如果原容量的1.5倍比
minCapacity
小,那么就扩容到minCapacity
- 特殊情况扩容到
Integer.MAX_VALUE
看完构造方法、添加方法、扩容方法之后,上文第1个问题终于有了答案。
原来,采用无参构造
new ArrayList()
会将elementData
赋值为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA,当有参构造时,如果给定初始容量为0,或者传入集合为空集合
new ArrayList(0)
会将elementData
赋值为 EMPTY_ELEMENTDATA,EMPTY_ELEMENTDATA添加元素会扩容到容量为
1
,而DEFAULTCAPACITY_EMPTY_ELEMENTDATA扩容之后容量为10
。
/**
* 数组可以分配的最大size
* 一些虚拟机在数组中预留一些header words
* 如果尝试分配更大的size,可能导致OutOfMemoryError
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
/**
* 增加容量,至少保证比minCapacity大
* @param minCapacity 期望的最小容量
*/
private void grow(int minCapacity) {
// 有可能溢出的代码
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
/**
* 最大容量返回 Integer.MAX_VALUE
*/
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
移除方法
移除方法名字、参数的个数都一样,使用的时候要注意。
移除指定元素方法
/**
* 移除列表中指定下标位置的元素
* 将所有的后续元素,向左移动
*
* @param 要移除的指定下标
* @return 返回被移除的元素
* @throws 下标越界会抛出IndexOutOfBoundsException
*/
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData,
index+1, elementData, index, numMoved);
// 将引用置空,让GC回收
elementData[--size] = null;
return oldValue;
}
私有移除方法
/**
* 移除第一个在列表中出现的指定元素
* 如果存在,移除返回true
* 否则,返回false
*
* @param o 指定元素
*/
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
查找方法
查找指定元素的所在位置
/**
* 返回指定元素第一次出现的下标
* 如果不存在该元素,返回 -1
* 如果 o ==null 会特殊处理
*/
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
查找指定位置的元素
- 该方法直接返回
elementData
数组指定下标的元素,效率还是很高的。所以ArrayList,for
循环遍历效率也是很高的。
/**
* 返回指定位置的元素
*
* @param index 指定元素的位置
* @throws index越界会抛出IndexOutOfBoundsException
*/
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
序列化方法
/**
* 将ArrayLisy实例的状态保存到一个流里面
*/
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException{
// Write out element count, and any hidden stuff
int expectedModCount = modCount;
s.defaultWriteObject();
// Write out size as capacity for behavioural compatibility with clone()
s.writeInt(size);
// 按照顺序写入所有的元素
for (int i=0; i<size; i++) {
s.writeObject(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
反序列化方法
看完序列化,反序列化方法,我们终于又能回答第二个问题了。
elementData
之所以用transient
修饰,是因为JDK不想将整个elementData
都序列化或者反序列化,而只是将size
和实际存储的元素序列化或反序列化,从而节省空间和时间。
/**
* 根据一个流(参数)重新生成一个ArrayList
*/
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
elementData = EMPTY_ELEMENTDATA;
// Read in size, and any hidden stuff
s.defaultReadObject();
// Read in capacity
s.readInt();
if (size > 0) {
// be like clone(), allocate array based upon size not capacity
ensureCapacityInternal(size);
Object[] a = elementData;
// Read in all elements in the proper order.
for (int i=0; i<size; i++) {
a[i] = s.readObject();
}
}
}
创建子数组
public List<E> subList(int fromIndex, int toIndex) {
subListRangeCheck(fromIndex, toIndex, size);
return new SubList(this, 0, fromIndex, toIndex);
}
我们看一下简短版的SubList
:
- SubList的set()方法,是直接修改ArrayList中
elementData
数组的,使用中应该注意 - SubList是没有实现
Serializable
接口的,是不能序列化的
private class SubList extends AbstractList<E> implements RandomAccess {
private final AbstractList<E> parent;
private final int parentOffset;
private final int offset;
int size;
SubList(AbstractList<E> parent,
int offset, int fromIndex, int toIndex) {
this.parent = parent;
this.parentOffset = fromIndex;
this.offset = offset + fromIndex;
this.size = toIndex - fromIndex;
this.modCount = ArrayList.this.modCount;
}
public E set(int index, E e) {
rangeCheck(index);
checkForComodification();
E oldValue = ArrayList.this.elementData(offset + index);
ArrayList.this.elementData[offset + index] = e;
return oldValue;
}
// 省略代码...
}
迭代器
创建迭代器方法
public Iterator<E> iterator() {
return new Itr();
}
Itr属性
// 下一个要返回的元素的下标
int cursor;
// 最后一个要返回元素的下标 没有元素返回 -1
int lastRet = -1;
// 期望的 modCount
int expectedModCount = modCount;
Itr的hasNext() 方法
public boolean hasNext() {
return cursor != size;
}
Itr的next()方法
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
在迭代的时候,会校验
modCount
是否等于expectedModCount
,不等于就会抛出著名的ConcurrentModificationException
异常。什么时候会抛出ConcurrentModificationException
?
public static void main(String[] args) {
ArrayList arrayList = new ArrayList();
for (int i = 0; i < 10; i++) {
arrayList.add(i);
}
remove(arrayList);
System.out.println(arrayList);
}
public static void remove(ArrayList<Integer> list) {
Iterator<Integer> iterator = list.iterator();
while (iterator.hasNext()) {
Integer number = iterator.next();
if (number % 2 == 0) {
// 抛出ConcurrentModificationException异常
list.remove(number);
}
}
}
那怎么写才能不抛出
ConcurrentModificationException
?很简单,将list.remove(number);
换成iterator.remove();
即可。why?请看Itr的remove()
源码…
Itr的remove()方法
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
// 移除之后将modCount 重新赋值给 expectedModCount
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
原因就是因为Itr的remove()
方法,移除之后将modCount
重新赋值给 expectedModCount
。这就是源码,不管单线程还是多线程,只要违反了规则,就会抛异常。
源码看的差不多了,开篇的问题却还剩一个!到底为什么
elementData
没有用private
修饰呢?
我们知道的,private
修饰的变量,内部类也是可以访问到的。难道注释中non-private to simplify nested class access
(非私有,以简化嵌套类访问)的这句话有毛病?
当我们看表面看不到什么东西的时候,不妨看一下底层。
测试类代码:
一顿javac
、javap
之后(使用JDK8):
再一顿javac
、javap
之后(使用JDK11):
虽然字节码指令我还看不太懂,但是我能品出来,注释是没毛病的,private
修饰的确会影响内部类的访问。
总结 🤔
- ArrayList底层的数据结构是数组
- ArrayList可以自动扩容,不传初始容量或者初始容量是
0
,都会初始化一个空数组,但是如果添加元素,会自动进行扩容,所以,创建ArrayList的时候,给初始容量是必要的 Arrays.asList()
方法返回的是的Arrays
内部的ArrayList,用的时候需要注意subList()
返回内部类,不能序列化,和ArrayList共用同一个数组- 迭代删除要用,迭代器的
remove
方法,或者可以用倒序的for
循环 - ArrayList重写了序列化、反序列化方法,避免序列化、反序列化全部数组,浪费时间和空间
elementData
不使用private
修饰,可以简化内部类的访问
既已览卷至此,何不品评一二: