参考链接:
Iterator(迭代器)
作为一种设计模式,迭代器可以用于遍历一个对象,对于这个对象的底层结构开发人员不必去了解。
java中的Iterator一般称为“轻量级”对象,创建它的代价是比较小的。这里笔者不会去考究迭代器这种
设计模式,仅在JDK代码层面上谈谈迭代器的时候以及使用迭代器的好处。
Iterator详解
Iterator是作为一个接口存在的,它定义了迭代器所具有的功能。这里我们就以Iterator接口来看,不考
虑起子类ListIterator。其源码如下:
package java.util;
public interface Iterator<E> {
boolean hasNext();
E next();
void remove();
}
对于这三个方法所实现的功能,字面意义就是了。不过貌似对迭代器的工作“过程”还是迷雾,接下来
我们以一个实际例子来看。
List<String> list = new ArrayList<String>();
list.add("TEST1");
list.add("TEST2");
list.add("TEST3");
list.add("TEST4");
list.add("TEST6");
list.add("TEST5");
Iterator<String> it = list.iterator();
while(it.hasNext())
{
System.out.println(it.next());
}
这段代码的输出结果不用多说,这里的it更像是“游标”,不过这游标具体做了啥,我们还得通过
list.iterator()好好看看。通过源码了解到该方法产生了一个实现Iterator接口的对象。
private class Itr implements Iterator<E> {
//游标记录当前索引的位置,是从0开始的
int cursor = 0; // index of next element to return
int lastRet = -1;// index of last element returned; -1 if no such
int expectedModCount = modCount;
//记录元素修改记录,若在迭代List时,modCount发生变化将会抛出ConcurrentModificationException异常
//判断游标是否到达最后的位置,若没有表示还有元素,若有则没有元素了
public boolean hasNext() {
return cursor != size();
}
public E next() {
//校验是否被修改(其实这里存在多线程问题,所以说ArrayList不是线程安全的)
checkForComodification();
try {
int i = cursor;//当前游标的位置
E next = get(i);
lastRet = i;
cursor = i + 1;//游标向后移动1
return next;
} catch (IndexOutOfBoundsException e) {
checkForComodification();
throw new NoSuchElementException();
//若游标的位置比数组长度还大则抛出异常
}
}
public void remove() {
//lastRet初始值为-1,若需要调用remove方法,则bi
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
//删除lastRet索引处的元素
try {
AbstractList.this.remove(lastRet);
//游标前移,由于是删除remove方法删除的是lastRet位置的元素则游标需要前移才能保证可以遍历到所有的元素
if (lastRet < cursor)
cursor--;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException e) {
throw new ConcurrentModificationException();
}
}
//检查列表是否修改,若修改则抛出异常
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}
对于上述的代码不难看懂,有点疑惑的是int expectedModCount = modCount;这句代码
其实这是集合迭代中的一种“快速失败”机制,这种机制提供迭代过程中集合的安全性。阅读源码
就可以知道ArrayList中存在modCount对象,增删操作都会使modCount++,通过两者的对比
迭代器可以快速的知道迭代过程中是否存在list.add()类似的操作,存在的话快速失败!
以一个实际的例子来看,简单的修改下上述代码。
while(it.hasNext())
{
System.out.println(it.next());
list.add("test");
}
这就会抛出一个下面的异常,迭代终止。
对于快速失败机制以前文章中有总结,现摘录过来:
Fail-Fast(快速失败)机制
仔细观察上述的各个方法,我们在源码中就会发现一个特别的属性modCount,API解释如下:
The number of times this list has been structurally modified. Structural modifications are those
that change the size of the list, or otherwise perturb it in such a fashion that iterations in progress
may yield incorrect results.
记录修改此列表的次数:包括改变列表的结构,改变列表的大小,打乱列表的顺序等使正在进行
迭代产生错误的结果。Tips:仅仅设置元素的值并不是结构的修改
我们知道的是ArrayList是线程不安全的,如果在使用迭代器的过程中有其他的线程修改了List就会
抛出ConcurrentModificationException这就是Fail-Fast机制。
那么快速失败究竟是个什么意思呢?
在ArrayList类创建迭代器之后,除非通过迭代器自身remove或add对列表结构进行修改,否则在其他
线程中以任何形式对列表进行修改,迭代器马上会抛出异常,快速失败。
迭代器的好处
通过上述我们明白了迭代是到底是个什么,迭代器的使用也十分的简单。现在简要的总结下使用迭代
器的好处吧。
1、迭代器可以提供统一的迭代方式。
2、迭代器也可以在对客户端透明的情况下,提供各种不同的迭代方式。
3、迭代器提供一种快速失败机制,防止多线程下迭代的不安全操作。
不过对于第三点尚需注意的是:就像上述事例代码一样,我们不能保证迭代过程中出现“快速
失败”的都是因为同步造成的,因此为了保证迭代操作的正确性而去依赖此类异常是错误的!
foreach循环
通过阅读源码我们还发现一个Iterable接口。它包含了一个产生Iterator对象的iterator()方法,
而且将Iterator对象呗foreach用来在序列中移动。对于任何实现Iterable接口的对象都可以使用
foreach循环。
foreach语法的冒号后面可以有两种类型:一种是数组,另一种是是实现了Iterable接口的类
对于数组不做讨论,我们看看实现了Iterable的类
package com.iterator;
import java.util.Iterator;
public class MyIterable implements Iterable<String> {
protected String[] words = ("And that is how "
+ "we know the Earth to be banana-shaped.").split(" ");
public Iterator<String> iterator() {
return new Iterator<String>() {
private int index = 0;
public boolean hasNext() {
return index < words.length;
}
public String next() {
return words[index++];
}
public void remove() {}
};
}
public static void main(String[] args){
for(String s:new MyIterable())
System.out.print(s+",");
}
}
输出结果如下:
And,that,is,how,we,know,the,Earth,to,be,banana-shaped.,