Java集合初识

什么是集合?
Java集合类是一种特别有用的工具类,可用于存储数量不等的对象,并可以实现常用的数据结构,如栈、队列等。除此之外,集合还可用于保存具有映射关系的关联数组。

集合与数组的区别

  • 数组的长度是固定的;集合的长度是可变的。
  • 数组可以存储基本数据类型,也可以存储引用数据类型;集合只能存储引用数据类型。
  • 数组只能存储同种数据类型的元素;集合可以存储不同类型的元素。

集合的用途
为了保存数量不确定的数据,以及保存具有映射关系的数据,集合类主要负责保存、盛装其他数据,因此也被称为容器类。集合类和数组不一样,数组元素可以是基本类型的值,也可以是对象(实际上保存的是对象的引用),而集合只能保存对象(实际上保存的是对象的引用变量)。

Java的集合类主要由两个接口派生而出:Collection和Map,这两者是集合框架的根接口,其中又包含一些子接口或实现类。
Java集合初识

Collection和Iterator接口

Collection是List、Set和Queue接口的父接口,该接口里定义的方法既可以用于操作Set集合,也可以用于操作List和Queue集合。Collection接口里定义了如下操作集合元素的方法。

  • boolean add(Object o):该方法用于向集合里添加一个元素,如果集合对象被添加的操作改变了则返回true;
        //创建一个集合对象
        Collection collection = new ArrayList();

        collection.add("孙悟空");
        collection.add("猪八戒");
        collection.add("唐三藏");
        System.out.println(collection.add("沙悟净"));//true
        System.out.println(collection);//[孙悟空, 猪八戒, 唐三藏, 沙悟净]
  • boolean addAll(Collection c):该方法把集合c里的所有元素添加到指定集合里,如果集合对象被添加操作改变了,则返回true。
        //创建第二个集合对象
        Collection collection1 = new ArrayList();

        collection1.add("孙悟空");
        collection1.add("猪八戒");

        System.out.println(collection.addAll(collection1));//true
        System.out.println(collection);//[孙悟空, 猪八戒, 唐三藏, 沙悟净, 孙悟空, 猪八戒]
  • void clear():清除集合里的所有元素,将集合长度变为0;
        //清空集合
        collection1.clear();
        System.out.println(collection1);//[]
  • boolean contains(Object o):返回集合里是否包含指定元素
System.out.println(collection.contains("孙悟空"));  //true
  • boolean containsAll(Collection c):返回集合里是否包含集合c里的所有元素
        //创建第二个集合对象
        Collection collection1 = new ArrayList();

        collection1.add("孙悟空");
        collection1.add("猪八戒");

        System.out.println(collection.retainAll(collection1));//true
        collection1.add("白龙马");
        System.out.println(collection.retainAll(collection1));//false
  • boolean isEmpty():返回集合是否为空。放集合长度为0时返回true,否则返回false
  • Iterator iterator():返回一个Iterator对象,用于遍历集合里的元素;
  • int size():该方法返回集合里的元素个数。
        Iterator it=collection.iterator();//[email protected]
        for (int i=0;i<collection.size();i++){
            System.out.print(it.next());
        }
  • boolean remove(Object o):删除集合中的指定元素o,当集合中包含一个或多个元素o时,该方法只删除第一个符合条件的元素,该方法将返回true。
        System.out.println(collection.remove("孙悟空"));
        System.out.println(collection);
  • boolean removeAll(Collection c):从集合中删除集合c里包含的所有元素,如果删除一个或多个元素,则该方法返回true;
        collection.removeAll(collection1);
        System.out.println(collection);//[唐三藏]
  • boolean retainAll(Collection c):从集合中删除集合c里不包含的元素,相当于把调用该方法的集合变成该集合和集合c的交集。
        collection1.add("白龙马");
        collection.retainAll(collection1);
        System.out.println(collection);//[孙悟空, 猪八戒]
  • Object[] toArray():该方法把集合转换成一个数组,所有集合元素变成对应的数组元素。

使用Lambda表达式遍历集合

Java8为Iterable接口新增了一个forEach(Consumer action)默认方法,该方法所需参数的类型是一个函数式接口,而Iterable接口是Collection接口的父接口,所以Collection集合可以直接调用该方法。
当程序调用Iterable的forEach遍历集合元素时,程序会依次将集合传给Consumer的accept(T t)方法。正因为Consumer是函数式接口,因此可以使用Lambda表达式来遍历集合元素。

        Collection collection= new ArrayList();

        collection.add("Java");
        collection.add("Python");
        collection.add("C++");

        collection.forEach(obj -> System.out.println("迭代集合元素:"+obj));
        /*迭代集合元素:Java
            迭代集合元素:Python
            迭代集合元素:C++*/

传给forEach方法的参数是一个Lambda表达式,该Lambda表达式的目标类型是Comsumer。forEach方法会自动将集合元素逐个地传递给Lambda表达式的形参。

使用Java8增强的Iterator遍历集合元素

Iterator接口也是java集合框架的成员,它与Collection和Map不同的是,它主要用于遍历(迭代访问)Collection中的元素,而其他两者主要用来盛放元素。

Iterator接口里的四种方法:

  • boolean hasNext():如果集合元素还没有被遍历完,则返回true;
  • Object next():返回集合里的下一个元素;
  • void remove():删除集合里上一次next方法返回的元素;
  • void forEachRemaining(Consumer action):可使用Lambda表达式来遍历集合元素。

Iterator必须依赖于Collection对象,若有一个Iterator对象,则必然有一个Collection对象与之关联。

        Collection collection= new ArrayList();

        collection.add("Java");
        collection.add("Python");
        collection.add("C++");

        //获取集合对应的迭代器
        Iterator it=collection.iterator();
        while (it.hasNext()){
            //it.next()方法返回的数据类型是Object类型,依尼翠需要强制类型转换
            String book=(String) it.next();
            System.out.println(book);

            if(book.equals("C++")){
                it.remove();
            }
            //对book变量赋值,不会改变集合本身
            book="go语言";
        }
        System.out.println(collection);

结论
当使用Iterator对集合进行迭代时,Iterator并不是把集合本身传给迭代变量,而是把集合元素的值传给了迭代变量,所以修改迭代变量的值对集合元素本身没有影响。只有通过Iterator的remove方法删除上一个next方法返回的集合元素才可以,否则如果在迭代过程中修改集合元素将会引发ConcurrentModificationException异常

        Collection collection= new ArrayList();

        collection.add("Java");
        collection.add("Python");
        collection.add("C++");

        //获取集合对应的迭代器
        Iterator it=collection.iterator();
        while (it.hasNext()){
            //it.next()方法返回的数据类型是Object类型,依尼翠需要强制类型转换
            String book=(String) it.next();
            System.out.println(book);

            if(book.equals("C++")){
                collection.remove(book);
            }
        }
        System.out.println(collection);
//Exception in thread "main" java.util.ConcurrentModificationException

上面代码中的collection.remove(book);位于Iterator迭代块内,所以在迭代过程中修改了集合元素,所以引发异常。

Iterator迭代器采用的是快速失败机制,一旦在迭代过程中检测到该集合被修改,程序立即引发ConcurrentModificationException异常,而不是显示修改后的结果,这样可以避免共享资源而引发的潜在问题

使用foreach循环遍历集合元素

除了使用Iterator接口访问Collection集合里的元素之外,使用Java5提供的foreach循环迭代访问集合元素更加便捷。

for (Object obj:collection){
            String book=(String) obj;
            System.out.println(book);
        }

使用java8新增的Predicate操作集合

Java8为Collection集合新增了一个removeIF(Predicate filter)方法,该方法将会批量删除符合filter添加的所有元素。该方法需要一个Predicate对象作为参数,Predicate也是函数式接口,因此可以使用Lambda表达式作为参数。

collection.removeIf(ele ->((String)ele).length()<10);
    public static void main(String[] args) {
        Collection collection= new ArrayList();
        collection.add("Java");
        collection.add("Python");
        collection.add("C++");

        //统计书名中包含“Python”的元素
        System.out.println(calAll(collection,ele->((String)ele).contains("Python")));
        //统计元素字符串长度大于3的元素数量
        System.out.println(calAll(collection,ele->((String)ele).length()>3));

    }

    public static int calAll(Collection books, Predicate p){
        int total=0;
        for (Object obj:books){
            //使用Predicate的test方法判断搞对象是否满足Predicate指定的条件
            if(p.test(obj)){
                total++;
            }
        }
        return total;

    }

上面代码Lambda表达式目标类型是Predicate。

使用java8新增的Stream操作集合

java8还新增了Stream、IntStream、LongStream等流式API,这些API代表多个支持串行和并行聚集操作的元素。其中Stream是一个通用的流接口,而其他的则对应int、long的流。
java8还为上面流式API提供了对用的Builder,用来通过这些Builder来创建对应的流。
独立使用Stream的步骤:

  • 使用Stream或XxxStream的builder()类方法创建该Stream对应的Builder;
  • 重复调用Builder的add方法向该流中添加多个元素。
  • 调用Builder的build方法获取对应的Stream。
  • 调用Stream的聚集方法。
        IntStream is=IntStream.builder()
                .add(10)
                .add(-32)
                .add(54)
                .add(-23)
                .build();
        //下面聚集方法的代码每次只能执行一次
        System.out.println("is所有元素中最大值:"+is.max().getAsInt());
        System.out.println("is所有元素中最小值:"+is.min().getAsInt());
        System.out.println("is所有元素的总数:"+is.count());
        System.out.println("is所有元素的平均值:"+is.average());
        System.out.println("is所有元素的平方值是否都大于20:"
        +is.allMatch(ele->ele*ele>20));
        System.out.println("is任何元素的平方值是否都大于20:"
        +is.anyMatch(ele->ele*ele>20));

上面执行方法的代码每次只能执行一行,因此需要把其他行注释掉。

Stream提供了大量的方法进行聚集操作,这些方法既可以是“中间的”也可以是“末端的”。

中间方法:
中间操作允许保持打开状态,并允许直接调用后续方法;
末端方法:
末端方法是对流的最终操作,当对某个Stream执行末端方法后,该流将会被消耗切不可再用。
除此之外,关于流的方法还有如下特征:
有状态的方法:
这种方法会给流增加一些新特性,比如元素的唯一性,元素的最大数量、保证元素以排序的方法被处理等。有状态的方法往往需要更大的性能开销。
短路方法:
短路方法可以尽早结束对流的操作,不必检查所有元素。

中间方法的简单介绍

  • filter(Predicate predicate):过滤Stream中所有不符合Predicate的元素。
  • mapToXxx(ToXxxFunction mapper):使用ToXxxFunction对流中的元素执行一对一的转换,该方法返回的新流中包含了ToXxxFunction转换生成的所有元素。
  • peek(Consumer action):依次对每个元素执行一些操作,该方法返回的流与原流包含相同的元素。
  • distinct():该方法用于排序流中所有重复的元素。这是一个有状态的方法。
  • sorted():该方法用于保证流中的元素在后续的访问中处于有序状态,这是一个有状态的方法。
  • limit(long maxSize):该方法用于保证对该流的后续访问中最大允许访问的元素的个数。这是一个有状态的、短路的方法。

末端方法介绍

  • forEach(Consumer action):遍历流中的所有元素,对每个元素执行action;
  • toArray():将流中所有元素转换成一个数组;
  • reduce():该方法有三个重载版本,都用于通过某种操作来合并流中的元素。
  • min()、max():分别返回流中的最小值和最大值;
  • count():返回流中所有元素的数量;
  • anyMatch(Predicate predicate):判断流中是否至少包含一个元素满足Predicate条件;
  • AllMatch(Predicate predicate):判断流中是否所有元素满足Predicate条件;
  • noneMatch(Predicate predicate):判断流中是否所有元素都不符合Predicate条件;
  • findFirst():返回流中的第一个元素。
  • findAny():返回流中的任意一个元素。

除此之外java8允许使用流式API来操作集合,Collection接口提供了一个stream默认方法,该方法可返回该集合对应流,接下来即可通过流式API来操作集合了。

        Collection collection= new ArrayList();

        collection.add("Java");
        collection.add("Python");
        collection.add("C++");
        collection.add("go语言");

        //统计元素中包含字符o的元素个数
        System.out.println(collection.stream().filter(ele->((String)ele).contains("o")).count());
        //统计元素字符串大于3的元素个数
        System.out.println(collection.stream().filter(ele->((String)ele).length()>3).count());
        //先调用Collection对象的Stream方法将集合转换为Stream对象
        //再调用Stream的mapToint方法获取原有Stream对应的IntStream
        collection.stream().mapToInt(ele->((String)ele).length())
        .forEach(System.out::println);