收集器

收集器是一种通用的、从流生成复杂值的结构。可以使用它从流中生成List、Set、Map等集合。 收集器都是在流的collect方法中调用，并且都在 Collectors类中。
java 的标准类库提供了很多有用的收集器，当然了，也可以自己自定义（这个对于使用者的要求很高）。

下面提供一个代码，用于测试接下里要说的收集器：

提供了一个简单的测试数据

学号姓名性别语文数学英语物理政治总分
09509002 节强男 86 90 90 93 90
09509003 杨青女 90 90 82 91 92
09509006 徐刚男 78 92 83 90 87
09509111 马力男 77 88 99 90 88
09509001 武向丽女 90 78 83 94 94
09509007 张文静女 85 90 79 94 88
09509005 徐小红女 78 85 88 93 92
09509009 李姝女 92 80 75 90 88
09509004 李文华男 68 59 70 85 90
09509008 夏婧女 87 65 73 91 95
09509010 王洪男 66 48 89 70 57

Student 实体类封装数据

package com.cdragon;

public class Student implements Comparable<Student> {
    private String number;
    private String name;
    private String sex;
    private Integer chinese;
    private Integer math;
    private Integer english;
    private Integer physics;
    private Integer politics;
	//省略getter和setter方法，这个使用IDE自动生成特别方便。
	//省略toString方法，同上。
	
	@Override
    public int compareTo(Student s) {
        return s.getNumber().compareTo(this.getNumber());
    }
}

LoadData 类加载数据到内存

package com.cdragon;

import java.io.*;
import java.util.ArrayList;
import java.util.List;

public class LoadData {

    public static List<Student> readFromFile(File file) {
        List<Student> students = new ArrayList<>();
        try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file)))) {
            String record = null;
            String header = br.readLine();
            //对于数据的第一行头，暂时不做处理。
            while ((record = br.readLine() ) != null) {
                Student s = resolveLineToStudent(record);
                students.add(s);
            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return students;
    }

    private static Student resolveLineToStudent(String record) {
        String[] array = record.split("\\s+");  // \\s 和 \\s+ 还是有区别的！
        Student s = new Student();
        s.setNumber(array[0]);
        s.setName(array[1]);
        s.setSex(array[2]);
        s.setChinese(Integer.parseInt(array[3]));
        s.setMath(Integer.parseInt(array[4]));
        s.setEnglish(Integer.parseInt(array[5]));
        s.setPhysics(Integer.parseInt(array[6]));
        s.setPolitics(Integer.parseInt(array[7]));
        return s;
    }

}

收集器应用

将流转换成其他集合

使用收集器是可以生成其他集合的，例如生成List、Set 和 Map等，下面来分别举例：

		//生成 List
        List<Student> studentList = students.stream().collect(Collectors.toList());
        //生成 Set
        Set<Student> studentSet = students.stream().collect(Collectors.toSet());
        //生成指定集合
        TreeSet<Student> studentTreeSet = students.stream().collect(Collectors.toCollection(TreeSet::new));
        //生成 Map 
        Map<String, Student> studentMap = students.stream().collect(Collectors.toMap(Student::getNumber, s->s));

        studentMap.forEach((no, s)->{
            System.out.println(no + "->" + s);
        });

说明：通常的 toList() 和 toSet() 方法是不指定生成集合的具体类型，这是由系统来选择最合适的类型，但是有时候我们必须返回特定的类型集合，这就用到了 toCollection() 方法，这个方法可以指定需要生成的集合的类型，这是使用方法引用进行简化代码：TreeSet::new

测试结果：
在这里插入图片描述

注意：生成 Map 的方式较为复杂，因为需要同时指定键和值。

转换成值

使用收集器生成一个值。

最大值和最小值

Collectors 类中的 maxBy 和 minBy 允许用户按照某种特定顺序生成一个值。它们的作用就如同它们的名字一样，分别是寻找最大值和最小值。

我写成一个方法，这样调用比较方便。

/**
 * 获取单科最高分。
 * */
public static Optional<Student> minOrMaxSubject(List<Student> students, Comparator<? super Student> comparator) {
    return students.stream().collect(Collectors.maxBy(comparator));
}

说明：使用 maxBy 或者 minBy 必须传入一个 Comparator 对象作为参数，即参数为一个比较器。

测试代码

//这个文件的路径应该使用自己指定的
List<Student> students = LoadData.readFromFile(new File("src/grade.txt"));
//获取数学最高分学生
Optional<Student> s1 = TestStream.minOrMaxSubject(students, Comparator.comparing(Student::getMath));
//获取英语最高分
Optional<Student> s2 = TestStream.minOrMaxSubject(students, Comparator.comparing(Student::getEnglish));
System.out.println(s1.get());
System.out.println(s2.get());

测试结果
在这里插入图片描述

说明：如果想要测试最低分，只要把上面的 maxBy 改成 minBy 就行了，或者直接更进一步，修改参数为collect里面传入的函数，不过那样就会显得格外复杂，而且不止可以查最高分和最低分了。

平均值

上面看过了最大值和最小值，现在来看看平均值。
下面这个方法是用来求单科平均分的。

/**
 * 获取单科平均分
 * */
 public static double averageScore(List<Student> students, ToIntFunction<? super Student> mapper) {
     return students.stream().collect(Collectors.averagingInt(mapper));
 }

测试代码

List<Student> students = LoadData.readFromFile(new File("src/grade.txt"));
double math = TestStream.averageScore(students, Student::getMath);
System.out.println("数学的单科平均分：" + math);

测试结果
在这里插入图片描述

数据分块

数据分块是指收集器将流分为两个集合，注意分块是只能分成两块。这里标准类库提供了一个收集器 partitioningBy，它接受一个流，并将其分为两个部分。返回的结果为一个 Map，键只有两种：true 或者 false，值是满足对应条件的集合。

例如我想知道某们成绩 90分以上和一下的学生分别是哪些。

/**
 * 以特定分数划分不同学生，例如90分以上（含90分）和90分一下。
 * 结果是一个Map集合，只有两个元素，true  false 个对应一个集合。
 * */
 public static Map<Boolean, List<Student>> splitScore(List<Student> students, Predicate<? super Student> predicate) {
     return students.stream().collect(Collectors.partitioningBy(predicate));
 }

说明：partitioningBy的参数为一个 Predicate 对象，这个和过滤器的很相似，功能上可以对比学习。

测试代码

//数学成绩以90分来划分学生
Map<Boolean, List<Student>> booleanListMap = TestStream.splitScore(students, stu->stu.getMath()>=90);
booleanListMap.forEach((bool, list)->{
    System.out.println("数学成绩大于90分：" + bool);
    list.forEach(System.out::println);
    System.out.println("========================");
});

测试结果
在这里插入图片描述

数据分组

数据分组是一种更为自然的分割数据操作，与将数据分成true和false两部分不同，可以使用任意值对数据分组。比如使用性别对学生进行分组。这很像SQL中的 groupBy 操作。

/**
* 数据分组
* 这里以性别来分组
* */
public static Map<String, List<Student>> groupBy(List<Student> students) {
    return students.stream().collect(Collectors.groupingBy(Student::getSex));
}

测试代码

Map<String, List<Student>> stringListMap = TestStream.groupBy(students);
stringListMap.forEach((sex, list)->{
    System.out.println("性别：" + sex);
    list.forEach(System.out::println);
    System.out.println("============");
});

测试结果
在这里插入图片描述

字符串

收集流中的数据最后生成一个字符串，这是一个很平常的操作。
例如一个所有学生的姓名列表，使用传统的迭代列表操作代码如下：

 /**
  * 获取所有学生姓名的字符串
  * 传统的迭代操作
  * 格式如下：[张三，李四]
  * */
 public static String nameStr1(List<Student> students) {
     StringBuilder builder = new StringBuilder("[");
     for (Student stu : students) {
         if (builder.length() > 1){
             builder.append(",");
         }
         String name = stu.getName();
         builder.append(name);
     }
     builder.append("]");
     return builder.toString();
 }

然后是使用收集器进行操作，代码如下：
这里我添加一些细节处理，学生的排名按照学生的总成绩从高到底排列，这是很符合习惯的。

/**
 * 获取所有学生姓名的字符串
 * 函数式方法
 * 格式如下：[张三，李四]
 *
 * 注意，他只能连接字符串，所有这里使用 map 操作，将 Student 转成 String（学生姓名）
 * */
public static String nameStr2(List<Student> students) {
    return students.stream()
            .sorted(Comparator.comparing(s -> {
                return s.getChinese() + s.getMath() + s.getEnglish()
                        + s.getPhysics() + s.getPolitics();
            }, Comparator.reverseOrder()))  //(sum1, sum2)-> sum2.compareTo(sum1)
            .map(Student::getName)
            .collect(Collectors.joining(",","[","]"));
}

说明：这里的 sorted 需要传入一个 Comparator 对象，但是可以使用静态方法 Compring 进行简化，但是它只是指定需要排序的标准，并没有说是从小到大还是从大到小，后来才发现，这个是默认的：大小到大排序。但是我需要的是使用从大到小，然后发现原来 compring 还有重载方法，具有两个参数，另一个参数是可以指定大小顺序的，所以第二个参数我传入了一个 Lambda 表达式：

(sum1, sum2)-> sum2.compareTo(sum1)

但是如果这样使用的话，还不如直接使用 Lambda 表达式创建 Comparator 对象方便呢，后来发现这个 IDE 比较智能，它指出这句代码，可以被替换为：

Comparator.reverseOrder();// 看意思就知道是 反序的意思。

这样看来使用 Comparator 静态的 comparing 方法还是比直接创建 Comparator 对象简单一些。

注意：如果不需要排序的话，就只有一个map方法和join方法了。这个map方法的作用是映射（我一开始把它和map集合总是搞混了），将Student对象映射为name字符串，然后使用 join 方法进行连接。

组合收集器

收集器还可以组合起来使用，这个和 SQL 感觉更像了，几乎具有函数式编程的语言，都有SQL那种处理数据的方式，例如最大值、最小值和分组等操作。
考虑对于学生按照性别分组，然后再分别统计男女生的人数。（这个在 SQL 里面也是一个基本的练习。）

/**
 * 组合收集器
 * 这里以性别来分组，再分别计数
 * */
public static Map<String, Long> combination(List<Student> students) {
    return students.stream().collect(Collectors.groupingBy(Student::getSex, Collectors.counting()));
}

测试代码

Map<String, Long> stringLongMap = TestStream.combination(students);
stringLongMap.forEach((sex, count)->{
    System.out.println("性别：" + sex + ", 人数：" + count);
});

测试结果
在这里插入图片描述

使用流的其他操作

对于流的使用，应该达到一个较为熟练的地步，但是由于没有什么机会实践，还是比较陌生。下面介绍几个我写的方法，来看看流的操作：

//通过过滤器选择特定的学生，过滤器用于过滤，然后选择第一个学生。
//这里应该加一个排序操作比较好。
public static Optional<Student> selectStudent(List<Student> students, Predicate<?  super Student> pre) {
        return students.stream().filter(pre).findFirst();
    }

public static List<Student> orderBy(List<Student> students, Comparator<? super Student> comparator) {
    if (comparator != null){
        return students.stream().sorted(comparator).collect(Collectors.toList());
    } else {
        return students.stream().sorted().collect(Collectors.toList());
    }
}

//获取一列数据。不是一行学生记录，是一列。
public static List<?> getAColumn(List<Student> students, Function<? super Student, ?> mapper) {
    return students.stream().map(mapper).collect(Collectors.toList());
}

/**
 * 获取所有学生的总分和学号
 * */
public static Map<String, Integer> getSum(List<Student> students) {
    return students.stream().collect(Collectors.toMap(Student::getNumber, stu->{
        return stu.getChinese() + stu.getEnglish() + stu.getMath() + stu.getPhysics() + stu.getPolitics();
    }));
}


/**
 * peek 和 forEach 的区别
 * peek 是一个中间操作，forEach 是一个终结操作。
 *
 * 假如实现一个功能：每个学生的某门科目分数进行修改。
 *
 * peek 操作后得到的仍然是一个 stream，此时可以进一步操作，
 * 但是 forEach 是终结操作，操作结束，流就结束了，如果需要进一步处理，
 * 必须再次进行得到流的操作。
 * */

public static List<Student> addScore1(List<Student> students, Consumer<? super Student> action) {
    return students.stream().peek(action).collect(Collectors.toList());
}

public static void addScore2(List<Student> students, Consumer<? super Student> action) {
    students.stream().forEach(action);
}

//指定返回类型为 LinkedList，这时一个测试，并不是说需要这样写。
//多数情况下，我们还是应该使用 ArrayList
public static List<Student> addScore3(List<Student> students, Consumer<? super Student> action) {
    return students.stream().peek(action).collect(Collectors.toCollection(LinkedList::new));
}

对于其中的几个进行测试（不是全部方法，如果感兴趣，可以自己尝试。）：

//对于学生进行排序，参数为一个比较器，参数为空的话，使用默认的 sorted 排序。
//测试代码 按照学号排序（默认从小到大）
TestStream.orderBy(students,Comparator.comparing(Student::getNumber)).forEach(System.out::println);

//按照学号排序（从大到小）
TestStream.orderBy(students,Comparator.comparing(Student::getNumber, Comparator.reverseOrder())).forEach(System.out::println);

//使用默认的排序
TestStream.orderBy(students).forEach(System.out::println);

//获取一列学生的记录，例如这里是英语成绩，这里返回值我使用通配符应该没有错吧
//因为返回数据可能为 String 也可能是 Integer
TestStream.getAColumn(students,Student::getEnglish).forEach(System.out::println);

//测试学生的总分
TestStream.getSum(students).forEach((no, stu)->{
    System.out.println(no + " -> " + stu);
});

总结

虽然这个收集器（也可以说Java的函数式编程）有的使用起来感觉很简单、简洁（当然了它的目的也是如此），但是内部实现看着还是感觉无从下手，大量使用了泛型、通配符上下限这些方面的知识，这对于使用来说可以忽视，但是如果想要深入了解的话，还是很有难度的，我就先看到这里吧，消化消化知识再说，哈哈！

CrazyDragon_King

发布了25 篇原创文章 · 获赞 37 · 访问量 2406

私信关注

Java8函数式编程之收集器

收集器

收集器应用

将流转换成其他集合

转换成值

最大值和最小值

平均值

数据分块

数据分组

字符串

组合收集器

使用流的其他操作

总结

猜你喜欢