# reduction

在上一小节中介绍了怎么计算一个集合中的平均年龄

double average = roster
                .stream()
                .filter(p -> p.getGender() == Person.Sex.MALE)
                .mapToInt(Person::getAge)
                .average()
                .getAsDouble();

1
2
3
4
5
6

JDK 包含许多终端的操作（如 average， sum， min， max，和 count 通过组合一个流的内容返回一个值，在 java.util.stream.IntStream 中）。这些操作被称为 reduce操作 。JDK 还包含返回集合而不是单个值的简化操作。许多简化操作执行特定任务，例如查找值的平均值或将元素分组到各个类别中。然而，JDK 提供了通用操作 reduce 和 collect，此节详细介绍。

本节涵盖以下主题：

Stream.reduce 方法
Stream.collect 方法

# Stream.reduce 方法

该 Stream.reduce 方法是通用的 reduce 操作。考虑以下管道，它计算 roster 集合中男性成员年龄的总和。它使用 Stream.sum 简化操作：

int sum = roster
                .stream()
                .filter(p -> p.getGender() == Person.Sex.MALE)
                .mapToInt(Person::getAge)
                .sum();

1
2
3
4
5

将其与以下管道进行比较，该管道使用该 Stream.reduce 操作来计算相同的值：

Integer totalAge = roster
                .stream()
                .map(Person::getAge)
                .reduce(
                        0,
                        (a, b) -> a + b);

1
2
3
4
5
6

reduce 这个例子中的操作有两个参数：

identity：

标识元素既是 reduce 的初始值，也是流中没有元素的默认结果。在这个例子中，标识元素是 0; 如果 roster 集合中不存在成员，则这是年龄总和和默认值的初始值。
accumulator：

累加器函数有两个参数：reduce 的部分结果（在本例中为所有已处理整数的总和）和流的下一个元素（在本例中为整数）。它返回一个新的部分结果。在这个例子中，累加器函数是一个 lambda 表达式，它添加了两个 Integer 值并返回一个 Integer 值：
```
（a，b）→a + b
```
1
这样写就明白了。
```
roster
.stream()
.map(Person::getAge)
.reduce(
    0,
    (a, b) -> {
        return a + b;
    });
```
1
2
3
4
5
6
7
8
reduce 通用的提供操作，这个累加器的第一个参数就是上一次计算的结果，和下一个元素的值

reduce 操作始终返回一个新值。但是，累加器函数每次处理流的元素时都会返回一个新值。假设你想把一个流的元素 reduce 到一个更复杂的对象，比如一个集合。这可能会妨碍您的应用程序的性能。如果您的 reduce 操作涉及向集合中添加元素，则每当您的累加器函数处理元素时，都会创建一个包含该元素的新集合，效率低下。相反，更新现有的集合会更有效率。你可以用 Stream.collect ,下一节描述的方法来做到这一点。

# Stream.collect 方法

与 reduce 处理元素时始终创建新值的方法不同，collect 方法修改或改变现有值。

考虑如何找到流中的平均值。您需要两个数据：总数值和这些值的总和。但是，与 reduce 方法和所有其他约简方法一样，该 collect 方法只返回一个值。您可以创建一个包含成员变量的新数据类型，这些成员变量跟踪值的总数和这些值的总和，如以下类 Averager：

public class Averager implements IntConsumer {
    private int total = 0;
    private int count = 0;

    public double average() {
        return count > 0 ? ((double) total) / count : 0;
    }

    @Override
    public void accept(int i) {
        total += i;
        count++;
    }

    public void combine(Averager other) {
        total += other.total;
        count += other.count;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

下面的管道使用 Averager 类和 collect 方法来计算所有男性成员的平均年龄：

Averager averageCollect = roster.stream()
        .filter(p -> p.getGender() == Person.Sex.MALE)
        .map(Person::getAge)
        .collect(Averager::new, Averager::accept, Averager::combine);

System.out.println("Average age of male members: " +
                           averageCollect.average());

1
2
3
4
5
6
7

collect这个例子中的操作有三个参数：

supplier：

供应商是工厂职能; 它构造了新的实例。对于 collect 操作，它创建结果容器的实例。在这个例子中，它是这个 Averager 类的一个新实例。
accumulator:

累加器函数将流元素合并到结果容器中。在这个例子中，它 Averager 通过将 count 变量加 1 来修改结果容器，并向 total 成员变量添加流元素的值，该元素是表示男性成员年龄的整数。
combiner：

组合函数需要两个结果容器并合并它们的内容。在这个例子中，修改一个 Averager 通过递增结果容器 count 由变量 count 的其他的成员变量 Averager 实例，并增加了 total 构件变量的其他的值 Averager 实例的 total 成员变量。---- 这个没有明白是什么？？？？？

请注意以下几点：

供应商是 lambda 表达式（或方法引用），而不是像 reduce 操作中的标识元素那样的值。
累加器和组合器功能不返回一个值。
您可以使用 collect 并行流的操作; 有关更多信息，请参见 Parallelism 部分。（如果 collect 使用并行流运行该方法，那么只要组合器函数创建一个新对象（如 Averager 本例中的一个对象），JDK 就会创建一个新线程，因此您不必担心同步。

尽管 JDK 为您提供了 average 计算流中元素平均值的 collect 操作，但是如果您需要从流元素计算多个值，则可以使用 collect 操作和自定义类。

该 collect 操作最适合收藏。以下示例使用以下 collect 操作将男性成员的姓名放入集合中：

        List<String> namesOfMaleMembersCollect = roster
                .stream()
                .filter(p -> p.getGender() == Person.Sex.MALE)
                .map(p -> p.getName())
                .collect(Collectors.toList());

1
2
3
4
5

这个版本的 collect 操作需要一个 Collector 类型的参数。该类在 collect 需要三个参数（供应商，累加器和组合器函数）的操作中封装用作参数的函数。

Collectors 类包含了许多有用的 reduce 操作，如累加元件到集合并且根据不同的标准总结元件。这些约简操作返回 Collector 类的实例，所以可以将它们用作 collect 操作的参数。

这个例子使用 Collectors.toList 操作，它将流元素累加到一个新的实例中 List。与 Collectors 类中的大多数操作一样，toList 操作符返回的 Collector 不是集合的实例。

以下示例 roster 按性别分组收集成员：

Map<Person.Sex, List<Person>> byGender =
        roster
                .stream()
                .collect(
                        Collectors.groupingBy(Person::getGender));

1
2
3
4
5

groupingBy 操作返回一个 Map，其键是通过应用指定的 lambda 表达式作为其参数（称为分类函数）而得到的值。在这个例子中，返回的 map 包含两个键，Person.Sex.MALE 和 Person.Sex.FEMALE。键的相应值是 List 包含流分析元素的实例，当由分类函数处理时，该元素对应于键值。例如，对应于键的值 Person.Sex.MALE 是 List 包含所有男性成员的实例。

以下示例检索 roster 集合中每个成员的名称，并按性别进行分组：

Map<Person.Sex, List<String>> namesByGender =
        roster
                .stream()
                .collect(
                        Collectors.groupingBy(
                                Person::getGender,
                                Collectors.mapping(
                                        Person::getName,
                                        Collectors.toList())));

1
2
3
4
5
6
7
8
9

groupingBy 在这个例子中的操作需要两个参数，一个分类函数和一个 Collector 实例。Collector 参数称为 下游收集器。这是 Java 运行时应用于其他收集器结果的收集器。因此，此 groupingBy 操作使您可以将 collect 方法应用于 List 由 groupingBy 操作员创建的值。此示例应用收集器 mapping，该收集器将映射函数应用于 Person::getName 流的每个元素。因此，结果流只包含成员的名称。包含一个或多个下游收集器的管道（如本例）称为多级reduce。

以下示例检索每个性别成员的总年龄：

Map<Person.Sex, Integer> totalAgeByGender =
        roster
                .stream()
                .collect(
                        Collectors.groupingBy(
                                Person::getGender,
                                Collectors.reducing(
                                        0,
                                        Person::getAge,
                                        Integer::sum)));

1
2
3
4
5
6
7
8
9
10

reducing 操作有三个参数：

identity：

与 Stream.reduce 一样，标识元素既是 reduce 的初始值，也是流中没有元素的默认结果。在这个例子中，标识元素是 0; 如果 roster 集合中不存在成员，则这是年龄总和和默认值的初始值。
mapper：

reducing 操作将此映射器函数应用于所有流元素。在这个例子中，mapper 检索每个成员的年龄。
operation：

操作函数用于 reduce 映射值。在这个例子中，操作函数添加了 Integer 值。

以下示例检索每个性别成员的平均年龄：

 Map<Person.Sex, Double> averageAgeByGender = roster
                .stream()
                .collect(
                        Collectors.groupingBy(
                                Person::getGender,
                                Collectors.averagingInt(Person::getAge)
                        ));

1
2
3
4
5
6
7

← 概述 parallelism →