map & reduce

𝑔𝑜𝑜𝑔𝑥ℎ2019年10月5日
大约 6 分钟

如果您读过 Google 的那篇大名鼎鼎的论文 “MapReduce: Simplified Data Processing on Large Clusters”open in new window(要翻墙),您就能大概明白 map/reduce 的概念。

map

举例说明,比如我们有一个函数 f(x)=x2,要把这个函数作用在一个数组 [1, 2, 3, 4, 5, 6, 7, 8, 9] 上,就可以用 map 实现如下:

map

由于 map() 方法定义在 JavaScript 的 Array 中,我们调用 Array 的 map() 方法,传入我们自己的函数,就得到了一个新的 Array 作为结果:

"use strict";

const pow = (x) => x * x;
const arr = [1, 2, 3, 4, 5, 6, 7, 8, 9];
const results = arr.map(pow);

console.log(results); // [1, 4, 9, 16, 25, 36, 49, 64, 81]

注意: map() 传入的参数是 pow,即函数对象本身。

您可能会想,不需要 map(),写一个循环,也可以计算出结果:

const f = (x) => x * x;
const arr = [1, 2, 3, 4, 5, 6, 7, 8, 9];
const result = [];

for (let i = 0; i < arr.length; i++) result.push(f(arr[i]));

的确可以,但是,从上面的循环代码,我们无法一眼看明白“把 f(x) 作用在 Array 的每一个元素并把结果生成一个新的 Array”。

所以,map() 作为高阶函数,事实上它把运算规则抽象了,因此,我们不但可以计算简单的 f(x)=x2,还可以计算任意复杂的函数,比如,把 Array 的所有数字转为字符串:

const arr = [1, 2, 3, 4, 5, 6, 7, 8, 9];

arr.map(String); // ['1', '2', '3', '4', '5', '6', '7', '8', '9']

只需要一行代码。

reduce

再看 reduce 的用法。Array 的 reduce() 把一个函数作用在这个 Array 的 [x1, x2, x3...] 上,这个函数必须接收两个参数,reduce() 把结果继续和序列的下一个元素做累积计算,其效果就是:

[x1, x2, x3, x4].reduce(f) = f(f(f(x1, x2), x3), x4);

比方说对一个 Array 求和,就可以用 reduce 实现:

const arr = [1, 3, 5, 7, 9];

arr.reduce((x, y) => x + y); // 25

要把 [1, 3, 5, 7, 9] 变换成整数 13579,reduce() 也能派上用场:

const arr = [1, 3, 5, 7, 9];

arr.reduce((x, y) => x * 10 + y); // 13579

如果我们继续改进这个例子,想办法把一个字符串 13579 先变成 Array —— [1, 3, 5, 7, 9],再利用 reduce() 就可以写出一个把字符串转换为 Number 的函数。

filter

filter 也是一个常用的操作,它用于把 Array 的某些元素过滤掉,然后返回剩下的元素。

map() 类似,Array 的 filter() 也接收一个函数。和 map() 不同的是,filter() 把传入的函数依次作用于每个元素,然后根据返回值是 true 还是 false 决定保留还是丢弃该元素。

例如,在一个 Array 中,删掉偶数,只保留奇数,可以这么写:

const arr = [1, 2, 4, 5, 6, 9, 10, 15];
const r = arr.filter((x) => x % 2 !== 0);

r; // [1, 5, 9, 15]

把一个 Array 中的空字符串删掉,可以这么写:

const arr = ["A", "", "B", null, undefined, "C", "  "];
const r = arr.filter((s) => s && s.trim());

r; // ['A', 'B', 'C']

可见用 filter() 这个高阶函数,关键在于正确实现一个“筛选”函数。

回调函数

filter() 接收的回调函数,其实可以有多个参数。通常我们仅使用第一个参数,表示 Array 的某个元素。回调函数还可以接收另外两个参数,表示元素的位置和数组本身:

const arr = ["A", "B", "C"];
const r = arr.filter((element, index, self) => {
  console.log(element); // 依次打印 'A', 'B', 'C'
  console.log(index); // 依次打印 0, 1, 2
  console.log(self); // self 就是变量 arr
  return true;
});

利用 filter,可以巧妙地去除 Array 的重复元素:

"use strict";

let r;
const arr = [
  "apple",
  "strawberry",
  "banana",
  "pear",
  "apple",
  "orange",
  "orange",
  "strawberry",
];

r = arr.filter((element, index, self) => self.indexOf(element) === index);

console.log(r.toString());

去除重复元素依靠的是 indexOf 总是返回第一个元素的位置,后续的重复元素位置与 indexOf 返回的位置不相等,因此被 filter 滤掉了。

sort

排序算法

排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个对象呢? 直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。通常规定,对于两个元素 xy,如果认为 x < y,则返回 -1,如果认为 x == y,则返回 0,如果认为 x > y,则返回 1,这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序。

JavaScript 中 Array 的 sort() 方法就是用于排序的,但是排序结果可能让您大吃一惊:

// 看上去正常的结果:
["Google", "Apple", "Microsoft"].sort(); // ['Apple', 'Google', 'Microsoft'];

// apple 排在了最后:
["Google", "apple", "Microsoft"].sort(); // ['Google', 'Microsoft", 'apple']

// 无法理解的结果:
[10, 20, 1, 2].sort(); // [1, 10, 2, 20]

第二个排序把 apple 排在了最后,是因为字符串根据 ASCII 码进行排序,而小写字母 a 的 ASCII 码在大写字母之后。

第三个排序结果是什么鬼? 简单的数字排序都能错?

这是因为 Arraysort() 方法默认把所有元素先转换为 String 再排序,结果 '10' 排在了 '2' 的前面,因为字符 '1' 比字符 '2' 的 ASCII 码小。

如果不知道 sort() 方法的默认排序规则,直接对数字排序,绝对栽进坑里!

幸运的是,sort() 方法也是一个高阶函数,它还可以接收一个比较函数来实现自定义的排序。

要按数字大小排序,我们可以这么写:

"use strict";

const arr = [10, 20, 1, 2];

arr.sort((x, y) => {
  if (x < y) return -1;
  if (x > y) return 1;
  return 0;
});
console.log(arr); // [1, 2, 10, 20]

如果要倒序排序,我们可以把大的数放前面:

const arr = [10, 20, 1, 2];

arr.sort((x, y) => {
  if (x < y) return 1;
  if (x > y) return -1;

  return 0;
}); // [20, 10, 2, 1]

默认情况下,对字符串排序,是按照 ASCII 的大小比较的,现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能定义出忽略大小写的比较算法就可以:

const arr = ["Google", "apple", "Microsoft"];

arr.sort((s1, s2) => {
  x1 = s1.toUpperCase();
  x2 = s2.toUpperCase();

  if (x1 < x2) return -1;
  if (x1 > x2) return 1;

  return 0;
}); // ['apple', 'Google', 'Microsoft']

忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。

从上述例子可以看出,高阶函数的抽象能力是非常强大的,而且,核心代码可以保持得非常简洁。

最后友情提示,sort() 方法会直接对 Array 进行修改,它返回的结果仍是当前 Array:

const a1 = ["B", "A", "C"];
const a2 = a1.sort();

a1; // ['A', 'B', 'C']
a2; // ['A', 'B', 'C']
a1 === a2; // true, a1 和 a2 是同一对象