数组

阮一峰2022年6月27日
大约 6 分钟

数组(array)是一个包含多个值的变量。成员的编号从 0 开始,数量没有上限,也没有要求成员被连续索引。

创建数组

数组可以采用逐个赋值的方法创建。

ARRAY[INDEX]=value

上面语法中,ARRAY 是数组的名字,可以是任意合法的变量名。INDEX 是一个大于或等于零的整数,也可以是算术表达式。注意数组第一个元素的下标是 0, 而不是 1。

下面创建一个三个成员的数组。

array[0]=val
array[1]=val
array[2]=val

数组也可以采用一次性赋值的方式创建。

ARRAY=(value1 value2 ... valueN)

# 等同于

ARRAY=(
  value1
  value2
  value3
)

采用上面方式创建数组时,可以按照默认顺序赋值,也可以在每个值前面指定位置。

array=(a b c)
array=([2]=c [0]=a [1]=b)

days=(Sun Mon Tue Wed Thu Fri Sat)
days=([0]=Sun [1]=Mon [2]=Tue [3]=Wed [4]=Thu [5]=Fri [6]=Sat)

只为某些值指定位置,也是可以的。

names=(hatter [5]=duchess alice)

上面例子中,hatter 是数组的 0 号位置,duchess 是 5 号位置,alice 是 6 号位置。

没有赋值的数组元素的默认值是空字符串。

定义数组的时候,可以使用通配符。

mp3s=( *.mp3 )

上面例子中,将当前目录的所有 MP3 文件,放进一个数组。

先用 declare -a 命令声明一个数组,也是可以的。

declare -a ARRAYNAME

read -a 命令则是将用户的命令行输入,读入一个数组。

read -a dice

上面命令将用户的命令行输入,读入数组 dice

读取数组

读取单个元素

读取数组指定位置的成员,要使用下面的语法。

echo ${array[i]}     # i 是索引

上面语法里面的大括号是必不可少的,否则 Bash 会把索引部分 [i] 按照原样输出。

$ array[0]=a

$ echo ${array[0]}
a

$ echo $array[0]
a[0]

上面例子中,数组的第一个元素是 a。如果不加大括号,Bash 会直接读取 $array 首成员的值,然后将 [0] 按照原样输出。

读取所有成员

@* 是数组的特殊索引,表示返回数组的所有成员。

$ foo=(a b c d e f)
$ echo ${foo[@]}
a b c d e f

这两个特殊索引配合 for 循环,就可以用来遍历数组。

for i in "${names[@]}"; do
  echo $i
done

@* 放不放在双引号之中,是有差别的。

$ activities=( swimming "water skiing" canoeing "white-water rafting" surfing )
$ for act in ${activities[@]}; \
do \
echo "Activity: $act"; \
done

Activity: swimming
Activity: water
Activity: skiing
Activity: canoeing
Activity: white-water
Activity: rafting
Activity: surfing

上面的例子中,数组 activities 实际包含 5 个元素,但是 for...in 循环直接遍历 ${activities[@]},会导致返回 7 个结果。为了避免这种情况,一般把 ${activities[@]} 放在双引号之中。

$ for act in "${activities[@]}"; \
do \
echo "Activity: $act"; \
done

Activity: swimming
Activity: water skiing
Activity: canoeing
Activity: white-water rafting
Activity: surfing

上面例子中,${activities[@]} 放在双引号之中,遍历就会返回正确的结果。

${activities[*]} 不放在双引号之中,跟 ${activities[@]} 不放在双引号之中是一样的。

$ for act in ${activities[*]}; \
do \
echo "Activity: $act"; \
done

Activity: swimming
Activity: water
Activity: skiing
Activity: canoeing
Activity: white-water
Activity: rafting
Activity: surfing

${activities[*]} 放在双引号之中,所有元素就会变成单个字符串返回。

$ for act in "${activities[*]}"; \
do \
echo "Activity: $act"; \
done

Activity: swimming water skiing canoeing white-water rafting surfing

所以,拷贝一个数组的最方便方法,就是写成下面这样。

hobbies=( "${activities[@]}" )

上面例子中,数组 activities 被拷贝给了另一个数组 hobbies

这种写法也可以用来为新数组添加成员。

hobbies=( "${activities[@]" diving )

上面例子中,新数组 hobbies 在数组 activities 的所有成员之后,又添加了一个成员。

默认位置

如果读取数组成员时,没有读取指定哪一个位置的成员,默认使用 0 号位置。

$ declare -a foo
$ foo=A
$ echo ${foo[0]}
A

上面例子中,foo 是一个数组,赋值的时候不指定位置,实际上是给 foo[0] 赋值。

引用一个不带下标的数组变量,则引用的是 0 号位置的数组元素。

$ foo=(a b c d e f)
$ echo ${foo}
a
$ echo $foo
a

上面例子中,引用数组元素的时候,没有指定位置,结果返回的是 0 号位置。

数组的长度

要想知道数组的长度(即一共包含多少成员),可以使用下面两种语法。

${#array[*]}
${#array[@]}

下面是一个例子。

$ a[100]=foo

$ echo ${#a[*]}
1

$ echo ${#a[@]}
1

上面例子中,把字符串赋值给 100 位置的数组元素,这时的数组只有一个元素。

注意,如果用这种语法去读取具体的数组成员,就会返回该成员的字符串长度。这一点必须小心。

$ a[100]=foo
$ echo ${#a[100]}
3

上面例子中,${#a[100]} 实际上是返回数组第 100 号成员 a[100] 的值(foo)的字符串长度。

提取数组序号

${!array[@]}${!array[*]},可以返回数组的成员序号,即哪些位置是有值的。

$ arr=([5]=a [9]=b [23]=c)
$ echo ${!arr[@]}
5 9 23
$ echo ${!arr[*]}
5 9 23

上面例子中,数组的 5、9、23 号位置有值。

利用这个语法,也可以通过 for 循环遍历数组。

arr=(a b c d)

for i in ${!arr[@]};do
  echo ${arr[i]}
done

提取数组成员

${array[@]:position:length} 的语法可以提取数组成员。

$ food=( apples bananas cucumbers dates eggs fajitas grapes )
$ echo ${food[@]:1:1}
bananas
$ echo ${food[@]:1:3}
bananas cucumbers dates

上面例子中,${food[@]:1:1} 返回从数组 1 号位置开始的 1 个成员,${food[@]:1:3} 返回从 1 号位置开始的 3 个成员。

如果省略长度参数 length,则返回从指定位置开始的所有成员。

$ echo ${food[@]:4}
eggs fajitas grapes

上面例子返回从 4 号位置开始到结束的所有成员。

追加数组成员

数组末尾追加成员,可以使用 += 赋值运算符。它能够自动地把值追加到数组末尾。否则,就需要知道数组的最大序号,比较麻烦。

$ foo=(a b c)
$ echo ${foo[@]}
a b c

$ foo+=(d e f)
$ echo ${foo[@]}
a b c d e f

删除数组

删除一个数组成员,使用 unset 命令。

$ foo=(a b c d e f)
$ echo ${foo[@]}
a b c d e f

$ unset foo[2]
$ echo ${foo[@]}
a b d e f

上面例子中,删除了数组中的第三个元素,下标为 2。

删除成员也可以将这个成员设为空值。

$ foo=(a b c d e f)
$ foo[1]=''
$ echo ${foo[@]}
a c d e f

上面例子中,将数组的第二个成员设为空字符串,就删除了这个成员。

由于空值就是空字符串,所以下面这样写也可以,但是不建议这种写法。

foo[1]=

上面的写法也相当于删除了数组的第二个成员。

直接将数组变量赋值为空字符串,相当于删除数组的第一个成员。

$ foo=(a b c d e f)
$ foo=''
$ echo ${foo[@]}
b c d e f

上面的写法相当于删除了数组的第一个成员。

unset ArrayName 可以清空整个数组。

$ unset ARRAY

$ echo ${ARRAY[*]}
<--no output-->

关联数组

Bash 的新版本支持关联数组。关联数组使用字符串而不是整数作为数组索引。

declare -A 可以声明关联数组。

declare -A colors
colors["red"]="#ff0000"
colors["green"]="#00ff00"
colors["blue"]="#0000ff"

整数索引的数组,可以直接使用变量名创建数组,关联数组则必须用带有 -A 选项的 declare 命令声明创建。

访问关联数组成员的方式,几乎与整数索引数组相同。

echo ${colors["blue"]}