在上两篇文章中,我主要为你讲解了与go
语句、goroutine 和 Go 语言调度器有关的知识和技法。
内容很多,你不用急于完全消化,可以在编程实践过程中逐步理解和感悟,争取夯实它们。
现在,让我们暂时走下神坛,回归民间。我今天要讲的if
语句、for
语句和switch
语句都属于 Go 语言的基本流程控制语句。它们的语法看起来很朴素,但实际上也会有一些使用技巧和注意事项。我在本篇文章中会以一系列面试题为线索,为你讲述它们的用法。
那么,今天的问题是:使用携带range
子句的for
语句时需要注意哪些细节? 这是一个比较笼统的问题。我还是通过编程题来讲解吧。
本问题中的代码都被放在了命令源码文件 demo41.go 的main
函数中的。为了专注问题本身,本篇文章中展示的编程题会省略掉一部分代码包声明语句、代码包导入语句和main
函数本身的声明部分。
1 | numbers1 := []int{1, 2, 3, 4, 5, 6} |
我先声明了一个元素类型为int
的切片类型的变量numbers1
,在该切片中有 6 个元素值,分别是从1
到6
的整数。我用一条携带range
子句的for
语句去迭代numbers1
变量中的所有元素值。
在这条for
语句中,只有一个迭代变量i
。我在每次迭代时,都会先去判断i
的值是否等于3
,如果结果为true
,那么就让numbers1
的第i
个元素值与i
本身做按位或的操作,再把操作结果作为numbers1
的新的第i
个元素值。最后我会打印出numbers1
的值。
所以具体的问题就是,这段代码执行后会打印出什么内容?
这里的典型回答是:打印的内容会是[1 2 3 7 5 6]
。
问题解析
你心算得到的答案是这样吗?让我们一起来复现一下这个计算过程。
当for
语句被执行的时候,在range
关键字右边的numbers1
会先被求值。这个位置上的代码被称为range
表达式。range
表达式的结果值可以是数组、数组的指针、切片、字符串、字典或者允许接收操作的通道中的某一个,并且结果值只能有一个。
对于不同种类的range
表达式结果值,for
语句的迭代变量的数量可以有所不同。就拿我们这里的numbers1
来说,它是一个切片,那么迭代变量就可以有两个,右边的迭代变量代表当次迭代对应的某一个元素值,而左边的迭代变量则代表该元素值在切片中的索引值。
那么,如果像本题代码中的for
语句那样,只有一个迭代变量的情况意味着什么呢?这意味着,该迭代变量只会代表当次迭代对应的元素值的索引值。
更宽泛地讲,当只有一个迭代变量的时候,数组、数组的指针、切片和字符串的元素值都是无处安放的,我们只能拿到按照从小到大顺序给出的一个个索引值。
因此,这里的迭代变量i
的值会依次是从0
到5
的整数。当i
的值等于3
的时候,与之对应的是切片中的第 4 个元素值4
。对4
和3
进行按位或操作得到的结果是7
。这就是答案中的第 4 个整数是7
的原因了。
现在,我稍稍修改一下上面的代码。我们再来估算一下打印内容。
1 | numbers2 := [...]int{1, 2, 3, 4, 5, 6} |
注意,我把迭代的对象换成了numbers2
。numbers2
中的元素值同样是从1
到6
的 6 个整数,并且元素类型同样是int
,但它是一个数组而不是一个切片。
在for
语句中,我总是会对紧挨在当次迭代对应的元素后边的那个元素,进行重新赋值,新的值会是这两个元素的值之和。当迭代到最后一个元素时,我会把此range
表达式结果值中的第一个元素值,替换为它的原值与最后一个元素值的和,最后,我会打印出numbers2
的值。
对于这段代码,我的问题依旧是:打印的内容会是什么?你可以先思考一下。
好了,我要公布答案了。打印的内容会是[7 3 5 7 9 11]
。我先来重现一下计算过程。当for
语句被执行的时候,在range
关键字右边的numbers2
会先被求值。
这里需要注意两点:
range
表达式只会在for
语句开始执行时被求值一次,无论后边会有多少次迭代;range
表达式的求值结果会被复制,也就是说,被迭代的对象是range
表达式结果值的副本而不是原值。
基于这两个规则,我们接着往下看。在第一次迭代时,我改变的是numbers2
的第二个元素的值,新值为3
,也就是1
和2
之和。
但是,被迭代的对象的第二个元素却没有任何改变,毕竟它与numbers2
已经是毫不相关的两个数组了。因此,在第二次迭代时,我会把numbers2
的第三个元素的值修改为5
,即被迭代对象的第二个元素值2
和第三个元素值3
的和。
以此类推,之后的numbers2
的元素值依次会是7
、9
和11
。当迭代到最后一个元素时,我会把numbers2
的第一个元素的值修改为1
和6
之和。
好了,现在该你操刀了。你需要把numbers2
的值由一个数组改成一个切片,其中的元素值都不要变。为了避免混淆,你还要把这个切片值赋给变量numbers3
,并且把后边代码中所有的numbers2
都改为numbers3
。
问题是不变的,执行这段修改版的代码后打印的内容会是什么呢?如果你实在估算不出来,可以先实际执行一下,然后再尝试解释看到的答案。提示一下,切片与数组是不同的,前者是引用类型的,而后者是值类型的。
解释如下:
- 数组的
range
表达式在循环开始时求值一次,返回的是数组的副本,后续对数组的修改不会影响到这个副本。 - 切片的
range
表达式同样求值一次,但切片本身是引用类型,修改会影响原始切片。
我们可以先接着讨论后边的内容,但是我强烈建议你一定要回来,再看看我留给你的这个问题,认真地思考和计算一下。
代码如下:
1 | package main |
运行结果如下:
知识扩展
问题 1:switch
语句中的switch
表达式和case
表达式之间有着怎样的联系?
先来看一段代码。
1 | value1 := [...]int8{0, 1, 2, 3, 4, 5, 6} |
我先声明了一个数组类型的变量value1
,该变量的元素类型是int8
。在后边的switch
语句中,被夹在switch
关键字和左花括号{
之间的是1 + 3
,这个位置上的代码被称为switch
表达式。这个switch
语句还包含了三个case
子句,而每个case
子句又各包含了一个case
表达式和一条打印语句。
所谓的case
表达式一般由case
关键字和一个表达式列表组成,表达式列表中的多个表达式之间需要有英文逗号,
分割,比如,上面代码中的case value1[0], value1[1]
就是一个case
表达式,其中的两个子表达式都是由索引表达式表示的。
另外的两个case
表达式分别是case value1[2], value1[3]
和case value1[4], value1[5], value1[6]
。
此外,在这里的每个case
子句中的那些打印语句,会分别打印出不同的内容,这些内容用于表示case
子句被选中的原因,比如,打印内容0 or 1
表示当前case
子句被选中是因为switch
表达式的结果值等于0
或1
中的某一个。另外两条打印语句会分别打印出2 or 3
和4 or 5 or 6
。
现在问题来了,拥有这样三个case
表达式的switch
语句可以成功通过编译吗?如果不可以,原因是什么?如果可以,那么该switch
语句被执行后会打印出什么内容。
我刚才说过,只要switch
表达式的结果值与某个case
表达式中的任意一个子表达式的结果值相等,该case
表达式所属的case
子句就会被选中。
并且,一旦某个case
子句被选中,其中的附带在case
表达式后边的那些语句就会被执行。与此同时,其他的所有case
子句都会被忽略。(不用写 break 啦)
当然了,如果被选中的case
子句附带的语句列表中包含了fallthrough
语句,那么紧挨在它下边的那个case
子句附带的语句也会被执行。
正因为存在上述判断相等的操作(以下简称判等操作),**switch
语句对switch
表达式的结果类型,以及各个case
表达式中子表达式的结果类型都是有要求的。毕竟,在 Go 语言中,只有类型相同的值之间才有可能被允许进行判等操作。**
如果switch
表达式的结果值是无类型的常量,比如1 + 3
的求值结果就是无类型的常量4
,那么这个常量会被自动地转换为此种常量的默认类型的值,比如整数4
的默认类型是int
,又比如浮点数3.14
的默认类型是float64
。
因此,由于上述代码中的switch
表达式的结果类型是int
,而那些case
表达式中子表达式的结果类型却是int8
,它们的类型并不相同,所以这条switch
语句是无法通过编译的。
再来看一段很类似的代码:
1 | value2 := [...]int8{0, 1, 2, 3, 4, 5, 6} |
其中的变量value2
与value1
的值是完全相同的。但不同的是,我把switch
表达式换成了value2[4]
,并把下边那三个case
表达式分别换为了case 0, 1
、case 2, 3
和case 4, 5, 6
。
如此一来,switch
表达式的结果值是int8
类型的,而那些case
表达式中子表达式的结果值却是无类型的常量了。这与之前的情况恰恰相反。那么,这样的switch
语句可以通过编译吗?
答案是肯定的。因为,如果case
表达式中子表达式的结果值是无类型的常量,那么它的类型会被自动地转换为switch
表达式的结果类型,又由于上述那几个整数都可以被转换为int8
类型的值,所以对这些表达式的结果值进行判等操作是没有问题的。
当然了,如果这里说的自动转换没能成功,那么switch
语句照样通不过编译。
通过上面这两道题,你应该可以搞清楚switch
表达式和case
表达式之间的联系了。由于需要进行判等操作,所以前者和后者中的子表达式的结果类型需要相同。
switch
语句会进行有限的类型转换,但肯定不能保证这种转换可以统一它们的类型。还要注意,如果这些表达式的结果类型有某个接口类型,那么一定要小心检查它们的动态值是否都具有可比性(或者说是否允许判等操作)。因为,如果答案是否定的,虽然不会造成编译错误,但是后果会更加严重:引发 panic(也就是运行时恐慌)。
问题 2:switch
语句对它的case
表达式有哪些约束?
我在上一个问题的阐述中还重点表达了一点,不知你注意到了没有,那就是:switch
语句在case
子句的选择上是具有唯一性的。正因为如此,switch
语句不允许case
表达式中的子表达式结果值存在相等的情况,不论这些结果值相等的子表达式,是否存在于不同的case
表达式中,都会是这样的结果。具体请看这段代码:
1 | value3 := [...]int8{0, 1, 2, 3, 4, 5, 6} |
变量value3
的值同value1
,依然是由从0
到6
的 7 个整数组成的数组,元素类型是int8
。switch
表达式是value3[4]
,三个case
表达式分别是case 0, 1, 2
、case 2, 3, 4
和case 4, 5, 6
。
由于在这三个case
表达式中存在结果值相等的子表达式,所以这个switch
语句无法通过编译。不过,好在这个约束本身还有个约束,那就是只针对结果值为常量的子表达式。
比如,子表达式1+1
和2
不能同时出现,1+3
和4
也不能同时出现。有了这个约束的约束,我们就可以想办法绕过这个对子表达式的限制了。再看一段代码:
1 | value5 := [...]int8{0, 1, 2, 3, 4, 5, 6} |
变量名换成了value5
,但这不是重点。重点是,我把case
表达式中的常量都换成了诸如value5[0]
这样的索引表达式。
虽然第一个case
表达式和第二个case
表达式都包含了value5[2]
,并且第二个case
表达式和第三个case
表达式都包含了value5[4]
,但这已经不是问题了。这条switch
语句可以成功通过编译。
在这个代码片段中,虽然 value5[2]
和 value5[4]
在不同的 case
中出现,但由于它们是通过索引表达式获得的,而不是直接的常量值,因此这个 switch
语句可以成功编译。
不过,这种绕过方式对用于类型判断的switch
语句(以下简称为类型switch
语句)就无效了。因为类型switch
语句中的case
表达式的子表达式,都必须直接由类型字面量表示,而无法通过间接的方式表示。代码如下:
1 | value6 := interface{}(byte(127)) |
变量value6
的值是空接口类型的。该值包装了一个byte
类型的值127
。我在后面使用类型switch
语句来判断value6
的实际类型,并打印相应的内容。
在类型 switch
中,**case
表达式必须是直接的类型字面量,不能使用变量或其他表达式**。
这里有两个普通的case
子句,还有一个default case
子句。前者的case
表达式分别是case uint8, uint16
和case byte
。你还记得吗?**byte
类型是uint8
类型的别名类型。**
因此,它们两个本质上是同一个类型,只是类型名称不同罢了。在这种情况下,这个类型switch
语句是无法通过编译的,因为子表达式byte
和uint8
重复了。好了,以上说的就是case
表达式的约束以及绕过方式,你学会了吗。
总结
我们今天主要讨论了for
语句和switch
语句,不过我并没有说明那些语法规则,因为它们太简单了。我们需要多加注意的往往是那些隐藏在 Go 语言规范和最佳实践里的细节。
这些细节其实就是我们很多技术初学者所谓的“坑”。比如,我在讲for
语句的时候交代了携带range
子句时只有一个迭代变量意味着什么。你必须知道在迭代数组或切片时只有一个迭代变量的话是无法迭代出其中的元素值的,否则你的程序可能就不会像你预期的那样运行了。
还有,range
表达式的结果值是会被复制的,实际迭代时并不会使用原值。至于会影响到什么,那就要看这个结果值的类型是值类型还是引用类型了。
说到switch
语句,你要明白其中的case
表达式的所有子表达式的结果值都是要与switch
表达式的结果值判等的,因此它们的类型必须相同或者能够都统一到switch
表达式的结果类型。如果无法做到,那么这条switch
语句就不能通过编译。
最后,同一条switch
语句中的所有case
表达式的子表达式的结果值不能重复,不过好在这只是对于由字面量直接表示的子表达式而言的。
请记住,普通case
子句的编写顺序很重要,最上边的case
子句中的子表达式总是会被最先求值,在判等的时候顺序也是这样。因此,如果某些子表达式的结果值有重复并且它们与switch
表达式的结果值相等,那么位置靠上的case
子句总会被选中。
思考题
- 在类型
switch
语句中,我们怎样对被判断类型的那个值做相应的类型转换? - 在
if
语句中,初始化子句声明的变量的作用域是什么?