作者:518094haha | 来源:互联网 | 2023-01-12 17:59
考虑这个基准,我们比较地图访问与交换机
var code = []int32{0, 10, 100, 100, 0, 10, 0, 10, 100, 14, 1000, 100, 1000, 0, 0, 10, 100, 1000, 10, 0, 1000, 12}
var mapCode = map[int32]int32{
0: 1,
10: 2,
100: 3,
1000: 4,
}
func BenchmarkMap(b *testing.B) {
success := int32(0)
fail := int32(0)
for n := 0; n
结果如下:
BenchmarkMap-2 5000000 277 ns/op 0 B/op 0 allocs/op
BenchmarkSwitch-2 30000000 48.2 ns/op 0 B/op 0 allocs/op
所以使用map似乎比switch更慢.
我目前正在尝试使用类似的代码来优化函数BenchmarkMap()
,其中地图访问是瓶颈,但我不能使用switch,因为当程序启动时动态生成映射(即它可能根据输入参数而改变)
有没有办法获得switch x {}
与动态生成的地图类似的性能?
1> icza..:
不使用映射,因为索引映射是在运行时计算的,并且从映射获取元素涉及的操作多于单个(切片)索引.某些switch
es(具有case
具有常量表达式的分支)可以/即使在编译时也可以优化.
但地图并不是唯一的"动态"结构.对于另一个,有切片.切片可以编入索引,就像地图一样.
是的,切片是底层数组的连续段的描述符.这意味着如果你有一个索引1000
,那么切片至少需要有1000+1 = 1001
元素.
因此,如果您愿意为了性能而牺牲一些内存并使用切片而不是地图,您甚至可以使用比使用switch
语句更快的解决方案:
var sliceCode = []int32{
0: 1,
10: 2,
100: 3,
1000: 4,
}
func BenchmarkSlice(b *testing.B) {
success := int32(0)
fail := int32(0)
for n := 0; n
基准测试结果如下:
BenchmarkMap-4 10000000 148 ns/op
BenchmarkSlice-4 100000000 17.6 ns/op
BenchmarkSwitch-4 50000000 31.0 ns/op
这个具体例子中的切片解决方案的速度是switch
解决方案的两倍!
笔记:
我上面提到过,如果你有一个索引1000
,你至少需要1001
元素.这部分是正确的.例如,如果你有类似的索引990..1000
,你可以有一个简单的索引转换逻辑index - 990
,然后只有11个元素的切片就足够了.
另请注意,在使用逗号成语索引地图时,我们可以判断元素是否在地图中.对于切片,我们没有这个选项.所以我们必须从元素类型的有效集合中指定一个值,并将其用作"缺失"信号.在上面的例子中,0
对于我们来说是完美的,因为没有使用(并且0
默认情况下未明确列出的所有元素都设置为).如果在您的示例中int32
可以使用所有有效值,则另一个选项是使用包装器或指针类型作为可能具有nil
值的切片的元素类型,指示索引的元素缺失.