草庐IT

Go Slice 扩容的这些坑你踩过吗?

王中阳Go 2023-08-18 原文

前言

之前对Go语言for循环做了一次踩坑经验分享《Go for range 一不小心就掉坑里了》,大家直呼有用。

今天对切片Slice的append操作也做一次踩坑经验分享,希望对朋友们有所帮助,有用请三连支持。

知识重温

切片底层结构定义:包含指向底层数组的指针长度容量

type slice struct {
  array unsafe.Pointer
  len   int
  cap   int
}

append操作:可以是1个、多个、甚至整个切片(记得后面加…);添加元素时当容量不足,则会自动触发切片扩容机制,产生切片副本,同时指向底层数组的指针发生变化

var nums []int
nums = append(nums, 1)
nums = append(nums, 2, 3, 4)
nums2 := []int{5, 6, 7}
nums = append(nums, nums2...)
fmt.Println(nums) //[1 2 3 4 5 6 7]

案例1:传值+未扩容

先来看看下面会输出什么结果?

func main() {
  s1 := make([]int, 0, 5)
  fmt.Println("s1切片: ", s1)
  appendFunc(s1)
  fmt.Println("s1切片: ", s1)
  fmt.Println("s1切片表达式: ", s1[:5])
}

func appendFunc(s2 []int) {
  s2 = append(s2, 1, 2, 3)
  fmt.Println("s2切片: ", s2)
}

输出结果:

s1切片:  []
s2切片:  [1 2 3]
s1切片:  []
s1切片表达式:  [1 2 3 0 0]

看到这个结果,大家就会有疑问了,明明切片是引用类型,为什么s2 append了新元素后,s2是有值了但s1却还是空的,并且对s1用切片表达式却能获取到值呢?

原因分析前,我们先来看看s1和s2到底是不是同一个切片,打印地址验证下

func main() {
  s1 := make([]int, 0, 5)
  fmt.Printf("s1切片地址: %p\n", s1)
  appendFunc(s1)
  //...
}

func appendFunc(s2 []int) {
  s2 = append(s2, 1, 2, 3)
  fmt.Printf("s2切片地址: %p\n", s2)
  //...
}

输出结果:
s1切片地址: 0xc000018150
s2切片地址: 0xc000018150

看到这就得傻眼了,两个切片的地址都是同一个,s2修改后s1也应该同步修改,应该都有值啊

我们还得继续再深究一下,fmt包%p打印的这个地址,到底是谁的地址

//fmt/print.go
func (p *pp) fmtPointer(value reflect.Value, verb rune) {
  var u uintptr
  switch value.Kind() {
  case reflect.Chan, reflect.Func, reflect.Map, reflect.Ptr, reflect.Slice, reflect.UnsafePointer:
    u = value.Pointer()
  default:
    p.badVerb(verb)
    return
  }
  //...
}

//reflect/value.go
func (v Value) Pointer() uintptr {
  k := v.kind()
  switch k {
  //...
  
  case Slice:
    return (*SliceHeader)(v.ptr).Data
  }
  panic(&ValueError{"reflect.Value.Pointer", v.kind()})
}

通过分析fmt包的源码,不难发现,打印的地址,其实是切片里指向底层数组的指针存储的地址,并不是两个切片本身的地址。同时也说明这两切片是指向同一个底层数组。

原因正式分析

  1. 传值操作,s1和s2是两个不同的切片变量,但是指向底层数组的指针是同一个;
  2. 长度和容量的变化:s1 Len=0和Cap=5,后来未发生过变化;s2一开始被赋值时 Len=0和Cap=5,在append操作后,Len=3和Cap=5,同时底层数组值从[0,0,0,0,0]被修改成了[1,2,3,0,0];
  3. 输出结果,s1由于Len=0所以输出空[],而s1用切片表达式,是基于底层数组[1,2,3,0,0]进行切片,所以输出结果为[1,2,3,0,0]

案例2:传值+扩容

将案例1,append的元素个数超过切片容量,触发自动扩容,输出的结果又会是怎样的呢?

func main() {
  s1 := make([]int, 0, 5)
  fmt.Println("s1切片: ", s1)
  appendFunc(s1)
  fmt.Println("s1切片: ", s1)
  fmt.Println("s1切片表达式: ", s1[:5])
}

func appendFunc(s2 []int) {
  s2 = append(s2, 1, 2, 3, 4, 5, 6)
  fmt.Println("s2切片: ", s2)
}

输出结果:

s1切片:  []
s2切片:  [1 2 3 4 5 6]
s1切片:  []
s1切片表达式:  [0 0 0 0 0]

原因分析

  1. 发生扩容后,s2指向的底层数组会产生副本,导致s1和s2不再指向同一个底层数组;
  2. 长度和容量的变化:s2 append后Len=6、Cap=10和底层数组值为[1,2,3,4,5,6,0,0,0,0];s2的操作完全不影响s1的数据,s1仍然是Len=0、Cap=5和底层数组值为[0,0,0,0,0]
  3. 输出结果,s2由于Len=6所以输出[1,2,3,4,5,6],s1由于Len=0所以输出空[],而s1用切片表达式,是基于底层数组[0,0,0,0,0]进行切片,所以输出结果为[0,0,0,0,0]

案例3:传址+不关心扩容

上面两个传值操作的例子,不管扩容与否,都不会影响原切片s1的长度和容量。如果我们期望修改s2的同时也修改原切片s1,则需要用到切片指针,基于地址传递进行操作

func main() {
  s1 := make([]int, 0, 5)
  fmt.Println("s1切片: ", s1)
  fmt.Printf("s1切片地址: %p len:%d cap:%d\n", &s1, len(s1), cap(s1))
  appendFunc(&s1)
  fmt.Println("s1切片: ", s1)
  fmt.Println("s1切片表达式: ", s1[:5])
}

func appendFunc(s2 *[]int) {
  fmt.Printf("s2切片地址: %p len:%d cap:%d\n", s2, len(*s2), cap(*s2))
  //*s2 = append(*s2, 1, 2, 3)
  *s2 = append(*s2, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
  fmt.Printf("append后s2切片地址: %p len:%d cap:%d\n", s2, len(*s2), cap(*s2))
  fmt.Println("s2切片: ", *s2)
}

输出结果:

s1切片:  []
s1切片地址: 0xc00000c030 len:0 cap:5
s2切片地址: 0xc00000c030 len:0 cap:5
append后s2切片地址: 0xc00000c030 len:10 cap:10
s2切片:  [1 2 3 4 5 6 7 8 9 10]
s1切片:  [1 2 3 4 5 6 7 8 9 10]
s1切片表达式:  [1 2 3 4 5]

万变不离其宗,传址操作,始终操作的是同一个切片变量,append操作后,长度和容量都会同时发生变化,以及如果触发扩容,那么指向底层数组的指针,也都会同时发生变化。

总结

切片传值操作,append未触发扩容,会同时修改底层数组的值,但不会影响原切片的长度和容量;当触发扩容,那么会产生副本,后面的修改则会和原底层数组剥离开,互不影响。

如果期望在修改切片后,对原切片也发生修改,则可以使用传址操作,始终基于同一个切片变量进行操作。

文章首发

我的文章会首发在我的公众号:程序员升职加薪之旅,欢迎大家关注,第一时间收到最新内容。

一起学习

我的所有文章都会首发在我的 学习小圈子 ,欢迎加入我们,一起学习进步,一起升职加薪。

有关Go Slice 扩容的这些坑你踩过吗?的更多相关文章

  1. ruby - 为什么这些方法没有解决? - 2

    这个问题在这里已经有了答案:WhydoRubysettersneed"self."qualificationwithintheclass?(3个答案)关闭29天前。给定这段代码:classSomethingattr_accessor:my_variabledefinitialize@my_variable=0enddeffoomy_variable=my_variable+3endends=Something.news.foo我收到这个错误:test.rb:9:in`foo':undefinedmethod`+'fornil:NilClass(NoMethodError)fromtes

  2. python - 这些脚本语言中哪种更适合渗透测试? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭9年前。Improvethisquestion首先,我想避免一场关于语言的口水战。可供选择的语言有Perl、Python和Ruby。我想提一下,我对所有这些都很满意,但问题是我不能只专注于一个。例如,如果我看到一个很棒的Perl模块,我必须尝试一下。如果我看到一个不错的Python应用程序,我必须知道它是如何制作的。如果我看到RubyDSL或一些Ruby巫术,我就会迷上Ruby一段时间。目前我是一名Java开发人员,但计划在不久的将来

  3. ruby-on-rails - 这些 Ruby 版本中存在 heroku 命令吗? - 2

    在我使用rbenv更新我的Ruby版本后,我无法使用Heroku命令行工具。我收到此错误:>herokurbenv:heroku:commandnotfoundThe`heroku'commandexistsintheseRubyversions:2.0.0-p195从toolbelt.heroku.com重新安装工具带没有帮助。 最佳答案 我切换到我以前的Ruby版本2.0.0p195并卸载了gem'heroku'rbenvglobal2.0.0p195gemuninstallheroku然后我切换到最新的Ruby版本2.0.0p

  4. ruby-on-rails - 为什么我在运行 "gem pristine --all"后不断收到这些错误 - 2

    我尝试运行gempristine--all并且我不断在控制台中获取它。当我运行gempristine--all我得到这个:权限被拒绝....我什至尝试为每个gem执行geminstall并且仍然得到这个:`Ignoringbinding_of_caller-0.7.2becauseitsextensionsarenotbuilt.Try:gempristinebinding_of_caller--version0.7.2Ignoringbyebug-5.0.0becauseitsextensionsarenotbuilt.Try:gempristinebyebug--version5.

  5. ruby-on-rails - 如何改进用 `' ` 引用所有数组元素并返回包含所有这些引用和逗号分隔元素的字符串的代码? - 2

    我正在使用Rails3.2.2,我想用'引用所有数组元素并返回一个包含所有这些引用和逗号分隔元素的字符串。这时候我在用['a','b','c'].collect{|x|"'#{x}'"}.join(",")#=>"'a','b','c'"但我认为我可以改进上面的代码(也许通过使用一个我不知道的Ruby方法,如果它存在的话)。可能吗? 最佳答案 我用"'#{%w{abc}.join("','")}'"这里是扩展版:'#Startingquote%w{abc}.join("','")#Joinarraywith','delimitert

  6. ruby - 测试散列是否包含特定键以及这些键的值是否不为零 - 2

    我如何使用RSpec测试方法返回包含特定键的散列并且这些键的值不为nil? 最佳答案 我会写:describeMyObjectdodescribe"#my_method"dosubject(:my_method){MyObject.new.my_method}it{is_expected.tobe_a_kind_of(Hash)}specify{expect(my_method.keys).toinclude(:key1,:key2)}specify{expect(my_method.values).not_toinclude(ni

  7. ruby - 续集连接表,但我有重叠的列名。如何为这些列名称起别名? - 2

    这是我连接两个表的代码:DB.from(:sources).join(:payloads,:source_id=>:id)表名是:sources,:payloads。问题是有效负载中有一个:id列覆盖了:sources中的:id列。我需要使用别名,以便我只获得一个包含所有列名的大型表。然而,正如目前所写的和我的表目前的结构,:id列正在合并,第二个表优先。这有意义吗?如何创建别名,以便:sources中的:id列仍然显示? 最佳答案 要将sources.id别名为其他名称,请使用Identifieraliases..select_a

  8. ruby - 包含/扩展内核不会在主 :Object 上添加这些方法 - 2

    我正在尝试向Kernel添加一个方法模块,而不是重新打开Kernel并直接定义一个实例方法,我正在编写一个模块,我想要Kernel至extend/include那个模块。moduleTalkdefhelloputs"hellothere"endendmoduleKernelextendTalkend当我在IRB中运行它时:$helloNameError:undefinedlocalvariableormethod`hello'formain:Objectfrom(irb):12from/Users/JackC/.rvm/rubies/ruby-1.9.2-p290/bin/irb:16

  9. ruby-on-rails - `secret_token` 环境缺少 `secret_key_base` 和 'development',在 `config/secrets.yml` 中设置这些值 - 2

    当我尝试运行railsserver命令时出现错误如何解决?我的config/environments/development.rbRails.application.configuredoconfig.secret_key_base=ENV["SECRET_KEY_BASE"]#Somestuffend而且我的文件夹中没有secret.yml文件。 最佳答案 然后创建一个:配置/secrets.yml#besuretorestartyourserverwhenyoumodifythisfile...#Makesurethesecre

  10. ruby-on-rails - 使用\而不是 + 或 << 来连接这些字符串 - 2

    我正在使用rubocop基本上清理我凌乱的代码...其中一个错误是:Use\insteadof+or这是为什么?我在Rubydocumentation中找不到它.我为什么要使用\而不是+或? 最佳答案 在Ruby中,文字字符串在遇到时会作为对象分配到内存中。如果连接两个字符串文字,如str="foo"+"bar"你实际上会分配三个String对象:"foo","bar"以及连接的结果(然后由str引用)。如果你这样做,也会发生同样的情况:"foo"在许多情况下,这只是轻微的低效率,您不必太担心。但是,请注意,如果您在循环中执行此操作

随机推荐