热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

详解golangstring和[]byte的对比

下面由golang教程栏目给大家介绍golangstring和[]byte的对比区别,希望对需要的朋友有所帮助!golangstring和[]byte的对比为啥string和[]b

本文摘自php中文网,作者藏色散人,侵删。

下面由golang教程栏目给大家介绍golang string和[]byte的对比区别,希望对需要的朋友有所帮助!

golang string和[]byte的对比

为啥string和[]byte类型转换需要一定的代价?

为啥内置函数copy会有一种特殊情况copy(dst []byte, src string) int?
string和[]byte,底层都是数组,但为什么[]byte比string灵活,拼接性能也更高(动态字符串拼接性能对比)?

今天看了源码探究了一下。
以下所有观点都是个人愚见,有不同建议或补充的的欢迎emial我aboutme

何为string?

什么是字符串?标准库builtin的解释:

1

2

3

type string

 

string is the set of all strings of 8-bit bytes, conventionally but not necessarily representing UTF-8-encoded text. A string may be empty, but not nil. Values of string type are immutable.

简单的来说字符串是一系列8位字节的集合,通常但不一定代表UTF-8编码的文本。字符串可以为空,但不能为nil。而且字符串的值是不能改变的。
不同的语言字符串有不同的实现,在go的源码中src/runtime/string.go,string的定义如下:

1

2

3

type stringStruct struct {

    str unsafe.Pointer

    len int}

可以看到str其实是个指针,指向某个数组的首地址,另一个字段是len长度。那到这个数组是什么呢? 在实例化这个stringStruct的时候:

1

2

3

4

func gostringnocopy(str *byte) string {

    ss := stringStruct{str: unsafe.Pointer(str), len: findnull(str)}

    s := *(*string)(unsafe.Pointer(&ss))    return s

}

哈哈,其实就是byte数组,而且要注意string其实就是个struct。

何为[]byte?

首先在go里面,byte是uint8的别名。而slice结构在go的源码中src/runtime/slice.go定义:

1

2

3

type slice struct { array unsafe.Pointer

    len   int

    cap   int}

array是数组的指针,len表示长度,cap表示容量。除了cap,其他看起来和string的结构很像。
但其实他们差别真的很大。

区别

字符串的值是不能改变

在前面说到了字符串的值是不能改变的,这句话其实不完整,应该说字符串的值不能被更改,但可以被替换。 还是以string的结构体来解释吧,所有的string在底层都是这样的一个结构体stringStruct{str: str_point, len: str_len},string结构体的str指针指向的是一个字符常量的地址, 这个地址里面的内容是不可以被改变的,因为它是只读的,但是这个指针可以指向不同的地址,我们来对比一下string、[]byte类型重新赋值的区别:

1

2

s := "A1" // 分配存储"A1"的内存空间,s结构体里的str指针指向这快内存

s = "A2"  // 重新给"A2"的分配内存空间,s结构体里的str指针指向这快内存

其实[]byte和string的差别是更改变量的时候array的内容可以被更改。

1

s := []byte{1} // 分配存储1数组的内存空间,s结构体的array指针指向这个数组。s = []byte{2}  // 将array的内容改为2

因为string的指针指向的内容是不可以更改的,所以每更改一次字符串,就得重新分配一次内存,之前分配空间的还得由gc回收,这是导致string操作低效的根本原因。

string和[]byte的相互转换

将string转为[]byte,语法[]byte(string)源码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

func stringtoslicebyte(buf *tmpBuf, s string) []byte {  var b []byte

    if buf != nil && len(s) <= len(buf) {

        *buf = tmpBuf{}

        b = buf[:len(s)]

    } else {

        b = rawbyteslice(len(s))

    }

    copy(b, s)  return b

}func rawstring(size int) (s string, b []byte) {

    p := mallocgc(uintptr(size), nil, false)

 

    stringStructOf(&s).str = p  stringStructOf(&s).len = size

 

    *(*slice)(unsafe.Pointer(&b)) = slice{p, size, size}    return}

可以看到b是新分配的,然后再将s复制给b,至于为啥copy函数可以直接把string复制给[]byte,那是因为go源码单独实现了一个slicestringcopy函数来实现,具体可以看src/runtime/slice.go

将[]byte转为string,语法string([]byte)源码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

func slicebytetostring(buf *tmpBuf, b []byte) string {

    l := len(b) if l == 0 {     // Turns out to be a relatively common case.

        // Consider that you want to parse out data between parens in "foo()bar",

        // you find the indices and convert the subslice to string.

        return ""

    }   if raceenabled && l > 0 {

        racereadrangepc(unsafe.Pointer(&b[0]),

            uintptr(l),

            getcallerpc(unsafe.Pointer(&buf)),

            funcPC(slicebytetostring))

    }   if msanenabled && l > 0 {

        msanread(unsafe.Pointer(&b[0]), uintptr(l))

    }

    s, c := rawstringtmp(buf, l)

    copy(c, b)  return s

}func rawstringtmp(buf *tmpBuf, l int) (s string, b []byte) {   if buf != nil && l <= len(buf) {

        b = buf[:l]

        s = slicebytetostringtmp(b)

    } else {

        s, b = rawstring(l)

    }   return}

依然可以看到s是新分配的,然后再将b复制给s。
正因为string和[]byte相互转换都会有新的内存分配,才导致其代价不小,但读者千万不要误会,对于现在的机器来说这些代价其实不值一提。 但如果想要频繁string和[]byte相互转换(仅假设),又不会有新的内存分配,能有办法吗?答案是有的。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

package string_slicebyte_testimport (   "log"

    "reflect"

    "testing"

    "unsafe")func stringtoslicebyte(s string) []byte {

    sh := (*reflect.StringHeader)(unsafe.Pointer(&s))

    bh := reflect.SliceHeader{

        Data: sh.Data,

        Len:  sh.Len,

        Cap:  sh.Len,

    }   return *(*[]byte)(unsafe.Pointer(&bh))

}func slicebytetostring(b []byte) string {

    bh := (*reflect.SliceHeader)(unsafe.Pointer(&b))

    sh := reflect.StringHeader{

        Data: bh.Data,

        Len:  bh.Len,

    }   return *(*string)(unsafe.Pointer(&sh))

}func TestStringSliceByte(t *testing.T) {

    s1 := "abc"

    b1 := []byte("def")

    copy(b1, s1)

    log.Println(s1, b1)

 

    s := "hello"

    b2 := stringtoslicebyte(s)

    log.Println(b2)    // b2[0] = byte(99) unexpected fault address

 

    b3 := []byte("test")

    s3 := slicebytetostring(b3)

    log.Println(s3)

}

答案虽然有,但强烈推荐不要使用这种方法来转换类型,因为如果通过stringtoslicebyte将string转为[]byte的时候,共用的时同一块内存,原先的string内存区域是只读的,一但更改将会导致整个进程down掉,而且这个错误是runtime没法恢复的。

如何取舍?

既然string就是一系列字节,而[]byte也可以表达一系列字节,那么实际运用中应当如何取舍?

  • string可以直接比较,而[]byte不可以,所以[]byte不可以当map的key值。
  • 因为无法修改string中的某个字符,需要粒度小到操作一个字符时,用[]byte。
  • string值不可为nil,所以如果你想要通过返回nil表达额外的含义,就用[]byte。
  • []byte切片这么灵活,想要用切片的特性就用[]byte。
  • 需要大量字符串处理的时候用[]byte,性能好很多。

最后脱离场景谈性能都是耍流氓,需要根据实际场景来抉择。

更多golang相关技术文章,请访问go语言栏目!















以上就是详解golang string和[]byte的对比的详细内容,更多文章请关注编程笔记!!


推荐阅读
  • 本文介绍了如何使用PHP向系统日历中添加事件的方法,通过使用PHP技术可以实现自动添加事件的功能,从而实现全局通知系统和迅速记录工具的自动化。同时还提到了系统exchange自带的日历具有同步感的特点,以及使用web技术实现自动添加事件的优势。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
  • 移动端常用单位——rem的使用方法和注意事项
    本文介绍了移动端常用的单位rem的使用方法和注意事项,包括px、%、em、vw、vh等其他常用单位的比较。同时还介绍了如何通过JS获取视口宽度并动态调整rem的值,以适应不同设备的屏幕大小。此外,还提到了rem目前在移动端的主流地位。 ... [详细]
  • Android系统源码分析Zygote和SystemServer启动过程详解
    本文详细解析了Android系统源码中Zygote和SystemServer的启动过程。首先介绍了系统framework层启动的内容,帮助理解四大组件的启动和管理过程。接着介绍了AMS、PMS等系统服务的作用和调用方式。然后详细分析了Zygote的启动过程,解释了Zygote在Android启动过程中的决定作用。最后通过时序图展示了整个过程。 ... [详细]
  • Java 11相对于Java 8,OptaPlanner性能提升有多大?
    本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明,在相同的硬件环境下,Java 11相对于Java 8在垃圾回收方面表现更好,从而提升了OptaPlanner的性能。 ... [详细]
  • 本文介绍了一种在PHP中对二维数组根据某个字段进行排序的方法,以年龄字段为例,按照倒序的方式进行排序,并给出了具体的代码实现。 ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
  • 全面介绍Windows内存管理机制及C++内存分配实例(四):内存映射文件
    本文旨在全面介绍Windows内存管理机制及C++内存分配实例中的内存映射文件。通过对内存映射文件的使用场合和与虚拟内存的区别进行解析,帮助读者更好地理解操作系统的内存管理机制。同时,本文还提供了相关章节的链接,方便读者深入学习Windows内存管理及C++内存分配实例的其他内容。 ... [详细]
  • ShiftLeft:将静态防护与运行时防护结合的持续性安全防护解决方案
    ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题,而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合,ShiftLeft帮助企业实现DevSecOps的安全部分,提供高效、准确的安全能力。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
author-avatar
姓赵的妖女
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有