解釋
String
Go語言中,string
就是只讀的采用utf8
編碼的字節切片(slice) 因此用len
函數獲取到的長度并不是字符個數,而是字節個數。 for循環遍歷輸出的也是各個字節。
rune
rune
是int32
的別名,代表字符的Unicode編碼,采用4個字節存儲,將string
轉成rune
就意味著任何一個字符都用4個字節來存儲其unicode值,這樣每次遍歷的時候返回的就是unicode值,而不再是字節了,這樣就可以解決亂碼問題了
byte
bytes操作的對象也是字節切片,與string的不可變不同,byte是可變的,因此string按增量方式構建字符串會導致多次內存分配和復制,使用bytes就不會因而更高效一點
轉換方式
String、bytes 相互轉換
String to bytes
func mAIn() {
str := "Hello, Golang!"
fmt.Println(string2bytes1(str))
fmt.Println(string2bytes2(str))
fmt.Println(string2bytes3(str))
}
func string2bytes1(str string) []byte {
bs := make([]byte, 0)
for i := 0; i < len(str); i++ {
bs = Append(bs, str[i])
}
return bs
}
func string2bytes2(str string) []byte {
return []byte(str)
}
func string2bytes3(s string) []byte {
sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
bh := reflect.SliceHeader{
Data: sh.Data,
Len: sh.Len,
Cap: sh.Len,
}
return *(*[]byte)(unsafe.Pointer(&bh))
}
前兩個方法是非常標準的轉換方式,第三種方式使用了 unsafe
和 reflect
處理,是個不安全的做法,而且 StringHeader
在我使用的 1.21 已經廢棄了。
bytes to String
func main() {
str := "Hello, Golang!"
bs := string2bytes3(str)
fmt.Println(bytes2string1(bs))
fmt.Println(bytes2string2(bs))
}
func bytes2string1(bs []byte) string {
return string(bs)
}
func bytes2string2(bs []byte) string {
return *(*string)(unsafe.Pointer(&bs))
}
第一種轉換也是一個非常標準的轉換方式,第二個方式使用了不安全的做法。
String、rune 相互轉換
String to rune
func main() {
str := "Hello, 中國!"
fmt.Println(string2rune1(str))
fmt.Println(string2rune2(str))
}
func string2rune1(str string) []rune {
rs := make([]rune, 0)
for _, r := range str {
rs = append(rs, r)
}
return rs
}
func string2rune2(str string) []rune {
return []rune(str)
}
這里的 for range
和上面 for index
是不一樣的,索引字符串產生字節。For range 循環每次迭代都會解碼一個 UTF-8 編碼的符文,因此值類型是 rune。
rune to String
func main() {
str := "Hello, 中國!"
rs := string2rune2(str)
fmt.Println(rune2string1(rs))
}
func rune2string1(rs []rune) string {
return string(rs)
}
rune、bytes 相互轉換
[]rune 和 []byte 的相互轉換需要先轉成字符串再轉換。
func main() {
str := "Hello, 中國!"
rs := string2rune1(str)
bs := string2bytes1(str)
convertedBytes := rune2bytes(rs)
convertedRunes := bytes2rune(bs)
fmt.Println(bs)
fmt.Println(convertedBytes)
fmt.Println(rs)
fmt.Println(convertedRunes)
}
func rune2bytes(rs []rune) []byte {
return []byte(string(rs))
}
func bytes2rune(bs []byte) []rune {
return []rune(string(bs))
}
總結
希望大家通過這篇文章可以鞏固自己對這幾種類型的理解,以及更方便的對它們進行轉換。