在這篇文章中,我們將討論 Golang 中的字符串,并查看一些不同的場景,以避免常見錯誤。讓我們深入探討!
1. 字符串是否可以為 nil?
我們已經對 Golang 中的字符串有了基本的了解,但我們可以從 Golang 字符串不能為 nil
開始,除非您使用指向字符串的指針。
如下代碼所示,當我們創建一個字符串變量時,默認值必須是空的""。如果我們用 nil
值初始化字符串變量,我們將面臨在變量聲明中不能使用 nil
作為字符串值的錯誤。例如:
func mAIn() {
var s string
s = nil // Cannot use 'nil' as the type string
fmt.Println(s)
}
編譯器會提示我們不能使用 nil
賦予 string
類型。因此,我們可以只是定義變量,或者使用""作為默認值:
func main() {
var s string
var ss = ""
fmt.Println(s, ss)
}
如果我們堅持在字符串類型變量中使用 nil
值,則應使用指針,如下所示:
func main() {
var s *string
fmt.Println(s)
}
這個時候輸出則為:
<nil>
但是,我們必須謹慎使用這種方法。每次要為變量賦值時,我們都必須編寫更多的代碼,而且在賦新值之前還要檢查是否有零值或前一個值。
func main() {
var s *string
tmp := "hello"
s = &tmp
fmt.Printf("address: %+v, value: %s", s, *s)
}
這個時候打印出來 s 的地址以及所指向的值:
address: 0xc00008a030, value: hello
2. 字符串是不可變的
Golang 中的字符串是不可變的,這意味著我們不能更改每個字符的值。例如:
func main() {
tmp := "hello"
tmp[0] = 'J'
fmt.Println(tmp)
}
上述代碼會導致編譯時錯誤,因為無法賦值給 tmp[0]
。
更改字符串中單個字符的常見錯誤如下:
func main() {
tmp := "hello"
tbs := []byte(tmp)
tbs[0] = 'J'
fmt.Println(string(tbs))
chi := "你好"
chiTBS := []byte(chi)
chiTBS[0] = 'J'
fmt.Println(string(chiTBS))
}
輸出為:
Jello
J??好
雖然第一個輸出顯示的結果符合我們的預期,但這并不是更改某個字符的正確方法。
這是因為我們打算修改的單個部分可能存儲在多個字節中,即使你想將變量轉換為符文類型并更改你想要的部分,我也不得不說,這是不可能做到的,因為它可能被放置在多個符文中,我們需要謹慎行事!
3. 字符串是字節數組
在 Golang 中,字符串由字節(字節的片段)組成,某些字符需要存儲在多個字節中,例如:"♥"。
因此,當需要確定一個字符串類型變量的長度時,我們必須謹慎編碼。例如
func main() {
tmp := "¥"
fmt.Println("bytes: ", len(tmp))
fmt.Println("runes: ", utf8.RuneCountInString(tmp))
}
len
函數返回的是字符串的字節數,而不是字符數。當我們需要找出字符串的符文數時,可以使用 uft8.RuneCountIntString()
函數。
另一個常見的誤解是使用 uft8.RuneCountIntString()
來確定字符數,但這并不是在任何情況下都正確,因為一個字符串變量可能跨越多個符文。請看這個例子:
func main() {
tmp := "??"
fmt.Println("bytes: ", len(tmp))
fmt.Println("runes: ", utf8.RuneCountInString(tmp))
}
輸出為:
bytes: 6
runes: 2
4. 字符串索引和forrange
在 Golang 中,使用索引檢索字符串的單個部分將為我們提供字符的 uint
值,并且只能檢索第一個字節。但在字符串變量的 for
循環中,我們可以訪問每個字符的符值:
func main() {
tmp := "?¥%……&*"
fmt.Printf("char at 0 index, has type %T and value is %+vn", tmp[0], tmp[0])
for _, t := range tmp {
fmt.Printf("value is %+v type is %Tn", t, t)
}
}
輸出:
char at 0 index, has type uint8 and value is 226
value is 10084 type is int32
value is 65509 type is int32
value is 37 type is int32
value is 8230 type is int32
value is 8230 type is int32
value is 38 type is int32
value is 42 type is int32
在對字符串進行迭代時,還要注意變量中可能存在的非 UTF8 字符,如果 Golang 無法將其理解為 UTF8,則會使用 unicode 替換而非實際值。
5. 字符串平等
在 Golang 中,我們總是可以使用 ==
來檢查簡單的字符串是否相等,但如果我們的變量存在隱藏點,則應在比較兩個字符串變量之前使用 unicode
規范包將其規范化:
func main() {
cafe1 := "Café"
cafe2 := "Cafeu0301"
normalizeCafe1 := norm.NFC.String(cafe1)
normalizeCafe2 := norm.NFC.String(cafe2)
fmt.Println(cafe1 == cafe2)
fmt.Println(normalizeCafe1 == normalizeCafe2)
}
6. 高效字符串構建
使用“+”
連接大量字符串的效率可能非常低。使用 strings.Builder
是高效構建字符串的最佳方法之一:
func main() {
sb := strings.Builder{}
for i := 0; i < 1000; i++ {
sb.WriteString("hello ")
}
result := sb.String()
fmt.Println(result)
}
與傳統的 + 連接方法相比,這種方法速度更快,內存消耗更少,而且可以避免創建不必要的中間字符串。我們還可以使用 bytes.Buffer
軟件包來實現這一目標。
總結
-
字符串的默認值是"" -
len
和RuneCountIntString
函數具有不同的行為 -
我們應該小心 for 循環和字符串 -
字符串相等是我們需要更精確的地方