如果您想要逐字節地從磁盤讀取數據,與每次直接從磁盤讀取每個字節相比,使用緩沖區IO技術,我們可以一次將一個數據塊讀入緩沖區,然后消費者可以以任何您想要的方式從緩沖區讀取數據。通過減少繁重的系統調用,性能將得到提高
最近一年各大中小廠都在搞"優化",說到優化,目的還是"降本增效",降低成本,增加效益(效率)。
技術層面,也有一些降本增效的常規操作。
比如池化、io緩沖區技術
|
golang |
C# |
eg. |
池化技術 |
snnc.Pool |
ObjectPool |
前端切圖仔,歸入前端資源池 , 隨用隨取 |
字節數組緩沖區 |
bytes.Buffer |
List |
--- |
io緩沖區 |
bufio |
BufferStream |
適度超前,賽道埋伏 |
池化技術 sync.Pool
sync.Pool位于標準庫,該文件提供了對臨時對象的重復使用能力, 避免了頻繁的gc, 對并發協程是安全的。
該文件只有三個控制點:
- • New: 默認的臨時對象
- • Get:從池中哪一個臨時對象
- • Put:放回池中,以重用
下面使用基準測試進行b.N*1000次運算時的內存消耗。
package mAIn
import (
"sync"
"testing"
)
type Person struct {
Age int
}
var (
personPool = sync.Pool{
New: func() interface{} { // 設置默認值
return &Person{}
},
}
)
func ExampleObjPool() {
var p *Person
for i := 0; i < 1000; i++ {
for j := 0; j < 1000; j++ {
p = personPool.Get().(*Person)
p.Age = i + 1
personPool.Put(p)
}
}
p = personPool.Get().(*Person)
fmt.Println(p.Age)
// output:1000
}
func BenchmarkWithoutPool(b *testing.B) {
var p *Person
b.ReportAllocs()
b.ResetTimer()
for i := 0; i < b.N; i++ {
for j := 0; j < 1000; j++ {
p = new(Person) // 每次均產生臨時對象
p.Age = 23
}
}
}
func BenchmarkWithPool(b *testing.B) {
var p *Person
b.ReportAllocs()
b.ResetTimer()
for i := 0; i < b.N; i++ {
for j := 0; j < 1000; j++ {
p = personPool.Get().(*Person) // 從池中復用對象
p.Age = 23
personPool.Put(p) // 放回以重用
}
}
}
測試結果如下,sync.Pool[重用臨時對象]的性能可見一斑。
圖片
bytes.Buffer
golang很多方法內充斥了[]byte, 就連最常規的序列化/反序列化,返回值/參數都是[]byte, 但是slice是一個冷冰冰的數據結構,沒有得心趁手的操作行為,還有很多陷阱。
func Marshal(v any) ([]byte, error)
func Unmarshal(data []byte, v any)
A bytes.Buffer is a variable-sized buffer of bytes with Read and Write methods.
坦白講bytes.Buffer并非底層優化機制, 實際提供了一個友好操作slice的方式。
下面的"abcd"字符串,先讀取首字符、后面追加字符"e":
var b bytes.Buffer
b.Write([]byte("abcd")) // 寫入之后,自動擴容
rdbuf := make([]byte, 1)
_, err := b.Read(rdbuf) // 讀取一個字節的數據,移動讀off指針
if err != nil {
panic(err)
}
fmt.Println(b.String()) // 上面讀取了一個字符,讀off已經移動,現從讀off位置轉換為string
b.WriteByte('e') // 在尾部寫字符
fmt.Println(b.String())
fmt.Printf("%d, %d n", b.Len(), b.Cap()) // Len方法返回還能讀取的字符數量,Cap返回底層buf的容量
//output:
bcd
bcde
4, 64
圖片
io緩沖區 bufio
Package bufio implements buffered I/O. It wraps an io.Reader or io.Writer object, creating another object (Reader or Writer) that also implements the interface but provides buffering and some help for textual I/O.
圖片
首先我們需要知道當應用程序執行IO操作(從文件、網絡和數據庫讀取或寫入數據),它將觸發底層的系統調用,從性能角度來看,這很繁重。
緩沖IO是一種技術,用于在傳遞之前暫時積累IO操作的結果。這種技術可以通過減少系統調用的次數來提高程序的速度。
例如,如果您想要逐字節地從磁盤讀取數據,與每次直接從磁盤讀取每個字節相比,使用緩沖區IO技術,我們可以一次將一個數據塊讀入緩沖區,然后消費者可以以任何您想要的方式從緩沖區讀取數據。通過減少繁重的系統調用,性能將得到提高。
磁盤:1.尋址:ms(毫秒) 2.磁盤帶寬[1]:MB/s
內存:1.尋址:ns(納秒) 2. 內存帶寬[2]:GB/s
磁盤比內存在尋址上慢了10W倍,傳輸帶寬上慢了20倍。
開源的帶緩沖區的logrus日志寫入hook[3],就利用了bufio技術。
// 利用bufio針對原始io.Writer封裝成帶緩沖區的io.Writer
`s.writer = bufio.NewWriterSize(s.Writer, size)
......
if len(bs) > s.writer.Available() && s.writer.Buffered() > 0 {
if err := s.writer.Flush(); err != nil {
return err
}
}
_, err = s.writer.Write(bs)`
優化總結
- sync.Pool 復用臨時對象,減少內存分配和gc次數
- bufio利用緩沖區,減少笨重的系統調用
- 其實就是“降本增效”的體現。
引用鏈接
[1] 磁盤帶寬: https://it.sohu.com/a/580279682_121118998
[2] 內存帶寬: https://baike.baidu.com/item/內存帶寬
[3] 帶緩沖區的logrus日志寫入hook: https://Github.com/zwbdzb/logrus-bufferedWriter-hook