面試官:請說一下如何優(yōu)化結(jié)構(gòu)體性能?
這篇繼續(xù)分享進(jìn)階內(nèi)容:
結(jié)構(gòu)體的定義,大家都很熟悉,想要定義出更節(jié)省內(nèi)存空間的結(jié)構(gòu)體,可不是一件簡單的事。
我們必須掌握Go的結(jié)構(gòu)體內(nèi)存對齊機(jī)制,才能做出相應(yīng)的優(yōu)化:節(jié)省內(nèi)存并提高性能。
先來看個(gè)例子
下面定義兩個(gè)結(jié)構(gòu)體,字段都一樣,只是部分字段稍微調(diào)整了一下順序。
但輸出的結(jié)果卻完全不同:一個(gè)順序調(diào)整就節(jié)省了8個(gè)字節(jié),太神奇了。
type BadSt struct {
A int32
B int64
C bool
}
type GoodSt struct {
A int32
C bool
B int64
}
func main() {
bad := BadSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(bad))//輸出結(jié)果:24
good := GoodSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(good))//輸出結(jié)果:16
}
為什么bad占用24字節(jié),而good卻只占用16字節(jié)呢?
想要解開這個(gè)問題,我們得先來學(xué)習(xí)一下內(nèi)存對齊機(jī)制,然后再來進(jìn)一步分析。
原理講解
基本概念
為了能讓CPU可以更快的存儲、讀取到各個(gè)字段,Go編譯器會幫我們把結(jié)構(gòu)體做數(shù)據(jù)的對齊。
所謂的數(shù)據(jù)對齊,是指內(nèi)存地址的大小是所存儲數(shù)據(jù)大小的整數(shù)倍(按字節(jié)為單位),以便CPU可以一次將該數(shù)據(jù)從內(nèi)存中讀取出來,減少了讀取次數(shù)。
編譯器通過在結(jié)構(gòu)體的各個(gè)字段之間填充一些空白,來達(dá)到對齊的目的。
CPU訪問內(nèi)存
CPU 訪問內(nèi)存時(shí),并不是逐個(gè)字節(jié)訪問,而是以機(jī)器字(word)為單位進(jìn)行訪問。
比如 64位CPU的字長(word size)為8bytes,那么CPU訪問內(nèi)存的單位也是8字節(jié),每次加載的內(nèi)存數(shù)據(jù)也是固定的若干字長,如8words(64bytes)、16words(128bytes)等
對齊系數(shù)
不同硬件平臺占用的大小和對齊值都可能是不一樣的,每個(gè)特定平臺上的編譯器都有自己的默認(rèn)"對齊系數(shù)",32位系統(tǒng)對齊系數(shù)是4,64位系統(tǒng)對齊系數(shù)是8
不同類型的對齊系數(shù)也可能不一樣,使用Go語言中的unsafe.Alignof函數(shù)可以返回相應(yīng)類型的對齊系數(shù),對齊系數(shù)都符合2^n這個(gè)規(guī)律,最大也不會超過8
func main() {
fmt.Printf("bool: %d\n", unsafe.Alignof(bool(true)))
fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
fmt.Printf("int: %d\n", unsafe.Alignof(int(0)))
fmt.Printf("int32: %d\n", unsafe.Alignof(int32(0)))
fmt.Printf("int64: %d\n", unsafe.Alignof(int64(0)))
fmt.Printf("float64: %d\n", unsafe.Alignof(float64(0)))
fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//輸出結(jié)果:
//bool: 1
//string: 8
//int: 8
//int32: 4
//int64: 8
//float64:8
//float32:4
對齊原則
結(jié)構(gòu)體變量中成員的偏移量必須是成員大小的整數(shù)倍
整個(gè)結(jié)構(gòu)體的內(nèi)存大小必須是最大字節(jié)的整數(shù)倍(結(jié)構(gòu)體的內(nèi)存占用是1/4/8/16byte…)
案例分析
type BadSt struct {
A int32
B int64
C bool
}
BadSt結(jié)構(gòu)體,占用24個(gè)字節(jié)
分析過程:
字段A 4字節(jié):先計(jì)算偏移量,最開頭下標(biāo)為0,0%4=0,正好整除,先占用4個(gè)字節(jié);
字段B 8字節(jié):下標(biāo)4-7,對8都不能整除,則填充空白,下標(biāo)8可以整除,所以下標(biāo)8-15 8個(gè)字節(jié)為字段B的存儲使用;
字段C 1字節(jié):下標(biāo)16,對1可以整除,所以下標(biāo)16則用作字段C的存儲;
最后,該結(jié)構(gòu)體字段最大字節(jié)為8且目前已占用17字節(jié),要保證是整數(shù)倍,所以最后面需要填充7個(gè)字節(jié),占滿24字節(jié),才能滿足條件(對齊原則2)。
GoodSt結(jié)構(gòu)體,占用16個(gè)字節(jié)
type GoodSt struct {
A int32
C bool
B int64
}
分析過程:
字段A 4字節(jié):先計(jì)算偏移量,最開頭下標(biāo)為0,0%4=0,正好整除,先占用4個(gè)字節(jié);
字段C 1字節(jié):下標(biāo)4,對1可以整除,所以下標(biāo)4則用作字段C的存儲;
字段B 8字節(jié):下標(biāo)5-7,對8都不能整除,則填充空白,下標(biāo)8可以整除,所以下標(biāo)8-15 8個(gè)字節(jié)為字段B的存儲使用;
最后,該結(jié)構(gòu)體字段最大字節(jié)為8且目前已占用16字節(jié),正好是整數(shù)倍,所以后面不再需要填充空白了。
總結(jié)
通過上文的原理講解和案例分析,我們發(fā)現(xiàn)內(nèi)存對齊機(jī)制并不復(fù)雜。
可以簡單理解為:將對齊系數(shù)小的字段,盡可能放在一起,盡量減少空白填充。
掌握了內(nèi)存對齊機(jī)制后,結(jié)構(gòu)體Struct的優(yōu)化,調(diào)整下字段順序,效果立竿見影。內(nèi)存對齊其實(shí)就是典型的空間換時(shí)間的方式,來達(dá)到優(yōu)化的目的。牢記對齊原則,對實(shí)際場景進(jìn)行分析,減少空白填充。