存儲管理及棧和堆的區(qū)別
作者:xcbeyond
瘋狂源自夢想,技術(shù)成就輝煌!微信公眾號:《程序猿技術(shù)大咖》號主,專注后端開發(fā)多年,擁有豐富的研發(fā)經(jīng)驗,樂于技術(shù)輸出、分享,現(xiàn)階段從事微服務(wù)架構(gòu)項目的研發(fā)工作,涉及架構(gòu)設(shè)計、技術(shù)選型、業(yè)務(wù)研發(fā)等工作。對于Java、微服務(wù)、數(shù)據(jù)庫、Docker有深入了解,并有大量的調(diào)優(yōu)經(jīng)驗。
存儲管理
內(nèi)存組織方式:
凡是要執(zhí)行的程序代碼、處理的數(shù)據(jù)都必須放置在內(nèi)存中。一般操作系統(tǒng)將占用內(nèi)存的高地址部分,而其他剩余的內(nèi)存供程序和數(shù)據(jù)使用,程序不能對操作系統(tǒng)占用的內(nèi)存進(jìn)行操作。
C語言中內(nèi)存分配情況:
靜態(tài)存儲分配,是指在編譯時,就能確定每個變量在運行時刻需要占用的內(nèi)存空間。對于全局變量、靜態(tài)變量使用的這種方式分配。C語言程序運行時的內(nèi)存分配有三種方式:靜態(tài)、棧、堆。
棧式存儲分配,也可以稱為動態(tài)存儲分配,由一個類似于堆棧的運行棧來實現(xiàn)。和靜態(tài)存儲分配不同,在棧式存儲中,程序變量對內(nèi)存空間的需求在編譯時不進(jìn)行分配,到運行時才進(jìn)行具體的分配。在使用棧式存儲分配時,編譯器在編譯時也需要知道函數(shù)所需數(shù)據(jù)區(qū)域的大小,然后,在程序運行時使用該值分配內(nèi)存。C語言函數(shù)內(nèi)部的局部變量都是采用棧式分配的。
堆式存儲分配,堆由大片的可利用塊或空閑塊組成,堆中的內(nèi)存可以按照任意順序分配和釋放。當(dāng)在程序編譯時,無法確定數(shù)據(jù)區(qū)域大小時(如可變長度的字符串),可在堆中分配內(nèi)存空間。
棧(stack)和堆(heap)具體的區(qū)別:
1、在申請方式上
棧(stack): 它由編譯器自動管理,無需我們手工控制(即:在程序執(zhí)行時由系統(tǒng)分配和回收)。 例如,聲明函數(shù)中的一個局部變量 int b 系統(tǒng)自動在棧中為b開辟空間;在調(diào)用一個函數(shù)時,系統(tǒng)自動的給函數(shù)的形參變量在棧中開辟空間。
堆(heap): 申請和釋放由程序員控制(通過程序員編寫代碼控制),并指明大小。若程序員不釋放,程序結(jié)束時,可能由操作系統(tǒng)回收。容易產(chǎn)生memory leak。
在C中使用malloc函數(shù)和free函數(shù)。
如:p1 = (char *)malloc(10);//(char )malloc(10sizeof(char));
在C++中用new運算符。
如:p2 = new char[20];//(char *)malloc(10);
但是注意p1本身在棧區(qū),而p2本身是在棧中的,只是它們指向的空間是在堆中。
2、申請后系統(tǒng)的響應(yīng)上
棧(stack):只要棧的剩余空間大于所申請空間,系統(tǒng)將為程序提供內(nèi)存,否則將報異常提示棧溢出。
堆(heap): 首先應(yīng)該知道操作系統(tǒng)有一個記錄空閑內(nèi)存地址的鏈表,當(dāng)系統(tǒng)收到程序的申請時, 會遍歷該鏈表,尋找第一個空間大于所申請空間的堆結(jié)點,然后將該結(jié)點從空閑結(jié)點鏈表中刪除,并將該結(jié)點的空間分配給程序。另外,對于大多數(shù)系統(tǒng),會在這塊內(nèi)存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete或free語句才能正確的釋放本內(nèi)存空間。另外,由于找到的堆結(jié)點的大小不一定正好等于申請的大小,系統(tǒng)會自動的將多余的那部分重新放入空閑鏈表中。
3、申請大小的限制
棧(stack):在DOS 、Windows操作系統(tǒng)下,棧是由高地址向低地址擴(kuò)展的數(shù)據(jù)結(jié)構(gòu),是一塊連續(xù)的內(nèi)存的區(qū)域。這句話的意思是棧頂?shù)牡刂泛蜅5淖畲笕萘渴窍到y(tǒng)預(yù)先規(guī)定好的,如果申請的空間超過棧的剩余空間時,將提示“堆棧溢出”。因此,能從棧獲得的空間較小。 例如,在VC6下面,默認(rèn)的棧空間大小是1M(好像是,記不清楚了)。
當(dāng)然,我們可以修改:打開工程,依次操作菜單如下:Project->Setting->Link,在Category 中選中Output,然后在Reserve中設(shè)定堆棧的最大值和commit。
注意:reserve最小值為4Byte;commit是保留在虛擬內(nèi)存的頁文件里面,它設(shè)置的較大會使棧開辟較大的值,可能增加內(nèi)存的開銷和啟動時間。
堆(heap): 堆是由低地址向高地址擴(kuò)展的數(shù)據(jù)結(jié)構(gòu),是不連續(xù)的內(nèi)存區(qū)域(空閑部分用鏈表串聯(lián)起來)。正是由于系統(tǒng)是用鏈表來存儲空閑內(nèi)存,自然是不連續(xù)的,而鏈表的遍歷方向是由低地址向高地址。一般來講在32位系統(tǒng)下,堆內(nèi)存可以達(dá)到4G的空間,從這個角度來看堆內(nèi)存幾乎是沒有什么限制的。由此可見,堆獲得的空間比較靈活,也比較大。
4、分配空間的效率上
棧(stack):棧是機(jī)器系統(tǒng)提供的數(shù)據(jù)結(jié)構(gòu),計算機(jī)會在底層對棧提供支持:分配專門的寄存器存放棧的地址,壓棧出棧都有專門的指令執(zhí)行,這就決定了棧的效率比較高。但程序員無法對其進(jìn)行控制。
堆(heap):是C/C++函數(shù)庫提供的,由new或malloc分配的內(nèi)存,一般速度比較慢,而且容易產(chǎn)生內(nèi)存碎片。它的機(jī)制是很復(fù)雜的,例如為了分配一塊內(nèi)存,庫函數(shù)會按照一定的算法(具體的算法可以參考數(shù)據(jù)結(jié)構(gòu)/操作系統(tǒng))在堆內(nèi)存中搜索可用的足夠大小的空間,如果沒有足夠大小的空間(可能是由于內(nèi)存碎片太多),就有可能調(diào)用系統(tǒng)功能去增加程序數(shù)據(jù)段的內(nèi)存空間,這樣就有機(jī)會分到足夠大小的內(nèi)存,然后進(jìn)行返回。這樣可能引發(fā)用戶態(tài)和核心態(tài)的切換,內(nèi)存的申請,代價變得更加昂貴。顯然,堆的效率比棧要低得多。
5、堆和棧中的存儲內(nèi)容
棧(stack):存放函數(shù)調(diào)用中的參數(shù)、函數(shù)的局部變量(靜態(tài)變量不入棧),通過棧才能完成函數(shù)間調(diào)用時的現(xiàn)成保護(hù)。
堆(heap):一般是在堆的頭部用一個字節(jié)存放堆的大小,堆中的具體內(nèi)容有程序員安排。
6、存取效率的比較
這個應(yīng)該是顯而易見的。拿棧上的數(shù)組和堆上的數(shù)組來說:
void main()
{
int arr[5]={1,2,3,4,5};
int *arr1;
arr1=new int[5];
for (int j=0;j<=4;j++)
{
arr1[j]=j+6;
}
int a=arr[1];
int b=arr1[1];
}
上面代碼中,arr1(局部變量)是在棧中,但是指向的空間確在堆上,兩者的存取效率,當(dāng)然是arr高。因為arr[1]可以直接訪問,但是訪問arr1[1],首先要訪問數(shù)組的起始地址arr1,然后才能訪問到arr1[1]。
總而言之:
在C/C++程序中,有關(guān)內(nèi)存使用的問題是最難發(fā)現(xiàn)和解決的。這些問題可能導(dǎo)致程序莫名其妙地停 止、崩潰,或者不斷消耗內(nèi)存直至資源耗盡。由于C/C++語言本身的特質(zhì)和歷史原因,程序員使用內(nèi)存需要注意的事項較多,而且語言本身也不提供類似Java的垃圾清理機(jī)制。編程人員使用一定的工具來查找和調(diào)試內(nèi)存相關(guān)問題是十分必要的。
總的說來,與內(nèi)存有關(guān)的問題可以分成兩類:內(nèi)存訪問錯誤和內(nèi)存使用錯誤。內(nèi)存訪問錯誤包括錯誤地讀取內(nèi)存和錯誤地寫內(nèi)存。錯誤地讀取內(nèi)存可能讓你的模塊返回意想不到的結(jié)果,從而導(dǎo)致后續(xù)的模塊運行異常。錯誤地寫內(nèi)存可能導(dǎo)致系統(tǒng)崩潰。內(nèi)存使用方面的錯誤主要是指申請的內(nèi)存沒有正確釋放,從而使程序運行逐漸減慢,直至停止。這方面的錯誤由于表現(xiàn)比較慢很難被人工察覺。程序也許運行了很久才會耗凈資源,發(fā)生問題。
堆和棧的區(qū)別可以用如下的比喻來看出:
使用棧就象我們?nèi)ワ堭^里吃飯,只管點菜(聲明變量)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準(zhǔn)備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。
使用堆就象是自己動手做喜歡吃的菜肴,比較麻煩,但是比較符合自己的口味,而且自由度大。
char s1[] = ”hello”;
char s2[] = ”hello”;
cout<<(s1==s2)<<endl; //這里是0,因為s1,s2是數(shù)組形式的字符,系統(tǒng)會自動在棧區(qū)為其分配空間,所以s1,s2是指向不同的區(qū)域的
char *s1 = ”hello”;
char *s2 = ”hello”;
cout<<(s1==s2)<<endl; //這里是1,因為s1,s2是指針的形式的字符指針,系統(tǒng)為其分配的空間是在棧區(qū)的,但是“hello”是存放在常量區(qū)域的,所以s1,s2是指向同一區(qū)域的,故比較時,是相等的。