Java之volatile如何保證可見性和指令重排序

1 我們先了解CPU緩存

CPU緩存為了解決CPU運算速度與內(nèi)存讀寫速度不匹配的問題,因為CPU運算速度要比內(nèi)存讀寫速度快得多

    一次主內(nèi)存的訪問通常在幾十到幾百個時鐘周期
    一次L1高速緩存的讀寫只需要1~2個時鐘周期
    一次L2高速緩存的讀寫也只需要數(shù)十個時鐘周期

CPU大多數(shù)情況下讀寫都不會直接訪問內(nèi)存,取而代之的是CPU緩存,CPU緩存是位于CPU與內(nèi)存之間的臨時存儲器(簡單理解為寄存器),它容量比內(nèi)存小得多但是交換速度卻比內(nèi)存快得多。而緩存中的數(shù)據(jù)是內(nèi)存中的一小部分數(shù)據(jù),但這一小部分是短時間內(nèi)CPU即將訪問的,當CPU調(diào)用大量數(shù)據(jù)時,就可先從緩存中讀取,從而加快讀取速度

CPU緩存可分為:一級緩存(是與CPU結(jié)合最為緊密的CPU緩存)、二級緩存、三級緩存,每一級緩存中所存儲的數(shù)據(jù)全部都是下一級緩存中的一部分

當CPU要讀取數(shù)據(jù)時,首先從一級緩存中查找,如果沒有再從二級緩存中查找,如果還是沒有再從三級緩存中或內(nèi)存中查找。一般來說每級緩存的命中率大概都有80%左右,只剩下20%的總數(shù)據(jù)量才需要從二級緩存、三級緩存或內(nèi)存中讀取。

CPU執(zhí)行計算的過程如下:

    程序以及數(shù)據(jù)被加載到主內(nèi)存
    指令和數(shù)據(jù)被加載到CPU緩存
    CPU執(zhí)行指令,把結(jié)果寫到高速緩存
    高速緩存中的數(shù)據(jù)寫回主內(nèi)存


 
2 總線鎖

每個CPU都有一級緩存,但是,我們卻無法保證每個CPU的一級緩存數(shù)據(jù)都是一樣的,如何保證各個CPU緩存中的數(shù)據(jù)是一致的。就是CPU的緩存一致性問題

1)總線鎖

一種處理一致性問題的辦法是使用Bus Locking(總線鎖)。當一個CPU對其緩存中的數(shù)據(jù)進行操作的時候,往總線中發(fā)送一個Lock信號。 這個時候,所有CPU收到這個信號之后就不操作自己緩存中的對應(yīng)數(shù)據(jù)了,也就是把數(shù)據(jù)直接寫入主內(nèi)存,當操作結(jié)束,釋放鎖以后,所有的CPU就去內(nèi)存中獲取最新數(shù)據(jù)更新。


 
3 volatile如何保證可見性

我們把有volatile修飾的變量編譯成部分匯編,這里有個lock指令

0x01a3de24: lock addl $0X0,(%esp);

如果是寫操作,cpu會發(fā)出一個lock指令,CUP會把數(shù)據(jù)直接寫到到主內(nèi)存

如果是讀操作,cpu會發(fā)出一個unlock指令, 所有的CPU就去內(nèi)存中獲取最新數(shù)據(jù)更新


 
4 volatile如何保證指令重排序

現(xiàn)代的操作系統(tǒng)都是多處理器.而每一個處理器都有自己的緩存,并且這些緩存并不是實時都與內(nèi)存發(fā)生信息交換.這樣就可能出現(xiàn)一個cpu上的緩存數(shù)據(jù)與另一個cpu上的緩存數(shù)據(jù)不一致的問題.而這樣在多線程開發(fā)中,就有可能導(dǎo)致出現(xiàn)一些異常行為.
而操作系統(tǒng)底層為了這些問題,提供了一些內(nèi)存屏障用以解決這樣的問題.目前有4種屏障.

    LoadLoad屏障:對于這樣的語句Load1; LoadLoad; Load2,在Load2及后續(xù)讀取操作要讀取的數(shù)據(jù)被訪問前,保證Load1要讀取的數(shù)據(jù)被讀取完畢。
    StoreStore屏障:對于這樣的語句Store1; StoreStore; Store2,在Store2及后續(xù)寫入操作執(zhí)行前,保證Store1的寫入操作對其它處理器可見。
    LoadStore屏障:對于這樣的語句Load1; LoadStore; Store2,在Store2及后續(xù)寫入操作被刷出前,保證Load1要讀取的數(shù)據(jù)被讀取完畢。
    StoreLoad屏障:對于這樣的語句Store1; StoreLoad; Load2,在Load2及后續(xù)所有讀取操作執(zhí)行前,保證Store1的寫入對所有處理器可見。

在每個volatile寫操作前插入StoreStore屏障,在寫操作后插入StoreLoad屏障;
在每個volatile讀操作前插入LoadLoad屏障,在讀操作后插入LoadStore屏障;

由于內(nèi)存屏障的作用,避免了volatile變量和其它指令重排序



作者:chen.yu
深信服三年半工作經(jīng)驗,目前就職游戲廠商,希望能和大家交流和學習,
微信公眾號:編程入門到禿頭 或掃描下面二維碼
零基礎(chǔ)入門進階人工智能(鏈接)