許多應(yīng)用程序擁有更為復(fù)雜的讀取模式(幾乎是隨機(jī)地,特別是當(dāng)cachehit不可預(yù)測的時候),并且沒有有效地利用帶寬。典型的這類應(yīng)用程序就是業(yè)務(wù)處理軟件,即使擁有如亂序執(zhí)行(outoforderexecution)這樣的CPU特性,也會受內(nèi)存延遲的限制。這樣CPU必須得等到運(yùn)算所需數(shù)據(jù)被除數(shù)裝載完成才能執(zhí)行指令(無論這些數(shù)據(jù)來自CPUcache還是主內(nèi)存系統(tǒng))。當(dāng)前低段系統(tǒng)的內(nèi)存延遲大約是120-150ns,而CPU速度則達(dá)到了3GHz以上,一次單獨(dú)的內(nèi)存請求可能會浪費(fèi)200-300次CPU循環(huán)。即使在緩存命中率(cachehitrate)達(dá)到99%的情況下,CPU也可能會花50%的時間來等待內(nèi)存請求的結(jié)束-比如因?yàn)閮?nèi)存延遲的緣故。 你可以看到Opteron整合的內(nèi)存控制器,它的延遲,與芯片組支持雙通道DDR內(nèi)存控制器的延遲相比來說,是要低很多的。英特爾也按照計(jì)劃的那樣在處理器內(nèi)部整合內(nèi)存控制器,這樣導(dǎo)致北橋芯片將變得不那么重要。但改變了處理器訪問主存的方式,有助于提高帶寬、降低內(nèi)存和提升處理器性 制造工藝:現(xiàn)在CPU的制造工藝是45納米,今年1月10號上市最新的I5I可以達(dá)到32納米,在將來的CPU制造工藝可以達(dá)到24納米。