基本介紹
Pentium 4
首款產品工程代號為:Willamette,擁有1.4GHz左右的核心時鐘,它其實是一個100MHz時鐘頻率的四倍數據速率(QDR)前端匯流排,因此數據傳輸速率為4×100MHz。
相應的,Pentium 4前期的競爭對手AMD Athlon處理器採用雙倍數據輸率(DDR)前端匯流排,擁有266MHz或333MHz的數據傳輸速率(2×133MHz、2×166MHz)。
性能
令業界觀察人士感到意外的是,Pentium 4沒有在“整數處理速度”和“浮點性能”這兩個標準重要性能之一上比之前的P6架構設計有任何提升。相反,它通過犧牲每個周期的性能以實現非常高的時鐘速度和
SSE性能。與
英特爾的傳統保持一致的是,Pentium 4也有低端
Celeron〔通常稱為
Celeron 4〕及Celeron版本和用於SMP配置的高端
至強〔至強〕版本。
設計目標
Pentium 4的設計目標是適應更快的時鐘速度,因為消費者開始依據更高的時鐘購買計算機。在這方面Pentium 4是一個經典的市場驅動技術的範例。這很快就推動了超微半導體(AMD)的
時鐘頻率神話運動。
英特爾使用一個深度的
指令流水線來實現這個目標,同其它如Pentium III和
Athlon那樣的CPU相比Pentium 4降低了每個
時鐘周期能夠處理的實際工作數目,但是它能夠以更高的時鐘速度工作。AMD則採用所謂的
PR值來標示與Pentium 4相對應的
Athlon XP處理器。
英特爾在發表Pentium 4時向大眾宣布說,
NetBurst架構能夠運行在10GHz。然而,NetBurst架構在4GHz遇到了無法解決的高功耗問題。這迫使英特爾在2005年年中放棄了Pentium 4,並轉向升溫更少的
Pentium M,祭出“MoDT (Mobile on DeskTop)”的旗幟;由此,Pentium M也被重新定位為桌面和小型
伺服器市場。
核心架構
Willamette
第一款Pentium 4 Willamette設計過程經過了很長時間的延遲。它最初在1998年的一個產品發展路線中提出,像英特爾把Pentium III作為他們的主流產品一樣看待。當時,人們僅僅希望Willamette在面世時能夠突破1GHz的屏障。然而,當Pentium III發布以後,很明顯英特爾不能將Willamette稱為Pentium III。由於它的架構與Pentium III相比有很大的不同,Pentium 4採用NetBurst架構,它被命名為Pentium 4,這也終結了英特爾以羅馬數字命名的規則。
許多業界專家認為,最初的1.4和1.5GHz P4的發布只是在產品真正完善之前的一個權宜之計。根據這些專家的觀點,Willamette的發布是因為當時競爭產品AMD AthlonThunderbird性能已經超過了Pentium III,並且英特爾對於Pentium III的改進還不現實。這個新的核心使用0.18微米〔180納米〕工藝生產,最初在主機板上使用
Socket 423,後來的版本更改到
Socket 478。
在
性能測試中,Willamette的表現有點兒讓分析人士失望,因為它不僅在所有的
測試環境中不能超過Athlon和最高頻率的Pentium III,而且很明顯它並不優於低端的
AMD Duron。儘管售價為819美元(1000顆的批發價),它的銷售表現一般但是增長勢頭可觀,這在一定程度上是由於需要相對較昂貴的
Rambus動態隨機存儲器(
RDRAM)所致。Pentium III仍然保持英特爾最賣座的晶片,Athlon的銷售也稍稍領先於Pentium 4。
在2001年1月,一個頻率更低的1.3GHz型晶片也加入到這個系列,但在隨後的12個月中,英特爾慢慢追上了AMD的領先地位。2001年4月英特爾推出了1.7GHz的P4,它是第一個性能明顯優於Pentium III的晶片。2001年7月英特爾推出了1.6和1.8GHz的型號,在8月它推出了1.9和2.0GHz的Pentium 4。在這個月中,它發布了一款新的能夠支持廉價PC133 SDRAM的
晶片組。儘管使用SDRAM將比RDRAM慢很多,PC133比較低廉的價格這樣一個事實帶來了Pentium 4銷售的大幅增長,幾乎是一夜之間就將Pentium III從市場銷售首位的位置趕了下去。
2.0 GHz 是第一款真正能夠挑戰Athlon Thunderbird的P4,當時它是市場上無可爭議的最快的
x86處理器。許多觀察人士認為雷鳥仍然是市場上總體性能最快的,但是它們之間的性能差距已經非常接近,所以任何一方的支持者宣稱超出對方都不是不合理的。對於英特爾來說,這是一個了不起的成就。英特爾已經在x86CPU性能上保持了16年的領先位置,在AMD Athlon發布之前只出現過兩次短暫的例外。
Northwood
2001年10月
Athlon XP又一次為AMD贏得了明顯的領先,但是在2002年1月英特爾發布了使用Northwood
核心的2.0和2.2GHz的Pentium 4。Northwood將二級快取的大小從256KB增加到了512KB(電晶體數量從4200萬增加到5500萬)並且使用了130納米製造工藝。使用更小電晶體製造的晶片能夠在同樣的速度產生更少的熱量,或者工作在更高的
時鐘頻率。不幸的是,對於許多用戶來說,這個新的晶片不能用來升級舊的系統,因為它需要一個新的插座(Socket 478),雖然後來又製造了能夠讓Socket 423使用Northwood處理器的轉換器。
Northwood帶來了Pentium 4時代。儘管爭奪性能領先的戰鬥依然很激烈(因為AMD發布了更快版本的Athlon XP),但是許多觀察人士都認同最快的Northwood P4稍稍領先於對手。尤其是在2002年夏天更是這樣,當時AMD轉換到130納米製造技術過程被延遲,從2.4到2.8GHz範圍的P4很顯然是當時市場上最快的晶片。
2.4GHz的Pentium 4於2002年4月發布,匯流排速度從400MHz(100MHz四倍)提升到533MHz(133MHz四倍)用於5月發布的2.53GHz、8月發布的2.6和2.8GHz P4,3.06GHz的Pentium 4在11月發布。
3.06GHz的處理器支持
超執行緒(首次出現在至強處理器中),它允許多個執行緒同時運行,它通過複製處理器的一部分讓作業系統認為有兩個邏輯處理器來實現。在所有的Northwood CPU中都有超執行緒機制,但是只在3.06GHz型號中允許使用。
2003年4月,英特爾發布了一系列頻率範圍從2.4到3.0GHz的新款800MHz FSB晶片。這些新版本的與以往晶片的主要不同就是全部都支持超執行緒機制,並且
系統匯流排頻率是800MHz。人們曾經猜想這些是為了與AMD處理器的Hammer系列競爭。然而,AMD只發布了
Opteron一款,並且最初拒絕提供AGP控制器,這樣就阻止了Opteron侵蝕Pentium 4的領地。AMD的確也將Athlon XP的匯流排速度從333MHz提升到了400MHz,但這並不能阻止新款的3.0GHz P4,並且FSB不是問題所在;從333MHz到400MHz的轉換僅僅帶來了很小的乃至沒有性能提升。3.2GHz的Pentium 4在6月上市,最後一個3.4GHz的版本在2004年早期上市。
評價
過分超頻早期的Northwood晶片將會產生令人震驚的現象。當核心電壓超過1.7V時,處理器將隨時間延長逐漸變得不穩定,直至最後壞掉完全不能再用。人們認為這是由於電子遷移這種物理現象導致的,其中CPU的內部通路由於過度的電子能量隨著時間逐步退化。這也被稱為Northwood突然死亡症(SuddenNorthwoodDeathSyndrome)。Mobile Pentium 4 Mobile Intel Pentium 4 Processor Intel Mobile Pentium 4處理器與Mobile Pentium 4-M不同,外觀上在大的差別就是Mobile Pentium 4上與桌面型Pentium 4處理器一樣有晶圓上的鐵蓋,INTEL將它定位使用筆記本電腦取代台式機的用戶,他與桌面型的Pentium 4一樣使用Socket 478的插槽 ,它也提供Hyper-Threading超執行緒與EIST的功能,FSB也比Mobile P4-M的400高,達到FSB533。新型的Mobile P4采90納米工藝,最高時鐘高達3.4GHz以及1MB的L2高速快取。
Pentium
也是基於Northwood核心,Mobile Intel Pentium 4 Processor - M在2002年4月23日發布,它包括了英特爾的EIST技術來降低功耗,但是不包括超執行緒技術,L2最大512K,最高時鐘為3.06GHz。同時期的廉價版Celeron也有推出類似Mobile Pentium 4-M的處理器,FSB與P4-M相同但L2降為P4-M的一半只有256K,後期的產品最高時鐘可達2.8GHz。
發展歷史
Extreme
2003年9月,在英特爾開發者論壇上,Pentium 4極致版(Pentium 4 Extreme Edition,P4EE)面世了,這僅僅比AMD的
Athlon 64和Athlon 64 FX(AMD64 FX)的發布早了一個星期。這個設計絕大部分與Pentium 4相同(以至於它們能工作在同一個主機板),但是它增加了一個2MB的3級
快取。它與
至強MP使用同一個Gallatin核心,儘管它使用Socket 478形式(不同於至強MP的603插座)和是至強 MP速度兩倍的800MHz匯流排。它同時也提供LGA775版本。
儘管英特爾宣稱極致版主要面向遊戲人員,人們認為這是英特爾試圖減弱Athlon 64發布的震撼一種努力,將它戲稱為“緊急版本”。令人奇怪的是,儘管很多人批評英特爾從至強系列拼湊技術,但是很少有人批評AMD,AMD在它們的Athlon 64 FX上使用了同樣的方法(它與Opteron的差別甚至少於極致版與至強 MP的區別)。
增加的
快取的功效在不同環境會有所不同。在辦公室套用中,極致版總體上比Northwood慢一點兒,這是由於L3快取增加了門檻值。一些遊戲程式受益於增加的快取,尤其是那些基於Quake III和
Unreal引擎的遊戲。然而,提升最大的是在多媒體編碼領域,在這裡它不僅比奔騰4要快,而且比兩款Athlon 64快。
在2004年晚些時候通過將匯流排速度從800MHz提升到1066MHz實現了小幅的性能提升。在Extreme Edition遷移到Prescott核心之前僅僅發布了一款3.46GHz基於Gallatin核心的晶片。新的3.73GHz Extreme Edition與6x0系列的Prescott 2M有同樣的特性,不同的是它使用1066MHz匯流排。然而實際上3.73GHz Extreme Edition幾乎總是比3.46GHz版本的速度要慢。
不要把
Pentium 4極致版與後來發布的有類似名字的基於雙核
Pentium D的
Pentium極致版相混淆。
Prescott
2004年2月1日
英特爾提出了一個代號為“Prescott”的新核心。這個核心首次使用90納米的製造工藝,並且“它”是奔騰4微架構的一次重要更新——重要到足夠讓一些分析人士感到奇怪為什麼英特爾沒有選擇將這個處理器稱為Pentium 5。儘管Prescott工作在與Northwood相同的時鐘速度,性能測試也顯示在遊戲應用程式中Northwood比Prescott還要稍微快一點兒,但是在
視頻編輯以及其它的多媒體套用中,Prescott額外的快取讓它比Northwood有明顯的速度優勢。Prescott的架構允許它很容易地使用更高的時鐘速度。(
參見超頻。)3.8GHz是批量生產的基於Prescott處理器的最快的處理器。
緊接著產品發布之後,人們就發現Prescott每個時鐘周期比Northwood多產生大約60%的熱量,幾乎所有的評論都是負面的。插座類型的轉換(從
Socket 478到
LGA775)原本希望能夠將發熱降低到可以接受的水平,但是實際上卻是產生了相反的效果,同時功率消耗也增加的大約10%。但是,LGA775涉及的降溫和
安裝系統是一種更好的設計,所以平均溫度有輕微的降低。英特爾工程師隨後對處理器進行的修改工作有望降低平均溫度,但是這除了降低速度等級之外從來也沒有先例。
最後,溫度問題變得非常嚴重英特爾不得不全部放棄Prescott架構,並且開發4GHz部分的努力也被認為是浪費內部資源而被放棄了。另外的擔憂是審查發現極端狀況下需要5.2GHz的Prescott核心才能與2.6GHz的Athlon FX-55的性能相比。回首當初英特爾發布Pentium 4時吹噓的Pentium 4是為10GHz的處理速度設計的,這將被看作英特爾歷史上最重要的或許也是最廣為人知的工程失敗(engineering shortfalls)事件。
Prescott以這樣一個災難性的結局終結是英特爾內部的策略使然。市場部不斷地要求更高的時鐘速度以使他們的產品與AMD有所區別。處理器的設計被市場需求而不是被架構本身所控制。職業發展也基於更高時鐘速度這樣一個理念,當P4項目終止最終到來的時候,它對於有著資助良好的桌面分部的許多管理人員有著嚴重的影響。
最初有兩種Prescott產品線上市:帶有800MHz FSB和支持
超執行緒的E系列以及533MHz FSB和不支持超執行緒的A系列。
LGA775 Prescott使用一個
評價系統將它們標記為5xx系列(Celeron D是3xx系列,Pentium M是7xx系列)。E系列的LGA775版本使用型號5x0(520-560),A系列的LGA775版本使用型號5x5和5x9(505-519)。最快的570J和571工作在3.8GHz。
5x0J系列(以及相應的低端版本5x5J系列和5x9J系列)為英特爾處理器產品線引進了
XD bit(eXecute Disable)或執行禁止位。這項最初由
AMD最初使用並稱為NX bit的技術能夠幫助阻止一定類型的有害代碼非法利用快取器溢出來執行。
英特爾也發布了一系列支持
EM64T的Prescott產品,它們是
AMD64對於
x86體系的64位擴充的 英特爾實現方法。這些產品最初作為F系列並且僅對OEM銷售,但是後來重命名為5x1系列並且面向大眾銷售。兩款低端的基於5x5/5x9系列的支持EM64T的Prescott也使用506和516的型號已經發布。
5x0、5x0J和5x1 Prescott為了加速一些諸如
視頻編輯這樣使用多執行緒軟體的處理器都集成有
超執行緒技術。
Prescott 2M
英特爾在2005年第一季度發布了代號為“Prescott 2M”的編號6x0的新版Prescott核心。它包含了嶄新的64位技術(
AMD64的實現,英特爾稱為
EM64T)、
XD、
EIST(英特爾增強SpeedStep技術)以及2MB的L2快取。然而,增加
快取帶來的優勢大部分被更高的快取門檻、EM64T模式下的雙字大小所抵消。雙倍的快取與其說是為了加快速度,不如說是為了提供同樣的空間以保證64位模式下的性能。
6xx系列的Prescott 2M處理器為了加速用於如
視頻編輯等多執行緒軟體的處理器,它們都包含有超執行緒技術。
2005年11月14日,英特爾發布了帶有VT(虛擬技術,代號為“Vanderpool”)的Prescott 2M處理器。英特爾只發布了兩款這種分別運行於3.6GHz 和 3.8GHz的Prescott 2M處理器:662和672。
Cedar Mill
英特爾將在2006年第一季度發布代號為'Cedar Mill'的最後一個奔騰4版本。有86W TDP的Cedar Mill有望解決Prescott的過熱問題。Cedar Mill有一個65nm工藝的核心,帶有31級的流水線(同Prescott一樣)、800MHz的
FSB、
EM64T、超執行緒和虛擬技術。Cedar Mill將帶有一個2MB的L2快取。Cedar Mill將作為從頻率2.8GHz到3.8GHz的奔騰6x1和6x3發布,如果市場足夠大的話,英特爾將會發布4.0GHz或者更高
時鐘頻率的晶片。
雙核
英特爾已經發布了市場推廣標識為
Pentium D8xx的三款主流雙核Pentium 4版本。人們稱讚這些晶片每個時鐘速度有60-80%的性能提升。一個極致版〔Extreme Edition〕也已上市,它有允許四個執行緒
並行處理的
超執行緒技術。其它的特點包括SpeedStep技術(在3.0GHz及以上版本)、xD bit和
EM64T。這些晶片在2005年5月推向了市場。
綽號為Smithfield核心的第一款Pentium D處理器使兩個相連的Prescott核心。電源消耗大約155瓦。英特爾開發人員通過讓每個核心工作在極低的
時鐘頻率實現了降低了從Prescott的電力消耗(115瓦)的大幅度增加。極致版工作在3.2GHz,主流型號的頻率分別為3.2、3.0和2.8GHz。除805使用533MHz FSB外,其他基於Smithfield的處理器都使用800MHz的
FSB。
2006年第一季度推出的是Presler,它是一個Smithfield核心的65納米版本。基於Presler的Pentium D有800MHz的FSB、發布型號將是920、930、940、950,分別工作在2.8、3.0、3.2和3.4GHz。基於Presler的奔騰極致版使用型號955,工作在3.46GHz,帶有1066MHz的FSB和超執行緒技術。
技術特點
不同版本英特爾Pentium 4處理的列表以及它們不同的特點。
公開名稱 | 核心 | CPU頻率 | Socket | FSB/理論 寬度 | 高速快取 | 其它特點 |
最初發布版本 | Willamette | 1.3 GHz - 2.0 GHz | 423, 478 | 400 MHz / 3.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 256 KB L2 | 20 級流水線,MMX / SSE / SSE2 指令 |
P4A | Northwood | 1.6 GHz - 2.8 GHz | 478 | 400 MHz / 3.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 改進的分支預測和其它的偽代碼調整; |
P4B | Northwood | 2.0 GHz - 3.06 GHz | 478 | 533 MHz / 4.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 更高前置匯流排, |
P4C | Northwood | 2.4 GHz - 3.4 GHz | 478 | 800 MHz / 6.4 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 更高前置匯流排, 超執行緒,21級的流水線,MMX / SSE / SSE2指令 |
P4E/5x0 系列 | Prescott | 2.8 GHz - 3.6 GHz | | 800 MHz / 6.4 GB/s | 16 KB L1 數據 + 12 KB L1 指令 / 1024 KB L2 | 超執行緒,31級的流水線,MMX / SSE / SSE2 / SSE3 指令 |
P4A* /5x5/5x9 系列 | Prescott | 2.4 GHz - 3.06 GHz | 478, LGA775 | 533 MHz / 4.2 GB/s | 16 KB L1 數據 + 12 KB L1 指令 / 1024 KB L2 | 不支持超執行緒,31級的流水線,MMX / SSE / SSE2 / SSE3 指令 |
P4 Extreme Edition | Gallatin | 3.2 GHz - 3.4 GHz | 478, LGA775 | 800 MHz / 6.4 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 / 2 MB L3 | 超執行緒,增加L3記憶體,21級的流水線,MMX / SSE / SSE2指令 |
5x0J 系列 | Prescott | 2.8 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 超執行緒、執行禁止位(eXecute Disable bit) |
5x5J/5x9J 系列 | Prescott | 2.67 GHz - 3.06 GHz | LGA775 | 533 MT/s / 4.2 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 無超執行緒、執行禁止位、 |
P4F/5x1 系列 | Prescott | 2.8 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | |
6x0 系列 | Prescott 2M** | 3.0 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | |
6x1 系列 | Prescott 2M** | 3.6 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | |
6x2 系列 | Cedar Mill | 3.0 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | |
P4 Extreme Edition | Gallatin | 3.46 GHz | LGA775 | 1066 MT/s / 8.5 GB/s | 8 KB L1 數據 + 12 KiB L1 指令 / 512 KiB L2 / 2 MB L3 | addition of on-die L3 快取、 |
P4 Extreme Edition | Prescott 2M** | 3.73 GHz | LGA775 | 1066 MT/s / 8.5 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 快取 | |
5x6 系列 | Prescott | 2.67 GHz - 2.93 GHz | LGA775 | 533 MT/s / 4.2 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | |
注意事項
奔騰 4 處理器使用能夠在方波四個狀態(上升、峰值、下降和谷值)傳送數據的前端匯流排,而不是像以前的處理器那樣使用一個狀態,這樣控制時鐘的方波頻率是FSB頻率的四分之一。400、533、800和1066 MT每秒的匯流排使用的是100、 133、200和266MHz的方波。
其他
* - 在作Prescott處理器系列規劃的時候英特爾重複了“P4A”的命名,他們認為零售商會用這個名稱讓用戶認識這個處理器;他們對於這種做法沒有給出任何理由
** - 600系列的正式名稱,儘管有時稱作等同於
至強,使用了Irwindale以將它與最初的Prescott區分開來。