基本簡述
Windows 2000 使用基於
分頁機制的
虛擬記憶體。每個進程有4GB的虛擬
地址空間。基於分頁機制,這4GB地址空間的一些部分被映射了
物理記憶體,一些部分映射硬碟上的交換檔案,一些部分什麼也沒有映射。程式中使用的都是4GB地址空間中的虛擬地址。而訪問物理記憶體,需要使用
物理地址。
相關比較
物理地址 (physical address): 放在定址匯流排上的地址。放在定址匯流排上,如果是讀,電路根據這個地址每位的值就將相應地址的
物理記憶體中的數據放到
數據匯流排中傳輸。如果是寫,電路根據這個地址每位的值就在相應地址的物理記憶體中放入數據匯流排上的內容。物理記憶體是以
位元組(8位)為單位
編址的。
虛擬地址 (virtual address): CPU啟動保護模式後,程式運行在虛擬
地址空間中。注意,並不是所有的“程式”都是運行在虛擬地址中。CPU在啟動的時候是運行在實模式的,Bootloader以及核心在初始化頁表之前並不使用虛擬地址,而是直接使用物理地址的。
如果CPU暫存器中的分頁標誌位被設定,那么執行記憶體操作的
機器指令時,CPU(準確來說,是
MMU,即Memory Management Unit,記憶體管理單元)會自動根據頁目錄和
頁表中的信息,把虛擬地址轉換成物理地址,完成該指令。
比如 mov eax,[004227b8h] ,這是把地址004227b8h處的值賦給暫存器的彙編代碼,004227b8這個地址就是虛擬址。CPU在執行這行代碼時,發現暫存器中的分頁標誌位已經被設定,就自動完成虛擬地址到
物理地址的轉換,使用物理地址取出值,完成指令。對於Intel CPU 來說,
分頁標誌位是暫存器CR0的第31位,為1表示使用分頁,為0表示不使用分頁。對於初始化之後的 Win2k 我們觀察 CR0 ,發現第31位為1。表明Win2k是使用分頁的。
使用了分頁機制之後,
4G的地址空間被分成了固定大小的頁,
每一頁或者被映射到物理記憶體,或者被映射到硬碟上的交換檔案中,或者沒有映射任何東西。對於一般程式來說,4G的地址空間,只有一小部分映射了物理記憶體,大片大片的部分是沒有映射任何東西。物理記憶體也被分頁,來映射地址空間。對於32bit的Win2k,
頁的大小是4K位元組。
CPU用來把虛擬地址轉換成物理地址的信息存放在叫做頁目錄和
頁表的結構里。
物理記憶體
分頁,一個
物理頁的大小為4K位元組,第0個物理頁從
物理地址 0x00000000 處開始。
由於頁的大小為4KB,就是0x1000位元組,所以第1頁從物理地址0x00001000 處開始。第2頁從物理地址 0x00002000 處開始。可以看到由於頁的大小是4KB,所以只需要32bit的地址中高20bit來定址物理頁。
頁表,一個
頁表的大小為4K位元組,放在一個物理頁中。由1024個4位元組的頁表項組成。頁表項的大小為4個位元組(32bit),所以一個頁表中有1024個頁表項。
頁表中的每一項的內容(每項4個位元組,32bit)高20bit用來放一個物理頁的
物理地址,低12bit放著一些標誌。
一個頁目錄有1024項,虛擬地址最高的10bit剛好可以索引1024項(2的10次方等於1024)。一個
頁表也有1024項,虛擬地址中間部分的10bit,剛好索引1024項。虛擬地址最低的12bit(2的12次方等於4096),作為頁內偏移,剛好可以索引4KB,也就是一個物理頁中的每個位元組。
對於x86系統,頁目錄的物理地址放在CPU的CR3暫存器中。
CPU把虛擬地址轉換成物理地址:
一個虛擬地址,大小4個
位元組(32bit),包含著找到
物理地址的信息,分為3個部分:
第22位到第31位這10位(最高10位)是頁目錄中的索引,
第0位到第11位這12位(低12位)是頁內偏移。
對於一個要轉換成物理地址的虛擬地址,CPU首先根據CR3中的值,找到頁目錄所在的物理頁。然後根據虛擬地址的第22位到第31位這10位(最高的10bit)的值作為索引,找到相應的頁目錄項(PDE,page directory entry),頁目錄項中有這個虛擬地址所對應頁表的物理地址。有了頁表的物理地址,根據虛擬地址的第12位到第21位這10位的值作為索引,找到該頁表中相應的頁表項(PTE,page table entry),頁表項中就有這個虛擬地址所對應物理頁的物理地址。最後用虛擬地址的最低12位,也就是頁內偏移,加上這個物理頁的物理地址,就得到了該虛擬地址所對應的物理地址。
一個頁目錄有1024項,虛擬地址最高的10bit剛好可以索引1024項(2的10次方等於1024)。一個
頁表也有1024項,虛擬地址中間部分的10bit,剛好索引1024項。虛擬地址最低的12bit(2的12次方等於4096),作為頁內偏移,剛好可以索引4KB,也就是一個物理頁中的每個位元組。
一個虛擬地址轉換成物理地址的計算過程就是,處理器通過CR3找到當前頁目錄所在物理頁,取虛擬地址的高10bit,然後把這10bit左移2bit(因為每個頁目錄項4個位元組長,左移2bit相當於乘4)得到在該頁中的地址,取出該地址處PDE(4個位元組),就找到了該虛擬地址對應頁表所在物理頁,取虛擬地址第12位到第21位這10位,然後把這10bit左移2bit(因為每個頁表項4個位元組長,左移2bit相當於乘4)得到在該頁中的地址,取出該地址處的PTE(4個位元組),就找到了該虛擬地址對應物理頁的地址,最後加上12bit的頁內偏移得到了物理地址。
32bit的一個指針,可以定址範圍0x00000000-0xFFFFFFFF,4GB大小。也就是說一個32bit的
指針可以定址整個4GB
地址空間的每一個位元組。一個
頁表項負責4K的地址空間和
物理記憶體的映射,一個頁表1024項,也就是負責1024*4k=4M的地址空間的映射。一個頁目錄項,對應一個頁表。一個頁目錄有1024項,也就對應著1024個頁表,每個頁表負責4M地址空間的映射。1024個頁表負責1024*4M=4G的地址空間映射。一個進程有一個頁目錄。所以以頁為單位,頁目錄和頁表可以保證4G的地址空間中的每頁和物理記憶體的映射。
每個進程都有自己的4G地址空間,從 0x00000000-0xFFFFFFFF 。通過每個進程自己的一套頁目錄和
頁表來實現。由於每個進程有自己的頁目錄和頁表,所以每個進程的
地址空間映射的
物理記憶體是不一樣的。兩個進程的同一個虛擬地址處(如果都有物理記憶體映射)的值一般是不同的,因為他們往往對應不同的物理頁。
在windows下4G地址空間中低2G,0x00000000-0x7FFFFFFF 是用戶地址空間,4G地址空間中高2G,
0x80000000-0xFFFFFFFF 是
系統地址空間。訪問系統地址空間需要程式有ring0的許可權。而Linux對4G空間的劃分不同與windows。linux將最高的1G 位元組(從虛擬地址0xC0000000 到0xFFFFFFFF),供核心使用,稱為“核心空間”。而將較低的3G 位元組(從虛擬地址0x00000000 到0xBFFFFFFF),供各個進程使用,稱為“用戶空間”。
在LINUX系統下,0xC00000000-0XFFFFFFFF為系統空間,為所有的系統進程所共享,0X00000000-0XBFFFFFFF為用戶空間。