關於阻塞的概念
阻塞(
Block)這個概念。當進程調用一個
阻塞的系統函式時,該進程被置於
睡眠(
Sleep)狀態,這時
核心調度其它進程運行,直到該
進程等待的事件發生了(比如網路上接收到
數據包,或者調用sleep指定的睡眠時間到了)它才有可能繼續運行。與睡眠狀態相對的是
運行(Running)狀態,在
Linux核心中,處於運行狀態的進程分為兩種情況:
正在被調度執行
CPU處於該
進程的上下文環境中,
程式計數器(eip)里保存著該進程的指令地址,通用
暫存器里保存著該進程運算過程的中間結果,正在執行該進程的指令,正在讀寫該進程的地址空間。
就緒狀態
該進程不需要等待什麼事件發生,隨時都可以執行,但
CPU暫時還在執行另一個進程,所以該進程在一個就緒佇列中等待被
核心調度。系統中可能同時有多個就緒的進程,那么該調度誰執行呢?核心的調度算法是基於優先權和時間片的,而且會根據每個進程的運行情況動態調整它的
優先權和
時間片,讓每個進程都能比較公平地得到機會執行,同時要兼顧用戶體驗,不能讓和用戶互動的進程回響太慢。
阻塞與非阻塞
阻塞
阻塞調用是指調用結果返回之前,當前
執行緒會被掛起。函式只有在得到結果之後才會返回。
有人也許會把
阻塞調用和同步調用等同起來,實際上他是不同的。對於同步調用來說,很多時候當前執行緒還是激活的,只是從邏輯上當前函式沒有返回而已。例如,我們在
CSocket中調用
Receive函式,如果
緩衝區中沒有數據,這個函式就會一直等待,直到有數據才返回。而此時,當前執行緒還會繼續處理各種各樣的訊息。如果主視窗和調用函式在同一個執行緒中,除非你在特殊的界面操作函式中調用,其實主界面還是應該可以刷新。
比如說,socket接收數據的另外一個函式recv就是一個阻塞調用的例子。當socket工作在阻塞模式的時候,如果沒有數據的情況下調用該函式,則當前執行緒就會被掛起,直到有數據為止。
非阻塞
非阻塞和
阻塞的概念相對應,指在不能立刻得到結果之前,該函式不會阻塞當前執行緒,而會立刻返回。
但是非阻塞I/O的問題是:由於完整的I/O沒有完成,立即返回的並不是業務層期望的數據,而僅僅是當前調用的狀態。為了獲取完整的數據,
應用程式需要重複調用I/O操作來確認是否完成。這種重複調用判斷操作是否完成的技術叫做輪詢。調用之後立即返回。
對象是否處於非阻塞模式和函式是不是非阻塞調用有很強的相關性,但是並不是一一對應的。非阻塞對象上可以有阻塞的調用方式,我們可以通過一定的
API去
輪詢狀態,在適當的時候調用阻塞函式,就可以避免阻塞。而對於非阻塞對象,調用特殊的函式也可以進入阻塞調用。
輪詢技術
主要有以下四種:
read
最原始、性能最低,通過重複調用來檢查
I/O的狀態來完成完整數據的讀取。在得到數據前,CPU一直好用在等待上。
select
改進了
read,通過對
檔案描述符上的事件狀態來進行判斷。有一個較弱的限制為由於它採用一個1024長度的數組來存儲狀態,所以它最多可以同時檢查1024個檔案描述符。
poll
對
select改進,採用鍊表方式避免
數組長度的限制,其次它能避免不需要的檢查。擔當檔案描述符較多時,它的性能還是低下。
epoll
Linux下效率最高的
I/O事件通知機制,在進入輪詢的時候如果沒有檢查到I/O事件,將會進行休眠,直到事件發生將它喚醒。它是真實利用了事件通知、執行回調的方式,而不是遍歷查詢,所以不會浪費
CPU,執行效率較高。
kequeue
IO模式設定
一般對於系統是阻塞模式還是非阻塞模式有兩種方式:
fcntl 設定
flags = fcntl(sockfd, F_GETFL, 0); //獲取檔案的flags值。
fcntl(sockfd, F_SETFL, flags | O_NONBLOCK); //設定成非阻塞模式;
flags = fcntl(sockfd,F_GETFL,0);
fcntl(sockfd,F_SETFL,flags&~O_NUNBLOCK); //設定成阻塞模式;
recv, send 函式設定
recv, send 函式的最後有一個flag 參數可以設定成MSG_DONTWAIT
臨時將sockfd 設定為非阻塞模式,而無論原有是阻塞還是非阻塞。
recv(sockfd, buff, buff_size,MSG_DONTWAIT); //非阻塞模式的訊息傳送
send(scokfd, buff, buff_size, MSG_DONTWAIT); //非阻塞模式的訊息接受
阻塞系統與非阻塞系統的區別
讀(read/recv/msgrcv)
阻塞和非阻塞的區別在於沒有數據到達的時候是否立刻返回。
read 也好,recv 也好只負責把數據從底層緩衝
copy到我們指定的位置。
阻塞情況下:
1、如果沒有發現數據在網路緩衝中會一直等待,
2、當發現有數據的時候會把數據讀到用戶指定的緩衝區,但是如果這個時候讀到的數據量比較少,比參數中指定的長度要小,read 並不會一直等待下去,而是立刻返回。
read 的原則,是數據在不超過指定的長度的時候有多少讀多少,沒有數據就會一直等待。所以一般情況下,我們讀取數據都需要採用循環讀的方式讀取數據,因為一次read 完畢不能保證讀到我們需要長度的數據,read 完一次需要判斷讀到的數據長度再決定是否還需要再次讀取。
非阻塞情況下:
1、如果發現沒有數據就直接返回,
2、如果發現有數據那么也是採用有多少讀多少的進行處理。
所以
read 完一次需要判斷讀到的數據長度再決定是否還需要再次讀取。
寫(send/write/msgsnd)
寫的本質也不是進行傳送操作,而是把用戶態的
數據copy 到系統底層去,然後再由系統進行傳送操作,send,write返回成功,只表示數據已經copy 到底層緩衝,而不表示數據已經發出,更不能表示對方連線埠已經接管到數據。
阻塞情況下,write會將數據傳送完。(不過可能被中斷)
在阻塞的情況下,是會一直等待,直到write 完,全部的數據再返回。這點行為上與讀操作有所不同。
非阻塞寫的情況下,是採用可以寫多少就寫多少的策略。與讀不一樣的地方在於,有多少讀多少是由網路傳送的那一端是否有數據傳輸到為標準,但是對於可以寫多少是由本地的網路堵塞情況為標準的,在網路阻塞嚴重的時候,
網路層沒有足夠的
記憶體來進行寫操作,這時候就會出現寫不成功的情況,阻塞情況下會儘可能(有可能被中斷)等待到數據全部傳送完畢, 對於非阻塞的情況就是一次寫多少算多少,沒有中斷的情況下也還是會出現write 到一部分的情況。