DCUI

基本介紹

  • 外文名:Direct Console User Interface
解決問題,遷移,結束維護模式,

解決問題


如果不想使用vCenter Server或者vSphere client管理ESXi主機,那么需要提前完成一些準備工作。在這種情況下,像Dell DRAC和HP ILO這些遠程控制工具能夠發揮重要作用。使用DCUI(Direct Console User Interface)——簡單來說就是ESXi console——來管理網路可能會有些複雜,但確DCUI是一種最為直接的方式。下面介紹一些我所了解的DCUI主機管理方式,不需要使用vSphere client——甚至是SSH。
在一個設計良好的DCUI網路環境當中,DCUI虛擬機(VM)網路應該和主機管理網路相互分離,並且需要正確配置多塊物理網卡連線到不同交換機。DCUI虛擬機和DCUI管理網路之間的流量不能相互影響。在將要分析的案例當中,DCUI虛擬機仍然能夠正常運行。如果能夠通過遠程桌面或者SSH協定登入到虛擬機,那么管理員應該嘗試將其安全關閉。
檢查DCUI網路基礎架構之後,發現這個問題和硬體或者交換機沒有關係,進一步排查顯示軟體驅動也不是引發問題的根本原因。

遷移


為了儘量減少DCUI對於業務的影響,應該首先將受影響的DCUI虛擬機轉移到另外一台正常工作的主機當中並且重新啟動,這樣能夠保證在修復故障主機的同時依然能夠管理業務DCUI虛擬機。但是需要注意的是這台主機伺服器可能位於幾千公里之外,因此我們必須使用DCUI帶外管理系統。
DCUI或者任何遠程管理功能都不適合作為日常管理方式,但是DCUI卻能夠用來處理緊急情況。管理員可以通過DCUI的方式關閉不能執行命令的DCUI虛擬機。在vSphere 6.0之前的版本當中,同時按下Ctrl+F1,輸入root賬戶密碼 ,就可以使用DCUI列出幾種console功能了。但是正如之前所說的那樣,應該使用其他DCUI方式來安全關閉虛擬機。這篇文章討論的僅僅是最後的應急方案,比如,虛擬機網路和管理網路之間出現嚴重故障。
在vSphere 6當中,如果管理員使用DCUI關閉當前主機,那么系統會提示管理員強制關閉所有未遷移DCUI虛擬機的電源。這是DCUI一項非常有用的功能,但是管理員在使用DCUI這種功能的時候需要特別小心,因為錯誤使用DCUI可能會導致大量DCUI虛擬機無法訪問。
對於DCUI的vSphere 5當中的虛擬機來說,可以使用下面的命令進行定位和關閉:
可以使用下面的命令列出所有DCUI虛擬機。(注意需要關閉的虛擬機的進程ID)
esxcli vm process list
使用如下命令關閉DCUI虛擬機:
esxcli vm process kill <process ID>
在關閉所有DCUI虛擬機之後,可以使用下面的命令將虛擬機置於維護模式:
esxcli system maintenanceMode set --enable true
儘管這個過程不是必須的,但是確保所有DCUI虛擬機已經被正常關閉,能夠隨時切斷主機電源是一種很好的操作流程。

結束維護模式


到這個階段為止,DCUI虛擬機應該已經完全獨立於之前的主機,可以在另外一台主機上接通電源之後手動重啟。在這個案例當中,由於某種原因我必須在之前的主機上重新啟動這些DCUI虛擬機。這的確不是一種最好的解決方案,但是完全能夠實現。和之前的操作類似,從結束DCUI伺服器的維護模式開始,使用下面的命令:
esxcli system maintenanceMode set --enable false
之後,手動開啟DCUI虛擬機電源。所有的DCUI虛擬機檔案都將位於自己的資料夾、也就是主機的\mvfs\volumes當中。使用cd命令進入目標資料夾,還可以使用tab實現名稱自動補全,這種特性可以起到很大幫助作用。每個資料夾都代表了一個data store,所以可以在對應的資料夾當中尋找DCUI虛擬機。
唯一的問題在於某些DCUI虛擬機會因為一個某些罕見錯誤而無法啟動或者最終逾時。對於這種情況來說,需要檢查問題DCUI虛擬機當中的vmware.log(位於虛擬機資料夾當中)檔案以查明具體錯誤信息,
這邊文章不可能列舉出管理員可能遇到的所有錯誤和複雜問題,但是為管理員提供了一種良好的排錯思路。
這種問題通常不會經常發生。如果DCUI虛擬機被劃分到單獨的網路連線埠組和鏈路當中,並且能夠回響遠程客戶端請求,那么就更像是DCUI管理問題,可以在非工作時間使用一種更為安全的方式進行修復,降低可能造成的影響。幸運的情況下,還有可能是DCUI網路連線問題,可以在不導致任何故障時間的情況下將問題解決。

相關詞條

熱門詞條

聯絡我們