首頁 資訊 實例健康診斷項有哪些

實例健康診斷項有哪些

來源:泰然健康網(wǎng) 時間:2024年12月25日 20:17

實例健康診斷功能是一種自助診斷方式,可以對實例的系統(tǒng)狀態(tài)、網(wǎng)絡(luò)狀態(tài)、磁盤狀態(tài)等進(jìn)行全方位的診斷,幫助您了解實例健康情況,及時發(fā)現(xiàn)并解決常見的問題。本文介紹該功能支持的診斷項,并提供了詳細(xì)的診斷范圍及建議操作供您參考。

診斷項

實例健康診斷功能支持以下診斷:

計算服務(wù)健康診斷:診斷云服務(wù)器ECS底層的資源和虛擬化層,確保ECS底層服務(wù)無異常。

網(wǎng)絡(luò)服務(wù)健康診斷:檢查實例內(nèi)部網(wǎng)絡(luò)組件狀態(tài),以及外部網(wǎng)絡(luò)環(huán)境異常等情況。

存儲服務(wù)健康診斷:檢查實例磁盤的運行狀態(tài)是否存在異常。

實例配置管理診斷:檢查實例在啟動過程中或運行中,是否被某個操作阻塞(block)導(dǎo)致實例無法啟動或者運行異常。

安全控制健康診斷:檢查實例關(guān)聯(lián)的所有安全組入方向常見端口的放行狀態(tài)。

費用類診斷:檢查實例本身和實例關(guān)聯(lián)組件(例如公網(wǎng)IP流量、EIP流量)是否欠費。

資源配額診斷:檢查核心資源的使用量是否即將達(dá)到配額上限。

實例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Linux):檢查實例操作系統(tǒng)內(nèi)的系統(tǒng)文件、關(guān)鍵進(jìn)程、常用業(yè)務(wù)端口占用狀態(tài)、防火墻狀態(tài)等是否正常。

實例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Windows):檢查實例操作系統(tǒng)內(nèi)的常用業(yè)務(wù)端口占用狀態(tài)、防火墻狀態(tài)等是否正常。

說明

計算服務(wù)健康診斷、網(wǎng)絡(luò)服務(wù)健康診斷、存儲服務(wù)健康診斷、實例配置管理診斷發(fā)現(xiàn)的異常屬于非實時態(tài)異常,診斷結(jié)果會包括過去12小時內(nèi)存在過的異常用于查看歷史問題,不一定需要實時修復(fù)。安全控制健康診斷、費用類診斷、資源配額診斷、實例操作系統(tǒng)內(nèi)相關(guān)配置診斷發(fā)現(xiàn)的異常屬于實時態(tài)異常,在當(dāng)前診斷時就存在,建議實時修復(fù)此類異常。

計算服務(wù)健康診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

實例申請資源異常

因CPU或內(nèi)存資源不足,導(dǎo)致實例無法正常啟動。

檢查該實例所需要的CPU、內(nèi)存等物理資源是否充足。

在需要重新為實例分配資源時,例如從節(jié)省停機模式啟動實例,如果因為庫存不足導(dǎo)致物理資源不足,將使實例無法啟動。您可以等待幾分鐘后重新嘗試開機,或者在其他地域或可用區(qū)嘗試重新創(chuàng)建實例。

實例操作系統(tǒng)異常

實例操作系統(tǒng)出現(xiàn)了內(nèi)核Panic、OOM異?;騼?nèi)部宕機等故障。

檢查該實例的操作系統(tǒng)(Guest OS)內(nèi)部是否存在內(nèi)核Panic、OOM異?;騼?nèi)部宕機等故障。

此類故障可能是由于實例配置不當(dāng)或用戶空間的程序配置不當(dāng)導(dǎo)致的,您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例虛擬化異常

實例在運行中出現(xiàn)崩潰或異常暫停。

檢查該實例底層虛擬化層核心服務(wù)是否出現(xiàn)異常。

出現(xiàn)此類異??赡軙?dǎo)致實例崩潰或出現(xiàn)異常暫停,您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例所在宿主機告警

實例所在的物理設(shè)備出現(xiàn)故障告警。

檢查該實例所在的底層物理機是否有故障。

如果底層物理機存在故障,則可能會影響實例的運行狀態(tài)或性能。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例性能受限

積分型實例當(dāng)前處于性能受限模式。

檢查突發(fā)性能實例的CPU積分余額是否足夠支付維持高性能所需的積分。

如果積分不夠,則該突發(fā)性能實例在業(yè)務(wù)高峰時只能使用基準(zhǔn)性能,而無法啟動突發(fā)性能。

實例CPU異常

實例因CPU爭搶而出現(xiàn)異常,或者獨享型實例的CPU綁定失敗。

檢查共享型實例底層是否存在CPU爭搶。

如果存在CPU爭搶,可能導(dǎo)致該實例無法獲得CPU或出現(xiàn)其他異常。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例管控系統(tǒng)異常

ECS實例后臺管控系統(tǒng)發(fā)生異常。

檢查該實例的后臺管控系統(tǒng)是否正常工作。

如果后臺管控系統(tǒng)未正常工作,可能會導(dǎo)致實例運行異常。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例性能短暫受損

檢查實例是否受到底層軟硬件問題的影響,導(dǎo)致性能短暫受損。

檢查實例是否存在因底層軟硬件問題導(dǎo)致的性能受損。

如果存在性能受損,會提示發(fā)生時間,請您檢查該實例的歷史系統(tǒng)事件或者系統(tǒng)日志進(jìn)行確認(rèn)。具體操作,請參見查看歷史系統(tǒng)事件和查看實例的系統(tǒng)日志和屏幕截圖。

網(wǎng)絡(luò)服務(wù)健康診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

實例的底層網(wǎng)絡(luò)鏈路存在丟包

實例對應(yīng)的底層網(wǎng)絡(luò)物理設(shè)施或網(wǎng)絡(luò)服務(wù)存在丟包。

檢查該實例的底層網(wǎng)絡(luò)鏈路是否存在丟包現(xiàn)象。

如果存在,將影響實例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例的網(wǎng)絡(luò)配置不一致

實例當(dāng)前生效的網(wǎng)絡(luò)配置與底層服務(wù)配置存在不一致。

檢查該實例的底層網(wǎng)絡(luò)配置是否一致。

如果實例的底層網(wǎng)絡(luò)配置不一致 ,將影響實例的網(wǎng)絡(luò)性能。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

實例鏈路層異常

實例網(wǎng)卡鏈路層出現(xiàn)異常。

通過向網(wǎng)卡發(fā)送ARP(地址解析協(xié)議)請求來驗證實例基礎(chǔ)網(wǎng)絡(luò)配置是否正常。

如果請求失敗,則很有可能是實例未正常啟動或網(wǎng)絡(luò)配置有問題,您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

網(wǎng)卡加載異常

實例的網(wǎng)卡加載異常。

檢查該實例的網(wǎng)卡是否能正常加載。

如果網(wǎng)卡無法正常加載,將影響實例的網(wǎng)絡(luò)連通性,例如實例無法遠(yuǎn)程連接。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

網(wǎng)卡丟包

網(wǎng)卡入方向或出方向存在丟包現(xiàn)象。

檢查該實例的網(wǎng)卡入方向或出方向是否存在丟包現(xiàn)象。

如果存在,將影響實例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

網(wǎng)絡(luò)會話異常

網(wǎng)卡會話無法正常建立,或會話數(shù)超過上限。

檢查該實例的網(wǎng)卡是否能正常建立會話。

如果網(wǎng)卡無法建立會話或已建立的會話超過限制,將影響實例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

DDos攻擊的防護(hù)狀態(tài)異常

檢查實例的公網(wǎng)IP是否受到DDoS攻擊以及防護(hù)狀態(tài)。

檢查該實例的IP地址是否受到了DDoS攻擊。

阿里云免費提供的DDoS原生防護(hù)服務(wù)可以幫您完成一定程度的攻擊流量清洗,緩解DDoS攻擊造成的不可用,但如果攻擊流量已超出您實例的防護(hù)能力,仍會導(dǎo)致實例進(jìn)入不可用狀態(tài),無法正常訪問。更多DDoS攻擊詳情,請參見什么是DDoS攻擊。

您可以視情況購買其他DDoS防護(hù)產(chǎn)品抵御DDoS攻擊,更多信息,請參見如何選擇DDoS防護(hù)產(chǎn)品。

阿里云DDoS預(yù)防最佳方案,請參見緩解DDoS攻擊的最佳實踐。

網(wǎng)絡(luò)流量達(dá)到實例網(wǎng)絡(luò)帶寬上限

檢查實例的網(wǎng)絡(luò)突發(fā)帶寬是否受到限制。

檢查該實例的突發(fā)網(wǎng)絡(luò)帶寬。

如果突發(fā)網(wǎng)絡(luò)帶寬已超過實例規(guī)格對應(yīng)的網(wǎng)絡(luò)突發(fā)帶寬上限,會導(dǎo)致網(wǎng)絡(luò)性能成為業(yè)務(wù)瓶頸,請您將實例升級至網(wǎng)絡(luò)帶寬能力更高的實例規(guī)格。具體操作,請參見修改實例規(guī)格。

說明

不同實例規(guī)格的網(wǎng)絡(luò)突發(fā)帶寬能力,請參見實例規(guī)格族。

網(wǎng)絡(luò)流量因達(dá)到實例網(wǎng)絡(luò)帶寬上限而受限

檢查實例的內(nèi)外網(wǎng)帶寬總量是否達(dá)到該實例規(guī)格對應(yīng)的網(wǎng)絡(luò)帶寬上限。

檢查該實例的內(nèi)外網(wǎng)帶寬總量。

如果帶寬總量已超過實例規(guī)格對應(yīng)的網(wǎng)絡(luò)基礎(chǔ)帶寬上限,會導(dǎo)致網(wǎng)絡(luò)性能成為業(yè)務(wù)瓶頸,請您將實例升級至網(wǎng)絡(luò)帶寬能力更高的實例規(guī)格。具體操作,請參見修改實例規(guī)格。

說明

不同實例規(guī)格的網(wǎng)絡(luò)基礎(chǔ)帶寬能力,請參見實例規(guī)格族。

存儲服務(wù)健康診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

磁盤擴容未生效

在控制臺對Linux實例的磁盤擴容后,檢查是否需要進(jìn)一步執(zhí)行擴容命令。

檢查在控制臺對該實例的磁盤擴容后,是否已經(jīng)生效。如果在控制臺完成了擴容操作但實際沒有生效,需要手動執(zhí)行擴容命令擴容分區(qū)和文件系統(tǒng)。具體操作,請參見步驟一:擴容云盤容量。

實例磁盤IO hang

磁盤IO hang,導(dǎo)致磁盤無法讀寫。

檢查該實例的系統(tǒng)盤是否存在IO hang的情況(即磁盤內(nèi)的文件系統(tǒng)因讀寫IO延遲過高導(dǎo)致系統(tǒng)不穩(wěn)定或宕機)。

如果出現(xiàn)IO hang,云盤無法進(jìn)行讀寫操作。建議您查看云盤的性能指標(biāo),具體操作,請參見查看云盤監(jiān)控信息。

如果您使用的是Alibaba Cloud Linux 2操作系統(tǒng),檢測IO hang的操作,請參見檢測文件系統(tǒng)和塊層的IO hang。

實例磁盤加載異常

創(chuàng)建或掛載磁盤時出現(xiàn)錯誤。

檢查該實例在啟動時云盤是否能正常掛載。

如果掛載失敗,則會導(dǎo)致實例無法正常啟動。請停止實例后再次啟動實例,或重新掛載云盤,進(jìn)行恢復(fù)。掛載云盤的操作,請參見掛載數(shù)據(jù)盤。

實例云盤讀寫受限

磁盤IO出現(xiàn)延遲過長,或達(dá)到該云盤類型的IO上限。

檢查該實例系統(tǒng)盤的讀寫IO是否存在延遲,以及讀寫的IOPS是否超過了該云盤的IOPS上限。

如果云盤讀寫IOPS超過上限,則云盤讀寫將被限制,查看云盤指標(biāo)的操作,請參見查看云盤監(jiān)控信息。

為避免該情況再次發(fā)生,請您降低磁盤的讀寫頻率或升級為更高性能的云盤類型。各類云盤的讀寫性能指標(biāo),請參見塊存儲性能。

實例磁盤擴縮容異常

磁盤擴縮容后,操作系統(tǒng)調(diào)整文件系統(tǒng)的大小失敗。

檢查該實例的系統(tǒng)盤在擴容后,云盤上的文件系統(tǒng)是否也調(diào)整成功。

如果文件系統(tǒng)未成功調(diào)整,表示云盤容量因資源不足或其他原因?qū)е聰U容失敗,新擴容的磁盤無法使用。請重新發(fā)起擴容操作。不同操作系統(tǒng)的擴容方法與限制,請參見云盤擴容指引。

實例配置管理診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

實例啟動異常

實例無法被管控系統(tǒng)正常啟動。

檢查該實例的boot操作是否能正常執(zhí)行加載。

如果實例無法正常啟動,您需要創(chuàng)建一個新的實例。

實例核心操作異常

您對實例進(jìn)行管理控制的操作執(zhí)行失敗。

檢查您對該實例最近執(zhí)行的管理操作,例如開機、關(guān)機、升配等是否執(zhí)行成功。

如果執(zhí)行失敗,您需要重新發(fā)起該操作。

實例鏡像加載異常

實例所使用的鏡像無法正常加載。

檢查該實例在啟動時所使用的鏡像是否能正常加載。

鏡像可能因為系統(tǒng)原因、鏡像問題等加載失敗。您可以嘗試通過重啟實例進(jìn)行恢復(fù)。

安全控制健康診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

安全組入方向常用端口未放開

對于Windows實例,檢查安全組的3389端口放開情況;對于Linux實例,檢查安全組的22端口放開情況。

檢查該實例關(guān)聯(lián)的安全組常見端口的放開狀態(tài)。

如果常見端口未放行,可能會導(dǎo)致部分服務(wù)無法正常運行或?qū)嵗裏o法訪問。檢查放行的常見端口如下:

入方向SSH端口(22),需放行。

入方向RDP端口(3389),需放行。

費用類診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

檢查包年包月實例是否已到期

檢查以包年包月方式購買的實例是否已到期。

如果該實例是包年包月的計費方式,檢查實例是否已到期。

到期后,實例將被關(guān)機停服,實例無法訪問。到期后資源狀態(tài)變化,請參見包年包月。您需要續(xù)費來恢復(fù)服務(wù),更多信息,請參見續(xù)費概述。

檢查按量實例是否因為欠費導(dǎo)致停服

檢查以按量付費方式購買的實例是否因欠費被停止而無法使用。

如果該實例是按量付費的計費方式,檢查賬號是否欠費。

欠費后,實例將被關(guān)機停服,實例無法訪問。賬號欠費后資源狀態(tài)變化,請參見按量付費。您需要充值后重啟才能恢復(fù)實例。

檢查實例的組件是否已欠費

檢查實例的云盤或網(wǎng)絡(luò)帶寬是否因賬號欠費而無法正常使用。

檢查包年包月實例關(guān)聯(lián)的按量付費云盤或網(wǎng)絡(luò)帶寬是否因賬號欠費而無法正常使用。

實例組件欠費被停服后,實例的訪問也將受到影響。您需要充值進(jìn)行恢復(fù)。

資源配額診斷

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

云盤容量配額不足

云盤容量即將達(dá)到限額。

如果當(dāng)前賬戶的云盤容量即將超過配額上限,您可以在ECS管理控制臺申請?zhí)嵘漕~,具體操作,請參見ECS配額管理。

鏡像數(shù)量配額不足

當(dāng)前賬戶鏡像數(shù)量即將達(dá)到限額。

如果當(dāng)前賬戶的鏡像總數(shù)即將達(dá)到配額上限,請您進(jìn)入云服務(wù)器ECS通用配額列表,單擊當(dāng)前賬戶保有自定義鏡像數(shù)量限額操作列的申請,提升鏡像數(shù)量配額。

彈性網(wǎng)卡創(chuàng)建數(shù)達(dá)到上限

當(dāng)前賬戶擁有的彈性網(wǎng)卡(輔助網(wǎng)卡)即將達(dá)到限額。

如果當(dāng)前賬戶的彈性網(wǎng)卡數(shù)量即將超過配額上限,您可以在ECS管理控制臺申請?zhí)嵘漕~,具體操作,請參見ECS配額管理。

網(wǎng)卡總隊列數(shù)達(dá)到上限

當(dāng)前實例使用的網(wǎng)卡隊列數(shù)已達(dá)到上限。

如果您需要調(diào)整網(wǎng)卡隊列數(shù),請參見管理網(wǎng)卡多隊列。

如果實例的網(wǎng)卡隊列數(shù)不能滿足您的需求,請升配實例規(guī)格,更多信息,請參見實例規(guī)格族和升降配方式概述。

安全組總數(shù)達(dá)到上限

當(dāng)前賬戶創(chuàng)建的安全組數(shù)量即將達(dá)到限額。

如果您的安全組總數(shù)即將達(dá)到配額上限,請您進(jìn)入云服務(wù)器ECS通用配額列表,單擊安全組總數(shù)量上限操作列的申請,提升安全組數(shù)量配額。

資源加入安全組達(dá)到上限

當(dāng)前網(wǎng)卡可加入的安全組即將達(dá)到限額。

如果網(wǎng)卡可加入的安全組即將達(dá)到配額上限,您可以在ECS管理控制臺申請?zhí)嵘漕~,具體操作,請參見ECS配額管理。

如果您調(diào)整了一臺ECS實例或彈性網(wǎng)卡可以加入的安全組數(shù)量限制,相應(yīng)的安全組最大規(guī)則數(shù)量也會發(fā)生變化。更多信息,請參見安全組使用限制。

安全組內(nèi)規(guī)則達(dá)到上限

當(dāng)前安全組內(nèi)的規(guī)則數(shù)即將達(dá)到限額。

如果安全組內(nèi)的規(guī)則數(shù)即將達(dá)到配額上限,您可以在ECS管理控制臺申請?zhí)嵘漕~,具體操作,請參見ECS配額管理。

如果您調(diào)整了安全組的最大規(guī)則數(shù),您的ECS實例或彈性網(wǎng)卡可加入的安全組數(shù)量也會發(fā)生變化。更多信息,請參見安全組使用限制。

實例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Linux)

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

總CPU使用率過高

實例當(dāng)前CPU的使用率已經(jīng)超過80%(基于top命令返回的數(shù)據(jù))。

檢查該實例的總CPU使用率。

如果使用率過高,請您定位使用較多CPU資源的進(jìn)程并判斷是否正常。查詢CPU資源使用情況的操作,請參見Linux系統(tǒng)的ECS實例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。

disk中inode檢查

檢查Disk中inode是否足夠。

檢查該實例磁盤的inode使用率。

如果使用率過高,可能會導(dǎo)致無法在磁盤上創(chuàng)建新的文件,請您根據(jù)需要擴容磁盤。具體操作,請參見步驟一:擴容云盤容量和離線擴容云盤(Linux&Windows)。

DHCP服務(wù)檢查

檢測DHCP配置情況下,網(wǎng)絡(luò)相關(guān)進(jìn)程是否存在,不存在的情況下可能會導(dǎo)致網(wǎng)絡(luò)租約到期之后丟失。

檢查該實例eth0網(wǎng)卡的DHCP服務(wù)進(jìn)程。

如果DHCP服務(wù)進(jìn)程不存在,可能會導(dǎo)致實例的IP地址在租約到期后無法續(xù)租,進(jìn)而導(dǎo)致網(wǎng)絡(luò)中斷。開啟DHCP服務(wù)進(jìn)程的方法,請參見Linux實例中網(wǎng)絡(luò)進(jìn)程異?;虿淮嬖冢瑢?dǎo)致無法續(xù)租IP地址怎么辦?。

fstab中的設(shè)備檢查

檢查fstab中的設(shè)備是否存在。

檢查該實例的/etc/fstab文件。

如果/etc/fstab文件中配置了不存在的設(shè)備,可能會導(dǎo)致實例無法啟動。移除/etc/fstab文件中不存在設(shè)備的方法,請參見如何移除Linux實例“/etc/fstab”文件中不存在的塊設(shè)備。

fstab中的設(shè)備掛載狀態(tài)檢查

檢查fstab設(shè)備是否正確掛載。

檢查該實例的/etc/fstab文件。

如果/etc/fstab文件中設(shè)備未配置自動掛載,會導(dǎo)致實例啟動后無法直接使用設(shè)備。請您執(zhí)行mount命令手動掛載設(shè)備,或在/etc/fstab文件中配置自動掛載。配置磁盤自動掛載的方法,請參見Linux實例中存在未正確掛載的云盤,如何處理?。

fstab文件的格式檢查

檢查fstab內(nèi)容格式是否正確。

檢查該實例的/etc/fstab文件。

如果/etc/fstab文件中存在格式錯誤,可能會導(dǎo)致實例無法啟動。修改/etc/fstab文件格式的方法,請參見啟動實例時提示Give root password for maintenance或Press xxx to continue該如何處理?。

系統(tǒng)防火墻狀態(tài)檢查

檢查系統(tǒng)防火墻是否打開。

檢查該實例的防火墻。

如果實例開啟了防火墻,并設(shè)置了屏蔽外界訪問的規(guī)則,可能會導(dǎo)致無法遠(yuǎn)程連接實例。開啟和關(guān)閉防火墻的方法,請參見開啟或關(guān)閉Linux實例中的系統(tǒng)防火墻

系統(tǒng)文件狀態(tài)檢查

檢查關(guān)鍵系統(tǒng)文件狀態(tài)。

fsck診斷發(fā)現(xiàn)實例的文件系統(tǒng)存在異常,可能會導(dǎo)致部分?jǐn)?shù)據(jù)丟失,進(jìn)而導(dǎo)致實例無法訪問等問題。

檢查并修復(fù)文件系統(tǒng)的方法,請參見Linux實例的文件系統(tǒng)檢查與修復(fù)。

limits設(shè)置檢查

檢查limits設(shè)置是否正確。

檢查該實例的/etc/security/limits.conf文件。

如果/etc/security/limits.conf文件中nofile的值過大,可能會導(dǎo)致無法遠(yuǎn)程連接實例。修改limits系統(tǒng)參數(shù)的方法,請參見Linux實例調(diào)整limits文件中nofile參數(shù)值的方法。

內(nèi)存設(shè)置檢查

檢查大頁內(nèi)存設(shè)置是否過大。

檢查該實例的/etc/sysctl.conf文件。

如果/etc/sysctl.conf文件中設(shè)置的大頁內(nèi)存數(shù)量和大頁內(nèi)存值過大,會導(dǎo)致大頁內(nèi)存(大頁內(nèi)存數(shù)量*大頁內(nèi)存值)超過總內(nèi)存。調(diào)整大頁內(nèi)存的方法,請參見調(diào)整Linux實例大頁內(nèi)存的方法。

常見業(yè)務(wù)端口監(jiān)聽狀態(tài)檢查

檢查常見業(yè)務(wù)端口(例如22和3389)是否處于監(jiān)聽狀態(tài)。

檢查該實例的常見業(yè)務(wù)端口。

如果端口未處于監(jiān)聽狀態(tài),可能會導(dǎo)致不能訪問實例上的應(yīng)用。檢查并修改常見業(yè)務(wù)端口的方法,請參見Linux實例啟動常見服務(wù)并查詢端口監(jiān)聽狀態(tài)的方法。

CPU使用率超過50%的進(jìn)程

實例當(dāng)前CPU的使用率已經(jīng)超過50%(基于top命令返回的數(shù)據(jù))。

檢查該實例中進(jìn)程的CPU使用率。

如果一些進(jìn)程的CPU使用率過高,請您判斷進(jìn)程是否正常。檢查CPU使用率的方法,請參見Linux系統(tǒng)的ECS實例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。

單個CPU使用率過高

單個CPU的使用率超過85%(基于top命令返回的數(shù)據(jù))。

檢查該實例的單個CPU在一段時間內(nèi)的使用率。

如果單個CPU的使用率過高,請您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查CPU使用率的方法,請參見Linux系統(tǒng)的ECS實例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。

系統(tǒng)關(guān)鍵進(jìn)程啟動狀態(tài)檢查

檢查系統(tǒng)關(guān)鍵進(jìn)程是否啟動。

檢查該實例的系統(tǒng)關(guān)鍵進(jìn)程。

如果系統(tǒng)關(guān)鍵進(jìn)程處于未運行狀態(tài),可能會導(dǎo)致實例無法訪問。啟動常見進(jìn)程的方法,請參見Linux實例啟動常見服務(wù)并查詢端口監(jiān)聽狀態(tài)的方法。

NAT環(huán)境內(nèi)核參數(shù)檢查

檢查NAT環(huán)境內(nèi)核參數(shù)是否正確。

檢查該實例內(nèi)與NAT環(huán)境相關(guān)的內(nèi)核參數(shù)配置。

如果NAT環(huán)境相關(guān)的內(nèi)核參數(shù)配置存在異常,會導(dǎo)致無法通過SSH連接實例,以及訪問實例上的HTTP服務(wù)時出現(xiàn)異常。請您檢查并調(diào)整/etc/sysctl.conf中的net.ipv4.tcp_tw_recycle和net.ipv4.tcp_timestamps參數(shù)的取值。修復(fù)NAT環(huán)境內(nèi)核參數(shù)的方法,請參見Linux系統(tǒng)內(nèi)核配置問題導(dǎo)致NAT環(huán)境訪問實例出現(xiàn)異常。

TCP SACK設(shè)置檢查

檢查TCP SACK是否開啟。

檢查該實例是否開啟了TCP SACK。

如果未開啟TCP SACK,可能會影響實例的網(wǎng)絡(luò)性能。開啟TCP SACK的方法,請參見Linux實例開啟TCP SACK的方法。

檢查操作系統(tǒng)是否OOM

檢查操作系統(tǒng)是否OOM。

檢查該實例的操作系統(tǒng)是否發(fā)生了OOM(Out of Memory)問題。

如果發(fā)生了OOM問題,請您檢查實例當(dāng)前的可用內(nèi)存大小是否足以支撐實例上運行的業(yè)務(wù),并在必要時升級配置提升實例內(nèi)存。分析OOM根因并解決OOM問題的方法,請參見如何處理Linux實例中的OOM問題?。

系統(tǒng)關(guān)鍵文件格式檢查

檢查系統(tǒng)關(guān)鍵文件格式。

檢查該實例的系統(tǒng)關(guān)鍵文件格式是否為Unix格式。

如果系統(tǒng)關(guān)鍵文件格式錯誤(不是Unix格式),可能會導(dǎo)致無法遠(yuǎn)程連接實例。修改系統(tǒng)文件格式的方法,請參見Linux實例中修改文件為Unix格式的方法。

selinux狀態(tài)檢查

檢查SELinux是否開啟。

檢查該實例是否開啟了SELinux服務(wù)。

如果開啟了SELinux服務(wù),會導(dǎo)致SSH遠(yuǎn)程連接實例時報錯,請您視情況選擇臨時或永久關(guān)閉SELinux服務(wù)。關(guān)閉SELinux服務(wù)的方法,請參見Linux實例中由于SELinux服務(wù)開啟導(dǎo)致SSH遠(yuǎn)程連接異常。

系統(tǒng)關(guān)鍵用戶狀態(tài)和密碼設(shè)置檢查

檢查關(guān)鍵系統(tǒng)用戶(Linux系統(tǒng)檢查root賬號、Windows系統(tǒng)檢查Administrator賬號)的密碼是否存在等。

檢查該實例操作系統(tǒng)的關(guān)鍵系統(tǒng)用戶。

如果不存在關(guān)鍵系統(tǒng)用戶,可能會導(dǎo)致無法登錄實例。請您檢查/etc/passwd中關(guān)鍵系統(tǒng)用戶的狀態(tài)和密碼設(shè)置情況。檢查關(guān)鍵系統(tǒng)用戶的方法,請參見Linux實例中關(guān)鍵的系統(tǒng)用戶不存在。

SSH訪問權(quán)限檢查

檢查SSH的訪問權(quán)限配置是否正確。

檢查該實例的SSH訪問權(quán)限配置。

如果SSH訪問權(quán)限配置不正確,可能會導(dǎo)致無法登錄實例。修改SSH訪問權(quán)限的方法,請參見SSH的訪問權(quán)限異常導(dǎo)致無法遠(yuǎn)程連接Linux實例。

SSH關(guān)鍵文件系統(tǒng)檢查

檢查SSH訪問所需要的關(guān)鍵文件或目錄是否存在。

檢查該實例中SSH服務(wù)所需的關(guān)鍵文件或目錄。

如果SSH服務(wù)所需的關(guān)鍵文件或目錄不存在,可能會導(dǎo)致無法SSH登錄實例。修復(fù)SSH服務(wù)所需的關(guān)鍵文件或目錄的方法,請參見檢查Linux實例是否存在SSH服務(wù)所需的必備文件或目錄。

SSH是否允許root用戶登錄檢查

檢查SSH配置是否允許root用戶連接。

檢查SSH配置是否允許root用戶連接。

如果禁止使用root用戶登錄實例,會導(dǎo)致使用root用戶登錄實例時返回Permission denied, please try again錯誤。修復(fù)root用戶登錄實例報錯的問題,請參見通過SSH客戶端登錄Linux實例時提示“Permission denied, please try again”錯誤怎么辦?。

網(wǎng)卡多隊列開啟狀態(tài)檢查

網(wǎng)卡多隊列是否開啟。

檢查該實例的網(wǎng)卡是否開啟了網(wǎng)卡多隊列特性。

如果未開啟網(wǎng)卡多隊列特性,可能會影響實例網(wǎng)絡(luò)性能。開啟網(wǎng)卡多隊列的方法,請參見管理網(wǎng)卡多隊列。

實例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Windows)

診斷項(控制臺)

描述

診斷范圍及建議操作

診斷項(控制臺)

描述

診斷范圍及建議操作

Windows操作系統(tǒng)的版本檢查

微軟已經(jīng)不再維護(hù)Windows Server 2008及之前的版本。

檢查該實例的Windows系統(tǒng)版本。

阿里云和微軟不再維護(hù)Windows Server 2008及之前的版本,請您視情況重裝更高版本的Windows系統(tǒng)。實例重裝系統(tǒng)的方法,請參見更換操作系統(tǒng)(系統(tǒng)盤)。

總CPU的使用率過高

檢查Windows CPU使用率總體超過85%。

檢查該實例的CPU使用率。

如果CPU總使用率過高,請您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查CPU使用率的方法,請參見Windows系統(tǒng)ECS實例中CPU使用率較高問題的排查及解決方案。

單CPU使用率過高

檢查單CPU使用率超過80%。

檢查該實例的CPU使用率。

如果單個CPU的使用率過高,請您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查單個CPU使用率的方法,請參見Windows系統(tǒng)ECS實例中CPU使用率較高問題的排查及解決方案。

內(nèi)存使用率偏高

檢查Windows系統(tǒng)內(nèi)存使用率是否超過80%。

檢查內(nèi)存的使用率是否超過80%。

如果該實例當(dāng)前內(nèi)存的總使用率已經(jīng)超過80%,會列出內(nèi)存使用率排名前5的進(jìn)程,請檢查對應(yīng)進(jìn)程是否正常。分析Windows內(nèi)存使用率過高的具體操作,請參見Windows系統(tǒng)內(nèi)存分析工具的介紹。

Windows常用業(yè)務(wù)端口占用狀態(tài)檢查

檢查Windows系統(tǒng)的3389端口是否開放。

檢查該實例的3389端口。

如果未開啟3389端口,會導(dǎo)致無法使用遠(yuǎn)程桌面連接RDP服務(wù)訪問實例。開啟3389端口允許遠(yuǎn)程桌面連接的方法,請參見Windows實例如何啟動遠(yuǎn)程桌面連接RDP服務(wù)。

Windows系統(tǒng)網(wǎng)卡狀態(tài)檢查

檢查Windows網(wǎng)卡是否打開。

檢查該實例的網(wǎng)卡。

如果網(wǎng)卡處于不可用狀態(tài),會導(dǎo)致無法遠(yuǎn)程連接實例。檢查并修復(fù)網(wǎng)卡狀態(tài)的方法,請參見Windows實例中系統(tǒng)網(wǎng)卡處于不可用狀態(tài)。

網(wǎng)卡IPv4地址檢查

檢查Windows系統(tǒng)網(wǎng)卡是否已獲得IPv4地址。

檢查網(wǎng)卡是否已經(jīng)獲取到IPv4地址。

如果網(wǎng)卡未獲取到IPv4地址,可能會導(dǎo)致服務(wù)無法訪問。請檢查該實例是否已啟用DHCP服務(wù)或配置靜態(tài)IP地址。開啟DHCP服務(wù)的具體操作,請參見如何在工作組中安裝和配置DHCP服務(wù)器。

系統(tǒng)網(wǎng)絡(luò)代理狀態(tài)檢查

檢查系統(tǒng)是否設(shè)置了網(wǎng)絡(luò)代理信息。

檢查系統(tǒng)是否設(shè)置了網(wǎng)絡(luò)代理。

如果設(shè)置了網(wǎng)絡(luò)代理,可能會導(dǎo)致服務(wù)無法正常訪問,請根據(jù)業(yè)務(wù)需要選擇是否關(guān)閉這些網(wǎng)絡(luò)代理。Windows系統(tǒng)關(guān)閉網(wǎng)絡(luò)代理的具體操作,請參見如何重置你的Internet Explorer代理設(shè)置。

DHCP配置狀態(tài)檢查

檢查Windows系統(tǒng)網(wǎng)卡的DHCP服務(wù)是否開啟

檢查網(wǎng)卡上DHCP服務(wù)的狀態(tài)。

如果網(wǎng)卡上的DHCP服務(wù)處于關(guān)閉狀態(tài),可能會導(dǎo)致服務(wù)無法訪問,請根據(jù)業(yè)務(wù)需要調(diào)整對應(yīng)網(wǎng)卡的DHCP配置。Windows配置DHCP服務(wù)的具體操作,請參見如何在工作組中安裝和配置 DHCP 服務(wù)器。

Windows虛擬磁盤驅(qū)動狀態(tài)檢查

檢查VirtIO驅(qū)動的版本。

檢查該實例的VirtIO驅(qū)動版本。

如果VirtIO驅(qū)動版本過低,會導(dǎo)致實例磁盤無法在線擴容。升級VirtIO版本的方法,請參見更新Windows實例的virtio驅(qū)動。

磁盤容量檢查

檢查系統(tǒng)C盤容量是否小于1 GB。

檢查該實例系統(tǒng)盤(C盤)的可用空間。

如果可用空間小于1 GB,可能會導(dǎo)致系統(tǒng)運行緩慢,甚至實例無法啟動,請您根據(jù)需要擴容磁盤。具體操作,請參見步驟一:擴容云盤容量和離線擴容云盤(Linux&Windows)。

Windows防火墻狀態(tài)檢查

檢查Windows防火墻的狀態(tài)是否為打開狀態(tài)。

檢查該實例的防火墻狀態(tài)。

如果防火墻處于開啟狀態(tài),可能會導(dǎo)致無法訪問實例上的服務(wù),請視情況調(diào)整防火墻的相關(guān)策略配置。配置防火墻策略的方法,請參見Windows Server系統(tǒng)的ECS實例防火墻策略的配置方法。

crash dump配置狀態(tài)檢查

檢查系統(tǒng)是否開啟了crash dump信息采集。

檢查是否開啟了采集crash dump信息。

如果未開啟采集crash dump信息,當(dāng)系統(tǒng)出現(xiàn)異常重啟或藍(lán)屏?xí)r,無法保存相關(guān)信息進(jìn)行故障排查,請根據(jù)業(yè)務(wù)需要選擇是否要開啟采集crash dump信息。Windows開啟采集crash dump信息的具體操作,請參見Windows系統(tǒng)異常重啟以及藍(lán)屏的處理方法。

Administrator賬號檢查

檢查Administrator賬號是否存在。

檢查是否存在Administrator賬號。

如果不存在Administrator賬號,可能會導(dǎo)致服務(wù)無法正常訪問,請根據(jù)業(yè)務(wù)需要選擇是否要創(chuàng)建Administrator賬號。Windows系統(tǒng)創(chuàng)建賬號的具體操作,請參見如何使用管理控制臺添加或刪除管理員。

相關(guān)知識

產(chǎn)前診斷有哪些項目
產(chǎn)前診斷:檢查哪些項目?
哪些情況需要做羊水診斷
生活中人工智能的應(yīng)用實例有哪些?
健康體檢有哪些項目
狗狗健康檢查的項目有哪些
男性健康體檢有哪些項目
做好產(chǎn)前診斷 守護(hù)生命健康
遠(yuǎn)程問診有哪些實現(xiàn)方式?
健康體檢有哪些項目?

網(wǎng)址: 實例健康診斷項有哪些 http://www.gysdgmq.cn/newsview805896.html

推薦資訊