當前位置: 妍妍網 > 碼農

IT運維應知必會的運維巡檢及樣版請收好了!

2024-04-24碼農

關註上方 浩道Linux ,回復 資料 ,即可獲取海量 L inux Python 網路通訊、網路安全 等學習資料!

前言

大家好,這裏是 浩道Linux ,主要給大家分享 L inux P ython 網路通訊、網路安全等 相關的IT知識平台。

今天浩道跟大家分享一份作為IT運維都應知必會的運維巡檢及樣版!請收藏好了,別到處問人家要了!

文章來源: http://www.evanjiang.net

目 錄

1. 概述

1.1 範圍定義

1.2 內容說明

2. 巡檢維度

2.1 基礎設施狀況

2.2 容量狀況

2.3 效能狀況

2.4 資訊保安

2.5 業務連續性

3. 巡檢內容

3.1 系統整體架構

3.2 機房環境

3.3 網路系統

3.4 儲存系統

3.5 主機系統

3.6 資料庫系統

3.6.1 Oracle 資料庫

3.6.2 DB2 資料庫

3.7 中介軟體系統

3.8 套用系統

3.9 備份與恢復系統

4. 巡檢方法

4.1 IBM 主機

4.2 IBM HACM PCluster

4.3 HP 主機

4.4 HP MC/ServiceGuard Cluster

4.5 SUN 主機

4.6 VCS Cluster

4.7 網路部份

4.7.1 XX 網路裝置

4.7.2 XX 網路裝置

5. FAQ

5.1 機房環境

5.2 網路系統

5.3 儲存系統

5.4 主機系統

5.4.1 sun solaris 主機命令

5.4.2 IBM AIX 主機命令

5.4.3 HP-UX 主機命令

5.5 資料庫系統

5.5.1 Oracle 資料庫

5.5.2 DB2 資料庫

5.6 中介軟體系統

5.7 套用系統

6. 附錄 1 詞匯表

7. 附錄 2 參考資料

1. 概述

1.1 範圍定義

對 IT 系統巡檢的邏輯組成,透過對範圍定義的與 IT 系統相關的維度的評估,定位當前 IT 系統的健康狀況,指導建立改進方案與方針。

1.2 內容說明

對 IT 系統巡檢的具體評估指標, 用於支持對範圍所定義的維度評估結論, 提供具體的數據支持;用於給客戶提供巡檢類報告的數據提供數據支持。

2、巡檢維度

對 IT 系統巡檢的評估維度主要包括以下五個方面:

一個完備的 IT 系統建設應該包括上述所有相關解決方案, 而客戶套用系統中在這幾方面體現了不同的完備程度。由於使用者行業與業務特點,對這些範圍的側重程度不同, 因此我們在評估特定行業使用者的 IT 系統之初, 要充分考慮這種行業因素,所得出的結論也是對特點行業使用者有指導意義的評估結果。

2.1 基礎設施狀況

IT 基礎設施包括系統軟體平台和硬體基礎設平台。

系統軟體平台主要包括作業系統、資料庫、中介軟體。

硬體基礎設平台主要包括網路通訊平台和伺服器系統平台以及儲存系統平台。

對基礎設施狀況的評估內容包括:

 IT 系統運維環境狀況

 IT 系統硬體執行狀況

 IT 系統軟體平台執行狀況

 IT 系統鏈路狀況

2.2 容量狀況

由於 IT 系統的業務和服務需求可能每天都在發生變化,資訊系統有時會遇到頻寬和儲存能力不足的問題。要與 IT 系統當前和將來的業務需求相符意味著必須經常地測定容量。容量規劃是一種效能價格比很高的手段,可以根據以往的效能統計數位預知潛在的資源短缺情況。

正確的對當前 IT 系統的容量狀況做出評估, 是掌握和預測系統當前和未來可用程度的一個重要標誌之一,進而也以此為依據做出合理的容量規劃。

對容量狀況的評估主要包括:

 網路頻寬負載狀況

 儲存的容量狀況

 主機系統負載情況

 業務系統所能承載的吞吐量

 軟體平台參數配置適用度。

2.3 效能狀況

IT 系統所提供的業務的效能,是當前業界評價 IT 系統實施成功與否的主要標準之一。

通常對 IT 系統效能狀況評估的物件為具體的業務功能模組, 但並不是針對所有的業務功能模組,對這些模組的選取一般遵循以下原則:

 系統日常執行中,使用頻率高的功能模組;

 系統日常執行中,業務容易產生相對大並行量的功能模組;

 涉及到的大數據量表操作的功能模組;

 使用者反映效能問題突出的模組。

透過選取具有代表性的功能模組,進行效能評測,得出當前系統的效能狀況,而這種巡檢的環境需要接近真實環境才具有說服力。而本 IT 系統預防性巡檢活動通常是在真實的生產環境下完成,因此需要采取適合現場環境的效能評估手段來完成。

對 IT 業務系統的效能評估主要包括以下三個方面:

 業務系統的響應效能狀況

 業務系統的穩定性效能狀況

 業務容量效能狀況

業務系統的響應效能指的是在正常業務並行負載下,以響應時間為主要關註點的業務模組操作的執行時間,通常單位為秒;

業務系統的穩定性效能的主要關註點則是在長時間較大負載壓力下,業務系統能夠正常完成業務操作的程度;

業務容量效能狀況指的是當前業務系統負載承受能力,目的是了解系統的業務壓力可承受的範圍,以便在峰值到來之前做出應對措施,通常關註的效能指標為並行量和業務的吞吐量。

2.4 資訊保安

這裏把資訊保安定義為資訊系統數據不會被非法使用者在未經授權的情況下取得或破壞。資訊保安所涉及的技術與業務層面很廣,以下是對其簡要分類:

1.物理安全

保護資訊系統的機房環境、裝置、設施、媒體和資訊免遭自然災害、環境事故、人為物理操作失誤、各種以物理手段進行的違法犯罪行為導致的破壞、遺失。

2.網路系統安全

網路防護安全是數中心據安全的重要組成部份。網路安全模式要求數據中心首先分析自己的網路系統,並從中找出不同業務、數據和安全策略的分界線,在這些分界線上構建 IT 系統安全等級不同的安全域。

在安全域劃分的基礎上,透過采用入侵檢測、漏洞掃描、病毒防治、防火墻、網路隔離、安全虛擬專網(VPN)等成熟技術,利用物理環境保護、邊界保護、系統加固、節點數據保護、數據傳輸保護等手段,透過對網路和系統安全防護的統一設計和統一配置,實作 IT 系統全系統高效、可靠的網路安全防護。

3.作業系統安全

作業系統提供若幹種基本的機制和能力來支持資訊系統和應用程式安全,如身份鑒別、存取控制、審計等等。目前主流的商用作業系統主要有 UNIX、LINUX和 Windows 平台。由於商用的普遍性特點,這些系統都存在許多安全弱點,甚至包括結構上的安全隱患, 比如超級管理員/系統管理員的不受控制的許可權、 緩沖區溢位攻擊、病毒感染等。

作業系統的安全是上層套用安全的基礎。提高作業系統本身的安全等級尤為關鍵,除了及時打 Patch 外,還要采用如下的加強措施:

 身份鑒別機制:實施強認證方法,比如口令、電子證書等;

 存取控制機制:實施細粒度的使用者存取控制、細化存取許可權等;

 數據保密性:對關鍵資訊、數據要嚴加保密;

 完整性:防止數據系統被惡意程式碼比如病毒破壞,對關鍵資訊進行數位簽名技術保護;

 系統的可用性:不能存取的數據等於不存在, 不能工作的業務行程也毫無用處。

因此作業系統要加強應對攻擊的能力,比如防病毒、防緩沖區溢位攻擊等;

 審計:審計是一種有效的保護措施,它可以在一定程度上阻止對資訊系統的威脅,並對系統檢測、故障恢復方面發揮重要作用。

4.資料庫安全

資料庫安全性問題應包括兩個部份:一、資料庫數據的安全。它應能確保當資料庫系統 DownTime 時, 當資料庫數據儲存媒體被破壞時以及當資料庫使用者誤操作時,資料庫數據資訊不至於遺失;二、資料庫系統不被非法使用者侵入。它應盡可能地堵住潛在的各種漏洞,防止非法使用者利用它們侵入資料庫系統。

5.數據的傳輸安全

為保證業務數據在傳輸過程的真實可靠,需要有一種機制來驗證活動中各方的真實身份。安全認證是維持業務資訊傳輸正常進行的保證, 它涉及到安全管理、加密處理、 PKI 及認證管理等重要問題。套用安全認證系統采用國際通用的 PKI技術、X.509 證書標準和 X.500 資訊釋出標準等技術標準可以安全發放證書,進行安全認證。當然,認證機制還需要法律法規支持。安全認證需要的法律問題包括信用立法、電子簽名法、電子交易法、認證管理法律等。

6.套用身份鑒定

由於傳統的身份認證多采用靜態的使用者名稱/口令身份認證機制, 客戶端發起認證請求, 由伺服器端進行認證並響應認證結果。使用者名稱/口令這種身份認證機制的優點是使用簡單方便,但是由於沒有全面的安全性方面的考慮,所以這種機制存在諸多的安全隱患。可以采用:雙因子認證和 CA 認證兩種解決方案。

7.套用授權管理

許可權管理系統是 IT 系統資訊保安基礎設施的重要組成部份,是 ICDC 資訊系統授權管理體系的核心。它將授權管理和存取控制決策機制從具體的套用系統中剝離出來,采用基於角色的存取控制(RBAC,Role Based Access Controls)技術,透過分級的、自上而下的許可權管理職能的劃分和委派,建立統一的特權管理基礎設施(PMI,Privilege Management Infrastructure) ,在統一的授權管理策略的指導下實作分布式的許可權管理。

許可權管理系統能夠按照統一的策略實作層次化的資訊資源結構和關系的描述和管理,提供統一的、基於角色和使用者組的授權管理,對授權管理和存取控制決策策略進行統一的描述、 管理和實施, 提供基於內容證書和 LDAP 的策略和授權資訊釋出功能,構建高效的決策資訊庫和決策資訊庫的更新、同步機制,面向各類套用系統提供統一的存取控制決策計算和決策服務。建立統一的許可權管理系統,不僅能夠解決面向單獨業務系統或軟體平台設計的許可權管理機制帶來的許可權定義和劃分不統一、各存取控制點安全策略不一致、管理操作冗余、管理復雜等問題, 還能夠提高授權的可管理性, 降低授權管理的復雜度和管理成本,方便套用系統的開發,提高整個系統的安全性和可用性。

8.套用存取控制

存取控制是 IT 系統安全防範和保護的主要核心策略, 它的主要任務是保證資訊資源不被非法使用和存取。存取控制規定了主體對客體存取的限制,並在身份辨識的基礎上,根據身份對提出資源存取的請求加以控制。它是對資訊系統資源進行保護的重要措施,也是電腦系統最重要和最基礎的安全機制。根據控制手段和具體目的的不同, 數據中心的存取控制技術包括以下幾個方面:入網存取控制、網路許可權控制、目錄級安全控制、內容安全控制等,只有各種安全策略相互配合才能真正起到保護作用。

9.套用審計追蹤

IT 系統的安全審計提供對使用者存取系統過程中所執行操作進行記錄的功能,將使用者在系統中發生的相關操作(如:系統登陸/結束、系統操作)記錄到資料庫中,以確保在需要的時候,對使用者歷史存取系統的操作進行追溯。

通常審計跟蹤與日誌恢復可結合起來使用,日記恢復處理可以很容易地為審計跟蹤提供審計資訊。如果將審計功能與告警功能結合起來,就可以在違反安全規則的事件發生時,或在威脅安全的重要操作進行時,及時向安檢員發出告警資訊,以便迅速采取相應對策,避免損失擴大。審計記錄應包括以下資訊:事件發生的時間和地點;引發事件的使用者;事件的型別;事件成功與否。

在 IT 系統中,審計可以是獨立工作的不相關的元件的集合,可以是相互關聯運作的元件的集合。審計範圍包括作業系統和各種應用程式。

10.安全管理與策略

IT 系統安全管理系統應包括管理策略、管理組織保障、管理法規制度以及管理技術保障等內容。

IT 系統安全是一個動態不斷調整的過程,它隨著 IT 系統業務套用和基礎設施的不斷發展而不斷改變,例如 IT 系統資訊系統各個資訊網路、資訊保安部件的具體設定規則,包括特定系統(裝置)的口令管理策略、特定防火墻的過濾規則、特定認證系統中的認證規則、特定存取控制系統中的主體存取控制串列、安全標簽等。為了保證 IT 系統資訊保安,及時進行安全策略調整是必要。管理組織保障,實作對人員、系統、安全裝置、物理環境和系統執行的安全管理。另外,IT 系統安全策略應遵照相關行業的法律、規定。

管理技術保障是 IT 系統安全執行管理的技術保證。

2.5 業務連續性

連續性是指一個數據中心類套用為了維持其生存, 一旦發生突發事件或災難後,在其所規定的時間內必須恢復關鍵業務功能的強制性要求,這就需要預先發現可能會影響企業關鍵業務能力和過程的所有事件, 采取相應的預防和處理策略,以保證企業在事件發生時業務不被中斷。透過業務連續性計劃保證數據中心業務的不間斷能力,即在災難、意外發生的情況下,無論是數據中心組織結構、業務操作和 IT 系統,都可以以適當的備用方式繼續業務運作。

嚴格的說,業務持續計劃的建立和實施過程,實際上是涉及數據中心營運,因此也涉及到計畫管理的方方面面。透過多年的實踐,根據自身實踐經驗並參照國際災難恢復協會(DRI)與業務連續性協會(BCI)的標準,總結出業務持續計劃的模型,經過長時間的驗證,該業務持續計劃模型能夠給數據中心帶來有效及徹底的業務持續管理。

災難恢復的技術實作和級別——

容災按級別可分為數據容災和套用容災兩部份:

數據容災:在異地建立一個數據拷貝,這個拷貝在本地生產系統的「數據系統」出現不可恢復的「物理故障」時,提供可用的數據。

套用容災:在異地提供一個完整的套用和數據系統拷貝(不一定要求同當量),這個拷貝在本地生產系統出現不可恢復的「物理故障」時,提供即時可用的生產系統。

1.平台安全性

平台完整性解決 ICDC 內部業務平台和接入平台的高可靠性問題。主要包括伺服器、儲存和網路層面的技術。

平台完整性涉及的技術主要包括:伺服器、記憶體、及相應網路連線的部件級可靠性技術;平台的集群技術;Application Server 的高可靠技術;資料庫的高可靠技術。

2.備份和恢復完整性

備份和恢復完整性實作 IT 系統內部對業務數據平台的保護。包括伺服器和儲存層相關技術。

備份完整性涉及的技術主要包括基於磁帶、光碟等離線介質的備份技術(或稱定點拷貝) ;以及基於線上儲存介質(磁盤)進行的生產數據快照技術。

實作備份完整性目標,首先需要對映業務種類所需要的數據集。即根據容災備份系統的需求,明確哪些業務狀態數據需要備份,事實上,需要提供最完善備份的是穩定的業務狀態數據, 而處理流程當中的中間臨時數據的備份需求較低。

另外,在備份完整性的實施過程中,應該區分備份數據和存檔數據。備份數據是為滿足容災備份的要求,具有較短的時效性,備份數據會根據一定的備份頻度被反復覆蓋。存檔數據則按照業務或法規的要求,有較長的時效性,並具有不斷累積的特性。

在絕大多數數據中心套用場合, 備份是經常性的工作, 恢復是十分偶然的操作,因此, 恢復往往是難以經過充分巡檢、 最佳化的容災備份技術---這就更加要求恢復操作具有明確的可預見性。

3.資訊完整性

資訊完整性實作對業務數據平台的跨 ICDC 生產中心的保護, 實作資訊完整性技術是將業務連續性擴充套件到容災階段的一個十分關鍵的步驟。

資訊完整性技術將生產中心的業務狀態數據完整地復制到備份中心。

實作資訊完整性可以采用同步或異步復制技術。

4.處理完整性

處理完整性即對業務支撐系統平台的完整的、跨越生產中心的保護。

實作處理完整性, 需要比較復雜的系統整合工作, 包括詳細的系統設計和規劃。

目前的大多數關鍵業務及其關聯子業務系統的容災的級別要求為處理完整性。

實作處理完整性的關鍵在於以下三個要素:

 對數據平台的保護-遠端數據復制技術(即資訊完整性)和對業務平台的保護-伺服器、資料庫等冗余及切換技術以及套用軟體切換技術的整合

 對接入平台的保護和切換-外部介面的冗余和切換

 系統的監控和切換

5.業務連續性管理

業務連續性管理是 IT 資訊保安政策的宏觀管理檔, 該規範清楚說明業務連續性計劃對於保障資訊保安所采取態度、監管責任以及信念。

業務連續性管理規範包含【災難恢復預案】 、 【業務連續性計劃】等檔。這些規範從宏觀層面,涵蓋了災難備份建設所涉及的內容,其目的是要保護資訊保安。根據這些規範,建立業務連續性計劃、災難恢復預案,其中主要包括:災難應急小組的組織架構和人員職責, 應急隊伍、 聯絡清單及各類應急處理流程,普及教育及人員培訓計劃和演習計劃等,並報主管部門備案。

主管部門要對各單位災難恢復預案進行全面稽核,評估災難恢復預案的完整性和可操作性,配合\建立規範的管理制度和操作文件。

定期進行災難演習與應急培訓。

3、巡檢內容

上一節完成了對 IT 系統巡檢的關註方面的分析說明, 這一節開始介紹具體體現這些關註方面的指標,在實際檢查過程中,可以根據客戶的需要選取特定的指標參數,作為評估目標系統的數據支持內容。

3.1 系統整體架構

以下內容作為基本 IT 系統資訊被首先調查記錄,供分析參考使用。

 IT 系統架構拓撲圖

 網路裝置配置

---裝置型號, IOS 版本, 模組型號和數量,用途

 儲存系統設定

---裝置型號, IO 頻寬, Cache 容量,磁盤數量,接入模式,儲存容量,LUN 配

置,所屬套用

 主機系統設定

---裝置型號,CPU 配置(型別,主頻,數量) ,記憶體容量,網卡配置(數量,

速率) ,內建硬碟配置(數量,容量,Raid) ,所屬套用

 資料庫軟體

---產品名稱,版本號,所屬套用

 中介軟體軟體

---產品名稱,版本號,JDK 版本,所屬套用

 套用系統

---產品名稱,版本號,架構平台,系統架構型別

3.2 機房環境

以上的條件可以現場觀察和詢問使用者完成。

3.3 網路系統

網路裝置

防火墻

IPS

IDS

VPN

3.4 儲存系統

3.5 主機系統



3.6 資料庫系統

3.6.1 Oracle 資料庫

3.6.2 DB2 資料庫

3.7 中介軟體系統

3.8 套用系統

3.9 備份與恢復系統

備份與恢復系統是 IT 系統中重要的容災措施,IT 系統應該根據自身業務特點選取以下備份與恢復方案。

1.備份系統

裝置系統備份:

部件的冗余

---包括網路裝置,主機裝置,儲存裝置內部部件的冗余,保證在裝置本身避免單點故障。

裝置的冗余

---網路層裝置冗余包括交換裝置的 HA 和路線冗余, 交換裝置的 HA 可以實作故障發生時自動切換。

---主機層裝置冗余可以采用冷備與熱備兩種方式, 熱備即主機集群, 實作故障發生時自動切換。

---儲存層的裝置冗余指陣列間的映像和異地復制方案。

數據系統備份:

系統級歸檔備份

---一般采用磁帶備份方式,備份裝置可選取磁帶機或磁帶庫

---制定備份策略,可以按一段時間周期,將完全備份、增量備份和差分備份組合使用制定備份策略。

---系統級歸檔備份的備份數據與線上生產數據存在備份間隔差異, 對資料庫數據采用這種備份時應將資料庫設定為歸檔模式,來消除這種差異,保證數據的完整性。

儲存級數據備份

---本地映像

---同城容災映像

---異地數據傳輸,分為同步和異步模式。

套用系統備份:

套用系統備份基於網路備份,主機系統備份和數據備份的整合,方案中涉及以下因素:

本地套用系統備份,遠端套用系統備份

手動套用切換,自動套用切換

套用系統備份是備份方案中級別最高的備份形式,而其中自動套用切換的遠端系統備份方案則是最高級備份方案,保證套用的完整性。

2.恢復系統

備份系統完成 IT 系統的容災保證的一般工作, 恢復的成功與否是衡量備份方案有效的唯一標誌。

備份是多次重復工作,而恢復操作則較少發生,這種情況下,驗證備份有效性就尤為重要。透過制定以下策略與措施,保證恢復策略的有效性:

  • 制定恢復應急預案

  • 制定恢復流程

  • 定期進行巡檢、培訓與演習

  • 4、巡檢方法

    對照巡檢計劃的安排,對主機系統進行硬體、作業系統進行功能及效能檢查。

    註意:系統中所使用的每台主機都要單獨列表檢查。

    4.1 IBM 主機

    巡檢物件:XX 系統 XX 伺服器(HOSTNAME)

    巡檢目的:檢查 XX 系統 XX 伺服器的狀態

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢

    4.2 IBM HACMP Cluster

    巡檢物件:XX 計畫雙機系統

    巡檢目的:XX 系統雙機熱備功能正常

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢

    4.3 HP 主機

    巡檢物件:XX 系統 XX 伺服器(HOSTNAME)

    巡檢目的:檢查 XX 系統 XX 伺服器的狀態

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢

    4.4 HP MC/ServiceGuard Cluster

    巡檢物件:XX 計畫雙機系統

    巡檢目的:XX 系統雙機熱備功能正常

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢



    4.5 SUN 主機

    巡檢物件:XX 系統 XX 伺服器(HOSTNAME)

    巡檢目的:檢查 XX 系統 XX 伺服器的狀態

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢

    4.6 VCS Cluster

    巡檢物件:XX 系統 XX 伺服器(HOSTNAME)

    巡檢目的:檢查 XX 系統 XX 伺服器的狀態

    巡檢平台:XX 系統主機,超級使用者

    前提條件:路線通暢

    4.7 網路部份

    對照巡檢計劃的安排,對網路裝置進行硬體、作業系統進行功能及效能巡檢。

    註意:系統中所使用的每台網路裝置都要單獨列表巡檢。

    4.7.1 XX 網路裝置

    巡檢物件:XX 系統網路裝置(NAME)

    巡檢目的:XX 系統網路裝置的系統狀態

    巡檢平台:XX 系統網路裝置,超級使用者

    前提條件:路線通暢

    4.7.2 XX 網路裝置

    巡檢物件:XX 系統網路裝置(NAME)

    巡檢目的:XX 系統網路裝置的系統狀態

    巡檢平台:XX 系統網路裝置,超級使用者

    前提條件:路線通暢

    5、FAQ

    5.1 機房環境

    對機房的基礎設施配備應該按照標準實施, 不符合標準的計畫應該盡可能整改,添加應有設施。對 UPS 的維護應該定期進行檢測,巡檢其供電的有效時間,一旦發現電池老化應盡快更換。

    5.2 網路系統

    網路裝置

    Cisco 系統的一些巡檢常用命令列表:

    總體的資訊收集 show tech

    檢視 ios 版本等資訊 show version

    檢視 log show log

    檢視裝置的時鐘 show clock

    檢視介面狀態 show ip int bri

    檢視裝置路由情況 show ip route

    檢視 ios 軟體包 show flash (或 show bootflash /show disk0)

    防火墻

    IPS

    IDS



    VPN

    5.3 儲存系統



    Sun T3 陣列的常用命令列表:

    系統狀態 sys stat

    系統設定 sys list

    系統部件狀態 fru stat

    系統部件列表 fru list

    卷的列表和狀態 vol list,vol stat

    SUN StorEdge 3000 系列陣列 cli 命令列表:

    顯示陣列全部配置 show configuration

    檢視裝置網路狀態 show network-parameters

    元件狀態命令

    show battery-status

    show enclosure-status

    show frus

    檢視磁盤資訊 show disks

    檢視邏輯裝置卷等

    show logical-drives

    show luns

    檢視分區狀態

    show lun-maps

    show partitions

    show logical-volumes

    顯示 firmware 版本

    show ses-devices

    show deses-devices

    5.4 主機系統

    5.4.1 sun solaris 主機命令

    檢視系統執行狀況裝置執行狀況

    tform/sun4u/sbin/prtdiag –v

    檢視系統日誌

    grep WARN /var/adm/messages*

    grep error /adm/messages*

    grep panic /adm/messages*

    檢視網路狀態路由配置

    ifconfig –a

    netstat –rn

    磁盤和分區使用情況

    df –k

    format

    disksuit

    metastat,metadb

    volume manager

    vxprint –ht

    CPU

    psrinfo

    sar 1 10

    vmstat

    prstat

    系統修補程式 uname –a

    行程情況 ps –ef

    磁盤 IO 狀況有無錯誤

    iostat –En

    iostat -xn 3

    5.4.2 IBM AIX 主機命令

    檢視系統執行狀況裝置執行狀況

    prtconf

    lscfg –pvv

    檢視系統日誌

    errpt

    errpt -a|more

    errpt -a -j 日誌號

    檢視網路狀態路由配置

    ifconfig –a

    netstat –rn

    磁盤和分區使用情況

    df –k

    lsdev -Ccdisk

    lsvg –o

    lsvg –l 磁盤組

    lsps -a

    CPU

    lsdev -Ccprocessor

    系統修補程式

    行程情況 ps –ef

    磁盤 IO 狀況有無錯誤

    iostat –En

    iostat -xn 3

    5.4.3 HP-UX 主機命令

    檢視系統執行狀況裝置執行狀況

    檢視系統日誌

    vi /var/adm/syslog/syslog.log

    列出 I/O 卡的相關資訊 ioscan -fn

    檢視網路狀態路由配置

    lanscan

    netstat –rn

    磁盤和分區使用情況

    bdf

    vgdisplay -v vgxx

    lvdisplay -v LVxx

    ioscan -funC disk

    pvdisplay -v /dev/dsk/c*t*d*

    CPU

    系統 ID OS 版本 uname -a

    行程情況 ps –ef

    磁盤 IO 狀況有無錯誤 iostat –En

    5.5 資料庫系統

    5.5.1 Oracle 資料庫

    Oracle 命令列表:

    資料庫 alert 日誌資訊――檢查日誌中是否有錯誤資訊提示。

    初始化參數 ―― show parameter;

    檢查控制檔狀態―― select * from v$controlfile;

    檢查線上日誌檔狀態―― select * from v$logfile;

    檢查數據檔狀態―― select * from v$datafile;

    檢查表空間使用率――

    select b.file_id "File ID",b.tablespace_name

    "TabSP_Name",b.bytes/1024/1024 "Size(M)",

    (b.bytes-sum(nvl(a.bytes,0))) "Used",sum(nvl(a.bytes,0)) "Free",

    sum(nvl(a.bytes,0))/(b.bytes)*100 "Free Per%"

    from dba_free_space a,dba_data_files b

    where a.file_id=b.file_id

    group by b.tablespace_name,b.file_id,b.bytes

    order by b.file_id;

    檢查回滾段使用情況――

    SELECT SEGMENT_NAME,OWNER,TABLESPACE_NAME,SEGMENT_ID,FILE_ID,STATUS

    FROM DBA_ROLLBACK_SEGS;

    檢查使用者狀態――

    select

    username,account_status,default_tablespace,temporary_tablespace,crea

    ted from dba_users;

    是否存在失效物件――

    select owner, object_name,object_type from dba_objects where status =

    ‘INVALID’;

    是否有異常等待事例 ――

    select event,sum(decode(wait_Time,0,0,1)) "Prev",

    sum(decode(wait_Time,0,1,0)) "Curr",count(*) "Tot"

    from v$session_Wait group by event order by 4;

    檢測連線數情況 ――

    SELECT status,count(*) "count" FROM v$session GROUP BY status;

    使用者使用情況 ―― 向客戶了解使用過程是否有問題。

    5.5.2 DB2 資料庫

    5.6 中介軟體系統

    5.7 套用系統

    6、附錄 1 詞匯表

    列出本巡檢方案中專門術語的定義、英文縮寫詞的原詞組和意義、計畫組內達成一致意見的專用詞匯,同時要求繼承全部的先前過程中定義過的詞匯。

    備註中註明該詞匯的來源,或有其他更詳細的解釋的文件位置;以及對該詞匯的其他叫法。

    7、附錄 2 參考資料

    本方案同時查閱了以下 Internet 網址上的技術標準及資訊。

    IBM e-Server p-Series 資訊中心:

    http://publib16.boulder.ibm.com/pseries/en_US/infocenter/base

    IBM Redbooks 網站:

    http://www.redbooks.ibm.com

    HP 公司網站:

    http://www.hp.com

    SUN 公司網站:

    http://www.sun.com

    CISCO 公司網站:

    http://www.cisco.com

    EMC2 公司網站:

    http://www.emc2.com

    更多精彩

    關註公眾號 浩道Linux

    浩道Linux ,專註於 Linux系統 的相關知識、 網路通訊 網路安全 Python相關 知識以及涵蓋IT行業相關技能的學習, 理論與實戰結合,真正讓你在學習工作中真正去用到所學。同時也會分享一些面試經驗,助你找到高薪offer,讓我們一起去學習,一起去進步,一起去漲薪!期待您的加入~~~ 關註回復「資料」可 免費獲取學習資料 (含有電子書籍、視訊等)。

    喜歡的話,記得 點「贊」 「在看」