一個網(wǎng)絡性能的好壞,直接影響到用戶的體驗和網(wǎng)絡的標準。那么在這方面我們?nèi)绾芜M行網(wǎng)絡監(jiān)控呢?這個問題并不容易回答。所以,我們分為幾個小問題來為大家詳細解答。
為什么需要網(wǎng)絡性能基線呢?
簡而言之,一個網(wǎng)絡性能基線是網(wǎng)絡性能監(jiān)控中用來定義企業(yè)網(wǎng)絡基礎架構(gòu)正常工作條件的一個衡量標準。工程師可以使用網(wǎng)絡性能基線進行比較,從而發(fā)現(xiàn)可能導致問題的流量變化。
設置一個網(wǎng)絡基線也能實現(xiàn)一個早期指示器,這樣應用和網(wǎng)絡需求的實現(xiàn)就會接近于有效容量,從而使網(wǎng)絡團隊有可能進行升級規(guī)劃。使網(wǎng)絡性能基線與現(xiàn)有的網(wǎng)絡服務級別協(xié)議(SLA)對齊可以幫助IT組織保持容量參數(shù)和確定違反規(guī)范的問題范圍。
然而,對于工程師來說網(wǎng)絡監(jiān)控的挑戰(zhàn)是定義他們組織基礎架構(gòu)正常的條件。
沒有網(wǎng)絡監(jiān)控或測試的行業(yè)標準對于采用Information Technology Infrastructure Library (ITIL)框架作為最佳實踐方法的IT組織來說,他們可以使用一些ITIL特有的監(jiān)控工具。這些工具的設計利用支持IT服務管理過程的設備配置數(shù)據(jù)庫和應用程序。然而,除了ITIL之外,還沒有一種設置性能基線的行業(yè)標準方法。支持監(jiān)控工具和生成具有廣度和寬度的信息會由于制造商、設備和操作系統(tǒng)的不同而明顯不同,從而最終妨礙在監(jiān)控中使用一組通用的測試基準。
對于解決這個問題,最好首先是從網(wǎng)絡供應商本身著手。至少,每一個供應商都有一系列支持特定設備的監(jiān)視器?紤]到諸如SNMP等監(jiān)控協(xié)議的普遍存在,許多供應商也有他們自己可用于監(jiān)控和定義他們的產(chǎn)品臨界值的推薦方法或最佳實踐。擁有了這些信息,管理員就可以首先關注于一個小范圍的可用監(jiān)視器并在需求時進行擴展。例如,Cisco推薦它的路由器的CPU負載不應該超過60%,并且已經(jīng)發(fā)布了一個監(jiān)控這個統(tǒng)計的SNMP消息。
網(wǎng)絡性能監(jiān)控:評估狀況和考慮虛擬化技術在創(chuàng)建網(wǎng)絡監(jiān)控設備清單時,一定要在清單中同時包含物理和虛擬設備。對于當前流行的設備和服務器虛擬化、虛擬交換機(vSwitch)和虛擬化應用加速器在檢查網(wǎng)絡性能時是很重要的考慮方面。vSwitch使虛擬機之間能夠在不需要通過物理網(wǎng)絡適配器的前提下實現(xiàn)通信。雖然vSwitch能加速內(nèi)部服務器通信,但是它們無法使網(wǎng)絡監(jiān)控工具實現(xiàn)對這些路徑的報告或?qū)眯阅軘?shù)據(jù)進行接受。幸好,網(wǎng)絡行業(yè)已經(jīng)認識到了這個問題,并且正在改善這個狀況。
收集數(shù)據(jù)來設置一個網(wǎng)絡性能基線在確定網(wǎng)絡設備清單后,下一步是分析基礎架構(gòu)中傳輸?shù)牧髁。雖然網(wǎng)絡的總體利用情況是網(wǎng)絡總體健康的一個合理的指示器,但是這一測量基準還不是用戶在網(wǎng)絡中實際操作的全部環(huán)境。要了解網(wǎng)絡是如何使用的,這些監(jiān)控工具必須收集和打開實際的數(shù)據(jù)包。
收集網(wǎng)絡數(shù)據(jù)進行流量分析的方法有兩種,每種方法都各有利弊。數(shù)據(jù)捕捉或嗅探工具能夠捕捉整個網(wǎng)絡數(shù)據(jù)流,這樣管理員便能及時獲得在一個特定時刻關于網(wǎng)絡狀況的完整視圖。嗅探網(wǎng)絡能夠完全了解網(wǎng)絡運行狀況。雖然這對于網(wǎng)絡故障分析和修復非常重要,但它可能會嚴重影響持續(xù)的網(wǎng)絡監(jiān)控和基線分析。對于網(wǎng)絡性能監(jiān)控,應用程序和網(wǎng)絡使用率的測量是非常重要的,但不一定要包含每個數(shù)據(jù)包中的信息。在這些情況中,網(wǎng)絡嗅探工具能夠提供所需要的信息,但是這可能會引起嚴重的過載。
提供sFlow/NetFlow監(jiān)控示例數(shù)據(jù)除此之外,諸如NetFlow或sFlow等協(xié)議在設計上通過指定的間隔進行流量捕捉而更節(jié)約存儲。NetFlow及其衍生軟件是內(nèi)置在許多企業(yè)路由器中的,它們將示例數(shù)據(jù)傳遞給監(jiān)視器而不引起嗅探器過載,從而獲得關于網(wǎng)絡中運行的應用程序的合理概況。通過執(zhí)行數(shù)據(jù)包分析,管理員可以看到應用使用的趨勢同時根據(jù)整個網(wǎng)絡使用分配每個應用的使用比率。
更進一步地,大多數(shù)工具也能夠幫助解析Internet流量,例如,將使用基于云技術的應用流量與常見Web瀏覽的流量。了解每一個應用程序使用了多少網(wǎng)絡資源不僅能夠確定響應時間的問題根源,也使管理員能夠看到新應用程序和服務在部署到網(wǎng)絡時產(chǎn)生的影響。
設置一個網(wǎng)絡性能基線必須監(jiān)視多長時間?
在準備好所有需要的監(jiān)視器后,下一步是使這些監(jiān)視器運行并創(chuàng)建數(shù)據(jù)點。許多專家認為一個有效的監(jiān)控窗口發(fā)現(xiàn)性能趨勢需要一周時間。
考慮捕捉流量的環(huán)境是很重要的。大多數(shù)組織使用的是周期使用模式,而所有流量分析員都應該了解這些模式。例如,一個大型零售商一定會在假期中遇到網(wǎng)絡和應用程序高峰。而一個制造商實際上則可能看到相反的效果,因為在相同的假期中工廠停工會顯著降低網(wǎng)絡的使用。如果分析人員不能說明這些業(yè)務周期,那么網(wǎng)絡性能基線結(jié)果可能在這兩種情況中會大相徑庭。
這些數(shù)字中的任何明顯高或低的數(shù)值都必需確定出來,并且要確定它們發(fā)生的原因和它們實際是否為網(wǎng)絡基準的一部分。如果您偶然發(fā)現(xiàn)由已知問題產(chǎn)生的峰值,那么就要在其余的數(shù)據(jù)點上創(chuàng)建基線。如果這個峰值被確定為一般情況,那么就要將它們計算在測量平均值中。很可能在您的監(jiān)控周期中網(wǎng)絡出現(xiàn)了一個重大的問題。在這種情況下,更安全的做法是先處理這些數(shù)據(jù)點,然后在問題消除后再進行測量。
當收集到一定量的監(jiān)控數(shù)據(jù)并說明了一些根本的變化后,我們就可以為每一個測量分配一個基線。最終結(jié)果是為您定義的每個監(jiān)視器確定一般范圍的值。這些范圍一起就構(gòu)成了當前的網(wǎng)絡性能基線。
最后一點要考慮的是您現(xiàn)在所設定的網(wǎng)絡性能基線只在網(wǎng)絡發(fā)生變化之前有效。網(wǎng)絡設備升級、新服務器和新應用程序都將會影響現(xiàn)在的基線,也將要求以持續(xù)的方式考慮和提供監(jiān)控解決方案。然而,好消息是在大多數(shù)情況下,不是所有事情都會馬上發(fā)生變化的,所以在添加或刪除一些應用、服務或設備時只需要做少量的修改。
相關推薦:考試吧策劃:2010年軟件水平考試完全指南北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |