現(xiàn)在位置:主頁 > 國(guó)內(nèi) > DeepFlow與云網(wǎng)絡(luò)監(jiān)控的發(fā)展

DeepFlow與云網(wǎng)絡(luò)監(jiān)控的發(fā)展

作者:編輯 ? 時(shí)間:2021-01-06 ? 瀏覽:人次

  本文以云杉網(wǎng)絡(luò)DeepFlow近幾年在客戶落地的方案實(shí)踐為主線,聚焦混合云、容器環(huán)境下的需求演進(jìn),介紹在新環(huán)境下云監(jiān)控的方案價(jià)值以及發(fā)展思考。

  在云原生環(huán)境下企業(yè)客戶主要面臨的挑戰(zhàn)主要體現(xiàn)在網(wǎng)絡(luò)分層以及彈性業(yè)務(wù)充分體現(xiàn)了監(jiān)控保障的難度,由此可以將挑戰(zhàn)歸納為三點(diǎn):對(duì)象數(shù)量大、波動(dòng)性強(qiáng)以及關(guān)系復(fù)雜。舉兩個(gè)例子,應(yīng)用在SOA、MSA架構(gòu)下,更多地以Ingress、Service、POD在呈現(xiàn),網(wǎng)絡(luò)IP動(dòng)態(tài)變化。如果仍然單獨(dú)以傳統(tǒng)的IP視角進(jìn)行可視化以及運(yùn)維保障,明顯是不夠的,存在短板。迫切需要將網(wǎng)絡(luò)視角與平臺(tái)、事件、應(yīng)用關(guān)聯(lián)起來。另一個(gè)典型的例子是“端到端分析”,在物理網(wǎng)絡(luò)段,可以通過有限的分光鏡像點(diǎn)來描述、展示路徑,但中斷于池內(nèi)或云內(nèi)網(wǎng)絡(luò)段。云內(nèi)網(wǎng)絡(luò)處于“黑盒”狀態(tài),云內(nèi)又包含有服務(wù)間交互訪問、東西向網(wǎng)關(guān)、負(fù)載均衡、地址轉(zhuǎn)化等各個(gè)環(huán)節(jié),缺乏有效的保障手段,這對(duì)一個(gè)生產(chǎn)環(huán)境來說是不能接受的。

  那么,云杉DeepFlow賦予自身的使命是什么呢?就是要“為客戶補(bǔ)齊云架構(gòu)中保障側(cè)的那塊拼圖”。去打開“黑盒”;去將采集與分析解耦;去繪制一張全網(wǎng)的網(wǎng)絡(luò)知識(shí)圖譜;去提升分布式業(yè)務(wù)系統(tǒng)的可觀測(cè)性,實(shí)現(xiàn)一個(gè)與云等量齊觀的完全可擴(kuò)展的監(jiān)控架構(gòu)。

  簡(jiǎn)單回顧一下DeepFlow的實(shí)踐發(fā)展。

  DeepFlow流量采集分發(fā):解決東西向流量采集難題以及流量引出

  2016年起我們就開始了客戶落地。當(dāng)時(shí),客戶的訴求很直接,就是要看到虛擬網(wǎng)絡(luò)中的流量,其中存在的挑戰(zhàn)包括避免對(duì)生產(chǎn)環(huán)境的侵?jǐn)_、保障性能的同時(shí)限制采集系統(tǒng)對(duì)資源的使用、能實(shí)現(xiàn)策略跟隨以及支持隧道分發(fā)??蛻舻沫h(huán)境與現(xiàn)在還是有些區(qū)別,資源池類型主要是ESXi、XEN以及KVM,理念上也是關(guān)注全包。DeepFlow方案的重點(diǎn)就是采集與分發(fā),為客戶解決虛擬機(jī)間的東西向流量采集難題以及流量引出。需要做到避免侵?jǐn)_數(shù)據(jù)面,在有限的資源使用下保障性能,在虛擬機(jī)發(fā)生遷移后,確保采集分發(fā)策略的統(tǒng)一及跟隨。通過隧道封裝,保時(shí)保序地將數(shù)據(jù)包分發(fā)至各類分析工具處。在這個(gè)階段,DeepFlow實(shí)現(xiàn)了面向各類資源池的網(wǎng)絡(luò)流量“采集處理抽象層”,統(tǒng)一提供采集、多維過濾、去重、壓縮、截短等預(yù)處理功能。抽象層中的各類型采集器本身也是一套分布式系統(tǒng),為后期面向大規(guī)模多類型的云環(huán)境監(jiān)控中高性能數(shù)據(jù)處理提供基礎(chǔ)保障。

  DeepFlow云網(wǎng)分析:解決分布在各地的資源池網(wǎng)絡(luò)監(jiān)控缺失

  在中期階段,客戶業(yè)務(wù)逐步上云,云建設(shè)的規(guī)模更大,同時(shí)開始關(guān)注容器網(wǎng)絡(luò)以及業(yè)務(wù)保障。這時(shí)客戶更多地關(guān)注多區(qū)域多資源池以及underlay和overlay的統(tǒng)一管理、對(duì)于多云異構(gòu)環(huán)境有統(tǒng)一網(wǎng)絡(luò)全景圖的需求、對(duì)虛擬網(wǎng)絡(luò)的故障診斷需求也浮出水面。客戶理念上也不再認(rèn)為云環(huán)境的網(wǎng)絡(luò)保障可單純地通過存儲(chǔ)、分析全包來解決。此時(shí)面臨的多點(diǎn)多地管理,Overlay網(wǎng)絡(luò)中的Trouble shooting等問題也很突出。DeepFlow方案著重面向客戶大規(guī)?;旌显凭W(wǎng)絡(luò)的整體監(jiān)控,包括多數(shù)據(jù)中心、多分支機(jī)構(gòu)、私有云和公有云的整體網(wǎng)絡(luò)全景圖,解決專線鏈路負(fù)載、公有云網(wǎng)絡(luò)性能、私有云故障排查等系列問題。在此階段,DeepFlow控制器集群不僅具備了管理10萬采集點(diǎn)規(guī)模的能力,而且廣泛地與云平臺(tái)、CMDB對(duì)接,使網(wǎng)絡(luò)IP、流量與VPC、虛擬機(jī)、POD、服務(wù)、平臺(tái)事件等關(guān)聯(lián),繪制一整張網(wǎng)絡(luò)知識(shí)圖譜。

  DeepFlow分布式業(yè)務(wù)的可觀測(cè)性:解決云原生應(yīng)用保障及容器平臺(tái)的網(wǎng)絡(luò)監(jiān)控

  在目前階段,云杉看到客戶處容器環(huán)境發(fā)展迅猛,云建設(shè)思路更清晰,也更有規(guī)劃。同時(shí)也在體系化地考慮監(jiān)控保障側(cè)的建設(shè),將應(yīng)用、網(wǎng)絡(luò)及基礎(chǔ)設(shè)施的Metric、Log、Tracing統(tǒng)一地加以規(guī)劃整合。此時(shí)客戶需求更多地面向業(yè)務(wù)側(cè)、更注重隨云擴(kuò)展的架構(gòu)實(shí)現(xiàn)、以及在此基礎(chǔ)上提供高性能數(shù)據(jù)服務(wù)的能力。比較典型的一個(gè)方案就是支撐微服務(wù)平臺(tái)的監(jiān)控中心建設(shè),通過DeepFlow各功能展現(xiàn)服務(wù)依賴關(guān)系、訪問指標(biāo)、網(wǎng)絡(luò)性能等,基于網(wǎng)絡(luò)流日志獲取業(yè)務(wù)Trace ID、容器Labels等鍵值,關(guān)聯(lián)Log平臺(tái)和Tracing框架,完善分布式應(yīng)用系統(tǒng)的可觀測(cè)性。

  容器、虛擬機(jī)、宿主機(jī)的結(jié)合,也是常見的全棧場(chǎng)景,產(chǎn)品通過“全景圖”不同維度的查詢展示來描述各層面的關(guān)系。圖中的“點(diǎn)”可以是數(shù)據(jù)中心、可用區(qū),可以是虛擬機(jī)、容器POD,可以是VPC、網(wǎng)段、IP,也可以是Service、資源組等?!包c(diǎn)”與“點(diǎn)”之間的連線可以設(shè)置為流量、調(diào)用關(guān)系的吞吐、延時(shí)、TCP連接狀態(tài)等指標(biāo)。當(dāng)看到兩個(gè)容器POD的連接延時(shí)超過閾值時(shí),客戶面臨的是一個(gè)復(fù)雜的全棧環(huán)境,涉及到POD、Bridge、vSwitch,再到東西向的Gateway,中間已進(jìn)行過多次地址轉(zhuǎn)換。DeepFlow清晰地將每一步的指標(biāo)呈現(xiàn)出來,快速高效地定位問題點(diǎn)。這就是云杉為客戶提供的全棧跟蹤能力。

  DeepFlow全?;旌显票O(jiān)控

  經(jīng)過這些年的積累演進(jìn),云杉DeepFlow產(chǎn)品實(shí)現(xiàn)了隨云擴(kuò)展的網(wǎng)絡(luò)監(jiān)控架構(gòu)。面向物理網(wǎng)絡(luò)、虛擬化以及容器等多類型的監(jiān)控對(duì)象,通過“采集處理抽象層”,首先確??蛻羝交貜奈锢憝h(huán)境向虛擬環(huán)境的監(jiān)控?cái)U(kuò)展;第二,得益于采集器的優(yōu)勢(shì),針對(duì)資源池類型、品牌、規(guī)模以及后續(xù)發(fā)展都可以實(shí)現(xiàn)橫向擴(kuò)展,統(tǒng)一具備流量采集及處理能力;第三,采集與分析解耦,通過分發(fā)功能實(shí)現(xiàn)“一次采集、多處分析”擴(kuò)展分析工具的能力,涵蓋客戶多種專業(yè)分析場(chǎng)景;第四,DeepFlow高性能分布式時(shí)序數(shù)據(jù)節(jié)點(diǎn)橫向擴(kuò)展保障Metric、流日志以及PCAP等數(shù)據(jù)的存儲(chǔ)與處理;最后,通過API、隊(duì)列等方式為安全、業(yè)務(wù)等其他數(shù)據(jù)平臺(tái)提供網(wǎng)絡(luò)數(shù)據(jù)服務(wù)。

  對(duì)于以上方案的實(shí)踐,涉及到各個(gè)行業(yè)的領(lǐng)先客戶群,DeepFlow的演進(jìn)離不開客戶的信任、幫助以及支持。在實(shí)踐過程中,云杉網(wǎng)絡(luò)也深入地與云、容器平臺(tái)進(jìn)行合作與探討,真切感受到技術(shù)人對(duì)于云原生的熱愛與追求,并在此基礎(chǔ)上團(tuán)隊(duì)之間的惺惺相惜。云杉將不斷進(jìn)步、保持先進(jìn),讓更多的客戶在云架構(gòu)保障側(cè)安心。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://www.parkingblocks4less.com/a/guona/20210106/60600.html上一篇:上一篇:九華山有獎(jiǎng)?wù)骷鲆娮蠲酪股涗涜残强?/a>
下一篇:下一篇:沒有了