南京艾聯科提供AIOps智能運維系統及平臺相關產品和解決方案,著重于云和容器云, SDN網絡的新一代運維工具和系統。
背景分析
隨著云和微服務業務中臺,SDN網絡的興起,正在向新的云網融合及業務運維和支撐的技術趨勢發展,包括業務多維多拓撲可視化,網絡拓撲可視化,云和虛擬化配置自動化,業務系統故障分析,云自治與遷移,故障根因分析,業務可視化,業務系統可視化,應用發布自動化,業務故障分析,云資源管理等。運維部門除了常規對網絡和業務穩態的管理,需要對網絡和云/容器敏態的管理和感知,實時反映云網絡單元的數據,規格,配置和遷移,比如業務,云,網絡多層資源和運行狀態關聯和敏態運維關系(含動態配置和遷移),包括:SDN,VLAN,VPN,VM,Docker,微服務等,云的虛擬化和敏捷交付,云網融合等。
混合云網絡運維和監控面臨的新挑戰
1. 云網絡資源池的拓撲和監控分析手段匱乏;
2. 網絡與業務應用緊密結合,網絡團隊的日常工作越來越多地關注、涉及應用業務,與系統部門的交界面也在融合,簡單、孤立的IP視角不再滿足目前的工作需求;
3. 網絡監控架構難以支持彈性擴展。
方案介紹
艾聯科的云網融合方案,解決了傳統監控無法適用于云網絡監控,使云網絡監控不再有盲區;幫助云網絡故障排查,滿足企業上云安全、穩定運行保障的核心能力;避免對現有云網環境的影響,流量采集方式保證對已有的物理網絡分流鏡像有能力進行兼容或平滑切換,并可以對接已有的分析工具。
1. GUI及通用管理:提供操作界面及通用管理功能。
2. 物理網絡監控:通過Prometheus監控云資源層的運行狀態,物理層網絡及流量狀態。
3. 云網絡流量性能監控:通過虛擬探針采集云網絡流量,實時上送到云網絡流量監控。
4. 云網絡編排:通過云管平臺和云網絡作業平臺進行網絡虛擬化連接及編排。
5. 云網絡資源管理:提供對云網絡資源池的操作和管理。
6. 云網絡業務性能監控:通過虛擬探針,采集云業務流量,監控業務性能。
7. 虛擬探針管理平臺:部署和監控探針狀態。
整體網絡組成
資源池:區域(Region)、可用區(AZ,Available Zone)
虛擬化:宿主機(Host)、虛擬機(VM,Virtual Machine)
PaaS集群:K8S Cluster,Docker Swarms
容器:容器節點(Node)、容器 Pod ,Docker
應用相關:業務,系統,組件(服務),集群
網絡:IP、VPC(Virtual Private Cloud)、子網
全平面網絡流量獲取方式
1. 在生產環境中,獲取混合云、云原生環境的網絡流、業務報文的內容,根據業務系統流程,進行跨區域,跨技術棧,跨層次,跨物理與虛擬資源節點/設備的數據采集/解析/關聯。
2. 基于分布式架構,實現對各類型資源池以及物理網絡的流量采集處理抽象,支持類型包括:分布式微服務,物理網絡、SDN,KVM、容器、K8S、異構云等資源池網絡環境。
3. 支持動態和可擴展網絡的監控和探針自動布防和監控,管理,支持控制器動態部署和數據采集,控制動態伸縮框架,流量采集與后端監控分析采用微服務連接,松耦合,在采集側,各類型號流量采集探針為云網全平面流量采集方案提供基礎捕獲能力。
應用場景
1. 繪制業務的端到端路徑。
2. 支持云資源的配置管理及拓撲連接。
3. 支持完整的容器資源、應用、物理層,網絡維度的關聯和流程展示。
4. 提供云業務調用鏈的端到端性能監控和報警。
5. 支持基于連接拓撲和業務流程關聯的流量和協議分析。
6. 提供全網的流量數據及網絡知識圖譜展現全網狀態的可視化。