南京艾聯科提供AIOps智能運維系統及平臺相關產品和解決方案,著重于云和容器云, SDN網絡的新一代運維工具和系統。
云廠商自帶的監控服務可用于收集獲取云資源的監控指標或自定義的監控指標,探測服務可用性,以及針對指標設置警報。能讓我們快速全面的了解云資源使用情況、業務的運行狀況和健康度,并及時收到異常報警做出反應,保證應用程序順暢運行。但是云廠商提供的監控存在諸如監控項過少、監控數據丟失、監控頻率過低等問題。
我們的云主機監控系統基于Prometheus內核,實現了對多家云廠商(阿里云、騰訊云、華為云、AWS等)多種云主機的集中監控及管理,采集指標豐富,配置多種圖形化的展示方式。
產品功能
1. 實時監控及展示云主機性能指標;
2. 云主機監控指標異常及告警功能;
3. 自定義監控項,采集的監控數據上報到云監控,云監控對其提供監控圖表和報警功能;
4. 云主機容量性能監控及預測功能。
技術特色:
1. 不依賴于分布式存儲,可以建立獨立的單服務器節點;
2. 圖形和儀表板支持多種模式;
3. 基于Exporter的機制進行采集Agent的開發和部署;
4. 采用時序數據庫存儲和處理采集的監測數據,數據查詢速度遠快于普通數據庫;
5. 支持分布式多節點數據庫集群,擴展非常方便。
產品價值:
1. 通過監控云服務器的CPU使用率、內存使用率、磁盤使用率等基礎指標,確保主機的正常使用;
2. 在監控數據達到報警閾值時發送報警通知,讓用戶及時獲取異常通知,查詢異常原因,并對異常進行處理;
3. 監控項不能滿足需求,可以根據用戶所需自定義監控項;
4. 對帶寬、連接數、磁盤使用率等監控項設置報警規則后,便于用戶及時了解云主機現狀。在業務量變大后,用戶可以及時收到報警通知,對云主機進行擴容。