K8S 生产实践-16-1-从整体把握监控

监控入门 -从整体把握监控

监控目的

  • 及时发现已经出现的问题
  • 提前预警可能发生的问题

监控什么

  • 系统基础指标
    服务器的 cpu,内存,网络,io
  • 服务基础信息
    服务占用内存,cpu,内存是否溢出,占用网络带宽,磁盘IO,监听的端口
  • 服务个性化信息
    web服务,请求的次数,响应时间等
  • 日志
    分析日志的异常数

如何监控

  • 数据采集
  • 数据存储
    数据的存储一般使用时间序列数据库
  • 定义报警规则
  • 配置报警方式

业内常见的监控组件/方案

  • Zabbix
  • OpenFalcon
  • 听云、监控宝

k8s的监控

  • 每个节点的基础指标
    监控每台服务器的基础指标
  • 每个容器的基础指标
    运行在这台节点上的容器要监控,其实就是每个应用要监控
  • k8s集群组件

为者常成,行者常至