K8S 生产实践-16-1-从整体把握监控
监控入门 -从整体把握监控
监控目的
- 及时发现已经出现的问题
- 提前预警可能发生的问题
监控什么
- 系统基础指标
服务器的 cpu,内存,网络,io - 服务基础信息
服务占用内存,cpu,内存是否溢出,占用网络带宽,磁盘IO,监听的端口 - 服务个性化信息
web服务,请求的次数,响应时间等 - 日志
分析日志的异常数
如何监控
- 数据采集
- 数据存储
数据的存储一般使用时间序列数据库 - 定义报警规则
- 配置报警方式
业内常见的监控组件/方案
- Zabbix
- OpenFalcon
- 听云、监控宝
k8s的监控
- 每个节点的基础指标
监控每台服务器的基础指标 - 每个容器的基础指标
运行在这台节点上的容器要监控,其实就是每个应用要监控 - k8s集群组件
为者常成,行者常至
自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)