课程介绍:
首先,让我们了解一下Prometheus的组件配置和调优实战。
Prometheus是一款用于监控和报警的开源软件。它由多个组件组成,包括Prometheus Server、Exporter、Alertmanager和Pushgateway等。
下面是一些组件配置和调优的实战建议:
Prometheus Server配置调优:
调整存储空间:根据需求和预期的数据量,调整存储空间大小。
调整抓取间隔:根据监控指标的变化速度,合理设置抓取间隔,避免过于频繁或过于稀疏的抓取。
配置持久化存储:使用远程存储(如Object Storage)或本地存储(如本地文件系统)来保存长期的监控数据。
Exporter配置调优:
选择合适的Exporter:根据需要监控的服务或应用,选择适合的Exporter,确保能够获取到准确的监控指标。
配置指标抓取:根据需要监控的指标,配置Exporter的指标抓取频率和抓取规则,避免不必要的资源浪费。
Alertmanager配置调优:
配置报警规则:根据实际需求,定义合理的报警规则,确保能够及时发现和处理问题。
配置报警通道:选择合适的报警通道(如邮件、短信、Slack等),确保报警信息能够及时传递给相关人员。
Pushgateway配置调优:
避免滥用Pushgateway:Pushgateway适用于临时性的指标数据,不适合长期存储。避免滥用Pushgateway,避免不必要的数据存储和资源浪费。
另外,还有一些通用的调优建议:
监控系统的资源使用情况,确保系统运行稳定。
定期清理过期的监控数据,避免存储空间被占满。
配置监控告警和报警规则,及时发现和处理问题。
定期进行系统性能优化,确保监控系统的性能和稳定性。
课程目录:
├──2021prometheus实战课程
| ├──.idea
| ├──01_全组件实战搭建调优篇
| ├──02_k8s监控实战和原理
| ├──03_高可用采集模块实战
| ├──04_高可用存储模块实战
| ├──05_高可用查询模块实战
| ├──06_loki介绍和优势分析
| └──目录.md 1.83kb
├──第2节 全组件实战搭建调优篇
| ├──01 prometheus部署和基本概念介绍.mp4 145.76M
| ├──02 ansible自动化部署node_exporter的使用.mp4 549.81M
| ├──03 黑盒探针、进程监控、中间件监控实战.mp4 764.99M
| ├──04 sdk打点4中数据结构和pushgateway使用.mp4 305.25M
| └──05 告警实战:企业微信配置分组、抑制、静默等.mp4 784.94M
├──第3节 k8s监控实战和prometheus采集k8s原理
| ├──01 10分钟使用kubeadmin安装k8s集群1.21版本.mp4 171.25M
| ├──02 k8s中prometheus和grafana一键部署导入大盘.mp4 482.54M
| ├──03 prome采集k8s底层原理和4大适配工作.mp4 582.78M
| └──04 k8s监控指标讲解,到底怎么写promql监控k8s.mp4 393.67M
├──第4节 高可用实战进阶:采集模块
| ├──01 和运维平台-cmdb对接,服务发现和consul使用.mp4 387.31M
| ├──02 动手实现pushgateway 高可用.mp4 249.34M
| └──03 hashmod和动态分片解决大内存和单节点问题.mp4 387.55M
├──第5节 高可用实战进阶:存储模块
| ├──01 tsdb底层原理:倒排索引、压缩算法、mmap.mp4 447.69M
| ├──02 集群tsdb实战:m3db搭建使用及问题总结.mp4 403.64M
| └──03 低成本高可用存储实战:multi_remote_read.mp4 281.75M
├──第6节 高可用实战进阶:查询模块
| ├──01 查询提速知识:预聚合,query_log,高基数.mp4 410.89M
| └──02 查询提速实战项目:提升查询速度30-100倍.mp4 283.01M
├──第7节 额外赠送篇:loki介绍
| └──loki安装、原理介绍、和alertmanger整合.mp4 452.78M
├──2021prometheus实战课所需软件包.tar.gz 662.39M
└──第1节 学习收益:冲击一线大厂offer.mp4 187.86M