运维管理k8s 日志/指标收集存储和展示体系prometheus 收集指标至 thanos 存储,alloy 收集日志至 loki 存储,最终通过 grafana 进行展示 k8s 系统管理 可观测性 实用教程 最新推荐 必看精选
运维管理警报管理器 Alertmanager 和命令行工具 amtoolAlertmanager 通过分组、抑制、静音减少告警噪音,基于 Gossip 实现去中心化高可用集群,最终一致同步状态,确保告警可靠送达与去重 可观测性 最新推荐
编程开发Prometheus 客户端 Python 库 prometheus_clientprometheus_client 多进程模式介绍,各类指标用法、收集器机制,以及指标暴露方式 python 可观测性 实用教程
编程开发向 Prometheus 暴露指标Prometheus 通过 exporter 或 client library 暴露指标;也可直接用 HTTP 文本/OpenMetrics/Protobuf 格式 可观测性
编程开发基于 Go 模板语言的 Prometheus 模板语法Prometheus 模板基于 Go template,用于告警与控制台,支持查询、条件、格式化及丰富函数,统一处理样本数据并安全渲染可视化页面 可观测性
运维管理Prometheus 规则配置:记录规则和告警规则Prometheus 通过规则组定期执行记录规则与告警规则,预计算高成本查询并生成告警,支持延迟、抑制抖动及与 Alertmanager 协作 可观测性 安全
运维管理Pushgateway 推送无法通过抓取方式获取的作业指标Pushgateway 是短期批处理任务的指标缓存补充方案,弥补 Prometheus 拉取模型不足,但存在单点、指标不自动清理等缺陷,需谨慎使用 可观测性
运维管理Prometheus 命令行工具 promtoolPrometheus 命令行工具 promtool 用于验证配置与规则、测试指标、执行查询、调试 TSDB 及性能分析 可观测性 调试 效率神器