指标与监控
使用 Prometheus 和 Grafana 进行Semantic Router 的指标收集和可视化。
1. 指标与端点
| 组件 | 端点 | 说明 |
|---|---|---|
| 路由指标 | :9190/metrics | Prometheus 格式(标志:--metrics-port) |
| 路由健康检查 | :8080/health | HTTP 就绪/存活探测 |
| Envoy 指标(可选) | :19000/stats/prometheus | 如果启用了 Envoy |
配置位置:tools/observability/
仪表板:tools/observability/llm-router-dashboard.json
2. 本地模式(路由在宿主机上运行)
路由在宿主机上原生运行,可观测性组件在 Docker 中。
快速开始
# 启动路由
make run-router
# 启动可观测性
make o11y-local
访问:
- Prometheus:http://localhost:9090
- Grafana:http://localhost:3000 (admin/admin)
验证目标:
# 检查 Prometheus 抓取 localhost:9190
open http://localhost:9090/targets
停止:
make stop-observability
配置
所有配置在 tools/observability/ 中:
prometheus.yaml- 从ROUTER_TARGET环境变量抓取目标(默认:localhost:9190)grafana-datasource.yaml- 指向localhost:9090grafana-dashboard.yaml- 仪表板配置llm-router-dashboard.json- 仪表板定义
故障排除
| 问题 | 修复 |
|---|---|
| 目标 DOWN | 启动路由:make run-router |
| 无指标 | 生成流量,检查 :9190/metrics |
| 端口冲突 | 更改端口或停止冲突服务 |
3. Docker Compose 模式
所有服务在 Docker 容器中。