使用 Redis Enterprise 进行 Uptrace

要收集、查看和监控来自数据库和其他集群组件的指标数据，您可以使用 OpenTelemetry Collector 将 Uptrace 连接到 Redis Enterprise 集群。

Uptrace 是一款开源 APM 工具，支持分布式跟踪、指标和日志。您可以使用它来监控应用程序并设置自动警报以接收通知。

Uptrace 使用 OpenTelemetry 收集和导出来自 Redis 等软件应用程序的遥测数据。OpenTelemetry 是一个开源可观察性框架，旨在为所有类型的可观察性信号（例如跟踪、指标和日志）提供单一标准。

使用 OpenTelemetry Collector，您可以接收、处理遥测数据并将其导出到任何OpenTelemetry 后端。您还可以使用 Collector 抓取 Redis 提供的 Prometheus 指标，然后将这些指标导出到 Uptrace。

您可以使用 Uptrace 来：

收集并显示管理控制台中不可用的数据指标。
使用由 Uptrace 社区维护的预建仪表板模板。
设置自动警报并通过电子邮件、Slack、Telegram 和其他方式接收通知。
使用OpenTelemetry 跟踪监控您的应用程序性能和日志。

安装 Collector 和 Uptrace

由于安装 OpenTelemetry Collector 和 Uptrace 可能需要一些时间，因此您可以使用Redis Enterprise 集群附带的docker-compose示例。

下载 Docker 示例后，您可以uptrace/example/redis-enterprise在启动 Docker 容器之前编辑目录中的以下配置文件：

otel-collector.yaml-/etc/otelcol-contrib/config.yaml在 OpenTelemetry Collector 容器中进行配置。
uptrace.yml-/etc/uptrace/uptrace.yml在 Uptrace 容器中进行配置。

您还可以按照以下指南从头开始安装 OpenTelemetry 和 Uptrace：

安装 Uptrace 后，您可以通过http://localhost:14318/访问 Uptrace UI 。

抓取 Prometheus 指标

Redis Enterprise 集群在上公开了一个 Prometheus 抓取端点http://localhost:8070/。您可以通过将以下几行添加到 OpenTelemetry Collector 配置来抓取该端点：

# /etc/otelcol-contrib/config.yaml

prometheus_simple/cluster1:
  collection_interval: 10s
  endpoint: "localhost:8070" # Redis Cluster endpoint
  metrics_path: "/"
  tls:
    insecure: false
    insecure_skip_verify: true
    min_version: "1.0"

接下来，您可以使用 OpenTelemetry 协议（OTLP）将收集到的指标导出到 Uptrace：

# /etc/otelcol-contrib/config.yaml

receivers:
  otlp:
    protocols:
      grpc:
      http:

exporters:
  otlp/uptrace:
    # Uptrace is accepting metrics on this port
    endpoint: localhost:14317
    headers: { "uptrace-dsn": "http://project1_secret_token@localhost:14317/1" }
    tls: { insecure: true }

service:
  pipelines:
    traces:
      receivers: [otlp]
      processors: [batch]
      exporters: [otlp/uptrace]
    metrics:
      receivers: [otlp, prometheus_simple/cluster1]
      processors: [batch]
      exporters: [otlp/uptrace]
    logs:
      receivers: [otlp]
      processors: [batch]
      exporters: [otlp/uptrace]

不要忘记重新启动收集器，然后检查日志中是否有任何错误：

docker-compose logs otel-collector

# or

sudo journalctl -u otelcol-contrib -f

您还可以在此处查看完整的 OpenTelemetry Collector 配置。

查看指标

当指标开始到达 Uptrace 时，您应该在“指标”选项卡中看到几个仪表板。总的来说，Uptrace 应该为 Redis Enterprise 指标创建 3 个仪表板：

“Redis：节点”仪表板显示集群节点列表。您可以选择一个节点来查看其指标。
“Redis：数据库”显示所有集群节点中的 Redis 数据库列表。要查找特定数据库，您可以使用过滤器或按列对表进行排序。
“Redis：分片”包含您在所有集群节点中拥有的分片列表。您可以筛选或排序分片，然后选择一个分片以了解更多详细信息。

监视指标Monitor metrics

要开始监控指标，您需要使用 Uptrace UI 创建指标监控器：

打开“警报”->“监视器”。
点击“创建监视器”->“创建指标监视器”。

例如，以下监视器使用表达式group by node在单个 Redis 分片关闭时创建警报：

monitors:
  - name: Redis shard is down
    metrics:
      - redis_up as $redis_up
    query:
      - group by cluster # monitor each cluster,
      - group by bdb # each database,
      - group by node # and each shard
      - $redis_up
    min_allowed_value: 1
    # shard should be down for 5 minutes to trigger an alert
    for_duration: 5m

您还可以创建具有更复杂表达式的查询。

例如，当键空间命中率低于 75% 或内存碎片过高时，以下监视器会创建警报：

monitors:
  - name: Redis read hit rate < 75%
    metrics:
      - redis_keyspace_read_hits as $hits
      - redis_keyspace_read_misses as $misses
    query:
      - group by cluster
      - group by bdb
      - group by node
      - $hits / ($hits + $misses) as hit_rate
    min_allowed_value: 0.75
    for_duration: 5m

  - name: Memory fragmentation is too high
    metrics:
      - redis_used_memory as $mem_used
      - redis_mem_fragmentation_ratio as $fragmentation
    query:
      - group by cluster
      - group by bdb
      - group by node
      - where $mem_used > 32mb
      - $fragmentation
    max_allowed_value: 3
    for_duration: 5m

您可以在此处了解有关查询语言的更多信息。

使用 Redis Enterprise 进行 Uptrace

安装 Collector 和 Uptrace

抓取 Prometheus 指标

查看指标

监视指标Monitor metrics

本页内容