Schulungsübersicht

Einführung in das Large-Scale Monitoring

  • Herausforderungen der Überwachung in Umgebungen mit hohem Verkehrsaufkommen
  • Skalierungsstrategien für Prometheus und Grafana
  • Architektonische Überlegungen für verteilte Systeme

Skalierung von Prometheus

  • Einrichten von Prometheus in einer Sharded-Umgebung
  • Verwendung des Prometheus-Verbunds für große Systeme
  • Implementierung von Prometheus Speicheroptimierungen

Optimieren von Grafana für große Umgebungen

  • Konfigurieren von Grafana für die Verarbeitung großer Datenmengen
  • Verbesserung der Dashboard-Leistung und der Ladezeiten
  • Bewährte Verfahren für komplexe Visualisierungen

Verteilte Überwachung mit Prometheus und Grafana

  • Integration von Prometheus mit verteilten Tracing-Tools
  • Überwachung von Microservices in Kubernetes-Umgebungen
  • Erweiterte Alarmierungs- und Benachrichtigungsstrategien

Verwaltung von Hochverfügbarkeit

  • Einrichten redundanter Prometheus- und Grafana-Instanzen
  • Failover-Strategien für Überwachungssysteme
  • Sicherstellung von Datenkonsistenz und Zuverlässigkeit

Fehlersuche und Debugging

  • Identifizieren und Beheben von Leistungsengpässen
  • Fehlersuche bei PromQL-Abfragen und Dashboard-Konfigurationen
  • Häufige Fallstricke bei groß angelegter Überwachung

Fortgeschrittene Integrationen

  • Integration von Prometheus und Grafana mit externen Datenbanken
  • Verwendung von Grafana-Plugins für erweiterte Funktionalität
  • Nutzung von Drittanbieter-Tools für erweiterte Überwachung

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Ausgeprägtes Verständnis der Prometheus- und Grafana-Grundlagen
  • Erfahrung mit Linux-Systemadministration
  • Vertrautheit mit verteilten Systemarchitekturen

Zielgruppe

  • DevOps Ingenieure
  • Ingenieure für Standortzuverlässigkeit (SREs)
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien