<EbeneX/>
DevOps Grundlagen · Updated 17. Februar 2026

Drift (Data Drift / Model Drift)

Definition

Die schleichende Verschlechterung eines ML-Modells in Produktion, weil sich die Eingabedaten oder die Zusammenhänge zwischen Eingabe und Ausgabe über die Zeit verändern.

Fortgeschritten 3 Min. Lesezeit EN: Data Drift / Model Drift / Concept Drift

Einfach erklärt

Drift ist das schleichende Problem in KI-Produktionssystemen: Ein Modell, das beim Deployment hervorragend funktioniert, wird über Monate schlechter – nicht weil das Modell sich verändert hat, sondern weil sich die Welt verändert hat. Nutzerverhalten, Sprache, Produktsortiment, wirtschaftliche Bedingungen – all das verändert sich kontinuierlich. Ohne aktives Monitoring und Drift-Erkennung merkt man das oft erst, wenn Geschäftskennzahlen sinken oder Nutzer sich beschweren.

Drift ist eines der häufigsten Probleme in produktiven KI-Systemen: Ein Modell, das beim Deployment hervorragend funktioniert, wird über Monate schlechter – nicht weil das Modell sich verändert hat, sondern weil sich die Welt verändert hat. Nutzerverhalten, Sprache, Produktsortiment, wirtschaftliche Bedingungen – all das verändert sich kontinuierlich. Ohne aktives Monitoring und Drift-Erkennung merkt man das oft erst, wenn Geschäftskennzahlen sinken.

Drift beschreibt das Problem, dass ML-Modelle über die Zeit schlechter werden, weil sich die Welt verändert. Ein Modell, das heute perfekt funktioniert, kann in 6 Monaten veraltet sein.

Arten von Drift:

TypWas sich ändertBeispiel
Data DriftVerteilung der EingabedatenNeue Kundengruppe, saisonale Effekte
Concept DriftZusammenhang Input → OutputNeue Betrugsmuster, Marktveränderungen
Label DriftVerteilung der AusgabenMehr Spam als früher

Technischer Deep Dive

Erkennung

Statistische Tests:

  • KS-Test: Vergleicht zwei Verteilungen (numerische Features)
  • Chi²-Test: Vergleicht kategorische Verteilungen
  • PSI (Population Stability Index): Standard in der Finanzbranche
  • MMD (Maximum Mean Discrepancy): Für hochdimensionale Daten

Gegenmaßnahmen

  • Regelmäßiges Retraining: Periodisch oder trigger-basiert
  • Online Learning: Modell lernt kontinuierlich aus neuen Daten
  • Ensemble-Methoden: Kombination aus altem und neuem Modell
  • Feature Monitoring: Drift auf Feature-Ebene erkennen und isolieren
  • Windowed Training: Nur auf den neuesten Daten trainieren

Praxisbeispiele

Beispiel 1: E-Commerce

Ein Online-Shop nutzt ein Empfehlungsmodell, das auf dem Kaufverhalten der Kunden basiert. Nach einigen Monaten stellt das Unternehmen fest, dass die Empfehlungen weniger relevant sind. Durch die Analyse der Eingabedaten erkennt man, dass sich die Kundenpräferenzen verändert haben, beispielsweise durch neue Trends oder saisonale Produkte. Hier tritt Data Drift auf, da die Verteilung der Eingabedaten nicht mehr mit der ursprünglichen Trainingsdaten übereinstimmt.

Beispiel 2: Finanzsektor

In einem Kreditbewertungsmodell kann es zu Concept Drift kommen, wenn sich die wirtschaftlichen Bedingungen ändern. Beispielsweise könnte eine plötzliche Wirtschaftskrise dazu führen, dass das Modell fälschlicherweise Kreditanträge genehmigt, die in der Vergangenheit als risikoarm galten. Das Modell muss regelmäßig überprüft und angepasst werden, um diese Veränderungen zu berücksichtigen.

Vor- und Nachteile

Vorteile

  • Früherkennung von Problemen: Durch Monitoring und regelmäßige Tests können Drift-Effekte frühzeitig erkannt werden.
  • Anpassungsfähigkeit: Modelle, die kontinuierlich retrainiert werden, bleiben relevanter und leistungsfähiger.
  • Verbesserte Genauigkeit: Durch die Berücksichtigung aktueller Daten kann die Vorhersagegenauigkeit erhöht werden.

Nachteile

  • Ressourcenintensiv: Regelmäßiges Retraining und Monitoring erfordern zusätzliche Rechenressourcen und Zeit.
  • Komplexität: Die Implementierung von Online Learning und Ensemble-Methoden kann komplex sein und erfordert tiefgehendes Fachwissen.
  • Risiko von Overfitting: Bei zu häufigem Retraining besteht die Gefahr, dass das Modell überangepasst wird und nicht mehr generalisiert.

Historischer Kontext

Der Begriff “Drift” hat seine Wurzeln in der Statistik und wurde in den letzten Jahren zunehmend im Kontext von Machine Learning populär. Mit der zunehmenden Verbreitung von KI-Anwendungen in verschiedenen Branchen wurde die Notwendigkeit, Modelle an sich ändernde Bedingungen anzupassen, immer deutlicher. Die Forschung zu Drift-Phänomenen hat sich parallel zur Entwicklung von Algorithmen und Technologien zur Überwachung und Anpassung von Modellen weiterentwickelt.

Drift ist wie ein Navigationsgerät mit veralteten Karten: Die Straßen (Daten) haben sich verändert, aber das Navi (Modell) navigiert noch nach den alten Karten – die Empfehlungen werden immer schlechter.

Data Drift: Die Verteilung der Eingabedaten verändert sich über die Zeit

Concept Drift: Der Zusammenhang zwischen Eingabe und Ausgabe verändert sich

Erfordert Monitoring und regelmäßiges Retraining zur Gegensteuerung

Betrugserkennung

Betrugsmuster ändern sich ständig – Modelle müssen regelmäßig aktualisiert werden

Empfehlungssysteme

Nutzerverhalten ändert sich saisonal und durch Trends

Kreditscoring

Wirtschaftliche Veränderungen beeinflussen Kreditausfallmuster

Wie erkenne ich Drift?

Statistische Tests (KS-Test, Chi²-Test) vergleichen die Verteilung aktueller Daten mit den Trainingsdaten. Performance-Metriken überwachen. Tools wie Evidently automatisieren die Erkennung.

Wie oft sollte man ein Modell neu trainieren?

Hängt von der Drift-Geschwindigkeit ab. Betrugserkennung: wöchentlich. Empfehlungssysteme: monatlich. Stabile Domänen: quartalsweise. Am besten: automatisiertes Retraining bei erkanntem Drift.

Wie kann ich Data Drift in meinem ML-Modell erkennen?

Data Drift kann durch regelmäßige Überwachung der Modellleistung und der Eingabedaten erkannt werden. Techniken wie statistische Tests oder visuelle Analysen der Datenverteilung helfen, signifikante Veränderungen zu identifizieren.

Welche Maßnahmen kann ich ergreifen, um Model Drift zu verhindern?

Um Model Drift zu verhindern, sollten Sie regelmäßige Retrainings des Modells mit aktuellen Daten planen und robuste Monitoring-Tools einsetzen. Zudem können Sie adaptive Modelle verwenden, die sich dynamisch an veränderte Daten anpassen.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.