Overfitting und Underfitting: Probleme im ML

ERKLÄRUNG

Einfach erklärt

Overfitting und Underfitting sind die zwei häufigsten Probleme beim Training von KI-Modellen. Sie beschreiben, wie gut ein Modell von Trainingsdaten auf neue, ungesehene Daten generalisiert – und das ist letztlich das Ziel jedes ML-Projekts.

Ein overfittetes Modell hat die Trainingsdaten auswendig gelernt, statt das zugrundeliegende Muster zu verstehen. Es performt auf Trainingsdaten hervorragend, auf neuen Daten aber schlecht. Ein underfittetes Modell ist zu simpel – es hat nicht genug Kapazität, das Muster zu lernen, und performt überall schlecht. Der Sweet Spot dazwischen ist das Ziel: ein Modell, das generalisiert. Techniken wie Regularisierung, Dropout und Cross-Validation helfen, diesen Sweet Spot zu finden.

Der Vergleich:

Aspekt	Underfitting	Gute Generalisierung	Overfitting
Training-Performance	Schlecht	Gut	Sehr gut
Test-Performance	Schlecht	Gut	Schlecht
Problem	Zu einfach	Optimal	Zu komplex
Lösung	Mehr Kapazität	Beibehalten	Regularisierung

Technischer Deep Dive

Bias-Variance Tradeoff

Das fundamentale Konzept hinter Overfitting/Underfitting:

Hoher Bias (Underfitting): Modell macht vereinfachende Annahmen, die nicht zu den Daten passen
Hohe Varianz (Overfitting): Modell reagiert zu stark auf Rauschen in den Trainingsdaten
Ziel: Minimaler Gesamtfehler = Bias² + Varianz + irreduzibler Fehler

Gegenmaßnahmen Overfitting

Dropout: Zufälliges Deaktivieren von Neuronen (typisch 10-50%)
Weight Decay / L2-Regularisierung: Bestrafung großer Gewichte
Early Stopping: Training beenden, wenn Validation Loss steigt
Data Augmentation: Künstliche Vervielfältigung der Trainingsdaten
Cross-Validation: Robustere Evaluation durch mehrfache Splits
Ensemble-Methoden: Mehrere Modelle kombinieren

Gegenmaßnahmen Underfitting

Komplexeres Modell (mehr Schichten, mehr Parameter)
Mehr oder bessere Features
Weniger Regularisierung
Längeres Training
Bessere Hyperparameter (höhere Learning Rate)

Loss-Kurven interpretieren

Loss
│
│  Underfitting         Gut                  Overfitting
│  ████████████████    ████                  ████
│  Train ≈ Val (hoch)     ██  ██               ██  ████ Val
│                          ██████████         ████████
│                         Train ≈ Val (niedrig)  ██████████ Train
└──────────────────────────────────────────────────────────── Epochs

Code-Beispiel: Early Stopping

best_val_loss = float('inf')
patience = 5
patience_counter = 0

for epoch in range(100):
    train_loss = train_one_epoch(model, train_loader)
    val_loss = evaluate(model, val_loader)
    
    if val_loss < best_val_loss:
        best_val_loss = val_loss
        patience_counter = 0
        torch.save(model.state_dict(), 'best_model.pt')  # Bestes Modell speichern
    else:
        patience_counter += 1
        
    if patience_counter >= patience:
        print(f"Early stopping at epoch {epoch}")
        break

# Bestes Modell laden
model.load_state_dict(torch.load('best_model.pt'))

Regularisierungstechniken im Detail

Technik	Wirkung	Typische Werte
Dropout	Zufällig Neuronen deaktivieren	0.1-0.5
L2 (Weight Decay)	Große Gewichte bestrafen	1e-4 bis 1e-2
L1	Sparsity fördern	1e-5 bis 1e-3
Data Augmentation	Künstliche Datenvielfalt	-
Label Smoothing	Weichere Targets	0.1

ANALOGIE

Overfitting ist wie ein Schüler, der Antworten auswendig lernt statt das Prinzip zu verstehen – bei neuen Aufgaben versagt er. Underfitting ist wie ein Schüler, der den Stoff gar nicht erst gelernt hat.

WICHTIGSTE PUNKTE

Overfitting: Modell performt auf Trainingsdaten gut, aber schlecht auf neuen Daten

Underfitting: Modell performt weder auf Trainings- noch auf Testdaten gut

Das Ziel ist die Balance dazwischen – gute Generalisierung

ANWENDUNGSFÄLLE

Modell-Diagnose

Erkennung und Behebung von Overfitting/Underfitting durch Loss-Kurven-Analyse

Hyperparameter-Tuning

Anpassung der Modellkomplexität für optimale Generalisierung

Datenqualität

Identifikation, ob mehr oder bessere Daten benötigt werden

HÄUFIGE FRAGEN

Wie erkenne ich Overfitting?

Wenn der Training Loss sinkt, aber der Validation Loss steigt oder stagniert. Die Lücke zwischen beiden wird größer. Das Modell hat die Trainingsdaten auswendig gelernt, statt allgemeine Muster zu erkennen.

Was hilft gegen Overfitting?

Mehr Trainingsdaten, Regularisierung (Dropout, Weight Decay), Data Augmentation, frühzeitiges Stoppen (Early Stopping), einfacheres Modell oder Cross-Validation.

Was hilft gegen Underfitting?

Komplexeres Modell, mehr Features, längeres Training, weniger Regularisierung oder bessere Feature Engineering.

TOOLS & RESSOURCEN

TensorBoard

Visualisierung von Training/Validation Loss zur Diagnose

Weights & Biases

Experiment-Tracking mit automatischer Overfitting-Erkennung

VERWANDTE BEGRIFFE

Grundlagen

Regularisierung

Techniken, die verhindern, dass ein KI-Modell Trainingsdaten auswendig lernt (Overfitting), indem sie die Modellkomplexität einschränken.

Grundlagen

Hyperparameter

Einstellungen, die vor dem Training eines KI-Modells manuell festgelegt werden und den Trainingsprozess steuern – im Gegensatz zu Parametern, die automatisch gelernt werden.

Grundlagen

Loss Function

Eine mathematische Funktion, die misst, wie weit die Vorhersage eines Modells von der tatsächlichen Antwort entfernt ist – das zentrale Optimierungsziel beim Training.

Grundlagen Daten

Trainingsdaten

Die Datensätze, mit denen KI-Modelle trainiert werden – sie bestimmen maßgeblich, was ein Modell lernt, wie gut es funktioniert und welche Verzerrungen es aufweist.

Grundlagen

Machine Learning (ML)

Ein Teilbereich der KI, bei dem Algorithmen aus Daten lernen und Vorhersagen treffen, ohne explizit programmiert zu werden.

Overfitting / Underfitting

Einfach erklärt

Technischer Deep Dive

Bias-Variance Tradeoff

Gegenmaßnahmen Overfitting

Gegenmaßnahmen Underfitting

Loss-Kurven interpretieren

Code-Beispiel: Early Stopping

Regularisierungstechniken im Detail

Regularisierung

Hyperparameter

Loss Function

Trainingsdaten

Machine Learning (ML)