<EbeneX/>
Grundlagen · Updated 3. März 2026

Overfitting / Underfitting

Definition

Zwei fundamentale Probleme beim Machine Learning: Overfitting bedeutet, das Modell lernt Trainingsdaten auswendig; Underfitting bedeutet, es lernt zu wenig.

Einsteiger 3 Min. Lesezeit EN: Overfitting / Underfitting

Einfach erklärt

Overfitting und Underfitting sind die zwei häufigsten Probleme beim Training von KI-Modellen. Sie beschreiben, wie gut ein Modell von Trainingsdaten auf neue, ungesehene Daten generalisiert – und das ist letztlich das Ziel jedes ML-Projekts.

Ein overfittetes Modell hat die Trainingsdaten auswendig gelernt, statt das zugrundeliegende Muster zu verstehen. Es performt auf Trainingsdaten hervorragend, auf neuen Daten aber schlecht. Ein underfittetes Modell ist zu simpel – es hat nicht genug Kapazität, das Muster zu lernen, und performt überall schlecht. Der Sweet Spot dazwischen ist das Ziel: ein Modell, das generalisiert. Techniken wie Regularisierung, Dropout und Cross-Validation helfen, diesen Sweet Spot zu finden.

Der Vergleich:

AspektUnderfittingGute GeneralisierungOverfitting
Training-PerformanceSchlechtGutSehr gut
Test-PerformanceSchlechtGutSchlecht
ProblemZu einfachOptimalZu komplex
LösungMehr KapazitätBeibehaltenRegularisierung

Technischer Deep Dive

Bias-Variance Tradeoff

Das fundamentale Konzept hinter Overfitting/Underfitting:

  • Hoher Bias (Underfitting): Modell macht vereinfachende Annahmen, die nicht zu den Daten passen
  • Hohe Varianz (Overfitting): Modell reagiert zu stark auf Rauschen in den Trainingsdaten
  • Ziel: Minimaler Gesamtfehler = Bias² + Varianz + irreduzibler Fehler

Gegenmaßnahmen Overfitting

  • Dropout: Zufälliges Deaktivieren von Neuronen (typisch 10-50%)
  • Weight Decay / L2-Regularisierung: Bestrafung großer Gewichte
  • Early Stopping: Training beenden, wenn Validation Loss steigt
  • Data Augmentation: Künstliche Vervielfältigung der Trainingsdaten
  • Cross-Validation: Robustere Evaluation durch mehrfache Splits
  • Ensemble-Methoden: Mehrere Modelle kombinieren

Gegenmaßnahmen Underfitting

Loss-Kurven interpretieren

Loss

│  Underfitting         Gut                  Overfitting
│  ████████████████    ████                  ████
│  Train ≈ Val (hoch)     ██  ██               ██  ████ Val
│                          ██████████         ████████
│                         Train ≈ Val (niedrig)  ██████████ Train
└──────────────────────────────────────────────────────────── Epochs

Code-Beispiel: Early Stopping

best_val_loss = float('inf')
patience = 5
patience_counter = 0

for epoch in range(100):
    train_loss = train_one_epoch(model, train_loader)
    val_loss = evaluate(model, val_loader)
    
    if val_loss < best_val_loss:
        best_val_loss = val_loss
        patience_counter = 0
        torch.save(model.state_dict(), 'best_model.pt')  # Bestes Modell speichern
    else:
        patience_counter += 1
        
    if patience_counter >= patience:
        print(f"Early stopping at epoch {epoch}")
        break

# Bestes Modell laden
model.load_state_dict(torch.load('best_model.pt'))

Regularisierungstechniken im Detail

TechnikWirkungTypische Werte
DropoutZufällig Neuronen deaktivieren0.1-0.5
L2 (Weight Decay)Große Gewichte bestrafen1e-4 bis 1e-2
L1Sparsity fördern1e-5 bis 1e-3
Data AugmentationKünstliche Datenvielfalt-
Label SmoothingWeichere Targets0.1

Overfitting ist wie ein Schüler, der Antworten auswendig lernt statt das Prinzip zu verstehen – bei neuen Aufgaben versagt er. Underfitting ist wie ein Schüler, der den Stoff gar nicht erst gelernt hat.

Overfitting: Modell performt auf Trainingsdaten gut, aber schlecht auf neuen Daten

Underfitting: Modell performt weder auf Trainings- noch auf Testdaten gut

Das Ziel ist die Balance dazwischen – gute Generalisierung

Modell-Diagnose

Erkennung und Behebung von Overfitting/Underfitting durch Loss-Kurven-Analyse

Hyperparameter-Tuning

Anpassung der Modellkomplexität für optimale Generalisierung

Datenqualität

Identifikation, ob mehr oder bessere Daten benötigt werden

Wie erkenne ich Overfitting?

Wenn der Training Loss sinkt, aber der Validation Loss steigt oder stagniert. Die Lücke zwischen beiden wird größer. Das Modell hat die Trainingsdaten auswendig gelernt, statt allgemeine Muster zu erkennen.

Was hilft gegen Overfitting?

Mehr Trainingsdaten, Regularisierung (Dropout, Weight Decay), Data Augmentation, frühzeitiges Stoppen (Early Stopping), einfacheres Modell oder Cross-Validation.

Was hilft gegen Underfitting?

Komplexeres Modell, mehr Features, längeres Training, weniger Regularisierung oder bessere Feature Engineering.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.