<EbeneX/>
Grundlagen · Updated 3. März 2026

Supervised Learning

Definition

Eine Machine-Learning-Methode, bei der ein Modell aus gelabelten Beispieldaten lernt – also aus Eingaben mit bekannter korrekter Ausgabe.

Einsteiger 2 Min. Lesezeit EN: Supervised Learning

Einfach erklärt

Supervised Learning ist die häufigste Form des Machine Learning. Das Prinzip ist einfach: Du gibst dem Modell Beispiele mit der richtigen Antwort, und es lernt daraus Muster, um bei neuen Daten die richtige Antwort vorherzusagen. Supervised Learning ist die Grundlage der meisten produktiven KI-Systeme – Spam-Filter, Betrugserkennung, Bildklassifikation, Übersetzung. Der entscheidende Faktor ist die Qualität und Menge der gelabelten Trainingsdaten. Supervised Learning skaliert gut: Mehr Daten führen fast immer zu besseren Modellen, solange die Labels korrekt sind. Für viele Aufgaben ist Supervised Learning die erste Wahl – es ist gut verstanden, gut tooled und liefert zuverlässige Ergebnisse, wenn ausreichend gelabelte Daten vorhanden sind.

Die zwei Hauptaufgaben:

AufgabeAusgabeBeispielAlgorithmen
KlassifikationKategorieSpam/Kein SpamLogistic Regression, SVM, Random Forest
RegressionZahlenwertHauspreis: 350.000€Linear Regression, Gradient Boosting

Der Ablauf:

  1. Daten sammeln: Eingaben mit korrekten Labels versehen
  2. Modell trainieren: Algorithmus lernt Muster aus den Daten
  3. Evaluieren: Modell auf ungesehenen Testdaten prüfen
  4. Anwenden: Vorhersagen für neue, unbekannte Daten treffen

Technischer Deep Dive

Klassische Algorithmen

Lineare Modelle:

  • Logistische Regression (Klassifikation)
  • Lineare Regression (Regression)
  • Schnell, interpretierbar, gut als Baseline

Baumbasierte Modelle:

  • Decision Trees: Einfach, aber anfällig für Overfitting
  • Random Forest: Ensemble aus vielen Bäumen, robust
  • Gradient Boosting (XGBoost, LightGBM): State-of-the-Art für tabellarische Daten

Support Vector Machines (SVM):

  • Findet optimale Trennebene zwischen Klassen
  • Kernel-Trick für nichtlineare Probleme
  • Gut bei kleinen bis mittleren Datensätzen

Evaluation

  • Accuracy: Anteil korrekter Vorhersagen
  • Precision/Recall: Wichtig bei unbalancierten Klassen
  • F1-Score: Harmonisches Mittel aus Precision und Recall
  • MSE/RMSE: Fehlermaße für Regression
  • Cross-Validation: Robuste Evaluation durch mehrfache Train/Test-Splits

Herausforderungen

  • Labeling-Aufwand: Gelabelte Daten sind teuer und zeitaufwändig
  • Overfitting: Modell lernt Trainingsdaten auswendig
  • Class Imbalance: Ungleiche Verteilung der Klassen
  • Feature Engineering: Relevante Merkmale müssen oft manuell erstellt werden

Supervised Learning ist wie Lernen mit Lösungsbuch: Du bearbeitest Aufgaben, vergleichst deine Antwort mit der Musterlösung und verbesserst dich mit jeder Übung.

Das Modell lernt aus Eingabe-Ausgabe-Paaren mit bekannter korrekter Antwort

Zwei Hauptaufgaben: Klassifikation (Kategorien) und Regression (Zahlenwerte)

Häufigste und am besten verstandene Form des Machine Learning

Spam-Erkennung

E-Mails werden als 'Spam' oder 'Kein Spam' klassifiziert basierend auf gelabelten Beispielen

Immobilienpreise

Vorhersage von Hauspreisen basierend auf Merkmalen wie Größe, Lage und Baujahr

Medizinische Diagnose

Erkennung von Krankheiten in Röntgenbildern anhand annotierter Beispiele

Was bedeutet 'supervised' in Supervised Learning?

Der Begriff kommt von 'Supervision' (Aufsicht). Die gelabelten Trainingsdaten fungieren als 'Lehrer', der dem Modell die richtige Antwort zeigt. Das Modell lernt unter dieser Aufsicht.

Was ist der Unterschied zwischen Klassifikation und Regression?

Klassifikation ordnet Daten in Kategorien ein (z.B. Spam/Kein Spam, Katze/Hund). Regression sagt einen kontinuierlichen Zahlenwert vorher (z.B. Preis, Temperatur, Alter).

Wie viele gelabelte Daten braucht man?

Das hängt von der Komplexität ab. Einfache Aufgaben: 100-1.000 Beispiele. Komplexe Bildklassifikation: 10.000+. Transfer Learning kann den Bedarf drastisch reduzieren.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.