Machine Learning (ML)
Ein Teilbereich der KI, bei dem Algorithmen aus Daten lernen und Vorhersagen treffen, ohne explizit programmiert zu werden.
Eine Machine-Learning-Methode, bei der ein Modell aus gelabelten Beispieldaten lernt – also aus Eingaben mit bekannter korrekter Ausgabe.
Supervised Learning ist die häufigste Form des Machine Learning. Das Prinzip ist einfach: Du gibst dem Modell Beispiele mit der richtigen Antwort, und es lernt daraus Muster, um bei neuen Daten die richtige Antwort vorherzusagen. Supervised Learning ist die Grundlage der meisten produktiven KI-Systeme – Spam-Filter, Betrugserkennung, Bildklassifikation, Übersetzung. Der entscheidende Faktor ist die Qualität und Menge der gelabelten Trainingsdaten. Supervised Learning skaliert gut: Mehr Daten führen fast immer zu besseren Modellen, solange die Labels korrekt sind. Für viele Aufgaben ist Supervised Learning die erste Wahl – es ist gut verstanden, gut tooled und liefert zuverlässige Ergebnisse, wenn ausreichend gelabelte Daten vorhanden sind.
Die zwei Hauptaufgaben:
| Aufgabe | Ausgabe | Beispiel | Algorithmen |
|---|---|---|---|
| Klassifikation | Kategorie | Spam/Kein Spam | Logistic Regression, SVM, Random Forest |
| Regression | Zahlenwert | Hauspreis: 350.000€ | Linear Regression, Gradient Boosting |
Der Ablauf:
Lineare Modelle:
Baumbasierte Modelle:
Support Vector Machines (SVM):
Supervised Learning ist wie Lernen mit Lösungsbuch: Du bearbeitest Aufgaben, vergleichst deine Antwort mit der Musterlösung und verbesserst dich mit jeder Übung.
Das Modell lernt aus Eingabe-Ausgabe-Paaren mit bekannter korrekter Antwort
Zwei Hauptaufgaben: Klassifikation (Kategorien) und Regression (Zahlenwerte)
Häufigste und am besten verstandene Form des Machine Learning
Spam-Erkennung
E-Mails werden als 'Spam' oder 'Kein Spam' klassifiziert basierend auf gelabelten Beispielen
Immobilienpreise
Vorhersage von Hauspreisen basierend auf Merkmalen wie Größe, Lage und Baujahr
Medizinische Diagnose
Erkennung von Krankheiten in Röntgenbildern anhand annotierter Beispiele
Der Begriff kommt von 'Supervision' (Aufsicht). Die gelabelten Trainingsdaten fungieren als 'Lehrer', der dem Modell die richtige Antwort zeigt. Das Modell lernt unter dieser Aufsicht.
Klassifikation ordnet Daten in Kategorien ein (z.B. Spam/Kein Spam, Katze/Hund). Regression sagt einen kontinuierlichen Zahlenwert vorher (z.B. Preis, Temperatur, Alter).
Das hängt von der Komplexität ab. Einfache Aufgaben: 100-1.000 Beispiele. Komplexe Bildklassifikation: 10.000+. Transfer Learning kann den Bedarf drastisch reduzieren.