Supervised Learning
Eine Machine-Learning-Methode, bei der ein Modell aus gelabelten Beispieldaten lernt – also aus Eingaben mit bekannter korrekter Ausgabe.
Eine Machine-Learning-Methode, bei der ein Modell eigenständig Muster und Strukturen in ungelabelten Daten erkennt – ohne vorgegebene richtige Antworten.
Unsupervised Learning lässt das Modell selbst herausfinden, welche Muster in den Daten stecken. Es gibt keine Labels, keine richtigen Antworten – nur Rohdaten, in denen das Modell Strukturen entdeckt. Das macht Unsupervised Learning besonders wertvoll, wenn Labeling teuer, zeitaufwändig oder schlicht unmöglich ist. Es ist auch die Grundlage für Dimensionsreduktion, Anomalieerkennung und Clustering – Aufgaben, bei denen man oft gar nicht weiß, wonach man sucht, bis man es findet. Viele der wichtigsten Durchbrüche in der KI – Word2Vec, Autoencoders, Self-Supervised Learning – bauen auf Unsupervised-Learning-Prinzipien auf. Es ist auch die Grundlage für Dimensionsreduktion und Anomalieerkennung, wo man oft gar nicht weiß, wonach man sucht.
Die Hauptaufgaben:
| Aufgabe | Beschreibung | Beispiel |
|---|---|---|
| Clustering | Daten in Gruppen einteilen | Kundensegmente finden |
| Dimensionsreduktion | Komplexität reduzieren | 1000 Features → 50 Features |
| Anomalieerkennung | Ausreißer finden | Betrugserkennung |
| Assoziationsregeln | Zusammenhänge finden | Warenkorbanalyse |
Unsupervised Learning ist wie ein Kind, das Spielzeug nach Farbe, Form oder Größe sortiert, ohne dass jemand erklärt hat, welche Gruppen es gibt – es entdeckt die Ordnung selbst.
Findet Muster und Strukturen in Daten ohne gelabelte Beispiele
Hauptaufgaben: Clustering, Dimensionsreduktion und Anomalieerkennung
Ideal, wenn keine gelabelten Daten verfügbar oder zu teuer sind
Kundensegmentierung
Automatische Gruppierung von Kunden nach Kaufverhalten ohne vordefinierte Kategorien
Anomalieerkennung
Erkennung ungewöhnlicher Transaktionen bei Kreditkartenbetrug
Datenvisualisierung
Reduktion hochdimensionaler Daten auf 2D/3D für visuelle Analyse
Wenn keine gelabelten Daten vorhanden sind, wenn du unbekannte Muster entdecken willst oder als Vorverarbeitungsschritt (z.B. Dimensionsreduktion) für Supervised Learning.
Schwieriger als bei Supervised Learning, da es keine 'richtige Antwort' gibt. Metriken wie Silhouette Score (Clustering) oder Reconstruction Error (Autoencoder) helfen, aber oft ist menschliche Bewertung nötig.
Unsupervised Learning wird häufig in der Kundenanalyse, Betrugserkennung und bei der Segmentierung von Märkten eingesetzt. Es hilft Unternehmen, Muster in großen Datenmengen zu erkennen, ohne dass vorherige Labels erforderlich sind.
Die Interpretation von Ergebnissen aus Unsupervised Learning kann herausfordernd sein, da es keine klaren Labels gibt. Techniken wie Cluster-Visualisierung oder Dimensionsreduktion können helfen, die Muster und Strukturen in den Daten besser zu verstehen.