AUC: Klassifikator-Güte in einer Zahl

ERKLÄRUNG

Einfach erklärt

AUC fasst die ROC-Kurve in einer Zahl zusammen: Wie gut trennt das Modell positive von negativen Beispielen?

AUC = 1.0: Perfekte Trennung
AUC = 0.5: Zufälliges Raten
AUC < 0.5: Schlechter als Zufall (Vorzeichen umdrehen!)

Interpretation:

AUC = P(score(positiv) > score(negativ))

"Wenn ich zufällig ein positives und ein negatives 
Beispiel wähle, wie wahrscheinlich rankt das Modell 
das positive höher?"

Technischer Deep Dive

AUC berechnen

from sklearn.metrics import roc_auc_score

y_true = [0, 0, 1, 1, 1, 0, 1, 0]
y_scores = [0.1, 0.4, 0.35, 0.8, 0.7, 0.3, 0.9, 0.2]

auc = roc_auc_score(y_true, y_scores)
print(f"AUC: {auc:.3f}")  # 0.875

Multi-Class AUC

from sklearn.metrics import roc_auc_score

# One-vs-Rest für Multi-Class
auc_ovr = roc_auc_score(y_true, y_proba, multi_class='ovr')

# One-vs-One
auc_ovo = roc_auc_score(y_true, y_proba, multi_class='ovo')

ANALOGIE

AUC ist wie eine Schulnote für deinen Klassifikator: 1.0 = perfekt, 0.5 = Zufall (durchgefallen), dazwischen = je höher desto besser.

WICHTIGSTE PUNKTE

Wert zwischen 0 und 1 (0.5 = Zufall)

Unabhängig vom gewählten Schwellenwert

Wahrscheinlichkeit, dass positives Beispiel höher gerankt wird

ANWENDUNGSFÄLLE

Modellvergleich

Welches Modell ist insgesamt besser?

Feature-Selektion

Welche Features verbessern AUC?

Hyperparameter-Tuning

AUC als Optimierungsziel

HÄUFIGE FRAGEN

Was ist ein guter AUC-Wert?

0.5 = Zufall, 0.7-0.8 = akzeptabel, 0.8-0.9 = gut, 0.9+ = exzellent. Aber: Kontext wichtig!

AUC-ROC vs. AUC-PR?

AUC-ROC bei balancierten Daten. AUC-PR (Precision-Recall) bei stark unbalancierten Daten besser geeignet.

VERWANDTE BEGRIFFE

Mathematik Grundlagen

ROC Curve

Ein Diagramm zur Bewertung von Klassifikatoren – zeigt das Verhältnis von True Positive Rate zu False Positive Rate bei verschiedenen Schwellenwerten.

Grundlagen Daten

Precision, Recall & F1-Score

Die drei wichtigsten Metriken zur Bewertung von Klassifikationsmodellen – Precision misst Genauigkeit, Recall misst Vollständigkeit, F1 kombiniert beide.

Grundlagen Daten

Klassifikation (Classification)

Klassifikation ist eine Machine-Learning-Aufgabe, bei der ein Modell Eingaben einer von mehreren festen Kategorien zuordnet – etwa E-Mails als Spam oder Nicht-Spam, oder Bilder nach ihrem Inhalt.

Grundlagen Daten

Confusion Matrix

Eine Tabelle, die zeigt wie oft ein Klassifikationsmodell richtig und falsch lag – aufgeschlüsselt nach True/False Positives und Negatives.

AUC (Area Under Curve)

Einfach erklärt

Technischer Deep Dive

AUC berechnen

Multi-Class AUC

ROC Curve

Precision, Recall & F1-Score

Klassifikation (Classification)

Confusion Matrix