Normalization vs. Standardization: Wann welche Methode?

ERKLÄRUNG

Einfach erklärt

Beide Methoden skalieren Features, aber unterschiedlich.

Normalization (Min-Max):
x_norm = (x - min) / (max - min)
→ Werte zwischen 0 und 1

Standardization (Z-Score):
x_std = (x - mean) / std
→ Mittelwert 0, Standardabweichung 1

Technischer Deep Dive

Vergleich

Aspekt	Normalization	Standardization
Bereich	[0, 1]	Unbegrenzt
Outlier	Sensitiv	Robuster
Verteilung	Erhält Form	Zentriert
Use Case	Bilder, bounded	Allgemein

Code

from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Normalization
norm = MinMaxScaler()
X_norm = norm.fit_transform(X)

# Standardization
std = StandardScaler()
X_std = std.fit_transform(X)

ANALOGIE

Normalization ist wie Prozentangaben (0-100%). Standardization ist wie Schulnoten relativ zum Klassendurchschnitt (wie viele Standardabweichungen über/unter dem Schnitt).

WICHTIGSTE PUNKTE

Normalization: Min-Max auf [0,1]

Standardization: Z-Score (mean=0, std=1)

Wahl abhängig von Algorithmus und Datenverteilung

ANWENDUNGSFÄLLE

Neural Networks

Standardization meist besser

Image Data

Normalization auf [0,1]

Outlier-sensitive

Standardization robuster

HÄUFIGE FRAGEN

Wann Normalization?

Wenn Werte in bekanntem Bereich sein sollen (0-1), bei Bilddaten, wenn keine Outlier.

Wann Standardization?

Bei Outliers (weniger sensitiv), bei Gaussian-ähnlichen Daten, für die meisten ML-Algorithmen.

VERWANDTE BEGRIFFE

Daten Grundlagen

Feature Scaling

Die Transformation von Features auf vergleichbare Wertebereiche – wichtig für viele ML-Algorithmen wie Gradient Descent, KNN und SVMs.

Grundlagen

Machine Learning (ML)

Ein Teilbereich der KI, bei dem Algorithmen aus Daten lernen und Vorhersagen treffen, ohne explizit programmiert zu werden.