Feature Scaling: Features auf gleiche Skala bringen

ERKLÄRUNG

Einfach erklärt

Feature Scaling bringt alle Features auf vergleichbare Wertebereiche.

Problem ohne Scaling:

Feature 1 (Alter):     18 - 80
Feature 2 (Einkommen): 20.000 - 500.000

→ Einkommen dominiert Distanzberechnungen!

Technischer Deep Dive

Methoden

Methode	Formel	Bereich
Min-Max	(x - min) / (max - min)	[0, 1]
Standard	(x - mean) / std	~[-3, 3]
Robust	(x - median) / IQR	Outlier-robust

Sklearn

from sklearn.preprocessing import StandardScaler, MinMaxScaler

# Fit auf Train, Transform auf beide
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)  # Nur transform!

ANALOGIE

Feature Scaling ist wie Währungsumrechnung: Bevor du Preise vergleichst, musst du alles in die gleiche Währung umrechnen – sonst dominieren große Zahlen.

WICHTIGSTE PUNKTE

Bringt Features auf vergleichbare Skala

Wichtig für Gradient Descent, KNN, SVM

Nicht nötig für Tree-basierte Modelle

ANWENDUNGSFÄLLE

Neural Networks

Schnellere Konvergenz beim Training

KNN

Distanzen fair berechnen

Regularisierung

L1/L2 funktioniert besser mit skalierten Features

HÄUFIGE FRAGEN

Wann ist Scaling nötig?

Bei distanzbasierten Algorithmen (KNN, SVM), Gradient Descent (Neural Nets, Logistic Regression), Regularisierung. Nicht bei Trees (Random Forest, XGBoost).

Fit auf Train, Transform auf Test?

Ja! Scaler auf Trainingsdaten fitten, dann auf Test anwenden. Sonst Data Leakage.

VERWANDTE BEGRIFFE

Daten Grundlagen

Normalization vs. Standardization

Zwei Feature-Scaling-Methoden im Vergleich – Normalization skaliert auf [0,1], Standardization auf Mittelwert 0 und Standardabweichung 1.

Grundlagen

Machine Learning (ML)

Ein Teilbereich der KI, bei dem Algorithmen aus Daten lernen und Vorhersagen treffen, ohne explizit programmiert zu werden.