Model Versioning: ML-Modelle versionieren und verwalten

ERKLÄRUNG

Einfach erklärt

Model Versioning speichert jede Version deines ML-Modells mit allen Informationen, die nötig sind, um es zu reproduzieren. So kannst du jederzeit zurückgehen oder Versionen vergleichen.

Was wird versioniert?

model_v1.0/
├── model.pkl              # Modell-Gewichte
├── config.yaml            # Hyperparameter
├── requirements.txt       # Dependencies
├── training_data_hash.txt # Daten-Referenz
├── metrics.json           # Performance-Metriken
└── metadata.json          # Wer, wann, warum

Lifecycle einer Modellversion:

Development → Staging → Production → Archived
     │           │           │           │
   v0.1       v0.9        v1.0        v0.8
   (Experiment) (Testing)  (Live)     (Retired)

Technischer Deep Dive

MLflow Model Registry

import mlflow

# Training und Logging
with mlflow.start_run():
    model = train_model(X, y)
    
    # Metriken loggen
    mlflow.log_metric("accuracy", 0.95)
    mlflow.log_metric("f1_score", 0.93)
    
    # Modell registrieren
    mlflow.sklearn.log_model(
        model, 
        "model",
        registered_model_name="fraud_detector"
    )

# Version zu Production promoten
client = mlflow.tracking.MlflowClient()
client.transition_model_version_stage(
    name="fraud_detector",
    version=3,
    stage="Production"
)

DVC für große Dateien

# Modell tracken (nicht in Git, sondern in DVC)
dvc add models/model.pkl

# Erzeugt models/model.pkl.dvc (klein, geht in Git)
git add models/model.pkl.dvc
git commit -m "Add model v1.0"

# Modell in Remote Storage pushen
dvc push

# Alte Version auschecken
git checkout v0.9
dvc checkout

Hugging Face Hub

from huggingface_hub import HfApi

api = HfApi()

# Modell hochladen mit Version
api.upload_folder(
    folder_path="./my_model",
    repo_id="username/my-model",
    commit_message="v1.0: Improved accuracy"
)

# Bestimmte Version laden
from transformers import AutoModel
model = AutoModel.from_pretrained(
    "username/my-model",
    revision="v1.0"  # Oder commit hash
)

Metadata Schema

{
  "version": "1.0.0",
  "created_at": "2026-03-11T14:30:00Z",
  "created_by": "ml-pipeline",
  "training": {
    "dataset": "s3://data/train_v3.parquet",
    "dataset_hash": "abc123...",
    "epochs": 10,
    "learning_rate": 0.001
  },
  "metrics": {
    "accuracy": 0.95,
    "f1_score": 0.93,
    "latency_p99_ms": 45
  },
  "dependencies": {
    "python": "3.11",
    "torch": "2.2.0",
    "transformers": "4.38.0"
  },
  "stage": "production",
  "parent_version": "0.9.0"
}

Best Practices

Aspekt	Empfehlung
Naming	Semantic Versioning + Stage
Storage	S3, GCS, Azure Blob für Modelle
Metadata	Immer mit Modell speichern
Automation	CI/CD für Promotion
Retention	Policy für alte Versionen

ANALOGIE

Model Versioning ist wie Git für ML-Modelle: Du kannst jederzeit zu einer früheren Version zurückkehren, Änderungen nachvollziehen und verschiedene Experimente parallel verwalten.

WICHTIGSTE PUNKTE

Versioniert Modell-Gewichte, Code, Daten und Konfiguration

Ermöglicht Reproduzierbarkeit und Rollback

Zentral für MLOps und Compliance

ANWENDUNGSFÄLLE

Reproduzierbarkeit

Exakt dasselbe Modell später wieder erstellen

Rollback

Bei Problemen zur vorherigen Version zurückkehren

Sicherheit

Audit-Trail für regulierte Branchen

A/B Testing

Verschiedene Modellversionen vergleichen

HÄUFIGE FRAGEN

Was sollte ich alles versionieren?

Modell-Gewichte, Training-Code, Hyperparameter, Trainingsdaten (oder Hash), Dependencies, Metriken. Alles was nötig ist, um das Modell zu reproduzieren.

Reicht Git für Model Versioning?

Für Code ja, für Modelle nein. Modell-Dateien sind zu groß für Git. Nutze Git LFS, DVC oder spezialisierte Tools wie MLflow.

Wie benenne ich Modellversionen?

Semantic Versioning (1.0.0) oder Timestamps (2026-03-11). Plus: Stage-Labels wie 'staging', 'production', 'archived'.

TOOLS & RESSOURCEN

MLflow

Model Registry mit Versionierung

DVC

Data Version Control für ML

Weights & Biases

Experiment Tracking mit Model Registry

Hugging Face Hub

Git-basierte Modell-Versionierung

VERWANDTE BEGRIFFE

DevOps Praxis

DevOps

Die Praxis, Machine-Learning-Modelle zuverlässig und effizient in Produktion zu bringen und zu betreiben – die Verbindung von ML, DevOps und Data Engineering.

DevOps Praxis

Model Registry

Ein zentrales Repository zur Versionierung, Speicherung und Verwaltung von Machine-Learning-Modellen – mit Metadaten, Lineage und Deployment-Status.

DevOps Praxis

Experiment Tracking

Die systematische Dokumentation von ML-Experimenten – Hyperparameter, Metriken, Code-Versionen und Artefakte, um Ergebnisse reproduzierbar und vergleichbar zu machen.

DevOps Praxis

MLflow

Eine Open-Source-Plattform für den gesamten ML-Lifecycle: Experiment-Tracking, Modell-Registry, Deployment und Reproduzierbarkeit von ML-Projekten.

Web DevOps

CI/CD (Continuous Integration / Continuous Deployment)

Automatisierte Prozesse, die Code-Änderungen kontinuierlich testen (CI) und in Produktion bringen (CD) – für schnellere und zuverlässigere Software-Releases.