<EbeneX/>
Daten · Updated 11. März 2026

Data Quality

Definition

Die Messung und Sicherstellung von Datenqualität anhand von Dimensionen wie Vollständigkeit, Genauigkeit, Konsistenz und Aktualität.

Fortgeschritten 1 Min. Lesezeit EN: Data Quality

Einfach erklärt

Data Quality misst, wie gut Daten für ihren Zweck geeignet sind.

Die 6 Dimensionen:

DimensionFrageMetrik
VollständigkeitFehlen Werte?% Non-Null
GenauigkeitSind Werte korrekt?% valide
KonsistenzStimmen Quellen überein?% Match
AktualitätWie alt sind Daten?Alter in Stunden
EinzigartigkeitGibt es Duplikate?% unique
ValiditätEntsprechen Werte dem Format?% valid format

Technischer Deep Dive

Data Quality Score

def calculate_dq_score(df):
    scores = {
        'completeness': 1 - df.isnull().mean().mean(),
        'uniqueness': df.duplicated().mean(),
        'validity': validate_formats(df)
    }
    return sum(scores.values()) / len(scores)

Monitoring

# Great Expectations für automatisches Monitoring
checkpoint = gx.Checkpoint(
    name="daily_orders_check",
    data_context=context,
    validations=[
        {"batch_request": batch, "expectation_suite_name": "orders"}
    ]
)

# In Airflow/Dagster einbinden
results = checkpoint.run()
if not results.success:
    alert_data_team(results)

Data Quality ist wie Lebensmittelqualität: Frisch (aktuell), vollständig (alle Zutaten), korrekt (richtige Zutaten), konsistent (immer gleich gut).

Dimensionen: Vollständigkeit, Genauigkeit, Konsistenz, Aktualität

Messen mit Metriken und Monitoring

Garbage In, Garbage Out – besonders für ML

ML-Training

Schlechte Daten = schlechte Modelle

Daten

Vertrauen in Dashboards und Reports

Sicherheit

Korrekte Daten für Regulatoren

Wie messe ich Data Quality?

Metriken pro Dimension: % Nulls (Vollständigkeit), % valide Werte (Genauigkeit), % konsistent über Quellen, Alter der Daten (Aktualität).

Wer ist verantwortlich?

Data Owner für ihre Daten, Data Engineers für Pipelines, Data Quality Team für Standards und Monitoring.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.