<EbeneX/>
Sicherheit Grundlagen · Updated 3. März 2026

Explainability (XAI)

Definition

Die Fähigkeit, Entscheidungen und Vorhersagen von KI-Systemen für Menschen nachvollziehbar und verständlich zu machen.

Fortgeschritten 2 Min. Lesezeit EN: Explainability / Explainable AI (XAI)

Einfach erklärt

Explainability (Erklärbarkeit) ist die Fähigkeit eines KI-Systems, seine Entscheidungen und Vorhersagen in für Menschen verständlicher Form zu begründen. Sie ist nicht nur ein technisches Feature, sondern eine ethische und rechtliche Anforderung: Der EU AI Act schreibt für Hochrisiko-KI-Systeme vor, dass Entscheidungen erklärbar sein müssen. Ein Kreditantrag, der von einer KI abgelehnt wird, muss begründet werden können – “das Modell hat es so entschieden” reicht nicht.

Explainability (Erklärbarkeit) bedeutet, dass ein KI-System nicht nur eine Entscheidung trifft, sondern auch erklären kann, warum. Das klingt selbstverständlich, ist aber bei modernen Deep-Learning-Modellen technisch schwierig – sie sind von Natur aus “Black Boxes”.

Explainability ist nicht nur ein technisches Problem, sondern ein rechtliches und ethisches. Der EU AI Act fordert Erklärbarkeit für Hochrisiko-KI-Systeme. Wenn ein Kredit abgelehnt, eine Bewerbung aussortiert oder eine medizinische Diagnose gestellt wird, haben Betroffene das Recht zu verstehen, warum. Methoden wie SHAP und LIME versuchen, diese Black Box nachträglich zu öffnen – sie erklären, welche Features die Entscheidung am stärksten beeinflusst haben.

Interpretierbarkeit vs. Erklärbarkeit:

AspektInterpretierbare ModelleErklärbare Modelle
AnsatzModell ist von Natur aus verständlichNachträgliche Erklärung eines komplexen Modells
BeispieleEntscheidungsbäume, lineare RegressionSHAP/LIME für neuronale Netze
GenauigkeitOft niedrigerKann hoch sein
VertrauenDirekt nachvollziehbarErklärung ist Approximation

Technischer Deep Dive

Methoden

SHAP (SHapley Additive exPlanations):

  • Basiert auf Spieltheorie (Shapley Values)
  • Berechnet den Beitrag jedes Features zur Vorhersage
  • Konsistent und theoretisch fundiert

LIME (Local Interpretable Model-agnostic Explanations):

  • Erstellt ein einfaches Modell, das die Vorhersage lokal approximiert
  • Funktioniert mit jedem Modell (model-agnostic)
  • Schneller als SHAP, aber weniger konsistent

Attention Visualization:

  • Zeigt, auf welche Eingabe-Teile das Modell “achtet”
  • Nützlich für Transformer-Modelle
  • Vorsicht: Attention ≠ Erklärung (Korrelation, nicht Kausalität)

Regulatorische Anforderungen

  • EU AI Act: Transparenzpflichten für Hochrisiko-KI
  • DSGVO Art. 22: Recht auf Erklärung bei automatisierten Entscheidungen
  • US Equal Credit Opportunity Act: Erklärungspflicht bei Kreditablehnungen

Explainability ist wie ein Arzt, der nicht nur eine Diagnose stellt, sondern auch erklärt, warum: 'Ihr Blutdruck ist erhöht und Ihre Blutwerte zeigen X – deshalb empfehle ich Y.' Ohne Erklärung fehlt das Vertrauen.

Macht KI-Entscheidungen für Menschen nachvollziehbar und überprüfbar

Besonders wichtig in regulierten Bereichen (Medizin, Finanzen, Justiz)

Methoden: SHAP, LIME, Attention Visualization, Feature Importance

Kreditentscheidungen

Erklärung, warum ein Kreditantrag abgelehnt wurde (gesetzlich vorgeschrieben)

Medizinische Diagnose

Ärzte müssen verstehen, warum die KI eine bestimmte Diagnose vorschlägt

Betrugserkennung

Analysten brauchen Erklärungen, um Fehlalarme von echtem Betrug zu unterscheiden

Sind LLMs erklärbar?

Eingeschränkt. Attention-Visualisierung zeigt, worauf das Modell 'achtet', aber bei Milliarden Parametern ist echte Erklärbarkeit schwierig. Chain-of-Thought-Prompting kann helfen, den Denkprozess sichtbar zu machen – ist aber keine echte Erklärung der internen Mechanismen.

Fordert der EU AI Act Explainability?

Ja, für Hochrisiko-KI-Systeme. Nutzer müssen über die Funktionsweise informiert werden, und Entscheidungen müssen nachvollziehbar sein. Die genauen Anforderungen hängen von der Risikokategorie ab.

Welche Methoden zur Explainability sind am effektivsten?

Zu den effektivsten Methoden gehören LIME und SHAP, die lokale Erklärungen für Modellvorhersagen liefern. Diese Techniken helfen, die wichtigsten Merkmale zu identifizieren, die die Entscheidungen des Modells beeinflussen.

Wie kann ich Explainability in mein KI-Projekt integrieren?

Explainability kann durch die Auswahl erklärbarer Modelle oder durch den Einsatz von Erklärungswerkzeugen in den Entwicklungsprozess integriert werden. Es ist wichtig, die Bedürfnisse der Endbenutzer zu berücksichtigen, um verständliche Erklärungen zu bieten.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.