Bias (Verzerrung)
Systematische Verzerrungen in KI-Systemen, die zu unfairen oder diskriminierenden Ergebnissen führen – verursacht durch einseitige Trainingsdaten, Algorithmen oder Designentscheidungen.
Die Fähigkeit, Entscheidungen und Vorhersagen von KI-Systemen für Menschen nachvollziehbar und verständlich zu machen.
Explainability (Erklärbarkeit) ist die Fähigkeit eines KI-Systems, seine Entscheidungen und Vorhersagen in für Menschen verständlicher Form zu begründen. Sie ist nicht nur ein technisches Feature, sondern eine ethische und rechtliche Anforderung: Der EU AI Act schreibt für Hochrisiko-KI-Systeme vor, dass Entscheidungen erklärbar sein müssen. Ein Kreditantrag, der von einer KI abgelehnt wird, muss begründet werden können – “das Modell hat es so entschieden” reicht nicht.
Explainability (Erklärbarkeit) bedeutet, dass ein KI-System nicht nur eine Entscheidung trifft, sondern auch erklären kann, warum. Das klingt selbstverständlich, ist aber bei modernen Deep-Learning-Modellen technisch schwierig – sie sind von Natur aus “Black Boxes”.
Explainability ist nicht nur ein technisches Problem, sondern ein rechtliches und ethisches. Der EU AI Act fordert Erklärbarkeit für Hochrisiko-KI-Systeme. Wenn ein Kredit abgelehnt, eine Bewerbung aussortiert oder eine medizinische Diagnose gestellt wird, haben Betroffene das Recht zu verstehen, warum. Methoden wie SHAP und LIME versuchen, diese Black Box nachträglich zu öffnen – sie erklären, welche Features die Entscheidung am stärksten beeinflusst haben.
Interpretierbarkeit vs. Erklärbarkeit:
| Aspekt | Interpretierbare Modelle | Erklärbare Modelle |
|---|---|---|
| Ansatz | Modell ist von Natur aus verständlich | Nachträgliche Erklärung eines komplexen Modells |
| Beispiele | Entscheidungsbäume, lineare Regression | SHAP/LIME für neuronale Netze |
| Genauigkeit | Oft niedriger | Kann hoch sein |
| Vertrauen | Direkt nachvollziehbar | Erklärung ist Approximation |
SHAP (SHapley Additive exPlanations):
LIME (Local Interpretable Model-agnostic Explanations):
Attention Visualization:
Explainability ist wie ein Arzt, der nicht nur eine Diagnose stellt, sondern auch erklärt, warum: 'Ihr Blutdruck ist erhöht und Ihre Blutwerte zeigen X – deshalb empfehle ich Y.' Ohne Erklärung fehlt das Vertrauen.
Macht KI-Entscheidungen für Menschen nachvollziehbar und überprüfbar
Besonders wichtig in regulierten Bereichen (Medizin, Finanzen, Justiz)
Methoden: SHAP, LIME, Attention Visualization, Feature Importance
Kreditentscheidungen
Erklärung, warum ein Kreditantrag abgelehnt wurde (gesetzlich vorgeschrieben)
Medizinische Diagnose
Ärzte müssen verstehen, warum die KI eine bestimmte Diagnose vorschlägt
Betrugserkennung
Analysten brauchen Erklärungen, um Fehlalarme von echtem Betrug zu unterscheiden
Eingeschränkt. Attention-Visualisierung zeigt, worauf das Modell 'achtet', aber bei Milliarden Parametern ist echte Erklärbarkeit schwierig. Chain-of-Thought-Prompting kann helfen, den Denkprozess sichtbar zu machen – ist aber keine echte Erklärung der internen Mechanismen.
Ja, für Hochrisiko-KI-Systeme. Nutzer müssen über die Funktionsweise informiert werden, und Entscheidungen müssen nachvollziehbar sein. Die genauen Anforderungen hängen von der Risikokategorie ab.
Zu den effektivsten Methoden gehören LIME und SHAP, die lokale Erklärungen für Modellvorhersagen liefern. Diese Techniken helfen, die wichtigsten Merkmale zu identifizieren, die die Entscheidungen des Modells beeinflussen.
Explainability kann durch die Auswahl erklärbarer Modelle oder durch den Einsatz von Erklärungswerkzeugen in den Entwicklungsprozess integriert werden. Es ist wichtig, die Bedürfnisse der Endbenutzer zu berücksichtigen, um verständliche Erklärungen zu bieten.