Parameter
Die internen Zahlenwerte eines KI-Modells, die während des Trainings gelernt werden und das 'Wissen' des Modells repräsentieren.
Eine mathematische Repräsentation, die aus Daten gelernte Muster enthält und Vorhersagen oder Entscheidungen für neue Eingaben treffen kann.
Ein KI-Modell ist die mathematische Funktion, die aus dem Trainingsprozess entsteht. Es ist das “Gehirn” eines KI-Systems: eine Sammlung von Millionen oder Milliarden von Parametern, die zusammen Muster aus Trainingsdaten kodieren. Wenn neue Daten durch das Modell fließen, nutzt es diese gelernten Muster, um Vorhersagen zu treffen – ob das nun die Klassifikation eines Bildes, die Generierung von Text oder die Vorhersage eines Preises ist.
Ein KI-Modell ist das Ergebnis des Trainingsprozesses. Es enthält alles, was das System aus den Daten gelernt hat, in Form von Zahlen (Parametern). Wenn du das Modell mit neuen Daten fütterst, nutzt es diese gelernten Muster, um Vorhersagen zu treffen.
Modell-Lebenszyklus:
| Typ | Parameter | Beispiel | Einsatz |
|---|---|---|---|
| Lineare Modelle | 10-1.000 | Logistische Regression | Einfache Klassifikation |
| Baummodelle | 1.000-100.000 | Random Forest, XGBoost | Tabellarische Daten |
| Kleine NNs | 100K-10M | MLP, kleine CNNs | Spezifische Aufgaben |
| Große NNs | 10M-1B | ResNet, BERT | Vision, NLP |
| LLMs | 1B-1T+ | GPT-5, Llama 4 | Allgemeine Sprachaufgaben |
Ein trainiertes Modell besteht aus:
Ein KI-Modell ist wie eine Formel, die ein Schüler aus vielen Übungsaufgaben abgeleitet hat – sie fasst das Gelernte zusammen und kann auf neue Aufgaben angewendet werden.
Enthält die gelernten Parameter (Gewichte), die Muster in Daten repräsentieren
Wird durch Training auf Daten erstellt und durch Inferenz angewendet
Reicht von einfachen linearen Modellen bis zu LLMs mit Billionen Parametern
Sprachmodelle
GPT-5, Claude und Llama 4 sind Modelle, die Text verstehen und generieren
Bildklassifikation
ResNet oder EfficientNet klassifizieren Bilder in Kategorien
Vorhersagemodelle
Modelle für Absatzprognosen, Churn-Prediction oder Kreditscoring
Ein Algorithmus ist die Lernmethode (z.B. Gradient Descent). Ein Modell ist das Ergebnis des Trainings – die gelernten Parameter, die Vorhersagen treffen können. Der Algorithmus erstellt das Modell.
Von Kilobytes (einfache lineare Regression) bis Terabytes (große LLMs). GPT-5 hat geschätzt über 1 Billion Parameter, was hunderte Gigabytes Speicher benötigt.
Ja, das nennt sich Model Drift. Wenn sich die realen Daten ändern, kann ein Modell schlechtere Vorhersagen liefern. Regelmäßiges Retraining oder Monitoring ist wichtig.