KI-Modell evaluieren
Systematische Evaluation eines LLM oder KI-Systems für einen spezifischen Anwendungsfall.
## Rolle Du bist ein ML-Engineer mit Fokus auf LLM-Evaluation. ## Kontext Anwendungsfall: [BESCHREIBUNG] Zu evaluierende Modelle: [LISTE] Anforderungen: [GENAUIGKEIT / GESCHWINDIGKEIT / KOSTEN / SPRACHE] Budget: [API-KOSTEN] ## Aufgabe Designe ein Evaluierungs-Framework. ## Format 1. Evaluierungs-Dimensionen 2. Test-Datensatz-Anforderungen 3. Metriken pro Dimension 4. Evaluierungs-Protokoll 5. Kosten-Nutzen-Analyse 6. Empfehlung ## Constraints Reproduzierbares Vorgehen. Keine subjektiven Einschätzungen ohne Begründung. - **Fehlender Kontext:** Wenn wichtige Angaben fehlen, stelle gezielte Rückfragen statt generische Antworten zu produzieren. - Wenn Modell oder API-Version fehlen, frage nach – Prompts sind modellspezifisch. ## Profi-Optionen - Erkläre warum dieser Prompt-Ansatz für das genannte Modell funktioniert. - Gib eine Variante für ein kleineres/günstigeres Modell. - Nenne Grenzen und Fallstricke des Ansatzes.
Über diesen Prompt
Dieser Experte-Prompt aus der Kategorie Ki hilft dir bei: Systematische Evaluation eines LLM oder KI-Systems für einen spezifischen Anwendungsfall. Der Prompt folgt einer klaren Struktur mit Rolle, Kontext, Aufgabe, Format und Constraints – so bekommst du von ChatGPT, Claude oder Gemini präzise, verwertbare Ergebnisse statt generischer Texte. Relevante Themen: llm evaluation, benchmarking, ki qualität, evals, modellauswahl.
Du kannst diesen Prompt direkt kopieren oder im Prompt-Builder weiter anpassen. Ersetze einfach die Platzhalter in eckigen Klammern mit deinen konkreten Angaben – je mehr Kontext du lieferst, desto besser das Ergebnis.
So verwendest du diesen Prompt
- Prompt kopieren
Klicke auf „Prompt kopieren" oben rechts.
- Platzhalter ersetzen
Ersetze alle Angaben in
[ECKIGEN KLAMMERN]mit deinen konkreten Informationen. Je mehr Kontext du gibst, desto besser das Ergebnis. - In KI-Modell einfügen
- Ergebnis verfeinern
Nicht zufrieden? Nutze den Prompt-Builder um den Prompt weiter anzupassen.