Tool Use / Function Calling
Die Fähigkeit von Sprachmodellen, externe Werkzeuge und Funktionen aufzurufen – von Websuche über Code-Ausführung bis zu API-Aufrufen.
Ein KI-System, das eigenständig Aufgaben plant, Entscheidungen trifft und Tools nutzt, um komplexe Ziele zu erreichen – über einfache Frage-Antwort-Interaktion hinaus.
Ein KI-Agent ist ein System, das über einfaches Frage-Antwort hinausgeht. Es kann eigenständig planen, Tools nutzen und mehrstufige Aufgaben lösen. Der entscheidende Unterschied zu einem Chatbot: Ein Agent handelt, statt nur zu antworten.
Die Fähigkeit, Tools zu nutzen – Websuche, Code-Ausführung, Datenbankabfragen, API-Aufrufe – macht Agenten zu einem Paradigmenwechsel in der KI-Nutzung. Statt “Was ist X?” kann man fragen “Erledige Y” und der Agent plant und führt die notwendigen Schritte selbstständig aus. Das bringt aber auch neue Herausforderungen: Agenten können in Schleifen geraten, falsche Entscheidungen treffen oder unbeabsichtigte Nebenwirkungen haben. Es kann eigenständig planen, Tools nutzen und mehrstufige Aufgaben lösen.
Agent vs. Chatbot:
| Aspekt | Chatbot | Agent |
|---|---|---|
| Interaktion | Frage → Antwort | Aufgabe → Plan → Aktionen → Ergebnis |
| Tools | Keine | Websuche, Code, APIs, Dateien |
| Planung | Keine | Plant und priorisiert Schritte |
| Iteration | Einmalig | Prüft Ergebnis, korrigiert sich |
| Autonomie | Passiv | Aktiv handelnd |
Der Agent-Loop:
Aufgabe → Planen → Tool wählen → Ausführen → Ergebnis prüfen → Fertig?
↓ Nein
Nächster Schritt ←
ReAct (Reasoning + Acting): Agent denkt laut nach (Reasoning), wählt eine Aktion (Acting), beobachtet das Ergebnis und wiederholt.
Plan-and-Execute: Agent erstellt zuerst einen vollständigen Plan, führt ihn dann Schritt für Schritt aus.
Reflexion: Agent bewertet seine eigenen Ergebnisse und verbessert sich iterativ.
Agenten können verschiedene Tools nutzen:
Ein KI-Agent ist wie ein persönlicher Assistent, der nicht nur Fragen beantwortet, sondern eigenständig recherchiert, E-Mails schreibt, Termine bucht und Aufgaben erledigt – er plant und handelt selbstständig.
Kann eigenständig planen, Entscheidungen treffen und Aktionen ausführen
Nutzt Tools (Websuche, Code-Ausführung, APIs) zur Aufgabenlösung
Geht über einfache Chat-Interaktion hinaus – iteriert und korrigiert sich selbst
Code-Assistenten
Agenten wie Cursor oder GitHub Copilot Workspace, die Code schreiben, testen und debuggen
Recherche-Agenten
Automatische Webrecherche, Zusammenfassung und Berichterstellung
Kundenservice
Agenten, die Kundenanfragen bearbeiten, Bestellungen prüfen und Tickets erstellen
Datenanalyse
Agenten, die Daten laden, analysieren, visualisieren und Berichte erstellen
Ein Chatbot antwortet auf Fragen. Ein Agent plant eigenständig, nutzt Tools, führt Aktionen aus und iteriert, bis die Aufgabe erledigt ist. Ein Agent kann z.B. eine Websuche durchführen, Code schreiben und ausführen, und basierend auf dem Ergebnis weitere Schritte planen.
Noch nicht vollständig. Agenten können in Schleifen geraten, falsche Tools wählen oder Halluzinationen folgen. Guardrails, menschliche Überprüfung und klare Grenzen sind wichtig. Die Technologie entwickelt sich aber schnell weiter.
Mehrere spezialisierte Agenten arbeiten zusammen: Ein Agent recherchiert, ein anderer schreibt, ein dritter prüft. Wie ein Team mit verschiedenen Rollen. Frameworks wie CrewAI und AutoGen ermöglichen dies.