LangChain / LlamaIndex
Die zwei populärsten Frameworks für LLM-Anwendungen – LangChain für Chains und Agents, LlamaIndex für RAG und Daten-Indexierung.
Das Koordinieren mehrerer KI-Komponenten – Modelle, Tools, Datenquellen und Agenten – zu einem zusammenhängenden Workflow, der automatisch die richtigen Schritte in der richtigen Reihenfolge ausführt.
KI-Orchestrierung ist die Koordination aller Teile eines KI-Systems. Statt ein einzelnes Modell aufzurufen, werden mehrere Schritte, Modelle und Tools zu einem zusammenhängenden Workflow verbunden.
Einfacher API-Aufruf vs. orchestrierter Workflow:
Einfach:
User-Frage → LLM → Antwort
Orchestriert (RAG):
User-Frage
→ Query-Rewriting (LLM)
→ Embedding-Suche (Vektordatenbank)
→ Reranking (Cross-Encoder)
→ Prompt Assembly
→ LLM-Generierung
→ Guardrail-Check
→ Antwort + Quellen
| Pattern | Beschreibung | Framework |
|---|---|---|
| Sequential Pipeline | Schritt für Schritt | LangChain Chains |
| Router | Weiterleitung an das richtige Modell | LLM Router, Semantic Router |
| Fan-out/Fan-in | Parallel verarbeiten, dann zusammenführen | LangGraph |
| Retry + Fallback | Bei Fehler: alternatives Modell nutzen | Eigene Logik |
| State Machine | Zustandsabhängige Abläufe | LangGraph |
| Human-in-the-Loop | Mensch an bestimmten Stellen einbinden | LangGraph Checkpoints |
| Framework | Stärke | Komplexität | Für |
|---|---|---|---|
| LangChain | Breitestes Ökosystem | Mittel-Hoch | RAG, Chains |
| LlamaIndex | Daten-fokussiert | Mittel | RAG, Indexierung |
| LangGraph | Zustandsbehaftete Agents | Hoch | Agenten, komplexe Workflows |
| Haystack | Pipeline-Fokus | Mittel | NLP, RAG |
| Custom (Python) | Maximale Kontrolle | Variabel | Produktion |
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI
from langchain_community.vectorstores import Chroma
# Komponenten definieren
retriever = Chroma(...).as_retriever(search_kwargs={"k": 5})
llm = ChatOpenAI(model="gpt-4o")
# Orchestrierung als Chain
rag_chain = (
{"context": retriever, "question": RunnablePassthrough()}
| prompt_template
| llm
| output_parser
)
# Ausführen
result = rag_chain.invoke("Was ist Orchestrierung?") KI-Orchestrierung ist wie ein Dirigent, der ein Orchester leitet: Jeder Musiker (Modell, Tool, Agent) ist für sich gut, aber erst der Dirigent sorgt dafür, dass alle zur richtigen Zeit das Richtige spielen und zusammen etwas Großes entsteht.
Verbindet LLMs, Tools, Datenquellen und Agenten zu automatisierten Workflows
Steuert Routing, Fallbacks, Retry-Logik und Zustandsmanagement
Frameworks wie LangChain, LlamaIndex und LangGraph als Orchestrierungsschichten
RAG-Pipelines
Suche → Ranking → Prompt-Zusammenstellung → LLM → Antwort als orchestrierter Workflow
Multi-Modell-Routing
Einfache Fragen an günstige Modelle, komplexe an leistungsstarke – automatisch
Data Processing
Dokumente einlesen → chunken → embedden → speichern als automatisierte Pipeline
Agent-Koordination
Mehrere Agenten orchestrieren: Recherche → Analyse → Bericht
Sobald dein KI-Workflow mehr als einen Schritt hat: RAG (Suche + LLM), Agenten (Plan + Tool + Reflexion), Multi-Modell-Setups (Router + Fallback) oder Pipelines mit Vor-/Nachverarbeitung.
Orchestrierung ist das 'Wie': die technische Infrastruktur, die Komponenten verbindet und Workflows steuert. Ein Agent ist das 'Was': eine KI-Entität, die Entscheidungen trifft. Agenten werden oft in einer Orchestrierungsschicht ausgeführt.
Für Prototypen und Standard-Patterns: LangChain/LlamaIndex nutzen. Für produktionskritische Systeme mit spezifischen Anforderungen: Oft besser, eine eigene, schlankere Lösung zu bauen – Frameworks können unnötige Komplexität einführen.