<EbeneX/>
LLM Praxis · Updated 3. März 2026

Llama

Definition

Metas Familie von Open-Weight-Sprachmodellen, die das KI-Ökosystem demokratisiert haben – von Llama 1 (2023) bis Llama 3.3 (2025) das meistgenutzte Open-Weight-Modell weltweit.

Fortgeschritten 2 Min. Lesezeit EN: Llama (Large Language Model Meta AI)

Einfach erklärt

Llama ist Metas Familie von Sprachmodellen mit öffentlich verfügbaren Gewichten. Seit der Veröffentlichung von Llama 1 im Februar 2023 hat Meta das Open-Weight-Ökosystem maßgeblich geprägt.

Llama-Evolution:

2023-02: Llama 1    → 7B–65B, nur Forschung
2023-07: Llama 2    → 7B–70B, kommerziell nutzbar
2024-04: Llama 3    → 8B–70B, deutlicher Qualitätssprung
2024-07: Llama 3.1  → 8B–405B, erstmals >400B Open Weight
2024-09: Llama 3.2  → 1B–90B, multimodal + Edge-Modelle
2025-01: Llama 3.3  → 8B–70B, optimiert, Reasoning verbessert

Ökosystem

Llama hat das größte Ökosystem aller Open-Weight-Modelle:

BereichBeispiele
Fine-Tuned-Varianten>10.000 auf Hugging Face
SpezialisiertCode Llama, Llama Guard, Med-Llama
Inference-Enginesllama.cpp, vLLM, TGI, Ollama
Fine-Tuning-ToolsLoRA, QLoRA, Axolotl, Unsloth
QuantisierungGGUF, GPTQ, AWQ, EXL2

Lokal betreiben

# Mit Ollama (2 Befehle)
ollama pull llama3.3
ollama run llama3.3 "Erkläre Transformer in 3 Sätzen"

# Als API-Server
ollama serve  # localhost:11434 – OpenAI-kompatible API

Llama vs. andere Open-Weight-Modelle

ModellAnbieterStärkeSchwäche
Llama 3.3MetaAllround, ÖkosystemNicht vollständig offen
Mistral LargeMistralEffizienz, EUKleineres Ökosystem
Qwen 2.5AlibabaMehrsprachig, CodeWeniger westliche Community
Gemma 2GoogleKompakt, effizientNur kleine Größen
DeepSeek R1DeepSeekReasoningPrimär Reasoning-fokussiert

Llama ist wie ein Lehrbuch, das kostenlos an alle verteilt wird: Jeder kann daraus lernen, es kopieren und für eigene Zwecke anpassen – während proprietäre Modelle wie GPT eher einem kostenpflichtigen Kurs entsprechen.

Open-Weight-Modell: Gewichte frei verfügbar für Forschung und kommerzielle Nutzung

Verfügbar in verschiedenen Größen (1B bis 405B Parameter)

Riesiges Ökosystem: Tausende Fine-Tuned-Varianten auf Hugging Face

Self-Hosted LLM

Llama auf eigener Infrastruktur betreiben für Datenschutz und Kostenkontrolle

Custom Fine-Tuning

Llama auf domänenspezifische Daten anpassen (Medizin, Recht, Code)

Forschung

Offene Gewichte ermöglichen akademische Forschung zu Interpretierbarkeit und Sicherheit

Edge Deployment

Kleine Llama-Varianten (1B, 3B) auf Mobilgeräten und Edge-Hardware

Ist Llama wirklich Open Source?

Streng genommen nein: Die Gewichte sind offen (Open Weight), aber Trainingsdaten und vollständiger Trainingscode sind nicht veröffentlicht. Die Meta Community License erlaubt kommerzielle Nutzung bis 700M monatliche Nutzer.

Welche Llama-Version sollte ich verwenden?

Llama 3.3 70B für beste Qualität, Llama 3.2 8B für gutes Preis-Leistungs-Verhältnis, Llama 3.2 3B/1B für Edge/Mobile. Es gibt auch spezialisierte Varianten wie Code Llama und Llama Guard für Safety.

Wie vergleicht sich Llama mit GPT-4?

Llama 3.3 70B erreicht bei vielen Benchmarks GPT-4-Niveau. Bei komplexem Reasoning und multimodalen Aufgaben hat GPT-4o noch Vorteile. Dafür bietet Llama volle Kontrolle, Datenschutz und keine API-Kosten.

Dein persönliches Share-Bild für Instagram – 1080×1080px, bereit zum Posten.