Open-Weight-Modelle
KI-Modelle, deren trainierte Gewichte öffentlich verfügbar sind und lokal oder auf eigener Infrastruktur betrieben werden können – im Gegensatz zu proprietären Modellen wie GPT-4, die nur über APIs zugänglich sind.
Metas Familie von Open-Weight-Sprachmodellen, die das KI-Ökosystem demokratisiert haben – von Llama 1 (2023) bis Llama 3.3 (2025) das meistgenutzte Open-Weight-Modell weltweit.
Llama ist Metas Familie von Sprachmodellen mit öffentlich verfügbaren Gewichten. Seit der Veröffentlichung von Llama 1 im Februar 2023 hat Meta das Open-Weight-Ökosystem maßgeblich geprägt.
Llama-Evolution:
2023-02: Llama 1 → 7B–65B, nur Forschung
2023-07: Llama 2 → 7B–70B, kommerziell nutzbar
2024-04: Llama 3 → 8B–70B, deutlicher Qualitätssprung
2024-07: Llama 3.1 → 8B–405B, erstmals >400B Open Weight
2024-09: Llama 3.2 → 1B–90B, multimodal + Edge-Modelle
2025-01: Llama 3.3 → 8B–70B, optimiert, Reasoning verbessert
Llama hat das größte Ökosystem aller Open-Weight-Modelle:
| Bereich | Beispiele |
|---|---|
| Fine-Tuned-Varianten | >10.000 auf Hugging Face |
| Spezialisiert | Code Llama, Llama Guard, Med-Llama |
| Inference-Engines | llama.cpp, vLLM, TGI, Ollama |
| Fine-Tuning-Tools | LoRA, QLoRA, Axolotl, Unsloth |
| Quantisierung | GGUF, GPTQ, AWQ, EXL2 |
# Mit Ollama (2 Befehle)
ollama pull llama3.3
ollama run llama3.3 "Erkläre Transformer in 3 Sätzen"
# Als API-Server
ollama serve # localhost:11434 – OpenAI-kompatible API
| Modell | Anbieter | Stärke | Schwäche |
|---|---|---|---|
| Llama 3.3 | Meta | Allround, Ökosystem | Nicht vollständig offen |
| Mistral Large | Mistral | Effizienz, EU | Kleineres Ökosystem |
| Qwen 2.5 | Alibaba | Mehrsprachig, Code | Weniger westliche Community |
| Gemma 2 | Kompakt, effizient | Nur kleine Größen | |
| DeepSeek R1 | DeepSeek | Reasoning | Primär Reasoning-fokussiert |
Llama ist wie ein Lehrbuch, das kostenlos an alle verteilt wird: Jeder kann daraus lernen, es kopieren und für eigene Zwecke anpassen – während proprietäre Modelle wie GPT eher einem kostenpflichtigen Kurs entsprechen.
Open-Weight-Modell: Gewichte frei verfügbar für Forschung und kommerzielle Nutzung
Verfügbar in verschiedenen Größen (1B bis 405B Parameter)
Riesiges Ökosystem: Tausende Fine-Tuned-Varianten auf Hugging Face
Self-Hosted LLM
Llama auf eigener Infrastruktur betreiben für Datenschutz und Kostenkontrolle
Custom Fine-Tuning
Llama auf domänenspezifische Daten anpassen (Medizin, Recht, Code)
Forschung
Offene Gewichte ermöglichen akademische Forschung zu Interpretierbarkeit und Sicherheit
Edge Deployment
Kleine Llama-Varianten (1B, 3B) auf Mobilgeräten und Edge-Hardware
Streng genommen nein: Die Gewichte sind offen (Open Weight), aber Trainingsdaten und vollständiger Trainingscode sind nicht veröffentlicht. Die Meta Community License erlaubt kommerzielle Nutzung bis 700M monatliche Nutzer.
Llama 3.3 70B für beste Qualität, Llama 3.2 8B für gutes Preis-Leistungs-Verhältnis, Llama 3.2 3B/1B für Edge/Mobile. Es gibt auch spezialisierte Varianten wie Code Llama und Llama Guard für Safety.
Llama 3.3 70B erreicht bei vielen Benchmarks GPT-4-Niveau. Bei komplexem Reasoning und multimodalen Aufgaben hat GPT-4o noch Vorteile. Dafür bietet Llama volle Kontrolle, Datenschutz und keine API-Kosten.