Large Language Model (LLM)
Ein KI-Modell, das auf riesigen Textmengen trainiert wurde und menschenähnliche Sprache verstehen und generieren kann.
Googles Familie multimodaler KI-Modelle, die Text, Code, Bild, Audio und Video nativ verarbeiten – von der kompakten Nano-Variante bis zum leistungsstärksten Ultra-Modell.
Gemini ist Googles KI-Modellfamilie, die seit Ende 2023 alle Google-Produkte durchdringt. Im Gegensatz zu GPT (das als reines Sprachmodell startete) wurde Gemini von Anfang an multimodal konzipiert.
Die Gemini-Familie:
Gemini Ultra → Stärkstes Modell, komplexe Aufgaben
Gemini Pro → Bestes Preis-Leistungs-Verhältnis
Gemini Flash → Schnellstes Modell, niedrige Kosten
Gemini Nano → On-Device, läuft auf Smartphones
| Feature | Details |
|---|---|
| Kontextfenster | Bis zu 2 Millionen Tokens (längster Kontext aller LLMs) |
| Nativ multimodal | Text, Bild, Audio, Video ohne separate Encoder |
| Grounding | Google-Suche als integrierte Faktenquelle |
| Code Execution | Kann Python-Code ausführen und Ergebnisse verifizieren |
| Function Calling | Strukturierte Tool-Integration |
| Aspekt | Gemini 2.0 | GPT-4o | Claude 3.5 |
|---|---|---|---|
| Kontextfenster | 2M Tokens | 128K | 200K |
| Multimodal | Nativ (alle) | Text+Bild+Audio | Text+Bild |
| Stärke | Long Context, Suche | Code, Reasoning | Nuance, lange Texte |
| Ökosystem | Google Cloud | Azure, breiteste API | AWS, fokussiert |
| Preis | Günstig (Flash) | Mittel | Mittel |
Gemini ist tief in das Google-Ökosystem eingebettet:
Gemini ist wie ein Schweizer Taschenmesser unter den KI-Modellen: Es kann gleichzeitig lesen, sehen und hören – und ist in verschiedenen Größen verfügbar, vom kompakten Werkzeug für die Hosentasche bis zum Profi-Multitool.
Nativ multimodal: Von Grund auf auf Text, Bild, Audio, Video und Code trainiert
Drei Größen: Nano (on-device), Flash (schnell), Pro/Ultra (maximale Qualität)
Tiefe Integration in Google-Ökosystem (Search, Workspace, Android, Cloud)
Google AI Overviews
KI-generierte Zusammenfassungen in der Google-Suche
Google Workspace
KI-Assistent in Gmail, Docs, Sheets und Slides
Android AI
Gemini Nano für On-Device-KI auf Smartphones
Entwickler-API
Gemini API und Vertex AI für eigene KI-Anwendungen
Flash ist für Geschwindigkeit und Kosten optimiert – ideal für hohe Volumina und einfachere Aufgaben. Pro bietet die beste Qualität für komplexes Reasoning, Coding und multimodale Analyse. Ultra ist das Spitzenmodell für die anspruchsvollsten Aufgaben.
Stand 2026 sind alle drei auf ähnlichem Niveau, mit unterschiedlichen Stärken: Gemini bei multimodalen Aufgaben und langem Kontextfenster (bis 2M Tokens), GPT-4o bei Code und Reasoning, Claude bei langen Texten und Nuancen.
Die Gemini-App und Google AI Studio bieten kostenlose Tiers. Die API hat ein kostenloses Kontingent für Entwickler. Für Produktionsnutzung fallen Kosten pro Token an – vergleichbar mit OpenAI und Anthropic.