<EbeneX/>
Architektur DevOps

A/B Rollout

A/B Rollout / Gradual Rollout / Percentage Rollout

Eine Deployment-Strategie, bei der neue Features schrittweise an Nutzergruppen ausgerollt werden – kombiniert A/B-Testing mit kontrolliertem Release.

Grundlagen Architektur

Aktivierungsfunktion

Activation Function

Mathematische Funktionen in neuronalen Netzen, die Nicht-Linearität einführen – ohne sie könnte ein Netz nur lineare Zusammenhänge lernen, egal wie viele Layers es hat.

Architektur Grundlagen

Attention Mechanism

Attention Mechanism

Der Kernmechanismus moderner KI-Modelle – ermöglicht es einem Modell, sich auf die relevantesten Teile der Eingabe zu konzentrieren, statt alles gleich zu gewichten.

Architektur DevOps

Autoscaling

Autoscaling / Auto Scaling

Die automatische Anpassung von Compute-Ressourcen basierend auf Last – mehr Server bei hoher Nachfrage, weniger bei niedriger. Kosteneffizient und performant.

Architektur Grundlagen

Batch Normalization

Batch Normalization

Eine Technik, die die Eingaben jeder Schicht normalisiert – stabilisiert das Training, ermöglicht höhere Lernraten und beschleunigt die Konvergenz deutlich.

LLM Architektur

Beam Search

Beam Search

Ein Decoding-Algorithmus für LLMs, der mehrere Kandidaten-Sequenzen parallel verfolgt und die wahrscheinlichste Gesamtsequenz auswählt – besser als Greedy, aber rechenintensiver.

Architektur DevOps

Blue-Green Deployment

Blue-Green Deployment

Eine Deployment-Strategie mit zwei identischen Produktionsumgebungen – schneller Wechsel zwischen Versionen ohne Downtime und einfaches Rollback.

Praxis Architektur

Clean Code

Clean Code

Prinzipien und Praktiken für lesbaren, wartbaren und verständlichen Quellcode – Code, der sich wie gut geschriebene Prosa liest.

Architektur Bild-KI

CLIP

CLIP (Contrastive Language-Image Pretraining)

Ein multimodales Modell von OpenAI, das Text und Bilder in einen gemeinsamen Vektorraum einbettet – die Grundlage für Bild-Suche, DALL-E und viele Vision-Language-Modelle.

Architektur Grundlagen

CNN (Convolutional Neural Network)

Convolutional Neural Network

Eine neuronale Netzwerk-Architektur, die speziell für die Verarbeitung von Bildern und räumlichen Daten entwickelt wurde und lokale Muster durch Filter erkennt.

Architektur DevOps

Cold Start

Cold Start

Die Verzögerung beim ersten Aufruf einer Serverless-Funktion oder eines skalierten Services – wenn Container oder VMs erst gestartet werden müssen.

Grundlagen Architektur

Continual Learning

Continual Learning / Lifelong Learning

Ein Paradigma, bei dem ML-Modelle kontinuierlich aus neuen Daten lernen, ohne das zuvor Gelernte zu vergessen – eine der größten Herausforderungen in der KI.

Architektur Architektur

CQRS

Command Query Responsibility Segregation

Ein Architektur-Pattern, das Lese- und Schreiboperationen trennt – unterschiedliche Modelle für Commands (Änderungen) und Queries (Abfragen).

Grundlagen Architektur

Cross-Entropy

Cross-Entropy Loss

Eine Loss Function, die misst, wie gut eine vorhergesagte Wahrscheinlichkeitsverteilung mit der tatsächlichen Verteilung übereinstimmt – Standard für Klassifikation und LLMs.

Architektur Praxis

Design Patterns

Design Patterns

Bewährte Lösungsschablonen für wiederkehrende Probleme in der Softwareentwicklung – von Singleton über Observer bis Factory.

Bild-KI Architektur

Diffusionsmodell

Diffusion Model

Eine generative KI-Architektur, die Bilder erzeugt, indem sie schrittweise Rauschen entfernt – die Technologie hinter Stable Diffusion, DALL-E und Midjourney.

Grundlagen Architektur

Entropy

Entropy

Ein Maß für Unsicherheit oder Informationsgehalt einer Wahrscheinlichkeitsverteilung – fundamental für Informationstheorie, Entscheidungsbäume und Sprachmodelle.

Architektur Architektur

Event Sourcing

Event Sourcing

Ein Architektur-Pattern, bei dem der Zustand einer Anwendung nicht direkt gespeichert wird, sondern aus einer Sequenz von Events rekonstruiert wird.

Architektur DevOps

Event-Driven Architecture

Event-Driven Architecture

Ein Architekturmuster, bei dem Komponenten über Ereignisse (Events) kommunizieren statt über direkte Aufrufe – ideal für lose Kopplung, Skalierbarkeit und Echtzeit-Datenverarbeitung in KI-Systemen.

Bild-KI Architektur

GAN (Generative Adversarial Network)

Generative Adversarial Network

Eine generative KI-Architektur, bei der zwei neuronale Netze gegeneinander antreten – ein Generator erzeugt Daten, ein Discriminator bewertet sie.

LLM Architektur

Greedy Decoding

Greedy Decoding

Die einfachste Decoding-Strategie für LLMs – wählt bei jedem Schritt das wahrscheinlichste Token. Schnell und deterministisch, aber oft nicht optimal.

DevOps Architektur

Groq

Groq

Ein KI-Hardwareunternehmen, das mit seiner Language Processing Unit (LPU) extrem schnelle LLM-Inferenz ermöglicht – bis zu 10× schneller als GPU-basierte Lösungen bei niedrigeren Kosten.

Architektur Architektur

gRPC

gRPC (gRPC Remote Procedure Calls)

Ein modernes RPC-Framework von Google für effiziente Service-zu-Service-Kommunikation – schneller als REST, mit starker Typisierung und Streaming-Support.

Bild-KI Architektur

Image Segmentation

Image Segmentation

Eine Computer-Vision-Aufgabe, bei der jeder Pixel eines Bildes einer Klasse oder Instanz zugeordnet wird – präziser als Object Detection und Grundlage für medizinische Bildgebung, autonomes Fahren und Bildbearbeitung.

Architektur Praxis

Inference Optimization

Inference Optimization

Techniken, die die Ausführung von KI-Modellen schneller und günstiger machen – von KV-Cache über Batching bis Speculative Decoding.

Architektur Sicherheit

JWT (JSON Web Token)

JSON Web Token (JWT)

Ein kompakter, URL-sicherer Token-Standard für die sichere Übertragung von Informationen zwischen Parteien – der De-facto-Standard für API-Authentifizierung.

Praxis Architektur

KI-Orchestrierung

AI Orchestration

Das Koordinieren mehrerer KI-Komponenten – Modelle, Tools, Datenquellen und Agenten – zu einem zusammenhängenden Workflow, der automatisch die richtigen Schritte in der richtigen Reihenfolge ausführt.

Architektur Grundlagen

Knowledge Distillation

Knowledge Distillation

Eine Technik, bei der ein kleines 'Student'-Modell lernt, das Verhalten eines großen 'Teacher'-Modells zu imitieren – für effizientere Modelle mit ähnlicher Qualität.

Architektur LLM

KV-Cache

KV-Cache (Key-Value Cache)

Ein Optimierungsmechanismus für Transformer-Modelle, der die Key-Value-Paare aus dem Attention-Mechanismus zwischenspeichert, um wiederholte Berechnungen zu vermeiden.

Architektur Praxis

Latency vs. Throughput

Latency vs. Throughput

Die zwei fundamentalen Performance-Metriken – Latenz misst wie schnell, Throughput misst wie viel. Oft ein Trade-off, beide wichtig für verschiedene Use Cases.

Bild-KI Architektur

Latent Diffusion

Latent Diffusion Model (LDM)

Eine Variante von Diffusionsmodellen, die im komprimierten latenten Raum arbeitet statt auf Pixel-Ebene – die Grundlage von Stable Diffusion und deutlich effizienter.

Grundlagen Architektur

Latent Space

Latent Space

Ein komprimierter, gelernter Repräsentationsraum, in dem ein Modell die wesentlichen Merkmale von Daten kodiert – die 'innere Vorstellung' eines neuronalen Netzes.

Architektur Grundlagen

LSTM (Long Short-Term Memory)

Long Short-Term Memory

Eine erweiterte RNN-Architektur mit speziellen Gate-Mechanismen, die Langzeitabhängigkeiten in Sequenzen besser erfassen kann als einfache RNNs.

Architektur LLM

Mixture of Experts (MoE)

Mixture of Experts

Eine Modellarchitektur, bei der nur ein Teil der Parameter pro Eingabe aktiviert wird – ermöglicht riesige Modelle bei moderatem Rechenaufwand.

Architektur LLM Praxis

Model Context Protocol (MCP)

Model Context Protocol

Ein offenes Protokoll von Anthropic, das KI-Modellen standardisierten Zugriff auf externe Datenquellen, Tools und Systeme ermöglicht – wie ein universeller USB-C-Anschluss für KI-Anwendungen.

DevOps Architektur

Model Versioning

Model Versioning

Die systematische Verwaltung verschiedener Versionen von ML-Modellen – inklusive Gewichte, Hyperparameter, Trainingsdaten und Metriken für Reproduzierbarkeit.

Architektur Architektur

Monolith

Monolithic Architecture

Eine Software-Architektur, bei der alle Komponenten einer Anwendung in einer einzigen, zusammenhängenden Codebasis entwickelt und deployed werden.

LLM Architektur

Multi-Agent Systems

Multi-Agent Systems (MAS)

Architekturen, in denen mehrere spezialisierte KI-Agenten zusammenarbeiten, um komplexe Aufgaben zu lösen – jeder Agent hat eine Rolle und kommuniziert mit anderen.

LLM Architektur

Multimodale KI

Multimodal AI

KI-Systeme, die mehrere Datentypen gleichzeitig verarbeiten – Text, Bilder, Audio, Video – und so ein ganzheitlicheres Verständnis der Welt entwickeln als reine Sprachmodelle.

Grundlagen Architektur

Neural Network Layers

Neural Network Layers

Die Bausteine neuronaler Netze – Input Layer empfängt Daten, Hidden Layers verarbeiten sie, Output Layer liefert das Ergebnis. Mehr Layers = tieferes Netz = Deep Learning.

LLM Architektur

Nucleus Sampling (Top-p Sampling)

Nucleus Sampling / Top-p Sampling

Eine Sampling-Strategie für LLMs, die nur die wahrscheinlichsten Tokens berücksichtigt, deren kumulative Wahrscheinlichkeit einen Schwellenwert p erreicht – die Grundlage für natürliche, diverse Textgenerierung.

Bild-KI Architektur

Object Detection

Object Detection

Eine Computer-Vision-Aufgabe, bei der KI-Modelle Objekte in Bildern oder Videos erkennen und mit Bounding Boxes lokalisieren – Grundlage für autonomes Fahren, Videoüberwachung und Robotik.

Praxis Architektur

ONNX

Open Neural Network Exchange

Ein offenes Format für ML-Modelle, das Portabilität zwischen Frameworks ermöglicht – ein Modell in PyTorch trainieren und in TensorFlow oder auf Edge-Geräten ausführen.

Architektur Architektur

OpenAPI / Swagger

OpenAPI Specification (OAS) / Swagger

Ein Standard zur Beschreibung von REST-APIs – ermöglicht automatische Dokumentation, Code-Generierung und API-Testing.

Sicherheit Architektur

OWASP

Open Web Application Security Project

Die Open Web Application Security Project Foundation – definiert die wichtigsten Web-Sicherheitsrisiken und Best Practices für sichere Entwicklung.

Architektur Grundlagen

Positional Encoding

Positional Encoding / Positional Embedding

Eine Technik, die Transformern die Position von Tokens in einer Sequenz mitteilt – notwendig, weil Attention allein keine Reihenfolge kennt.

Architektur DevOps

Pruning

Pruning

Eine Optimierungstechnik, bei der unwichtige Gewichte oder Neuronen aus einem trainierten Modell entfernt werden – für kleinere, schnellere Modelle mit minimaler Qualitätseinbuße.

Sicherheit Architektur

RBAC und ABAC

Role-Based / Attribute-Based Access Control

Zwei Modelle für Zugriffssteuerung – RBAC basiert auf Rollen, ABAC auf Attributen. Grundlage für sichere Autorisierung.

LLM Architektur

Reasoning-Modelle

Reasoning Models

Eine neue Klasse von KI-Modellen, die komplexe Probleme durch explizites mehrstufiges Denken lösen – GPT-5 Thinking, Claude Opus 4.6 und DeepSeek R1 sind prominente Beispiele.

Architektur Architektur

Redis

Redis (Remote Dictionary Server)

Eine extrem schnelle In-Memory-Datenbank, die als Cache, Message Broker und Session Store eingesetzt wird – unverzichtbar für performante Anwendungen.

Architektur Architektur

Reverse Proxy

Reverse Proxy

Ein Server, der vor deinen Backend-Servern sitzt und Anfragen entgegennimmt, verteilt und absichert – für Load Balancing, SSL, Caching und Security.

Architektur Grundlagen

RNN (Recurrent Neural Network)

Recurrent Neural Network

Eine neuronale Netzwerk-Architektur mit internem Gedächtnis, die sequenzielle Daten wie Text oder Zeitreihen verarbeiten kann – weitgehend durch Transformer ersetzt.

Architektur DevOps

Shadow Deployment

Shadow Deployment / Shadow Mode / Dark Launch

Eine Deployment-Strategie, bei der eine neue Version parallel zur Produktion läuft und echten Traffic erhält, aber keine Antworten an Nutzer sendet – für risikofreies Testen.

Architektur DevOps

SLA, SLO, SLI

Service Level Agreement / Objective / Indicator

Die drei Säulen der Service-Zuverlässigkeit – SLI misst, SLO definiert Ziele, SLA ist der Vertrag. Grundlage für Reliability Engineering.

Grundlagen Architektur

Softmax

Softmax Function

Eine mathematische Funktion, die einen Vektor von Zahlen in eine Wahrscheinlichkeitsverteilung umwandelt – zentral für Klassifikation und Attention in neuronalen Netzen.

Architektur Praxis

SOLID-Prinzipien

SOLID Principles

Fünf fundamentale Designprinzipien der objektorientierten Programmierung, die zu wartbarem, erweiterbarem und testbarem Code führen.

LLM Architektur

Speculative Decoding

Speculative Decoding

Eine Optimierungstechnik, bei der ein kleines Modell Tokens vorschlägt und ein großes Modell sie parallel verifiziert – für deutlich schnellere Inferenz.

Daten Architektur

SQL vs. NoSQL

SQL vs. NoSQL

Zwei grundlegend verschiedene Ansätze zur Datenspeicherung: relationale Datenbanken mit fester Struktur (SQL) versus flexible, schema-lose Datenbanken (NoSQL).

LLM Architektur

Test-Time Compute

Test-Time Compute (TTC) / Inference-Time Compute

Eine Strategie, bei der KI-Modelle zur Inferenzzeit mehr Rechenkapazität nutzen, um durch längeres Nachdenken, Selbstkorrektur oder mehrfache Versuche bessere Ergebnisse zu erzielen.

Sicherheit Architektur

Threat Modeling

Threat Modeling

Ein strukturierter Prozess zur Identifikation von Sicherheitsbedrohungen in Systemen – bevor Angreifer sie finden.

Architektur LLM

Transformer

Transformer

Eine revolutionäre neuronale Netzwerk-Architektur, die auf dem Attention-Mechanismus basiert und die Grundlage für moderne Sprachmodelle wie GPT und BERT bildet.

Architektur Grundlagen

VAE (Variational Autoencoder)

Variational Autoencoder

Eine generative Modellarchitektur, die Daten in einen latenten Raum komprimiert und daraus neue, ähnliche Daten generieren kann – Grundlage für viele generative KI-Systeme.

Architektur Bild-KI

Vision Transformer (ViT)

Vision Transformer (ViT)

Eine Transformer-Architektur für Computer Vision, die Bilder in Patches aufteilt und wie Tokens verarbeitet – ohne Convolutional Layers.

Praxis Architektur

WebSockets

WebSockets

Ein Kommunikationsprotokoll für bidirektionale Echtzeit-Verbindungen zwischen Client und Server – im Gegensatz zu HTTP bleibt die Verbindung dauerhaft offen.

Sicherheit Architektur

Zero Trust

Zero Trust Architecture

Ein Sicherheitsmodell, das keinem Nutzer, Gerät oder Netzwerk automatisch vertraut – jeder Zugriff wird einzeln verifiziert, unabhängig vom Standort.