Architektur | EbeneX

Architektur DevOps

A/B Rollout

A/B Rollout / Gradual Rollout / Percentage Rollout

Eine Deployment-Strategie, bei der neue Features schrittweise an Nutzergruppen ausgerollt werden – kombiniert A/B-Testing mit kontrolliertem Release.

Fortgeschritten Mehr erfahren →

Grundlagen Architektur

Aktivierungsfunktion

Activation Function

Mathematische Funktionen in neuronalen Netzen, die Nicht-Linearität einführen – ohne sie könnte ein Netz nur lineare Zusammenhänge lernen, egal wie viele Layers es hat.

Fortgeschritten Mehr erfahren →

Architektur Grundlagen

Attention Mechanism

Der Kernmechanismus moderner KI-Modelle – ermöglicht es einem Modell, sich auf die relevantesten Teile der Eingabe zu konzentrieren, statt alles gleich zu gewichten.

Experte Mehr erfahren →

Architektur DevOps

Autoscaling

Autoscaling / Auto Scaling

Die automatische Anpassung von Compute-Ressourcen basierend auf Last – mehr Server bei hoher Nachfrage, weniger bei niedriger. Kosteneffizient und performant.

Fortgeschritten Mehr erfahren →

Architektur Grundlagen

Batch Normalization

Eine Technik, die die Eingaben jeder Schicht normalisiert – stabilisiert das Training, ermöglicht höhere Lernraten und beschleunigt die Konvergenz deutlich.

Experte Mehr erfahren →

LLM Architektur

Beam Search

Ein Decoding-Algorithmus für LLMs, der mehrere Kandidaten-Sequenzen parallel verfolgt und die wahrscheinlichste Gesamtsequenz auswählt – besser als Greedy, aber rechenintensiver.

Experte Mehr erfahren →

Architektur DevOps

Blue-Green Deployment

Eine Deployment-Strategie mit zwei identischen Produktionsumgebungen – schneller Wechsel zwischen Versionen ohne Downtime und einfaches Rollback.

Fortgeschritten Mehr erfahren →

Praxis Architektur

Clean Code

Prinzipien und Praktiken für lesbaren, wartbaren und verständlichen Quellcode – Code, der sich wie gut geschriebene Prosa liest.

Einsteiger Mehr erfahren →

Architektur Bild-KI

CLIP

CLIP (Contrastive Language-Image Pretraining)

Ein multimodales Modell von OpenAI, das Text und Bilder in einen gemeinsamen Vektorraum einbettet – die Grundlage für Bild-Suche, DALL-E und viele Vision-Language-Modelle.

Experte Mehr erfahren →

Architektur Grundlagen

CNN (Convolutional Neural Network)

Convolutional Neural Network

Eine neuronale Netzwerk-Architektur, die speziell für die Verarbeitung von Bildern und räumlichen Daten entwickelt wurde und lokale Muster durch Filter erkennt.

Fortgeschritten Mehr erfahren →

Architektur DevOps

Cold Start

Die Verzögerung beim ersten Aufruf einer Serverless-Funktion oder eines skalierten Services – wenn Container oder VMs erst gestartet werden müssen.

Fortgeschritten Mehr erfahren →

Grundlagen Architektur

Continual Learning

Continual Learning / Lifelong Learning

Ein Paradigma, bei dem ML-Modelle kontinuierlich aus neuen Daten lernen, ohne das zuvor Gelernte zu vergessen – eine der größten Herausforderungen in der KI.

Experte Mehr erfahren →

Architektur Architektur

CQRS

Command Query Responsibility Segregation

Ein Architektur-Pattern, das Lese- und Schreiboperationen trennt – unterschiedliche Modelle für Commands (Änderungen) und Queries (Abfragen).

Experte Mehr erfahren →

Grundlagen Architektur

Cross-Entropy

Cross-Entropy Loss

Eine Loss Function, die misst, wie gut eine vorhergesagte Wahrscheinlichkeitsverteilung mit der tatsächlichen Verteilung übereinstimmt – Standard für Klassifikation und LLMs.

Fortgeschritten Mehr erfahren →

Architektur Praxis

Design Patterns

Bewährte Lösungsschablonen für wiederkehrende Probleme in der Softwareentwicklung – von Singleton über Observer bis Factory.

Fortgeschritten Mehr erfahren →

Bild-KI Architektur

Diffusionsmodell

Diffusion Model

Eine generative KI-Architektur, die Bilder erzeugt, indem sie schrittweise Rauschen entfernt – die Technologie hinter Stable Diffusion, DALL-E und Midjourney.

Experte Mehr erfahren →

Grundlagen Architektur

Entropy

Ein Maß für Unsicherheit oder Informationsgehalt einer Wahrscheinlichkeitsverteilung – fundamental für Informationstheorie, Entscheidungsbäume und Sprachmodelle.

Fortgeschritten Mehr erfahren →

Architektur Architektur

Event Sourcing

Ein Architektur-Pattern, bei dem der Zustand einer Anwendung nicht direkt gespeichert wird, sondern aus einer Sequenz von Events rekonstruiert wird.

Experte Mehr erfahren →

Architektur DevOps

Event-Driven Architecture

Ein Architekturmuster, bei dem Komponenten über Ereignisse (Events) kommunizieren statt über direkte Aufrufe – ideal für lose Kopplung, Skalierbarkeit und Echtzeit-Datenverarbeitung in KI-Systemen.

Fortgeschritten Mehr erfahren →

Bild-KI Architektur

GAN (Generative Adversarial Network)

Generative Adversarial Network

Eine generative KI-Architektur, bei der zwei neuronale Netze gegeneinander antreten – ein Generator erzeugt Daten, ein Discriminator bewertet sie.

Experte Mehr erfahren →

LLM Architektur

Greedy Decoding

Die einfachste Decoding-Strategie für LLMs – wählt bei jedem Schritt das wahrscheinlichste Token. Schnell und deterministisch, aber oft nicht optimal.

Fortgeschritten Mehr erfahren →

DevOps Architektur

Groq

Ein KI-Hardwareunternehmen, das mit seiner Language Processing Unit (LPU) extrem schnelle LLM-Inferenz ermöglicht – bis zu 10× schneller als GPU-basierte Lösungen bei niedrigeren Kosten.

Experte Mehr erfahren →

Architektur Architektur

gRPC

gRPC (gRPC Remote Procedure Calls)

Ein modernes RPC-Framework von Google für effiziente Service-zu-Service-Kommunikation – schneller als REST, mit starker Typisierung und Streaming-Support.

Experte Mehr erfahren →

Bild-KI Architektur

Image Segmentation

Eine Computer-Vision-Aufgabe, bei der jeder Pixel eines Bildes einer Klasse oder Instanz zugeordnet wird – präziser als Object Detection und Grundlage für medizinische Bildgebung, autonomes Fahren und Bildbearbeitung.

Experte Mehr erfahren →

Architektur Praxis

Inference Optimization

Techniken, die die Ausführung von KI-Modellen schneller und günstiger machen – von KV-Cache über Batching bis Speculative Decoding.

Experte Mehr erfahren →

Architektur Sicherheit

JWT (JSON Web Token)

JSON Web Token (JWT)

Ein kompakter, URL-sicherer Token-Standard für die sichere Übertragung von Informationen zwischen Parteien – der De-facto-Standard für API-Authentifizierung.

Fortgeschritten Mehr erfahren →

Praxis Architektur

KI-Orchestrierung

AI Orchestration

Das Koordinieren mehrerer KI-Komponenten – Modelle, Tools, Datenquellen und Agenten – zu einem zusammenhängenden Workflow, der automatisch die richtigen Schritte in der richtigen Reihenfolge ausführt.

Fortgeschritten Mehr erfahren →

Architektur Grundlagen

Knowledge Distillation

Eine Technik, bei der ein kleines 'Student'-Modell lernt, das Verhalten eines großen 'Teacher'-Modells zu imitieren – für effizientere Modelle mit ähnlicher Qualität.

Experte Mehr erfahren →

Architektur LLM

KV-Cache

KV-Cache (Key-Value Cache)

Ein Optimierungsmechanismus für Transformer-Modelle, der die Key-Value-Paare aus dem Attention-Mechanismus zwischenspeichert, um wiederholte Berechnungen zu vermeiden.

Experte Mehr erfahren →

Architektur Praxis

Latency vs. Throughput

Die zwei fundamentalen Performance-Metriken – Latenz misst wie schnell, Throughput misst wie viel. Oft ein Trade-off, beide wichtig für verschiedene Use Cases.

Fortgeschritten Mehr erfahren →

Bild-KI Architektur

Latent Diffusion

Latent Diffusion Model (LDM)

Eine Variante von Diffusionsmodellen, die im komprimierten latenten Raum arbeitet statt auf Pixel-Ebene – die Grundlage von Stable Diffusion und deutlich effizienter.

Experte Mehr erfahren →

Grundlagen Architektur

Latent Space

Ein komprimierter, gelernter Repräsentationsraum, in dem ein Modell die wesentlichen Merkmale von Daten kodiert – die 'innere Vorstellung' eines neuronalen Netzes.

Experte Mehr erfahren →

Architektur Grundlagen

LSTM (Long Short-Term Memory)

Long Short-Term Memory

Eine erweiterte RNN-Architektur mit speziellen Gate-Mechanismen, die Langzeitabhängigkeiten in Sequenzen besser erfassen kann als einfache RNNs.

Experte Mehr erfahren →

Architektur LLM

Mixture of Experts (MoE)

Mixture of Experts

Eine Modellarchitektur, bei der nur ein Teil der Parameter pro Eingabe aktiviert wird – ermöglicht riesige Modelle bei moderatem Rechenaufwand.

Experte Mehr erfahren →

Architektur LLM Praxis

Model Context Protocol (MCP)

Model Context Protocol

Ein offenes Protokoll von Anthropic, das KI-Modellen standardisierten Zugriff auf externe Datenquellen, Tools und Systeme ermöglicht – wie ein universeller USB-C-Anschluss für KI-Anwendungen.

Fortgeschritten Mehr erfahren →

DevOps Architektur

Model Versioning

Die systematische Verwaltung verschiedener Versionen von ML-Modellen – inklusive Gewichte, Hyperparameter, Trainingsdaten und Metriken für Reproduzierbarkeit.

Fortgeschritten Mehr erfahren →

Architektur Architektur

Monolith

Monolithic Architecture

Eine Software-Architektur, bei der alle Komponenten einer Anwendung in einer einzigen, zusammenhängenden Codebasis entwickelt und deployed werden.

Einsteiger Mehr erfahren →

LLM Architektur

Multi-Agent Systems

Multi-Agent Systems (MAS)

Architekturen, in denen mehrere spezialisierte KI-Agenten zusammenarbeiten, um komplexe Aufgaben zu lösen – jeder Agent hat eine Rolle und kommuniziert mit anderen.

Experte Mehr erfahren →

LLM Architektur

Multimodale KI

Multimodal AI

KI-Systeme, die mehrere Datentypen gleichzeitig verarbeiten – Text, Bilder, Audio, Video – und so ein ganzheitlicheres Verständnis der Welt entwickeln als reine Sprachmodelle.

Fortgeschritten Mehr erfahren →

Grundlagen Architektur

Neural Network Layers

Die Bausteine neuronaler Netze – Input Layer empfängt Daten, Hidden Layers verarbeiten sie, Output Layer liefert das Ergebnis. Mehr Layers = tieferes Netz = Deep Learning.

Einsteiger Mehr erfahren →

LLM Architektur

Nucleus Sampling (Top-p Sampling)

Nucleus Sampling / Top-p Sampling

Eine Sampling-Strategie für LLMs, die nur die wahrscheinlichsten Tokens berücksichtigt, deren kumulative Wahrscheinlichkeit einen Schwellenwert p erreicht – die Grundlage für natürliche, diverse Textgenerierung.

Experte Mehr erfahren →

Bild-KI Architektur

Object Detection

Eine Computer-Vision-Aufgabe, bei der KI-Modelle Objekte in Bildern oder Videos erkennen und mit Bounding Boxes lokalisieren – Grundlage für autonomes Fahren, Videoüberwachung und Robotik.

Fortgeschritten Mehr erfahren →

Praxis Architektur

ONNX

Open Neural Network Exchange

Ein offenes Format für ML-Modelle, das Portabilität zwischen Frameworks ermöglicht – ein Modell in PyTorch trainieren und in TensorFlow oder auf Edge-Geräten ausführen.

Fortgeschritten Mehr erfahren →

Architektur Architektur

OpenAPI / Swagger

OpenAPI Specification (OAS) / Swagger

Ein Standard zur Beschreibung von REST-APIs – ermöglicht automatische Dokumentation, Code-Generierung und API-Testing.

Fortgeschritten Mehr erfahren →

Sicherheit Architektur

OWASP

Open Web Application Security Project

Die Open Web Application Security Project Foundation – definiert die wichtigsten Web-Sicherheitsrisiken und Best Practices für sichere Entwicklung.

Fortgeschritten Mehr erfahren →

Architektur Grundlagen

Positional Encoding

Positional Encoding / Positional Embedding

Eine Technik, die Transformern die Position von Tokens in einer Sequenz mitteilt – notwendig, weil Attention allein keine Reihenfolge kennt.

Experte Mehr erfahren →

Architektur DevOps

Pruning

Eine Optimierungstechnik, bei der unwichtige Gewichte oder Neuronen aus einem trainierten Modell entfernt werden – für kleinere, schnellere Modelle mit minimaler Qualitätseinbuße.

Experte Mehr erfahren →

Sicherheit Architektur

RBAC und ABAC

Role-Based / Attribute-Based Access Control

Zwei Modelle für Zugriffssteuerung – RBAC basiert auf Rollen, ABAC auf Attributen. Grundlage für sichere Autorisierung.

Fortgeschritten Mehr erfahren →

LLM Architektur

Reasoning-Modelle

Reasoning Models

Eine neue Klasse von KI-Modellen, die komplexe Probleme durch explizites mehrstufiges Denken lösen – GPT-5 Thinking, Claude Opus 4.6 und DeepSeek R1 sind prominente Beispiele.

Fortgeschritten Mehr erfahren →

Architektur Architektur

Redis

Redis (Remote Dictionary Server)

Eine extrem schnelle In-Memory-Datenbank, die als Cache, Message Broker und Session Store eingesetzt wird – unverzichtbar für performante Anwendungen.

Fortgeschritten Mehr erfahren →

Architektur Architektur

Reverse Proxy

Ein Server, der vor deinen Backend-Servern sitzt und Anfragen entgegennimmt, verteilt und absichert – für Load Balancing, SSL, Caching und Security.

Fortgeschritten Mehr erfahren →

Architektur Grundlagen

RNN (Recurrent Neural Network)

Recurrent Neural Network

Eine neuronale Netzwerk-Architektur mit internem Gedächtnis, die sequenzielle Daten wie Text oder Zeitreihen verarbeiten kann – weitgehend durch Transformer ersetzt.

Fortgeschritten Mehr erfahren →

Architektur DevOps

Shadow Deployment

Shadow Deployment / Shadow Mode / Dark Launch

Eine Deployment-Strategie, bei der eine neue Version parallel zur Produktion läuft und echten Traffic erhält, aber keine Antworten an Nutzer sendet – für risikofreies Testen.

Fortgeschritten Mehr erfahren →

Architektur DevOps

SLA, SLO, SLI

Service Level Agreement / Objective / Indicator

Die drei Säulen der Service-Zuverlässigkeit – SLI misst, SLO definiert Ziele, SLA ist der Vertrag. Grundlage für Reliability Engineering.

Fortgeschritten Mehr erfahren →

Grundlagen Architektur

Softmax

Softmax Function

Eine mathematische Funktion, die einen Vektor von Zahlen in eine Wahrscheinlichkeitsverteilung umwandelt – zentral für Klassifikation und Attention in neuronalen Netzen.

Fortgeschritten Mehr erfahren →

Architektur Praxis

SOLID-Prinzipien

SOLID Principles

Fünf fundamentale Designprinzipien der objektorientierten Programmierung, die zu wartbarem, erweiterbarem und testbarem Code führen.

Fortgeschritten Mehr erfahren →

LLM Architektur

Speculative Decoding

Eine Optimierungstechnik, bei der ein kleines Modell Tokens vorschlägt und ein großes Modell sie parallel verifiziert – für deutlich schnellere Inferenz.

Experte Mehr erfahren →

Daten Architektur

SQL vs. NoSQL

Zwei grundlegend verschiedene Ansätze zur Datenspeicherung: relationale Datenbanken mit fester Struktur (SQL) versus flexible, schema-lose Datenbanken (NoSQL).

Einsteiger Mehr erfahren →

LLM Architektur

Test-Time Compute

Test-Time Compute (TTC) / Inference-Time Compute

Eine Strategie, bei der KI-Modelle zur Inferenzzeit mehr Rechenkapazität nutzen, um durch längeres Nachdenken, Selbstkorrektur oder mehrfache Versuche bessere Ergebnisse zu erzielen.

Experte Mehr erfahren →

Sicherheit Architektur

Threat Modeling

Ein strukturierter Prozess zur Identifikation von Sicherheitsbedrohungen in Systemen – bevor Angreifer sie finden.

Fortgeschritten Mehr erfahren →

Architektur LLM

Transformer

Eine revolutionäre neuronale Netzwerk-Architektur, die auf dem Attention-Mechanismus basiert und die Grundlage für moderne Sprachmodelle wie GPT und BERT bildet.

Experte Mehr erfahren →

Architektur Grundlagen

VAE (Variational Autoencoder)

Variational Autoencoder

Eine generative Modellarchitektur, die Daten in einen latenten Raum komprimiert und daraus neue, ähnliche Daten generieren kann – Grundlage für viele generative KI-Systeme.

Experte Mehr erfahren →

Architektur Bild-KI

Vision Transformer (ViT)

Eine Transformer-Architektur für Computer Vision, die Bilder in Patches aufteilt und wie Tokens verarbeitet – ohne Convolutional Layers.

Experte Mehr erfahren →

Praxis Architektur

WebSockets

Ein Kommunikationsprotokoll für bidirektionale Echtzeit-Verbindungen zwischen Client und Server – im Gegensatz zu HTTP bleibt die Verbindung dauerhaft offen.

Fortgeschritten Mehr erfahren →

Sicherheit Architektur

Zero Trust

Zero Trust Architecture

Ein Sicherheitsmodell, das keinem Nutzer, Gerät oder Netzwerk automatisch vertraut – jeder Zugriff wird einzeln verifiziert, unabhängig vom Standort.

Fortgeschritten Mehr erfahren →