Message Queue: Asynchrone Kommunikation zwischen Services

ERKLÄRUNG

Einfach erklärt

Eine Message Queue ist eine Warteschlange für Nachrichten zwischen Services. Der Sender legt eine Nachricht ab und macht weiter. Der Empfänger holt sie ab, wenn er bereit ist.

Warum ist das nützlich?

Ohne Queue (synchron):
User → API → LLM (30 Sekunden warten) → Response
= User wartet, Server blockiert

Mit Queue (asynchron):
User → API → "Job in Queue, ID: abc123" (sofort)
Worker → Queue → LLM → Ergebnis speichern
User → "Status von abc123?" → Ergebnis
= User kann weitermachen, System skaliert besser

Technischer Deep Dive

Architektur

Producer → [Message Queue] → Consumer
              ↓
         Persistenz
         (Nachrichten überleben Neustarts)

Python mit Redis Queue

from rq import Queue
from redis import Redis

redis_conn = Redis()
q = Queue(connection=redis_conn)

# Job in Queue legen
def process_llm_request(prompt):
    response = call_llm_api(prompt)
    save_result(response)
    return response

job = q.enqueue(process_llm_request, "Erkläre ML")
print(f"Job ID: {job.id}")

# Später: Status prüfen
if job.is_finished:
    result = job.result

Vergleich Message Broker

Broker	Stärke	Use Case
RabbitMQ	Flexibel, viele Patterns	Allgemein
Kafka	Hoher Durchsatz, Replay	Event Streaming
Redis	Einfach, schnell	Leichtgewichtig
SQS	Managed, skaliert	AWS-Umgebung

Delivery Guarantees

Garantie	Beschreibung
At-most-once	Nachricht kann verloren gehen
At-least-once	Nachricht kann doppelt ankommen
Exactly-once	Genau einmal (schwer zu erreichen)

ANALOGIE

Eine Message Queue ist wie ein Briefkasten: Der Absender wirft den Brief ein und geht weiter (asynchron). Der Empfänger holt ihn ab, wenn er Zeit hat. Beide müssen nicht gleichzeitig verfügbar sein.

WICHTIGSTE PUNKTE

Entkoppelt Sender und Empfänger zeitlich und räumlich

Puffert Lastspitzen und erhöht Systemresilienz

Ermöglicht asynchrone Verarbeitung von LLM-Anfragen

ANWENDUNGSFÄLLE

LLM-Batch-Processing

Viele Anfragen in Queue, Worker verarbeiten asynchron

Microservices

Lose Kopplung zwischen Services

Task Queues

Hintergrund-Jobs wie E-Mail-Versand, Bildverarbeitung

HÄUFIGE FRAGEN

Wann sollte ich eine Message Queue verwenden?

Bei asynchronen Aufgaben (E-Mail, Bildverarbeitung), zur Entkopplung von Services, bei Lastspitzen (Puffer), oder wenn Sender und Empfänger unterschiedlich schnell sind.

Was ist der Unterschied zwischen Queue und Pub/Sub?

Queue: Eine Nachricht wird von genau einem Consumer verarbeitet. Pub/Sub: Eine Nachricht geht an alle Subscriber. Kafka kann beides, RabbitMQ primär Queues.

Wie nutze ich Message Queues für LLM-Anwendungen?

Anfragen in Queue → Worker holt Anfrage → Ruft LLM-API auf → Ergebnis in Response-Queue oder Webhook. Ermöglicht Skalierung und Retry bei Fehlern.

TOOLS & RESSOURCEN

RabbitMQ

Populärer Open-Source Message Broker

Apache Kafka

Distributed Event Streaming Platform

Redis Streams

Leichtgewichtige Message Queue in Redis

AWS SQS

Managed Message Queue von AWS

VERWANDTE BEGRIFFE

Web DevOps

Microservices

Ein Architekturmuster, bei dem eine Anwendung aus vielen kleinen, unabhängigen Services besteht, die jeweils eine spezifische Aufgabe erfüllen.

Web DevOps

API (Application Programming Interface)

Eine definierte Schnittstelle, über die Softwaresysteme miteinander kommunizieren können – der Standard für die Integration von KI-Diensten in Anwendungen.

Web DevOps

Serverless

Ein Cloud-Computing-Modell, bei dem der Cloud-Anbieter die Server-Infrastruktur vollständig verwaltet – Entwickler deployen nur ihren Code, der bei Bedarf ausgeführt wird.

Web DevOps

Webhook

Ein Mechanismus, bei dem ein Server automatisch eine HTTP-Anfrage an eine vordefinierte URL sendet, wenn ein bestimmtes Ereignis eintritt – 'Don't call us, we'll call you'.

Architektur DevOps

Event-Driven Architecture

Ein Architekturmuster, bei dem Komponenten über Ereignisse (Events) kommunizieren statt über direkte Aufrufe – ideal für lose Kopplung, Skalierbarkeit und Echtzeit-Datenverarbeitung in KI-Systemen.