AWS Lambda Managed Instances mit Terraform: Skalierbare Hochleistungs-Workloads

Lambda Managed Instances (LMI) erweitern die Möglichkeiten von AWS Lambda deutlich – besonders für Workloads, die hohe Rechenleistung, große Speicherkapazitäten oder konfigurierbare vCPU-Memory-Relationen erfordern. Während herkömmliche Lambda-Funktionen einzelne Anfragen sequenziell verarbeiten, können LMI mehrere gleichzeitige Aufrufe pro Ausführungsumgebung abdecken. Diese Innovation, auf der AWS re:Invent 2025 vorgestellt und im März 2026 mit Unterstützung für bis zu 32 GB RAM und 16 vCPUs erweitert, kombiniert die Einfachheit des Lambda-Programmiermodells mit der Flexibilität von EC2-Instanz-Typen.

Die Technologie eignet sich besonders für Anwendungen mit nachhaltigem Durchsatz wie etwa maschinelle Lernmodelle, Vektorähnlichkeitsberechnungen oder datenintensive Batch-Prozesse. Ein praktisches Beispiel ist eine Produktähnlichkeits-Engine, die mit Nova Embeddings aus Amazon Bedrock arbeitet. Die Lambda-Funktion lädt einen Produktkatalog in den Arbeitsspeicher, verarbeitet Suchanfragen durch Multimodale Embeddings und berechnet die Kosinus-Ähnlichkeit parallel über mehrere Threads. Diese Architektur nutzt die Ressourcen effizienter als Standard-Lambda, da sie sowohl CPU-intensive Berechnungen als auch API-Aufrufe zu Bedrock gleichzeitig bewältigen kann.

Die Implementierung erfolgt mit Terraform für die Infrastruktur, Python 3.14 inklusive AWS Lambda Powertools für Observability und unterstützt wahlweise das Nova- oder Titan-Text-Embeddings-Modell. Die vollständige Codebasis ist auf GitHub verfügbar.

AWS-Rechenkontinuum: Wo Lambda Managed Instances optimal passt

AWS bietet ein breites Spektrum an Compute-Optionen, das von vollständig verwalteten bis hin zu selbstverwalteten Lösungen reicht. Lambda Managed Instances positioniert sich zwischen Standard-Lambda und Container-Services wie ECS oder EKS. Die folgende Tabelle vergleicht die wichtigsten Merkmale:

| Kriterium | Standard Lambda | Lambda Managed Instances | ECS Express Mode | ECS Fargate | EKS | |-----------------------------|-------------------------------------|-----------------------------------|----------------------------------|---------------------------------|----------------------------------| | Skalierung | Pro Anfrage, sofort | CPU-basiert, asynchron | Traffic-basiert, automatisch | Task-basiert, Minuten | Pod-basiert, Minuten | | Gleichzeitige Verarbeitung | 1 pro Umgebung | Mehrere pro Umgebung | Konfigurierbar | Konfigurierbar | Konfigurierbar | | Preismodell | Pro Anfrage + GB-Sekunde | Pro Anfrage + EC2 + 15 % Gebühr | Fargate + ALB | Fargate + ALB | EC2/Fargate + Steuerungsebene | | Rabattoptionen | Keine | Savings Plans, Reservierte Instanzen | Fargate Savings Plans | Fargate Savings Plans | EC2 Savings, Reservierte Instanzen | | Cold Start | Millisekunden bis Sekunden | Zehn Sekunden (neue Instanzen) | Minuten | Minuten | Minuten | | Maximale Laufzeit | 15 Minuten | 15 Minuten (langlebige Instanzen) | Keine Grenze | Keine Grenze | Keine Grenze | | VPC-Anforderung | Optional | Erforderlich | Erforderlich | Erforderlich | Erforderlich | | Arbeitsspeicher | Bis zu 10 GB | Bis zu 32 GB (anpassbare vCPU-Ratio) | Konfigurierbar | Konfigurierbar | Konfigurierbar | | Betriebsaufwand | Null | Gering | Gering | Mittel | Hoch |

Ideale Einsatzszenarien für Lambda Managed Instances:

Hoher, vorhersehbarer Durchsatz: Hunderte oder tausende Anfragen pro Sekunde, die über längere Zeiträume stabil bleiben.
Spezifische Hardware-Anforderungen: Nutzung von EC2-Instanz-Typen wie Graviton4 oder Instanzen mit hoher Netzwerkbandbreite.
Speicherintensive Workloads: Funktionen, die mehr als 10 GB RAM benötigen oder eine fein abgestimmte vCPU-RAM-Konfiguration erfordern.
Kostenoptimierung bei Skalierung: Ab etwa 10 Millionen Anfragen pro Monat können Savings Plans die Kosten im Vergleich zum Standard-Lambda-Preismodell deutlich senken.
Datenlastige Anwendungen: Funktionen, die große Datensätze wie Embeddings oder Referenzdaten in den Arbeitsspeicher laden und über mehrere Anfragen hinweg wiederverwenden.

Standard-Lambda bleibt jedoch die bessere Wahl für:

Unvorhersehbare Lastspitzen: Funktionen mit stark schwankendem Traffic, bei denen sofortige Skalierung entscheidend ist.
Geringe bis moderate Durchsatzanforderungen: Hier punktet das preisgünstige Pro-Anfrage-Modell von Standard-Lambda.
Sofortige Skalierung: Lambda Managed Instances skaliert zwar, jedoch mit einer Verzögerung von bis zu fünf Minuten bei extremen Lastsprüngen. Bei Verdopplung der Anfragen in diesem Zeitraum kann es zu vorübergehenden Drosselungen kommen.

Für detaillierte Analysen anderer AWS-Containeroptionen empfehle ich meine früheren Artikel zu ECS Express Mode und Fargate, die Einsatzmöglichkeiten mit Lambda und Step Functions sowie Best Practices für AWS Lambda Powertools.

Architektur: Schichtenweise Trennung für Stabilität und Sicherheit

Die Architektur von Lambda Managed Instances besteht aus drei klar getrennten Schichten, die jeweils spezifische Verantwortlichkeiten übernehmen. Diese Modularität verbessert nicht nur die Skalierbarkeit, sondern auch die Sicherheit und Wartbarkeit des Systems.

Kapazitätsprovider: Die Grundlage für Leistung und Isolation

Der Capacity Provider definiert die grundlegenden Parameter der Infrastruktur, darunter:

VPC-Konfiguration und Netzwerksegmentierung
Anforderungen an Instanz-Typen und Architektur (z. B. ARM64 für Graviton-Prozessoren)
Skalierungsrichtlinien und Sicherheitsgrenzen

Ein zentraler Aspekt ist die Isolation zwischen Workloads. Alle Funktionen, die demselben Capacity Provider zugeordnet sind, teilen sich EC2-Instanzen und müssen vertrauenswürdig sein. Eine kompromittierte Funktion könnte daher Auswirkungen auf andere Funktionen innerhalb desselben Providers haben. Aus diesem Grund empfiehlt es sich, unterschiedliche Workloads – etwa regulierte Produktionsumgebungen, unvertrauenswürdige Testumgebungen und sensible Datenverarbeitungen – in separaten Capacity Providern zu hosten. Die Instanzen werden automatisch alle 14 Tage rotiert, um Compliance-Anforderungen zu erfüllen und Sicherheitsrisiken zu minimieren.

Verwaltete Instanzen: EC2-Ressourcen im Lambda-Management

Die Managed Instances sind EC2-Instanzen, die von AWS Lambda in Ihrem VPC bereitgestellt und verwaltet werden. Diese Instanzen erscheinen zwar im EC2-Dashboard (mit entsprechenden Lambda-Tags), erfordern jedoch keine manuelle Konfiguration von Auto-Scaling-Gruppen, Patching oder SSH-Zugriff. AWS übernimmt die gesamte Lebenszyklusverwaltung, einschließlich der regelmäßigen Rotation der Instanzen.

Ausführungsumgebungen: Containerisierte Funktionen mit Multi-Request-Fähigkeit

Jede Execution Environment hostet einen Container mit der Lambda-Funktionslogik. Im Gegensatz zu Standard-Lambda, wo jede Anfrage eine separate Umgebung startet, können LMI-Umgebungen mehrere gleichzeitige Aufrufe verarbeiten. Bei Python erfolgt dies durch separate Prozesse mit eigenem Speicherraum für jeden Concurrency-Slot. Dies ermöglicht eine effizientere Ressourcennutzung, insbesondere bei CPU-lastigen oder speicherintensiven Aufgaben.

Netzwerkanforderungen: VPC als unverzichtbarer Baustein

Eine korrekte VPC-Konfiguration ist essenziell für den Betrieb von Lambda Managed Instances. Ohne ausreichende Netzwerkanbindung – etwa durch private Subnetze mit NAT-Gateway – können Telemetriedaten verloren gehen, obwohl die Funktionen selbst ausgeführt werden. In diesem Projekt wurde eine bewährte Konfiguration mit privaten Subnetzen und dediziertem NAT-Gateway für die Übertragung von Logs und Traces implementiert.

Fazit: Lambda Managed Instances als Brücke zwischen Serverless und EC2

Lambda Managed Instances schließen eine wichtige Lücke im AWS-Ökosystem, indem sie die Einfachheit und Skalierbarkeit von Lambda mit der Leistung und Flexibilität von EC2 verbinden. Besonders für rechenintensive, speicherlastige oder datengetriebene Anwendungen bietet diese Technologie erhebliche Vorteile – sowohl in puncto Performance als auch bei den Betriebskosten.

Die Integration mit Terraform vereinfacht die Bereitstellung und Verwaltung der Infrastruktur, während native AWS-Mechanismen wie Savings Plans und automatische Patch-Verwaltung den administrativen Aufwand auf ein Minimum reduzieren. Mit der kontinuierlichen Erweiterung der unterstützten Hardware-Optionen, etwa durch Graviton4-Prozessoren oder Instanzen mit hoher Speicherkapazität, wird Lambda Managed Instances zu einer noch attraktiveren Wahl für anspruchsvolle Workloads. Unternehmen, die nach einer Lösung suchen, um die Grenzen von Standard-Lambda zu überwinden, sollten diese Technologie auf ihre Eignung für die eigenen Anwendungsfälle prüfen.

KI-Zusammenfassung

Explore how Lambda Managed Instances combines serverless simplicity with EC2 performance for multi-concurrent, memory-intensive workloads up to 32GB/16vCPU.

AWS Lambda Managed Instances mit Terraform: Skalierbare Hochleistungs-Workloads

AWS-Rechenkontinuum: Wo Lambda Managed Instances optimal passt

Architektur: Schichtenweise Trennung für Stabilität und Sicherheit

Kapazitätsprovider: Die Grundlage für Leistung und Isolation

Verwaltete Instanzen: EC2-Ressourcen im Lambda-Management

Ausführungsumgebungen: Containerisierte Funktionen mit Multi-Request-Fähigkeit

Netzwerkanforderungen: VPC als unverzichtbarer Baustein

Fazit: Lambda Managed Instances als Brücke zwischen Serverless und EC2

Kommentare

Warum Unternehmen keine Infrastruktur bauen sollten – ein Blick auf moderne Softwarearchitektur

Python-Tool zum YouTube-Download: PyFlowDownloader in Version 0.3.0

HeliosProxy: Die nächste Generation der PostgreSQL-Datenebene