LAMBDA LABS · TECH

Lambda Labs: dedizierte GPU-Cloud USA, A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h

Lambda Labs ist eine US-GPU-Cloud mit ML-Engineer-Fokus. A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h, Reserved-Verträge mit 1-Year/3-Year-Rabatten.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Was ist Lambda Labs?

Lambda Labs (offiziell Lambda, Inc.) ist eine US-amerikanische GPU-Cloud-Plattform mit Sitz in San Francisco, gegründet 2012 ursprünglich als GPU-Workstation-Hersteller. Stand Mai 2026 betreibt Lambda Labs dedizierte GPU-Rechenzentren in den USA (mehrere Standorte an der Westküste und im mittleren Westen) und ist einer der etablierten Anbieter im ML-Engineer-Markt. Im Gegensatz zu Vast.ai (Auction-Marktplatz) oder RunPod (Mix aus Secure und Community Cloud) betreibt Lambda Labs ausschliesslich eigene Hardware in eigenen Rechenzentren.

Das Produkt-Portfolio ist auf ML-Workloads zugeschnitten. On-Demand GPU Cloud mit Stunden-Abrechnung. Reserved Cloud mit 1-Jahres- oder 3-Jahres-Verträgen und deutlichen Rabatten (typisch 30-50% Reduktion gegenüber On-Demand). Lambda Stack als praeinstallierte ML-Umgebung (CUDA, cuDNN, PyTorch, TensorFlow, JAX, alle in passenden Versionen). Lambda Workstations (physische Hardware für das eigene Büro) als Hardware-Verkauf. Und seit 2023 Lambda Inference als Serverless-API für Open-Weight-Modelle.

Das Inventar Mai 2026: NVIDIA A10 (24 GB) ab USD 0.60/h, A100-40GB ab USD 1.10/h, A100-80GB SXM ab USD 1.79/h, H100-80GB PCIe ab USD 2.49/h, H100-80GB SXM ab USD 2.99/h, H200-141GB ab USD 3.99/h, B200 (Blackwell) ab USD 4.49-6.99/h je nach Konfiguration. Multi-GPU-Instances bis 8x H100 SXM in einem Knoten mit voller InfiniBand-Topologie sind verfügbar. Reserved-Verträge für 8x H100 SXM über 1 Jahr ab ca. USD 18.000-23.000/Monat, über 3 Jahre noch günstiger.

Die Plattform ist auf ML-Engineering-Workflows ausgelegt. Vorgefertigte Cluster mit pretrained Modellen, NVIDIA-Stack vorinstalliert, Slurm-Scheduler-Optionen für Multi-Node-Training, Jupyter-Notebooks per Web-UI startbar, SSH-Zugang Standard. CLI mit `lambda-cli`, Python-SDK, REST-API. Custom Image Support für eigene Docker- oder Container-Konfigurationen.

Warum es wichtig ist

Drei Punkte machen Lambda Labs für den ML-Engineer-Markt zur Standardwahl: ML-fokussierte Plattform-Reife, klare Reserved-Verträge für Dauer-Workloads, und grössere Multi-GPU-Cluster mit voller InfiniBand-Topologie.

ML-Engineer-Reife: die Plattform ist seit über 10 Jahren im ML-Markt etabliert. Lambda Stack als praeinstallierte Umgebung löst die häufigste Pain-Point in ML-Setups: kompatible Versions-Kombinationen von CUDA, cuDNN und Framework. Wer einen Pod startet, hat sofort eine arbeitsfähige Umgebung – keine 4-Stunden-Tortur mit Versions-Konflikten. Das ist im ML-Alltag ein bedeutender Produktivitätsvorteil.

Reserved-Verträge für Dauer-Workloads: wer ein produktives Inferenz-Setup mit 24/7-Last betreibt, profitiert von Lambda Reserved Cloud massiv. 1-Year-Reserved-A100-80GB ab USD 1.39/h (gegenüber USD 1.79/h on-demand), 3-Year-Reserved ab USD 1.05/h. Beispielrechnung: 8x A100-80GB über 12 Monate on-demand: USD 1.79 × 8 × 720 × 12 = USD 123.500. Mit 1-Year-Reserved: USD 95.800 – Ersparnis 22%. Mit 3-Year-Reserved: USD 72.500 – Ersparnis 41% gegenüber on-demand-12-Monate.

Multi-GPU-Cluster: Lambda Labs bietet Mai 2026 echte 8x-H100-SXM-Knoten mit voller InfiniBand-Topologie, was für Multi-Node-Training (32+ GPUs) zentral ist. CoreWeave ist hier der direkte Konkurrent, Lambda Labs preislich oft leicht günstiger pro Stunde, mit klarem Reserved-Pfad. Für ein Training-Set mit 70B-Parameter-Modell ist Lambda Labs eine der wirtschaftlich attraktivsten Optionen.

Lambda Inference: seit 2023 betreibt Lambda Labs eine Serverless-Inference-API für Open-Weight-Modelle (Llama 3.3 70B, Llama 3.3 405B, Qwen, DeepSeek). Pay-per-Token, OpenAI-Schema-kompatibel, mit hoher Durchsatz-Garantie. Diese Variante konkurriert mit Together AI und Fireworks AI, mit Vorteilen bei kostengöttlichen Tarifen für einige Modelle.

Regulatorische Position: Lambda Labs ist eine US-Delaware-Corporation, unterliegt US-Recht und dem CLOUD Act. Eine US-Subpoena kann Lambda Labs direkt zur Datenherausgabe zwingen. Mai 2026 hat Lambda Labs keine EU- oder CH-Region. Für Workloads mit CH- oder EU-Datenresidenz-Anforderung ist Lambda Labs nicht direkt einsetzbar. Für Trainings-Daten ohne Personen-Bezug (Open-Weight-Modell-Finetune auf öffentlichen Daten) ist die Konstellation pragmatisch, aber die TIA bleibt aufwendig wegen US-Standort.

Wie es funktioniert

Bestellung: über das Portal lambdalabs.com. Konto-Anlage per E-Mail-Verifizierung mit Firmenangaben, Bezahlung per Kreditkarte oder Banktransfer (USD), Prepaid-Modell oder Reserved-Vertrag. Instance-Provisionierung typisch in 1-3 Minuten für On-Demand-Pods, sofort für Reserved-Cluster.

Beispiel-Preise Mai 2026 (On-Demand): NVIDIA A10 24GB: USD 0.60/h. A100-40GB: USD 1.10/h. A100-80GB SXM: USD 1.79/h. 8x A100-80GB SXM Cluster: USD 14.32/h. H100-80GB PCIe: USD 2.49/h. H100-80GB SXM: USD 2.99/h. 8x H100-80GB SXM Cluster: USD 23.92/h. H200-141GB: USD 3.99/h. B200: USD 4.49-6.99/h.

Reserved-Preise (1-Year): A100-80GB SXM ab USD 1.39/h, H100-80GB SXM ab USD 2.49/h. Reserved (3-Year): A100-80GB SXM ab USD 1.05/h, H100-80GB SXM ab USD 1.89/h. Multi-GPU-Cluster mit Rabatt bei grösseren Bestellungen.

Lambda Inference: Llama 3.3 70B Instruct ab USD 0.20/Million Input-Tokens, USD 0.30/Million Output-Tokens. Llama 3.3 405B Instruct ab USD 0.80/Million Input, USD 0.80/Million Output. Qwen 2.5 72B ähnlich. DeepSeek-V3 ab USD 0.25/Million Input, USD 0.40/Million Output. OpenAI-Schema-kompatibel, einfacher Endpoint-Swap möglich.

Netzwerk: jeder Pod hat eine öffentliche IPv4 und IPv6. SSH-Zugriff per Public Key. Private Netze zwischen Pods im gleichen Konto verfügbar. InfiniBand-Topologie auf Multi-GPU-Knoten mit voller Bandbreite zwischen den GPUs.

Storage: lokales NVMe SSD am Pod für schnelle I/O, plus persistente Volumes (File-Storage) die über Pod-Restarts erhalten bleiben. Für grosse Datasets ist S3-kompatibles Object Storage typisch über AWS S3 oder Cloudflare R2 angebunden, da Lambda Labs Mai 2026 keinen eigenen S3-Service hat.

Vertragsdetails: On-Demand Pay-as-you-go. Reserved-Verträge mit 1-Year oder 3-Year Mindestlaufzeit. AVV nach DSGVO Art. 28 ist auf Anfrage für EU-/CH-Kunden verfügbar, aber wegen US-Standort und CLOUD-Act-Anwendbarkeit nicht vollständig DSGVO-konform ohne zusätzliche Massnahmen.

Umzug: bei Wechsel von Vast.ai oder RunPod zu Lambda Labs Docker-Image und Trainings-Skripte übertragen, Daten über S3-Sync hochladen, Pod starten. Typisch in einem halben Tag erledigt.

Lambda-Labs-Setup für Multi-Node-Training in 5 Schritten

01Konto unter lambdalabs.com anlegen, Firmenangaben hinterlegen, Kreditkarte oder Banktransfer als Bezahlmethode konfigurieren, AVV für EU/CH-Kunden anfordern.
02Cluster-Sizing entscheiden: 8x H100 SXM für 70B-Modell-Pretraining, oder 32x H100 SXM über 4 Knoten mit InfiniBand für schnelleren Durchlauf.
03Reserved-Vertrag vs. On-Demand abwaegen: 1-Year-Reserved für planbare Dauer-Workloads (Ersparnis 20-30%), 3-Year für Production (Ersparnis 40-50%).
04Lambda-Stack-Image wählen mit passenden CUDA/PyTorch-Versionen, Pod starten, Daten über S3-Sync von AWS S3 oder Cloudflare R2 hochladen.
05Training mit Slurm- oder Ray-Scheduler über alle Knoten parallel starten, Checkpoint-Logik alle 30 Minuten zu Object Storage konfigurieren, am Ende Daten exportieren und TIA-Eintrag dokumentieren.

Wann Lambda Labs einsetzen

Lambda Labs ist die richtige Wahl, wenn (a) Multi-GPU-Cluster mit InfiniBand für ernsthaftes Training nötig sind, (b) Reserved-Verträge für 24/7-Dauer-Inferenz wirtschaftlich werden, oder (c) Open-Weight-Modell-Inferenz über Lambda Inference einfacher als Self-Hosting ist. Konkrete Fälle: AI-Lab mit Bedarf an 32x H100-Cluster für 70B-Modell-Pretraining. SaaS-Unternehmen mit Dauer-Inferenz-Workload und 1-Year-Reserved-Vertrag. ML-Team, das Lambda Inference als kosteneffiziente Open-Weight-API nutzt.

Für 8x H100-SXM-Knoten mit voller InfiniBand-Topologie ist Lambda Labs eine der wirtschaftlich attraktivsten Optionen. CoreWeave ist konkurrenzfähig, aber preislich oft höher. Für Multi-Node-Training (32+ GPUs) sind beide Anbieter ernsthaft zu prüfen.

Lambda Inference für Open-Weight-Modelle ist Mai 2026 ein attraktiver Preis-Leistungs-Punkt. Llama 3.3 70B ab USD 0.20/M Input-Tokens ist günstiger als Together AI oder Fireworks AI für das gleiche Modell. Für ein Schweizer KMU mit Volume bleibt Scaleway Generative API mit EU-Datenresidenz aber die saubere Wahl.

Für reproducible ML-Experimente ist Lambda Stack einer der besten praeinstallierten Stacks im Markt. CUDA, cuDNN, PyTorch, TensorFlow, JAX in passenden Versionen – keine Versions-Schön-Spalt-Suche. Das ist in der Forschung und in produktiven ML-Pipelines ein deutlicher Vorteil.

Wann NICHT

Lambda Labs ist nicht passend für Workloads mit Schweizer oder EU-Datenresidenz-Anforderung. Mai 2026 hat Lambda Labs keine EU- oder CH-Region – alle Standorte sind in den USA. Eine TIA mit US-Standort ist für Daten unter revDSG schwer zu führen. Für EU/CH-Workloads ist Scaleway, OVHcloud oder Exoscale die saubere Wahl.

Wer extrem niedrige Stundenpreise für experimentelle Workloads sucht, ist bei Vast.ai oder RunPod Community Cloud günstiger. Lambda Labs ist gegenüber Vast.ai Interruptible etwa Faktor 2-3 teurer.

Wer eine breite Region-Wahl mit globaler Verteilung braucht, ist bei OVHcloud (33 Standorte) oder AWS/Azure besser bedient. Lambda Labs hat seinen Schwerpunkt klar in den USA, ohne globale Multi-Region-Architektur.

Für Mandate unter Berufsgeheimnis (StGB Art. 321) oder Bankgeheimnis (BankG Art. 47) ist Lambda Labs nicht akzeptabel – das CLOUD-Act-Risiko ist nicht durch standardmässige Vertragsklauseln eliminierbar. Selbst-Hosting auf Hetzner-GPU oder Exoscale-A100 in CH ist die korrekte Alternative.

Generelle Vorsicht: Lambda Labs Verfügbarkeit von H100 SXM und H200 ist Mai 2026 manchmal auf Warteliste, insbesondere für Reserved-Verträge. Wer eine kritische Deadline hat, sollte frühzeitig anfragen und ggf. CoreWeave parallel als Backup-Option halten.

Vor- und Nachteile

STÄRKEN

ML-Engineer-fokussierte Plattform mit praeinstalliertem Lambda Stack
Echte 8x H100 SXM Multi-GPU-Knoten mit voller InfiniBand-Topologie
Klare Reserved-Verträge mit 30-50% Rabatten gegenüber on-demand
Lambda Inference als günstige Pay-per-Token-API für Open-Weight-Modelle

SCHWÄCHEN

Keine EU- oder CH-Region Mai 2026, alle Standorte in den USA
CLOUD-Act-Anwendbarkeit für alle Workloads, TIA mit US-Standort schwer zu führen
H100/H200/B200 gelegentlich auf Warteliste, Reserved-Verträge mit Vorlaufzeit
Kein eigenes S3-kompatibles Object Storage, Anbindung an AWS S3 oder Cloudflare R2 nötig

Häufige Fragen

Hat Lambda Labs eine EU-Region?

Mai 2026 nein. Alle Lambda Labs Rechenzentren sind in den USA. Für EU/CH-Datenresidenz-Anforderungen ist Lambda Labs nicht direkt einsetzbar – Scaleway Paris, OVHcloud Frankfurt, Exoscale Zürich oder Hetzner GEX sind die EU/CH-Alternativen. Lambda Inference (Pay-per-Token-API) ist ebenfalls US-gehostet; für EU-Residenz bei Inference ist Scaleway Generative API oder Infomaniak Apertus passender.

Was kostet ein 8x-H100-Cluster über ein Jahr?

On-Demand: USD 23.92/h × 8760h = USD 209.500 für 12 Monate. Mit 1-Year-Reserved-Vertrag: ca. USD 145.000-165.000 für 12 Monate, je nach Konfiguration und Cluster-Grösse. Mit 3-Year-Reserved: ca. USD 105.000-125.000 pro Jahr über 3 Jahre. Lambda Labs gehört mit diesen Reserved-Tarifen zu den preislich attraktivsten Multi-GPU-Cluster-Anbietern. CoreWeave ist auf vergleichbarem Niveau, mit etwas anderer Cluster-Topologie-Optimierung.

Wie funktioniert Lambda Inference?

Lambda hostet Open-Weight-Modelle (Llama 3.3 70B, 405B, Qwen 2.5 72B, DeepSeek-V3 und weitere) auf eigener H100-Hardware in den USA. Die API ist OpenAI-Chat-Completions-Schema-kompatibel – eine bestehende OpenAI-Integration kann mit einem Endpoint-Swap auf Lambda umgeleitet werden. Abrechnung pro Million Input- und Output-Tokens, mit günstigeren Tarifen als Together AI oder Fireworks AI für einige Modelle. Vorteil: kostengöttlich, einfacher Start. Nachteil: US-gehostet, CLOUD-Act-Anwendbarkeit, für EU/CH-Mandate nicht ohne TIA einsetzbar.

Wie steht Lambda Labs gegen CoreWeave?

Beide sind US-GPU-Clouds mit Schwerpunkt auf Multi-GPU-Training-Workloads. Lambda Labs ist preislich Mai 2026 oft leicht günstiger pro H100-Stunde, mit klarem Reserved-Pfad. CoreWeave hat grössere Cluster (16+ H100 mit Top-InfiniBand-Topologie), eine grössere Multi-Region-Präsenz (USA-East/West, UK, Spain), und ist tiefer in Enterprise-Verträge mit Hyperscaler-Konkurrenz eingestiegen. Für Standard-ML-Engineering-Workflows ist Lambda Labs oft die natürlichere Wahl. Für Top-End-Enterprise-Training mit grössten Clustern ist CoreWeave etablierter.

Quellen

Lambda Labs – On-demand and reserved GPU pricing · 2026-05
Lambda Labs – Inference API for open-weight models · 2026-05
Lambda Stack – Pre-installed ML environment · 2026-04
Lambda Labs – Multi-GPU cluster topology and InfiniBand · 2026-04

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen