RUNPOD vs VAST.AI vs HETZNER GPU - DUELL

RunPod vs Vast.ai vs Hetzner GPU - wo trainieren und inferieren 2026?

Drei GPU-Cloud-Modelle. RunPod als seriose On-Demand-Plattform, Vast.ai als Spot-Marktplatz, Hetzner als EU-Reserved-Hosting - Preis- und Profil-Vergleich Mai 2026.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Worum geht das Duell?

Drei Wege führen Mai 2026 zur GPU-Stunde für LLM-Training oder Inferenz. RunPod ist eine kuratierte On-Demand-Cloud aus den USA mit Datacentern in Europa und Asien. Vast.ai ist ein Auktions-Marktplatz, auf dem Privatpersonen und kleine Provider freie GPU-Kapazität versteigern. Hetzner ist ein deutscher EU-Hoster, der dedizierte Server mit GPU als Reserved-Hardware vermietet - kein On-Demand, kein Stunden-Abruf.

Die drei Modelle unterscheiden sich fundamental nach Preisbildung und Verfügbarkeit. RunPod und Vast.ai sind elastisch: Sie buchen eine GPU für eine Stunde, einen Tag oder eine Woche, zahlen pro Sekunde, geben sie zurück. Hetzner ist statisch: Sie mieten einen Server für mindestens einen Monat, die GPU ist dauerhaft Ihre. Das verschiebt die Wirtschaftlichkeit deutlich: Wer eine GPU nur sporadisch braucht, fliegt mit RunPod oder Vast.ai. Wer 24/7 ein Modell hostet, ist mit Hetzner-Reserved-Pricing nach drei bis fünf Wochen günstiger als On-Demand-Tarife.

Wichtig für Schweizer Treuhand- und Anwalts-Setups: nur Hetzner hält die Daten unstrittig in der EU/DE. RunPod hat zwar EU-Regionen (Schweden, Niederlande), aber die Plattform-Hoheit liegt in den USA - für DSG-strikte Auslegung relevant. Vast.ai versteigert Kapazität weltweit, der Standort eines konkreten Hosts ist nicht garantiert vorhersehbar.

Warum die Wahl wichtig ist

Drei harte Achsen entscheiden, welcher Anbieter zum konkreten Use-Case passt: Preis pro GPU-Stunde, Verfügbarkeit und EU-Datenschutz.

Preis pro GPU-Stunde Mai 2026: Vast.ai ist klar günstigster Anbieter. RTX 4090 bei rund USD 0.31-0.40 pro Stunde, A100 80 GB ab USD 0.67 pro Stunde wenn ein High-Reliability-Host verfügbar ist. RunPod liegt im Mittelfeld: Community-Cloud RTX 4090 ab USD 0.29 pro Stunde, A100 80 GB ab USD 1.39 pro Stunde, H100 80 GB ab USD 2.39 pro Stunde. Im Secure-Cloud-Tier (zuverlässiger, festere SLA) sind die Preise etwa 30-40 Prozent höher: A100 80 GB ab USD 1.89, H100 80 GB ab USD 2.69. Hetzner spielt eine andere Liga: GPU-Server mit RTX 6000 Ada oder L40S kosten EUR 600-1500+ pro Monat - umgerechnet pro Stunde günstig, nur eben mit Minimum-Bindung von einem Monat.

Verfügbarkeit: RunPod liefert die höchste Konstanz. Wer eine A100 für nächste Woche reservieren will, bekommt sie Mai 2026 in den meisten Regionen ohne Wartezeit. Vast.ai ist von der Marktlage abhängig - bei hoher Nachfrage verschwinden die besten Preise, manche Hosts gehen offline, das versprochene RAM ist manchmal weniger als angegeben. Hetzner braucht Vorlauf: GPU-Server sind nicht immer sofort verfügbar, typische Wartezeit ein bis vier Tage.

EU-Datenschutz: Hier ist Hetzner die saubere Wahl. Server in Falkenstein, Nürnberg oder Helsinki, deutscher Anbieter, vertraglich nach DSGVO/DSG handhabbar. RunPod hat EU-Regionen, aber als US-Konzern bleibt das Cloud Act-Risiko, das ein TIA dokumentieren muss. Vast.ai ist datenschutzrechtlich ein offenes Feld: der Mietvertrag läuft mit Vast.ai (USA), die physische Hardware steht bei einem dritten Host irgendwo auf der Welt. Für sensible Mandantendaten in der Inferenz: ungeeignet. Für anonymisiertes Training auf synthetischen Daten: brauchbar.

Die drei Anbieter im Detail

RunPod (USA, San Francisco): On-Demand-Cloud mit zwei Tiers. Community Cloud ist günstiger und bündelt Kapazität aus partner-eigenen Datacentern - typisch USD 0.29-1.39 pro Stunde für RTX 4090 bis A100 80 GB. Secure Cloud ist Premium, eigene Datacenter, höhere Verfügbarkeits-Garantie, etwa 30-40 Prozent teurer. Pods werden via Docker-Image gebootet, GPU-Wahl per Klick, SSH oder Jupyter sofort. Serverless-Endpoints für Auto-Scaling-Inferenz. Mai 2026 verfügbare GPUs: RTX 4090, RTX 6000 Ada, L40S, A40, A100 40/80 GB, H100 80 GB, H200, AMD MI300X. Datacenter in USA, Schweden, Niederlande, Singapur, Indien. Per-Sekunde-Abrechnung, Netzwerk-Traffic im Preis enthalten in den meisten Regionen.

Vast.ai (USA, San Francisco): Marktplatz-Modell, kein eigenes Datacenter. Wer eine GPU rumliegen hat, listet sie auf Vast.ai mit eigenem Preis. Wer eine GPU braucht, durchsucht das Angebot nach GPU-Typ, RAM, CPU, Netzwerk-Bandbreite, Host-Reliability-Score. Preise schwanken stark: RTX 4090 USD 0.31-0.50 pro Stunde, A100 80 GB USD 0.67-1.20 pro Stunde abhängig von Marktlage. Vorteile: deutlich günstiger als RunPod, riesige Kapazität bei flexibler Suche. Nachteile: Host-Qualität schwankt (langsame Disks, überlastete Netzwerke), keine garantierte SLA, manche Hosts löschen Pods bei Strompreisspitzen. Best Practice: Reliability-Score über 99 Prozent wählen, eigene Snapshots in S3, kein langfristiges State auf der Box.

Hetzner Dedicated GPU (Deutschland, Nürnberg/Helsinki/Falkenstein): Reserved-Hardware, kein Cloud-Konstrukt. Sie mieten einen physischen Server mit fest eingebauter GPU für mindestens einen Monat. Modell-Linie Mai 2026: GEX44 mit RTX 6000 Ada (48 GB VRAM) ab EUR 599/Monat, EX130-S mit RTX 4090 ab EUR 380/Monat (sehr nachgefragt, Wartezeit), grössere Modelle mit L40S oder mehreren GPUs auf Anfrage. Setup-Gebühr typisch EUR 0-149 einmalig. Vertraglich DSGVO-konform, deutsches Recht, kein Drittland-Risiko. Praktisch keine GPU-Wahl - die Modelle sind fixiert, kein Hot-Swap, keine elastische Skalierung. Wer mehr GPU braucht: zweiten Server bestellen.

GPU-Cloud-Auswahl in 6 Schritten

01Load-Profil festlegen: sporadisch (Training-Burst) = Vast.ai; spitz (Inferenz mit Auto-Scaling) = RunPod Serverless; konstant 24/7 = Hetzner.
02Daten-Sensitivität prüfen: Mandantendaten = Hetzner Pflicht; anonymisiert/synthetisch = alle drei; öffentliche Daten = günstigster Anbieter.
03GPU-Bedarf quantifizieren: 24 GB VRAM (RTX 4090) reicht für 7B-13B Modelle; 48 GB (RTX 6000 Ada / L40S) für 70B in 4-Bit; 80+ GB (A100/H100) für ungquantisiertes 70B oder Multi-Modell.
04Kosten überschlagen: Hetzner Monatspreis durch erwartete Nutzungsstunden teilen vs. RunPod Stundenpreis x Nutzungsstunden. Break-Even bei etwa drei bis fünf Wochen Dauerlast.
05PoC mit RunPod Community Cloud: zwei Tage testen, Workload validieren, dann auf Production-Anbieter wechseln.
06Production-Anbieter wählen: Hetzner für konstanten Load und EU-Pflicht; RunPod Secure Cloud für elastische Production; Vast.ai nur für nicht-sensiblen Training-Use.

Empfehlung je Szenario

Sporadisches Training oder Fine-Tuning, 10-50 Stunden pro Monat: Vast.ai. Bei USD 0.67 pro Stunde für eine A100 80 GB kostet ein 30-Stunden-Trainings-Lauf rund USD 20 - undbiet von keinem anderen Anbieter. Daten müssen anonymisierbar oder synthetisch sein, für Mandantendaten ist die unklare Host-Geographie ungeeignet.

Production-Inferenz mit Auto-Scaling, mal 0 mal 50 parallele Requests: RunPod Serverless. Skaliert nach Bedarf hoch und runter, pay-per-second auch für GPU-Idle. Latency-Profil etwas höher als dedicated-GPU (Cold-Start 5-20 Sekunden), aber Kosten bei spitzem Load-Profil deutlich besser als 24/7 reservierte Hardware.

24/7 Inferenz mit konstantem Load, Treuhand- oder Anwalts-Anwendung, EU-DSG-konform: Hetzner GEX44 oder EX130-S. EUR 380-599 pro Monat für eine Karte mit 24-48 GB VRAM, dauerhaft verfügbar, in Deutschland gehostet, deutsches Recht. Ab etwa fünf Wochen Dauerbetrieb pro Monat ist Hetzner günstiger als RunPod Secure Cloud.

LLM-Training auf eigenen Mandantendaten (selten, aber kommt vor): Hetzner. Daten verlassen nicht die EU, Vertrag mit dem Anbieter ist DSGVO-konform. Training braucht GPU-Stunden, für ein 7B-Modell auf 10 GB Trainingsdaten zwei bis fünf Tage auf einer Karte - passt in Monatsmiete.

PoC mit unklarer Laufzeit, "drei Tage testen, dann sehen": RunPod Community Cloud. Schnell hochgefahren, schnell wieder runter, pay-per-second. Per-Sekunde-Abrechnung verzeiht abgebrochene Versuche besser als ein Monatsvertrag bei Hetzner.

Multi-GPU-Training, 8x H100 oder mehr: RunPod Secure Cloud oder hyperscaler-ähnliche Anbieter. Hetzner hat Mai 2026 keine 8x-H100-Boxen im Standardprogramm, Vast.ai-Hosts mit 8 GPUs auf einer Node sind selten und teuer.

Wann keine GPU-Cloud passt

Wenn die Last gering bleibt (unter 5 Millionen Tokens pro Monat, gelegentliche Anfragen) und kein DSG-Argument gegen Cloud-APIs spricht, ist OpenAI, Anthropic oder Mistral API einfach günstiger als eine eigene GPU. Eine A100 80 GB bei RunPod Secure Cloud kostet bei 50 Prozent Auslastung pro Monat rund USD 680 - das entspricht etwa 50-150 Millionen das jeweils aktuelle GPT-Spitzenmodell-Tokens.

Wenn Sie die GPU nur für Vektor-Embedding brauchen (RAG-Pipeline ohne lokales LLM), reicht eine CPU-Box. text-embedding-3-small von OpenAI kostet rund USD 0.02 pro Million Tokens - günstiger als jede GPU-Stunde für dasselbe Volumen. GPU lohnt nur, wenn das Sprachmodell selbst lokal betrieben werden soll.

Wenn Sie keinen Linux-Sysadmin im Team haben und keinen externen DevOps-Partner: Vast.ai und Hetzner sind Sysadmin-Pflicht, RunPod ist etwas freundlicher dank vorgefertigter Docker-Templates. In dem Fall ist eine Managed-LLM-Cloud (Anthropic, OpenAI, Mistral La Plateforme) bequemer als eigene GPU-Operations.

Wenn Compliance-Audit jede Block-Storage-Beschreibung dokumentiert haben will, ist Vast.ai problematisch - der konkrete physische Host wechselt, jeder Wechsel ist potenziell ein neuer Drittland-Transfer. Hetzner ist hier klar dokumentierbar, RunPod akzeptabel mit fixierter Region.

Vor- und Nachteile

STÄRKEN

RunPod: kuratierte On-Demand-Cloud, Per-Sekunde-Abrechnung, Serverless-Endpoints, breite GPU-Auswahl von RTX 4090 bis H200
Vast.ai: günstigster Markt, RTX 4090 ab USD 0.31/h, A100 80 GB ab USD 0.67/h, riesige Kapazität wenn Reliability-Score >99
Hetzner: EU-DSGVO-konform, deutsches Recht, dauerhafte Verfügbarkeit, ab etwa 3 Wochen 24/7-Betrieb günstiger als RunPod Secure
Alle drei: keine Bindung an einen Hyperscaler, OSS-freundlich, keine Mindest-Verträge bei RunPod/Vast.ai

SCHWÄCHEN

RunPod: US-Konzern, Cloud Act-Risiko bei strikter DSG-Auslegung, EU-Regionen vorhanden aber nicht juristisch entkoppelt
Vast.ai: Host-Geographie unsicher, Host-Qualität schwankt, manche Hosts löschen Pods bei Marktdruck, für Mandantendaten ungeeignet
Hetzner: kein On-Demand, Minimum 1 Monat, GPU-Auswahl beschränkt (kein H100 im Standardprogramm), Verfügbarkeit nicht immer sofort
Alle drei: GPU-Ops verlangt Linux-Sysadmin, keine "Klick-Lösung" wie Managed-LLM-API

Häufige Fragen

Wie viel kostet 24/7 Llama-3.3-70B-Inferenz Mai 2026?

Auf einer A100 80 GB bei RunPod Secure Cloud (USD 1.89/h x 720 h) etwa USD 1360 pro Monat. Auf einer RTX 4090 in 4-Bit-Quantisierung via RunPod Community Cloud (USD 0.29-0.40/h) etwa USD 210-290 pro Monat - mit Verfügbarkeits-Risiko. Auf einem Hetzner GEX44 (RTX 6000 Ada, 48 GB) festen EUR 599/Monat - umgerechnet rund USD 670, mit voller EU-DSGVO-Konformität. Faustregel: Hetzner ab etwa drei Wochen Dauerbetrieb pro Monat günstiger als RunPod Secure.

Ist Vast.ai für Mandantendaten geeignet?

Nein, nicht ohne Anonymisierung. Vast.ai ist ein Marktplatz mit Hosts weltweit - der konkrete Standort des Servers ist nicht garantiert vorhersehbar. Für DSG-konforme Inferenz auf Mandantendaten ungeeignet. Für Training auf anonymisierten oder synthetischen Daten brauchbar, mit Pseudonymisierung und Prüfung der Host-Reputation.

Was unterscheidet RunPod Community von Secure Cloud?

Community Cloud bundlet Kapazität aus partner-eigenen Datacentern - günstiger, aber mit grösserer Schwankung bei Verfügbarkeit und Performance. Secure Cloud sind RunPod-eigene Datacenter mit höheren SLAs - typisch 30-40 Prozent teurer. Für ernsthafte Production: Secure Cloud. Für PoCs, Forschung, Training-Bursts: Community Cloud reicht.

Welche H100-Optionen gibt es Mai 2026?

RunPod Secure Cloud bietet H100 80 GB ab USD 2.69 pro Stunde, H200 verfügbar in ausgewählten Regionen. Vast.ai-Hosts mit H100 sind verfügbar, aber meist um USD 2.00-3.50 pro Stunde - kein dramatischer Vorteil gegenüber RunPod, dafür weniger SLA. Hetzner hat H100 Mai 2026 nicht im Standardprogramm; auf Anfrage und mit ein paar Wochen Vorlauf zu finden, Preis individuell.

Quellen

RunPod - GPU pricing page · 2026-05
Vast.ai - live GPU marketplace pricing · 2026-05
Hetzner - dedicated GPU server lineup · 2026-05
Spheron - GPU cloud pricing comparison 2026 · 2026-04

PASSEND ZU IHREM STACK?

Sie planen GPU-Hosting für LLM-Inferenz mit DSG-Pflicht? Wir bauen Setup auf Hetzner inkl. Ollama/vLLM-Stack in 5-10 Tagen.

Erstgespräch buchen