RUNPOD · TECH

RunPod: GPU-Cloud mit EU-Sweden-Region, A100 ab USD 1.69/h, H100 ab USD 2.59/h

RunPod betreibt GPU-Cloud in Hong Kong, USA und EU-Sweden. A100-80GB ab USD 1.69/h, H100 ab USD 2.59/h. Secure Cloud und Community Cloud Tiers.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Was ist RunPod?

RunPod ist eine GPU-fokussierte Cloud-Plattform, 2022 in Delaware (USA) gegründet, mit operativem Schwerpunkt auf GPU-Vermietung für KI-Workloads. Stand Mai 2026 betreibt RunPod über 20 Rechenzentren über Asien, Nordamerika und Europa hinweg, mit einer aktiven EU-Region in Stockholm (Schweden). Das Unternehmen wuchs in den letzten 24 Monaten rasch und positioniert sich als günstige Alternative zu CoreWeave und Lambda Labs, mit klarem Fokus auf On-Demand- und Spot-GPU-Stunden statt langfristige Reserved-Verträge.

Das Produkt teilt sich in zwei Tiers. Secure Cloud sind dedizierte GPU-Instances in RunPod-eigenen Rechenzentren mit Enterprise-SLA, Standard-Verfügbarkeit und HIPAA-konformer Betriebsweise (US-relevant für Gesundheits-Workloads). Community Cloud sind GPU-Instances in Partner-Rechenzentren mit etwas tieferen Preisen, dafür ohne SLA-Garantie – die Kapazität kann je nach Last variieren, der Standort ist je nach Karte unterschiedlich.

Das Inventar Mai 2026: NVIDIA RTX 4090 (24 GB VRAM) ab USD 0.34/h, RTX A6000 (48 GB) ab USD 0.59/h, A100-40GB ab USD 1.10/h, A100-80GB ab USD 1.69/h, H100-80GB SXM ab USD 2.49-2.79/h, H100-80GB NVL ab USD 3.29/h, H200-141GB ab USD 4.99/h, B200-180GB (Blackwell) ab USD 6.99/h. Die Preise variieren leicht zwischen Secure Cloud und Community Cloud, mit etwa 20-30% Rabatt im Community-Tier. Spot-Pricing (Interruption-Risk) ist nochmals 30-50% günstiger.

Die Plattform-Schnittstellen sind auf ML-Entwickler zugeschnitten. CLI mit `runpodctl`, Python-SDK, REST-API. Vorgefertigte Container-Templates für Stable Diffusion, ComfyUI, Ollama, vLLM, A1111, Text-Generation-WebUI und Jupyter sind Ein-Klick startbar. Serverless-Inferenz (RunPod Serverless) als Pay-per-Token-Variante für Open-Weight-Modelle, alternativ zur Pod-Miete.

Warum es wichtig ist

Drei Punkte machen RunPod für den Schweizer und EU-Markt interessant: niedrige On-Demand-GPU-Preise, EU-Region in Schweden, und schnelle Pod-Provisionierung für agile ML-Workflows.

Niedrige On-Demand-Preise: A100-80GB ab USD 1.69/h ist Mai 2026 einer der niedrigsten Stundenpreise für eine A100 bei einem Anbieter mit SLA. Vergleich: Lambda Labs USD 1.99/h, AWS USD 4.96/h für p4d-Instances, Scaleway EUR 3/h für Vergleichbares. Für ein 24-Stunden-Finetune auf einer A100 liegen die Kosten bei rund USD 41 – deutlich unter den Hyperscaler-Alternativen.

EU-Sweden-Region: seit 2025 hat RunPod eine stabile EU-Region in Stockholm. Schweden ist im revDSG-Anhang als Staat mit angemessenem Datenschutzniveau anerkannt, was den Drittlandtransfer-Aufwand entlastet. Achtung: RunPod als US-Konzern unterliegt dem CLOUD Act – auch für EU-Sweden-Workloads. Das ist in der TIA zu dokumentieren. Für Berufsgeheimnis-Daten (StGB Art. 321) bleibt damit ein Rest-Risiko, für Standard-Trainings-Daten ohne Personen-Bezug ist die Konstellation pragmatisch.

Schnelle Pod-Provisionierung: ein neuer Pod ist typisch in 30-60 Sekunden gestartet, sobald die GPU verfügbar ist. Vorgefertigte Templates (ComfyUI, vLLM, Ollama) sind Ein-Klick startbar. Für agile Experimente und kurzlebige Workloads ist das ein klarer Produktivitätsvorteil gegenüber AWS oder Azure.

Spot- und Community-Cloud-Optionen: wer experimentell unterwegs ist und Unterbrechungen tolerieren kann, spart 30-50% gegenüber Secure-Cloud-On-Demand. Mit Checkpoint-Logik (Modell alle 30 Minuten speichern) ist Spot-Mode robust einsetzbar für Training-Workloads.

Serverless-Modus: RunPod Serverless bietet Pay-per-Token-Inferenz für Open-Weight-Modelle ohne eigene Pod-Verwaltung. Cold-Start-Zeit ist nicht null (typisch 5-15 Sekunden bis zur ersten Antwort), dafür keine 24/7-Vorhalte-Kosten. Für sporadische Inferenz-Workloads ist das eine interessante Variante.

Regulatorische Position: RunPod ist eine US-Delaware-LLC, ISO 27001 zertifiziert, mit veröffentlichter Compliance-Dokumentation. Der CLOUD Act bleibt anwendbar – eine US-Subpoena kann RunPod direkt zur Datenherausgabe zwingen. Das ist in jeder TIA zu adressieren. Für Workloads mit eindeutig Schweizer Compliance-Anspruch ist RunPod nicht passend, für reine Trainings-Workloads ohne Personen-Daten dagegen sehr brauchbar.

Wie es funktioniert

Bestellung: über das Portal runpod.io. Konto-Anlage per E-Mail-Verifizierung, Bezahlung per Kreditkarte mit Prepaid-Guthaben. Pod-Provisionierung typisch in 30-60 Sekunden nachdem die gewünschte GPU verfügbar ist. Pod-Templates für gängige ML-Workloads (ComfyUI, vLLM, Stable Diffusion, Ollama, Text-Gen-WebUI, JupyterLab) sind Ein-Klick startbar.

Beispiel-Preise Mai 2026: RTX 4090 24GB Secure Cloud: USD 0.34/h. RTX A6000 48GB Secure Cloud: USD 0.59/h. A100-40GB Secure Cloud: USD 1.10/h. A100-80GB Secure Cloud: USD 1.69/h. A100-80GB Community Cloud: USD 1.19/h (ohne SLA-Garantie). H100-80GB SXM Secure Cloud: USD 2.79/h, Community USD 2.49/h. H100-80GB NVL: USD 3.29/h. H200-141GB: USD 4.99/h. B200-180GB Blackwell: USD 6.99/h. Storage 1 GB: USD 0.10/Monat für persistente Volumes, kostenlos während Pod-Laufzeit. Egress-Traffic: erste 100 GB/Monat kostenlos pro Pod, danach USD 0.05/GB.

Serverless: Pay-per-Sekunde für Inference-Workloads. Beispiel: Llama 3.3 70B Serverless ab USD 0.0008/Sekunde bei A100-Backend, sehr stark abhängig von Modell und Last. Cold-Start 5-15 Sekunden, warm 100-300ms Latenz pro Anfrage.

Netzwerk: jeder Pod hat eine öffentliche IPv4-Adresse mit Reverse-Proxy über RunPod-Domain. SSH-Zugriff per generierten Key. WebSSH und JupyterLab direkt im Browser. Privates Netz zwischen Pods im gleichen Konto verfügbar.

Storage: lokales SSD am Pod für schnelle I/O, plus persistente Volumes (Network Storage) die über Pod-Restarts erhalten bleiben. Network Volumes können zwischen Pods geteilt werden, was Training-Resume-Workflows vereinfacht.

Vertragsdetails: Pay-as-you-go ohne Mindestlaufzeit. Bezahlung per Prepaid-Konto, Konto-Aufladung in USD ab USD 10. AVV nach DSGVO Art. 28 / revDSG Art. 9 ist auf Anfrage verfügbar. ISO 27001 Zertifizierung für alle Secure Cloud Standorte. CLOUD-Act-Anwendbarkeit muss in der TIA dokumentiert werden – RunPod als US-Delaware-LLC unterliegt US-Recht.

Umzug: keine echte Migration nötig – RunPod ist typisch als kurzfristiger Workload-Provider eingesetzt, nicht als Dauer-Hoster. Container-Image bauen, hochladen, Pod starten – fertig. Daten kommen über S3-kompatible Buckets oder direkte Object-Storage-Mounts.

RunPod-Setup für Finetune-Job in 5 Schritten

01Konto unter runpod.io anlegen, Prepaid-Guthaben aufladen, AVV bei Bedarf anfordern.
02EU-Sweden-Region wählen für EU-Datenresidenz, GPU-Typ und -Anzahl entscheiden (A100-80GB Secure Cloud für 70B-Modelle, RTX 4090 Community für kleinere Workloads).
03Template auswählen oder eigenes Docker-Image hochladen, Persistent Volume für Checkpoints definieren, Pod starten.
04Daten über S3-Mount oder rsync auf das Volume kopieren, Training-Script starten, Checkpointing alle 30 Minuten konfigurieren.
05Nach Job-Ende Pod sofort beenden um Kosten zu stoppen, Checkpoints auf eigenen Hetzner- oder Infomaniak-Object-Storage exportieren, TIA-Eintrag für den Workload dokumentieren.

Wann RunPod einsetzen

RunPod ist die richtige Wahl, wenn (a) On-Demand-GPU-Stunden mit niedrigem Stundenpreis gebraucht werden, (b) ein Finetune oder Training-Job mit fester Endzeit ansteht, oder (c) Open-Weight-Modell-Inferenz ohne eigene Hardware getestet werden soll. Konkrete Fälle: ML-Team mit 24-72h-Finetune auf Llama 3.3 70B. AI-Startup mit experimentellen Workloads und tight budget. Forscher mit gelegentlichem H100-Bedarf für Benchmarks.

Für ComfyUI- oder Stable-Diffusion-Workloads ist RunPod Mai 2026 die beliebteste Wahl im Hobby- und Pro-Bereich. Vorgefertigte Templates, eine grosse Community und niedrige Preise machen es zur Standard-Plattform für Bild- und Video-Generierung.

Für Serverless-Inferenz mit Open-Weight-Modellen ist RunPod Serverless eine interessante Variante. Anders als Together AI oder Replicate ist es Pay-per-Sekunde statt Pay-per-Token, was bei langen Antworten unterschiedliche Kosten-Profile ergibt. Für ein Schweizer KMU-Workload mit klarer Compliance-Anforderung bleibt aber Scaleway oder Infomaniak-Apertus die saubere Wahl.

Für Trainings-Daten ohne Personen-Bezug (Open-Weight-Modell-Finetune auf öffentlich verfügbaren Daten) ist RunPod EU-Sweden eine pragmatische Wahl. Die Daten verlassen die EU nicht, der CLOUD-Act-Aspekt ist in einer einfachen TIA dokumentierbar, die Kosten sind niedrig.

Wann NICHT

Wer Daten unter Berufsgeheimnis nach StGB Art. 321 oder Bankgeheimnis nach BankG Art. 47 verarbeiten will, sollte RunPod nicht einsetzen. Die US-Mutter und der CLOUD Act schaffen ein Rest-Risiko, das für hochsensible Daten nicht akzeptabel ist. Für diese Fälle ist Exoscale Zürich (A100-GPU in CH) oder ein selbst-gehosteter GPU-Server auf Hetzner oder OVHcloud passender.

Wer Dauer-Inferenz mit konstanter 24/7-Last betreibt, fahrt mit Hetzner GPU oder OVHcloud GPU-Monatsmiete oft günstiger als mit RunPod-Stundenmiete. Beispielrechnung: A100 24/7 über einen Monat bei RunPod USD 1.69/h × 720h = USD 1.217. Bei Hetzner mit GEX130 oder einer GPU-Reservierung deutlich weniger. RunPod ist On-Demand-Champion, nicht Reserved-Champion.

Wer maximale Multi-GPU-Cluster (32+ H100 mit voller InfiniBand-Topologie) braucht, ist bei CoreWeave oder Lambda Labs besser bedient. RunPod bietet H100-SXM-Multi-GPU-Pods, aber die Cluster-Topologie und Verfügbarkeit ist nicht auf dem Niveau eines Hyperscaler-Trainings.

Wer ISO-27001-Zertifizierung mit europäischer Rechts-Position braucht, sollte zu Scaleway oder OVHcloud wechseln. Beide sind EU-Anbieter ohne US-Mutter, mit klarer EU-Rechts-Position und ISO-Zertifizierung. RunPod EU-Sweden hat ISO 27001, aber der CLOUD Act bleibt anwendbar.

Generelle Vorsicht: Community Cloud Tiers haben keine SLA. Eine Karte kann theoretisch ohne Vorwarnung den Service verlieren – Backups und Checkpointing sind Pflicht. Für Produktion mit hohen Verfügbarkeits-Anforderungen besser Secure Cloud wählen.

Vor- und Nachteile

STÄRKEN

Niedrige On-Demand-GPU-Preise: A100-80GB ab USD 1.69/h, H100 ab USD 2.49/h
EU-Sweden-Region seit 2025 stabil, EU-Datenresidenz machbar
Schnelle Pod-Provisionierung in 30-60 Sekunden, vorgefertigte Templates
Pay-as-you-go ohne Mindestlaufzeit, plus Community-Cloud-Tier für noch tiefere Preise

SCHWÄCHEN

US-Delaware-LLC unter CLOUD Act, TIA-Dokumentation für alle Personen-Daten Pflicht
Für Berufsgeheimnis-Daten (StGB Art. 321) nicht passend – Exoscale CH bevorzugen
Community Cloud ohne SLA, Pods können ohne Vorwarnung Service verlieren
Bei 24/7-Dauerlaufzeit ist Hetzner GPU oder OVHcloud Monatsmiete günstiger

Häufige Fragen

Ist RunPod EU-Sweden DSGVO-konform?

Die Region selbst ja – Schweden ist EU-Mitgliedsstaat unter DSGVO. Die Mutterkonzern-Frage bleibt: RunPod ist eine US-Delaware-LLC und unterliegt damit dem CLOUD Act. Eine US-Subpoena kann RunPod direkt zur Datenherausgabe zwingen, auch wenn die Daten in Stockholm liegen. Für Workloads mit Personen-Daten unter revDSG ist eine Drittlandtransfer-Impact-Assessment Pflicht. Für Trainings-Daten ohne Personen-Bezug ist die Konstellation pragmatisch.

Was kostet ein 24-Stunden-Finetune auf A100?

A100-80GB Secure Cloud USD 1.69/h × 24h = USD 41. Plus Storage für Checkpoints (typisch USD 1-5 für 50-100 GB), plus Egress für Datenübertragung (typisch USD 1-2 wenn unter 100 GB pro Pod). Insgesamt unter USD 50 für einen 24-Stunden-Job. Im Community Cloud Modus reduziert sich der A100-Stundenpreis auf USD 1.19, das sind USD 29 für 24 Stunden – ohne SLA-Garantie.

Wie unterscheidet sich RunPod von Lambda Labs?

RunPod ist pay-as-you-go ohne Mindestlaufzeit und mit Community-Cloud-Tier für noch tiefere Preise. Lambda Labs ist klassischer ML-Engineer-fokussiert mit besseren Reserved-Verträgen (1-year/3-year mit deutlichen Rabatten) und einer technisch reiferen CLI. RunPod hat EU-Region (Sweden), Lambda Labs Mai 2026 nicht. Für kurzfristige Workloads ist RunPod oft günstiger; für Dauer-Reserved-Verträge ist Lambda Labs konkurrenzfähig. Beide sind US-Konzerne unter CLOUD Act.

Wie sicher ist Community Cloud?

Community Cloud Pods laufen in Partner-Rechenzentren ohne RunPod-eigene Hardware-Garantie. Es gibt keine SLA. In der Praxis ist die Verfügbarkeit oft hoch (>95% Uptime), aber einzelne Pods können ohne Vorwarnung den Service verlieren. Für experimentelle Workloads, Hyperparameter-Suche und kostensensitive Trainings ist es passend. Für Produktions-Inferenz mit Verfügbarkeits-Anforderung Secure Cloud wählen. Mit guter Checkpoint-Logik (alle 30 Minuten speichern) sind Unterbrechungen handhabbar.

Quellen

RunPod – Pricing (Secure Cloud, Community Cloud, Serverless) · 2026-05
RunPod – Data centre regions including EU-Sweden · 2026-05
RunPod – Compliance and ISO 27001 certification · 2026-04
RunPod – Serverless inference pricing for open-weight models · 2026-05

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen