VAST.AI · TECH

Vast.ai: GPU-Auction-Marktplatz, RTX 4090 ab USD 0.31/h, A100 ab USD 0.40/h, weltweit verteilt

Vast.ai ist ein Auction-Marktplatz für GPU-Stunden, mit privaten und professionellen Anbietern weltweit. Billigste Spot-GPUs, ohne SLA und mit schwankender Verfügbarkeit.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Was ist Vast.ai?

Vast.ai ist ein Auction-Marktplatz für GPU-Compute, 2018 gegründet und in San Francisco registriert. Das Geschäftsmodell unterscheidet sich grundlegend von RunPod, Lambda Labs oder CoreWeave: Vast.ai betreibt keine eigene Hardware, sondern vermittelt GPU-Stunden zwischen privaten und professionellen Anbietern (Verkäufer) und Mietern (Käufer). Stand Mai 2026 gibt es über 10.000 verfügbare GPU-Instances aus weltweit verteilten Rechenzentren, Home-Setups und Rack-Hostings – geografisch über Nordamerika, Europa und Asien verteilt, mit einem starken Schwerpunkt in den USA und Osteuropa.

Das Auction-Modell funktioniert nach Bid-Logik. Verkäufer setzen einen Minimum-Preis pro GPU-Stunde, Käufer wählen verfügbare Karten nach Filter (GPU-Typ, VRAM, RAM, Storage, Region, Bandbreite, Verifikation). Es gibt zwei Modi: On-Demand-Instances mit garantierter Laufzeit (Verkäufer kann nicht unterbrechen), und Interruptible-Instances mit deutlich niedrigerem Preis (Verkäufer kann jederzeit überbieten und die Instance terminieren).

Mai 2026 das Inventar: NVIDIA RTX 3090 (24 GB) ab USD 0.18/h interruptible, RTX 4090 (24 GB) ab USD 0.31/h interruptible bis USD 0.45/h on-demand, RTX A6000 (48 GB) ab USD 0.55/h, A100-40GB ab USD 0.40/h interruptible, A100-80GB ab USD 0.78-1.20/h, H100-80GB ab USD 1.85-2.50/h, H200 ab USD 3.50/h. Die Preise schwanken täglich nach Verfügbarkeit – einer der niedrigsten H100-Preise im Markt, mit allen Konsequenzen einer Auction-Plattform.

Die Verifikation der Anbieter ist eine Schlüssel-Kategorie. "Verified" Anbieter sind durch Vast.ai überprüft (Hardware, Netzwerk, SSH-Zugriff). "Datacenter" Anbieter operieren aus echten Rechenzentren mit Standard-Infrastruktur. "Community" Anbieter sind weniger streng geprüft, oft Home-Hosting mit Consumer-Internet. Wer Produktion oder sensitive Daten verarbeiten will, filtert auf "Verified" und "Datacenter".

Die Plattform ist API-first mit CLI (`vastai`), Python-SDK und einer Web-Konsole. Docker-Container-basierte Workloads sind Standard – wer ein Image hat, kann es starten. Vorgefertigte Templates für Stable Diffusion, vLLM, Ollama, Jupyter sind verfügbar.

Warum es wichtig ist

Vast.ai ist Mai 2026 die günstigste GPU-Cloud im Markt – Faktor 2-3 unter RunPod Community Cloud, Faktor 3-5 unter Lambda Labs, Faktor 5-10 unter Hyperscalern. Drei Use-Cases rechtfertigen den Einsatz: experimentelle Workloads, Hyperparameter-Suche und unsensible Training-Jobs.

Experimentelle Workloads: ein ML-Forscher testet 20 verschiedene Modell-Architekturen über je 2 Stunden. Auf Vast.ai mit RTX 4090 zu USD 0.31/h kostet das USD 12.40 für 40 GPU-Stunden. Bei RunPod wären das USD 13.60, bei AWS rund USD 80, bei Scaleway EUR 24. Die Ersparnis ist marginal pro Job, aber kumulativ über ein Forschungs-Quartal signifikant.

Hyperparameter-Suche: ein Job, der über Bayesian Optimization 100 verschiedene Konfigurationen testet, profitiert massiv von paralleler Auction-Verfügbarkeit. 100x parallele A100-Stunden auf Vast.ai sind in vielen Fällen verfügbar und billiger als bei jedem anderen Anbieter. Die Interruptible-Logik ist hier kein Problem – fehlerhafte Hyperparameter-Trials werden neu gestartet, der Sucher-Algorithmus ist resilient.

Training-Jobs ohne Personen-Bezug: Open-Weight-Modell-Finetuning auf öffentlich verfügbaren Daten (Wikipedia, Common Crawl, Code-Repositories) hat keine Personen-Daten-Compliance-Anforderung. Wer hier auf "Verified Datacenter" filtert, bekommt brauchbare Stabilität zu niedrigsten Preisen. Mit Checkpoint-Logik (alle 30 Minuten speichern) sind Interruptible-Pods robust nutzbar.

Die Kehrseite ist klar. Vast.ai-Verkäufer sind heterogen – von ernsthaften Rechenzentren bis zu Hobby-Hostern mit einer einzigen RTX 3090 im Wohnzimmer. Das bedeutet: keine garantierte Datenresidenz, keine ISO-Zertifizierung der Plattform, keine AVV in standardisierter Form, kein Compliance-Paket für regulierte Mandate. Für Schweizer Treuhand mit Mandanten-Daten ist Vast.ai nicht geeignet.

Regulatorische Position: Vast.ai ist eine US-Delaware-LLC, unterliegt US-Recht und dem CLOUD Act. Die Daten liegen je nach Verkäufer in beliebigen Ländern – die Region-Filter helfen bei der geografischen Eingrenzung, aber die rechtliche Position des einzelnen Verkäufers kann unterschiedlich sein. Eine Drittlandtransfer-Impact-Assessment für Vast.ai ist kompliziert und Mai 2026 für die meisten Schweizer Compliance-Anwender nicht vertretbar.

Wie es funktioniert

Bestellung: über die Web-Konsole vast.ai oder die CLI `vastai`. Konto-Anlage per E-Mail-Verifizierung, Bezahlung per Kreditkarte oder Krypto (Bitcoin, USDC), Prepaid-Guthaben in USD. Instance-Suche über Filter: GPU-Typ, VRAM, RAM, Storage, Region, Verkäufer-Verifikation, Bandbreite, Disk-IO. Sortierung typisch nach USD/h aufsteigend.

Beispiel-Preise Mai 2026 (Auction-bedingt schwankend): RTX 3090 24GB interruptible USD 0.18-0.25/h, on-demand USD 0.32-0.45/h. RTX 4090 24GB interruptible USD 0.31-0.40/h, on-demand USD 0.45-0.65/h. A100-40GB interruptible USD 0.40-0.60/h, on-demand USD 0.80-1.20/h. A100-80GB interruptible USD 0.78-1.10/h, on-demand USD 1.20-1.80/h. H100-80GB interruptible USD 1.85-2.50/h, on-demand USD 2.50-3.50/h. Plattform-Gebühr (Vast.ai) typisch 10-15% auf den Mietpreis, in den angezeigten Preisen schon enthalten.

Netzwerk: jede Instance hat eine öffentliche IPv4-Adresse, SSH-Port ist typisch 22 plus zusätzliche Ports nach Konfiguration. Bandbreite-Filter ermöglichen Auswahl nach Download/Upload-Speed – wer grosse Datasets streamen muss, sollte auf "Datacenter"-Anbieter mit garantierter Bandbreite filtern.

Storage: jede Instance hat lokales SSD/NVMe Storage. Cloud-Sync zu S3-kompatiblen Buckets (eigener oder vom Anbieter bereitgestellter) ist die typische Workflow-Variante für Daten-Persistenz. Vast.ai bietet keinen eigenen persistenten Volume-Service über Pod-Lifecycle hinaus.

Vertragsdetails: kein klassischer Vertrag, sondern Plattform-Nutzungsbedingungen. AVV ist im Standard-Setup nicht enthalten – der Verkäufer ist eine andere Partei als Vast.ai, der Mieter ist der Endkunde, das ist eine 3-Parteien-Konstellation. Eine echte Auftragsbearbeitung nach revDSG Art. 9 mit standardisiertem Vertrag ist deshalb komplex und Mai 2026 nicht über Vast.ai abbildbar.

Docker und Templates: jede Workload läuft als Docker-Container. Vorgefertigte Templates für ComfyUI, Stable Diffusion, A1111, vLLM, Ollama, Jupyter, ML Studio sind in der Plattform verfügbar. Eigene Container können über Docker Hub, Github Container Registry oder andere Registries gepullt werden.

Interruption-Logik: bei Interruptible-Instances kann ein anderer Bidder die Instance überbieten – die laufende Workload bekommt typisch 30-120 Sekunden Vorwarnzeit (SIGTERM) bevor SIGKILL. Wer checkpointing nicht implementiert, verliert maximal die letzten Minuten Arbeit. Wer es korrekt implementiert, ist robust gegen Interruptions.

Umzug: typischerweise keine Migration nötig – Vast.ai ist Job-basiert, kein Dauer-Hoster.

Vast.ai-Setup für Hyperparameter-Suche in 5 Schritten

01Konto unter vast.ai anlegen, Prepaid-Guthaben aufladen, CLI `vastai` lokal installieren und API-Key konfigurieren.
02Filter setzen: "Verified Datacenter", gewünschte GPU (z.B. A100-40GB), Region (EU oder Nordamerika), minimale Bandbreite und Storage-Grösse.
03Docker-Image vorbereiten: eigene Workload oder Template (vLLM, ComfyUI, Jupyter), in Docker Hub oder Github Container Registry hochladen.
04Job starten: `vastai search offers` zum Filtern, `vastai create instance` zum Starten der besten Karte, S3-Bucket für Checkpointing konfigurieren.
05Workload mit Checkpoint-Logik (alle 30 Minuten Modell-State sichern) starten, bei Interruption automatisches Restart-Skript auf nächster Instance, am Ende Instance terminieren und Daten exportieren.

Wann Vast.ai einsetzen

Vast.ai ist die richtige Wahl für (a) extrem kostensensitive Experimente, (b) Hyperparameter-Suche mit vielen parallelen Trials, oder (c) Training-Workloads auf öffentlich verfügbaren Daten ohne Personen-Bezug. Konkrete Fälle: ML-Forschungs-Gruppe mit 50.000-USD-Quartals-Budget. Open-Source-AI-Projekt mit Community-finanziertem Finetuning. Startup mit experimentellen Workloads, das pro Tag mehrere Architekturen testet.

Für Stable-Diffusion- und ComfyUI-Workloads ist Vast.ai ebenfalls beliebt. RTX 3090 oder RTX 4090 zu USD 0.18-0.31/h ist die günstigste Option im Markt für ComfyUI-Generationen. Mit Checkpoint-Logik und Cloud-Backup zu S3 ist die Interruption-Risiko-Lösung pragmatisch.

Für Hyperparameter-Sweeps mit Ray Tune oder Optuna ist Vast.ai sehr passend. Parallel 50-200 GPU-Stunden über wenige Tage verteilen, mit Stop-Logik bei schlechten Trials, ergibt Kosten weit unter Standard-Cloud-Anbietern.

Für LLM-Benchmark-Studien (Latenz-Tests, Durchsatz-Messungen über verschiedene Hardware) ist Vast.ai die einfachste Plattform zur GPU-Diversifikation. Eine Reihe von H100-, A100-, L40S- und A6000-Instances kann in einer halben Stunde gestartet werden.

Wann NICHT

Vast.ai ist nicht passend für (a) Daten mit Personen-Bezug unter revDSG, (b) Berufsgeheimnis nach StGB Art. 321, (c) Bank- oder Versicherungs-Daten unter FINMA-Regulation, oder (d) produktive Inferenz-Workloads mit Verfügbarkeits-Anforderung.

Die Mehrparteien-Konstellation (Mieter – Vast.ai – Verkäufer) macht eine saubere Auftragsbearbeitungs-Vereinbarung schwierig. Eine TIA für Vast.ai mit unklarem Anbieter-Standort ist Mai 2026 nicht realistisch zu führen. Für Schweizer Treuhand mit Mandanten-Daten ist Exoscale Zürich, Infomaniak oder eine andere CH-AG die saubere Wahl.

Produkltive Inferenz mit garantierter Verfügbarkeit: weil Verkäufer ihre Instanzen ohne Vorwarnung beenden können (Interruptible) oder die Hardware nicht 24/7-mission-critical-tauglich ist, ist Vast.ai für produktive Live-Inferenz mit Verfügbarkeits-Anforderung nicht passend. Auch on-demand-Instances haben keinen echten Hardware-SLA.

Wer ein Training-Job mit harter Deadline und garantierter Endzeit braucht (z.B. für einen Konferenz-Beitrag mit Submission-Datum), sollte zu RunPod Secure Cloud oder Lambda Labs wechseln. Vast.ai-Verfügbarkeit kann theoretisch zu kritischen Momenten reduziert sein.

Wer professionellen Support mit Rückruf-Garantie und Reaktionszeiten erwartet, ist bei Vast.ai falsch. Der Support ist Community-orientiert (Discord, Forum) und nicht auf Enterprise-SLA-Niveau.

Generelle Vorsicht: bei Wahl eines unverified Community-Anbieters besteht das theoretische Risiko, dass der Anbieter SSH-Zugriff auf die Instance hat. Wer auch nur halbsensitive Daten verarbeitet, sollte auf "Verified Datacenter" filtern.

Vor- und Nachteile

STÄRKEN

Billigste GPU-Stunden im Markt: RTX 4090 ab USD 0.31/h, A100-80GB ab USD 0.78/h, H100 ab USD 1.85/h
Hohe Parallel-Verfügbarkeit für Hyperparameter-Sweeps mit vielen Trials
Breite Hardware-Vielfalt von RTX 3090 bis H200, Filter nach Region und Verkäufer
Pay-as-you-go ohne Mindestlaufzeit, Bezahlung per Kreditkarte oder Krypto

SCHWÄCHEN

Mehrparteien-Konstellation macht standardisierte AVV unmöglich, für CH-Personen-Daten nicht passend
Heterogene Verkäufer-Qualität, ohne "Verified Datacenter"-Filter Risiko von Home-Hosting
Interruptible-Instances können ohne Vorwarnung überboten werden, kein echter SLA
Support Community-orientiert, kein Enterprise-Telefon-Support oder Rückruf-Garantie

Häufige Fragen

Ist Vast.ai revDSG-konform für CH-Daten?

Nein, nicht in vertretbarer Form für Daten mit Personen-Bezug. Vast.ai ist eine US-Delaware-LLC, die Verkäufer sind heterogene Dritte mit unterschiedlichen Standorten und Rechtsformen. Eine standardisierte Auftragsbearbeitungs-Vereinbarung nach revDSG Art. 9 ist nicht im System vorgesehen. Eine TIA mit unklarem Verkäufer-Standort ist nicht plausibel zu führen. Für CH-Daten unter revDSG ist Vast.ai nicht die richtige Wahl – stattdessen Exoscale CH (A100 in Zürich) oder Infomaniak.

Wie billig ist Vast.ai wirklich gegenüber RunPod?

Mai 2026 ist Vast.ai im Interruptible-Modus etwa Faktor 2-3 unter RunPod Community Cloud bei vergleichbarer Karte. A100-80GB bei Vast.ai interruptible USD 0.78-1.10/h, bei RunPod Community Cloud USD 1.19/h, bei RunPod Secure Cloud USD 1.69/h. Im On-Demand-Modus (Vast.ai) liegt der Preis ähnlich wie RunPod Community Cloud. Die wahren Ersparnisse kommen bei Interruptible-Workloads mit guter Checkpoint-Logik. Für 24-Stunden-Finetune ohne Interruption-Toleranz ist RunPod Secure Cloud die robustere Wahl.

Was bedeutet "Verified Datacenter" praktisch?

Verkäufer mit Verifikation "Datacenter" operieren aus etablierten Rechenzentren mit redundanter Stromversorgung, professioneller Netzwerk-Anbindung und stabilem Hardware-Betrieb. Vast.ai prüft Hardware-Identität, SSH-Zugriff und Netzwerk-Konfiguration. "Verified" ist eine zusätzliche Prüfstufe. Im Filter sollte für Produktion immer auf "Verified Datacenter" eingeschränkt werden – die Preise sind dann etwa 20-30% höher als Community-Tier, aber die Stabilität ist akzeptabel.

Ist Krypto-Bezahlung sinnvoll?

Vast.ai akzeptiert Bitcoin und USDC als Alternative zur Kreditkarte. Für Privatsphaere-orientierte Anwender (Datenschutz beim Bezahl-Vorgang selbst) ist das eine Option. Für Firmen-Buchhaltung ist Kreditkarte einfacher (Rechnung mit Mehrwertsteuer-Ausweis, klare Belege). USDC-Bezahlung erspart Wechselkurs-Risiken gegenüber USD. In CH ist Krypto-Bezahlung steuerlich klar regelt – die Eingangsrechnung wird in CHF nach Tageskurs umgerechnet, gleich wie bei USD-Zahlung.

Quellen

Vast.ai – Pricing and instance marketplace · 2026-05
Vast.ai – Verified Datacenter program · 2026-04
Vast.ai – CLI documentation and API · 2026-05
Vast.ai – Interruptible vs on-demand modes · 2026-05

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen