QDRANT · WEAVIATE · PGVECTOR · DUELL

Qdrant vs Weaviate vs pgvector – welche Vektor-DB für KMU-RAG?

Drei Vektor-Datenbanken im Direktvergleich: Self-Host-Aufwand, Skalierungs-Limit, Postgres-Integration, EU-Hosting. Entscheidungshilfe für RAG-Pipelines in CH-KMU.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Worum es geht

Qdrant, Weaviate und pgvector sind die drei meistgenutzten Vektor-Datenbanken für Retrieval-Augmented Generation (RAG) im Mai 2026. Jede speichert Vektoren (Listen von Zahlen, die semantische Bedeutung kodieren) und beantwortet die Frage "welche Texte sind diesem Vektor am ähnlichsten" in Millisekunden.

Qdrant ist eine in Rust geschriebene, dedizierte Vektor-Datenbank aus Berlin. Sehr schnell, payload-basierte Filter, HNSW-Indexing, gRPC und REST. Apache-2.0-Lizenz. Weaviate ist ein Open-Source-Vektor-DB-Projekt aus Amsterdam mit GraphQL-API, eingebauten Hybrid-Search-Modulen und Multi-Modal-Support. BSD-3-Clause-Lizenz. pgvector ist eine Postgres-Extension von Andrew Kane – kein eigener Server, sondern eine Erweiterung der etablierten Postgres-Datenbank. PostgreSQL-Lizenz.

Mai 2026 ist das Bild differenziert: pgvector (Version 0.9 im April 2026 released) hat dank pgvectorscale (Timescale) bei sehr grossen Workloads überraschend stark aufgeholt – bei 50M Vektoren liefert pgvectorscale 471 QPS gegen Qdrant 41 QPS auf 99 Prozent Recall. Bei mittleren Workloads (1M Vektoren) führt Qdrant mit 1840 QPS. Weaviate punktet bei Multi-Modal und Hybrid-Search.

Warum dieser Vergleich?

Wenn Sie RAG für eine Schweizer KMU bauen – interne Wegleitungen, Mandantenkorrespondenz, Mandanten-FAQ – entscheidet die Vektor-DB-Wahl über drei Folgen.

Erstens Operations-Aufwand. Wenn Sie schon Postgres im Stack haben (was 80 Prozent der KMU-Setups zutrifft, von Pexeos über Fairlane bis Realty51), kostet pgvector eine CREATE EXTENSION-Zeile. Qdrant braucht einen eigenen Container, ein Volume, einen Backup-Plan. Weaviate braucht zudem GraphQL-Knowhow und einen Schema-Manager.

Zweitens Skalierungs-Limit. Bis 1 Million Vektoren ist pgvector ausreichend (und meistens schon vorhanden). Bei 10 Millionen Vektoren wird Qdrant das schnellste und einfachste Tool. Ab 50 Millionen Vektoren lohnt sich pgvectorscale (Timescale-Erweiterung) – oder Sie verteilen auf mehrere Qdrant-Knoten. Weaviate skaliert ebenfalls, aber mit höherem Operations-Aufwand.

Drittens Feature-Set. Wenn Sie Hybrid-Search (Vektor + Volltext-BM25) brauchen, hat Weaviate das eleganteste eingebaute Modell. Qdrant unterstützt Hybrid-Search seit Version 1.10 (2025), aber konfigurativ. pgvector kombiniert mit Postgres-Full-Text-Search ist die manuellste Variante.

Dieser Vergleich hilft, die richtige DB für Ihre Datenmenge und Ihren Stack zu finden – ohne in das "alle drei sind gleich"-Klischee zu verfallen.

Head-to-Head auf 6 Achsen

Datenschutz und EU-Hosting. Alle drei sind Self-Host-fähig auf eigener EU/CH-Infrastruktur. Qdrant Cloud hostet zusätzlich in Frankfurt; Weaviate Cloud Service hostet in EU-Regionen; pgvector läuft wo auch immer Ihr Postgres läuft (Hetzner, Exoscale, Infomaniak). DSG-Konformität ist Setup-Frage, nicht Tool-Frage.

Preis und Lizenz. Alle drei sind Open-Source und kostenlos in Self-Host. Qdrant Apache 2.0, Weaviate BSD-3-Clause, pgvector PostgreSQL-Lizenz. Qdrant Cloud Free-Tier 1 GB, dann ab USD 25/Monat. Weaviate Cloud ab USD 25/Monat. pgvector als reine Extension hat keine eigene Cloud-Variante, aber jeder Postgres-Hosting-Provider (Supabase, Neon, Crunchy) liefert pgvector standardmässig.

Reife / Skalierung. Qdrant 1840 QPS bei 1M Vektoren (ANN-Benchmarks 2025), p99-Latenz ca. 12 ms bei 10M, 10-25 Prozent schneller als Weaviate und Milvus. Weaviate ca. 1400 QPS bei 1M, p99 ca. 16 ms bei 10M. pgvector klassisch langsamer bei 1M (ca. 800 QPS) – aber mit pgvectorscale bei 50M ca. 471 QPS gegen Qdrant 41 QPS. Skalierungs-Profile sind unterschiedlich.

Lock-in. Qdrant: REST/gRPC mit klarem Schema, Daten-Export einfach. Weaviate: GraphQL-First, Daten-Export über Backup-Modul, Schema-Sprache eigen. pgvector: bleibt in Postgres, voller pg_dump-Workflow, kein Lock-in jenseits Postgres.

Self-Host-Aufwand. pgvector am einfachsten: ein CREATE EXTENSION-Kommando in bestehendem Postgres, fertig. Qdrant: ein Docker-Container, ca. 1 Stunde Setup inklusive Backup. Weaviate: ein Docker-Container plus optional Vectorizer-Module (z.B. text2vec-openai) plus GraphQL-Schema, ca. 2-4 Stunden Setup.

DACH-Tauglichkeit. Qdrant deutsche Firma (Berlin), Forum in DE/EN, Doku zweisprachig. Weaviate niederländisch, EN-only. pgvector internationale Community, EN-only – aber Postgres selbst hat eine grosse DACH-Community.

Entscheidungsweg in 6 Schritten

01Vektor-Menge schätzen: Anzahl Dokumente x durchschnittliche Chunks pro Dokument. Unter 1M = pgvector, 1-10M = Qdrant oder pgvectorscale, über 10M = Qdrant Cluster.
02Bestehenden Stack prüfen: Postgres schon da? Dann pgvector zuerst. Kein Postgres, oder Postgres-Last schon hoch? Dann Qdrant.
03Feature-Bedarf checken: Hybrid-Search nötig? Multi-Modal nötig? Bei beidem Weaviate evaluieren.
04Latenz-Anforderung festlegen: unter 50 ms p99 reicht pgvector; unter 20 ms p99 ist Qdrant.
05Backup- und Disaster-Recovery-Plan schreiben: pgvector mit pg_dump, Qdrant mit Snapshot-API, Weaviate mit Backup-Modul.
06Pilot bauen: 5000-10000 echte Chunks indexieren, 20 echte Anfragen messen, Latenz und Relevanz dokumentieren.

Wann welche DB

Wann pgvector. Sie haben schon Postgres im Stack. Ihre Vektor-Menge ist unter 1-2 Millionen (deckt 80 Prozent der KMU-RAG-Fälle ab). Sie wollen einen Tech-Stack, nicht zwei. Sie schätzen einfache Backups, einfaches Monitoring, eine Datenbank-Engine, die jeder Engineer kennt. pgvector ist die Default-Wahl für Schweizer Treuhand, Anwaltskanzleien und KMU-RAG bis mittlere Grösse. Mit pgvectorscale skaliert es bis 100M Vektoren überraschend gut.

Wann Qdrant. Ihre Vektor-Menge geht über 5-10 Millionen (z.B. grosser Dokumentenbestand, Anwaltskanzlei mit 20+ Jahren Praxis-Archiv). Sie brauchen sehr schnelle Latenz (unter 20 ms p99). Sie wollen payload-basierte Filter (Mandant=X UND Vertraulichkeit=hoch UND Datum>2024). Sie wollen einen sauberen Tech-Stack, in dem die Vektor-DB nicht in der Hauptdatenbank hängt. Qdrant ist die Default-Wahl ab mittlerem Skalierungsbedarf.

Wann Weaviate. Sie brauchen Multi-Modal-Suche (Text + Bild + Audio in einem Index). Sie wollen Hybrid-Search (BM25 + Vektor) eingebaut, nicht selbstgebaut. Sie haben ein Team, das GraphQL kennt und schätzt. Sie haben ein E-Commerce- oder Content-Discovery-Use-Case mit gemischten Datentypen. Weaviate ist die Wahl bei Multi-Modal-Heavy-Use-Cases.

Wann KEINES. Wenn Sie weniger als 10000 Dokumente und Konfiguration eine Hauptlast ist: nutzen Sie die in-Memory-Variante von LangChain/LlamaIndex (FAISS-basiert). Wenn Sie Real-Time-Personalisierung mit Streaming-Updates auf 1B+ Vektoren brauchen (Werbe-Targeting): hierfür sind Vespa oder Milvus besser positioniert. Wenn Sie absolute Tier-A-Souveränität und Offline-Fähigkeit brauchen: ein lokales Qdrant in Air-Gapped-Setup.

Wann KEINE der drei

Wenn Sie unter 10000 Dokumente haben und ein Engineer wartet, ist eine Vektor-DB Overkill. FAISS in-Memory (in LangChain/LlamaIndex eingebaut) reicht; Re-Indexing dauert Sekunden, kein Backup-Konzept nötig.

Wenn Sie 1 Milliarde Vektoren oder mehr brauchen (z.B. Werbe-Personalisierung, riesige Empfehlungssysteme), sind Vespa und Milvus besser positioniert – beide haben distributed-by-default Architekturen mit verteiltem Sharding. Qdrant unterstützt Sharding ab Version 1.7, aber Vespa hat in dem Bereich einen Vorsprung von Jahren.

Wenn Sie absolut keine zusätzliche Datenbank betreiben wollen und sehr klein bleiben (50 Dokumente): legen Sie die Embeddings in einer Markdown- oder JSON-Datei ab, machen Sie Brute-Force-Cosine-Similarity bei jeder Anfrage. Ehrlich, das ist für ein 50-Dokumenten-Mandanten-FAQ schneller und einfacher als jede Vektor-DB.

Wenn Sie eine pure Volltext-Suche brauchen, ist Elasticsearch oder OpenSearch passender – Vektor-DBs lohnen sich erst, wenn semantische Nahesuche das Schlüssel-Bedurfnis ist (Frage in natürlicher Sprache, Antwort aus Dokumenten in anderer Formulierung).

Vor- und Nachteile

STÄRKEN

Drei-DB-Vergleich klärt eine Default-Wahl-Frage in 10 Minuten
Stack-Realität (Postgres schon da?) als erstes Kriterium statt Benchmark-Theorie
Skalierungsachsen explizit gelistet: 1M / 10M / 50M / 1B
Self-Host-Aufwand quantifiziert (Stunden Setup) statt "möglich"

SCHWÄCHEN

Benchmark-Zahlen veralten schnell – Qdrant 1.x und pgvector 0.9 sind Stand Mai 2026
Hybrid-Search-Eignung hängt mehr am Setup als am Tool
Multi-Modal-Use-Cases nur grob umrissen, hier braucht es einen separaten Vergleich
Cloud-Tier-Preise und Self-Host-TCO sind nicht 1:1 vergleichbar

Häufige Fragen

Ist pgvector wirklich produktionsreif für RAG?

Ja. Version 0.9 (April 2026) mit HNSW-Index und der pgvectorscale-Extension von Timescale machen pgvector für RAG bis 100M Vektoren konkurrenzfähig. Sehr verbreitet in CH-KMU 2026, oft die erste Wahl wenn schon Postgres im Stack ist.

Wann lohnt sich Qdrant trotz Postgres?

Drei Fälle: (a) über 5M Vektoren mit harter Latenz-Anforderung, (b) komplexe payload-Filter (Mandant + Vertraulichkeit + Datum kombiniert), (c) wenn die Postgres-Hauptdatenbank schon hoch ausgelastet ist und die Vektor-Last separat skaliert werden muss. Sonst pgvector.

Brauche ich Weaviate für Hybrid-Search?

Nein, Qdrant kann Hybrid-Search seit Version 1.10 (2025). pgvector kombiniert mit Postgres-Full-Text-Search (tsvector) ist eine weitere Option. Weaviate hat den elegantesten eingebauten Pfad, aber kein Monopol mehr. Wahl hängt von Multi-Modal-Bedarf ab.

Wo hoste ich die Vektor-DB in der Schweiz?

Self-host auf Exoscale Zürich oder Infomaniak Geneva für reine CH-Residenz. Hetzner Falkenstein (DE) ist EU und reicht für revDSG, für FINMA-nahe Mandate aber meiden. Pgvector läuft mit jedem Postgres; Qdrant und Weaviate als Docker-Container überall, wo Docker läuft.

Quellen

Qdrant – Documentation and benchmarks · 2026-05
Weaviate – Documentation · 2026-05
pgvector – GitHub repository (Andrew Kane) · 2026-05
Vector Database Benchmarks 2026 – pgvector 0.9, Qdrant, Weaviate, Milvus, LanceDB · 2026-04
pgvectorscale – Timescale extension · 2026-03

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen