VOYAGE AI · TECH
Voyage AI: spezialisierte Embedding-API für RAG-Setups
Voyage AI ist ein 2024 von MongoDB übernommener Embedding-Provider. voyage-3 kostet USD 0.06 pro 1M Tokens und gehört Mai 2026 zu den stärksten RAG-Modellen.
Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05
Was ist Voyage AI?
Voyage AI ist ein 2023 gegründetes US-Unternehmen aus dem Umfeld der Stanford-NLP-Forschung, das sich ausschliesslich auf Embeddings und Reranker für Retrieval-Aufgaben spezialisiert hat. Im Februar 2026 wurde Voyage AI von MongoDB übernommen – Teil deren Strategie, Vektor-Search in Atlas zu einem Erstklass-Feature zu machen. Trotz der Übernahme bleibt die API unter voyageai.com unabhängig nutzbar und auch über AWS Bedrock in der Region Frankfurt (eu-central-1) verfügbar.
Die Modellfamilie umfasst (Stand Mai 2026): voyage-3 als generalistisches Flaggschiff (1024 Dimensionen, USD 0.06 pro 1M Tokens), voyage-3-lite als günstige Variante (512 Dimensionen, USD 0.02 pro 1M Tokens), voyage-multimodal-3 mit Text-und-Bild-Verständnis, voyage-code-3 für Code-Repositories, voyage-law-2 für juristische Texte (mit explizitem Training auf US-Case-Law, Verträgen und Statutes) und voyage-finance-2 für Finanz-Dokumente. Diese Domain-Spezialisierung ist im Mai 2026 ein Alleinstellungsmerkmal – kein anderer Embedding-Provider liefert vier domänenspezifische Modelle in der Qualität.
Voyage AI fokussiert sich auf einen Aspekt, in dem viele Generalisten schwach sind: Retrieval-Qualität auf realen RAG-Lasten. Das Trainingsregime nutzt sehr viel Web-MS-MARCO-Style-Daten plus eigene Kuratierung. Auf BEIR und auf den 2025/2026 MTEB-Retrieval-Splits liegt voyage-3 fast immer in den Top-3, oft gleichauf mit Cohere embed-v3 und vor OpenAI text-embedding-3-large. Für rein englische RAG-Setups ist Voyage Mai 2026 oft die nuechtern beste Wahl.
Warum es für die Schweiz wichtig ist
Drei Argumente sind für Schweizer Mandate relevant. Erstens das Preis-Leistungs-Verhältnis. voyage-3 kostet USD 0.06 pro 1M Tokens – das ist ein Drittel von OpenAI text-embedding-3-large bei deutlich besserer Retrieval-Qualität. Eine Treuhand mit 50.000 Dokumenten und durchschnittlich 1000 Tokens pro Dokument zahlt einmalig 3 USD für den gesamten Bestand. Selbst bei kontinuierlicher Re-Ingestion bleiben die Embedding-Kosten unter 30 CHF pro Jahr.
Zweitens die Domain-Modelle. Eine Anwaltskanzlei mit englischsprachiger Mandantschaft kann voyage-law-2 nutzen, ein juristisch trainiertes Embedding-Modell, das auf Case-Law und Vertragsklauseln optimiert ist. Auf juristischen Retrieval-Benchmarks (CaseHOLD, ContractNLI) liefert es 10-15 Prozent mehr Recall@5 als ein generalistisches Modell. Bei Finanz-Daten gilt das gleiche für voyage-finance-2 – relevant für Vermögensverwalter und Family Offices. Die Domain-Modelle sind eine seltene Spezialität, die OpenAI und Cohere bisher nicht anbieten.
Drittens – und das ist der wichtigste Punkt für Schweizer Compliance – EU-Hosting über AWS Bedrock. Voyage AI wird seit Mitte 2025 als Bedrock-Foundation-Model in eu-central-1 (Frankfurt) angeboten. Damit greift der Standard-AWS-DPA und die Daten verlassen die EU nicht. Wer den Standard-Voyage-Endpoint nutzt, hat US-Datenfluss (Voyage betreibt Server in den USA); wer über Bedrock geht, hat EU-Hosting. Diese Distinktion ist im AVV-Wortlaut entscheidend und sollte explizit dokumentiert werden.
Für Mandate unter strenger revDSG-Auslegung oder unter dem Berufsgeheimnis nach StGB Art. 321 bleibt Voyage AI direkt allerdings problematisch, weil der Provider ein US-Unternehmen ist (auch nach der MongoDB-Übernahme). EU-AI-Act-Konformität ist über den Bedrock-Pfad gegeben, aber eine Berufsgeheimnis-konforme Lösung bleibt Self-Hosting mit BGE-M3 oder mxbai.
Wie es funktioniert
Die Voyage-AI-API folgt der gewohnten OpenAI-ähnlichen Konvention: ein POST-Endpoint, der Liste von Strings entgegen nimmt und Liste von Vektoren plus Token-Usage zurückliefert. Auth über einen API-Schlüssel im Authorization-Header.
Eine typische Integration:
```python import voyageai
client = voyageai.Client(api_key="voyage-xxx")
documents = [ "Mandant beansprucht Schadenersatz nach Vertragsbruch.", "Le client reclame des dommages-interets pour rupture de contrat.", ]
resp = client.embed( texts=documents, model="voyage-3", input_type="document", )
vectors = resp.embeddings # 2 x 1024 list of floats ```
Wichtig ist das input_type-Argument: Dokumente sollen mit input_type="document" embedet werden, Suchanfragen mit input_type="query". Anders als bei multilingual-e5, das mit Prefix-Strings arbeitet, ist es bei Voyage ein API-Parameter. Vergessen kostet Recall, genau wie bei E5.
Über AWS Bedrock läuft die Integration anders. Statt voyageai.Client nutzt man boto3 (AWS-SDK) gegen den Bedrock-Endpoint in eu-central-1. Das Aufruf-Schema ist Bedrock-typisch:
```python import boto3, json
bedrock = boto3.client("bedrock-runtime", region_name="eu-central-1")
body = json.dumps({ "texts": documents, "input_type": "document", }) resp = bedrock.invoke_model( modelId="voyage.voyage-3-v1", body=body, ) vectors = json.loads(resp["body"].read())["embeddings"] ```
Damit liegen die Embeddings physisch in der Bedrock-Frankfurt-Region. Wichtig: der Bedrock-Modell-Katalog kann sich ändern, im Mai 2026 ist Voyage als Bedrock-Foundation-Model in eu-central-1 und us-east-1 verfügbar – aktuelle Verfügbarkeit pro Region in der AWS-Konsole prüfen.
Die Modellauswahl folgt einer einfachen Heuristik: voyage-3 für alle Standard-RAG-Fälle, voyage-3-lite für extrem grosse Bestände mit Storage-Druck (halbe Dimensionen sparen Storage), voyage-multimodal-3 für Setups mit Rechnungs-Scans oder Diagrammen, voyage-law-2 oder voyage-finance-2 für domänenspezifische Fälle. Ein Mischbetrieb ist möglich – verschiedene Qdrant-Collections, jede mit dem passenden Modell.
Voyage AI in 5 Schritten produktiv
- 01Modell festlegen: voyage-3 als Default; voyage-3-lite bei Storage-Druck; voyage-law-2 oder voyage-finance-2 bei klarer Domain.
- 02Hosting-Pfad entscheiden: voyageai.com direkt (US-Hosting) oder AWS Bedrock eu-central-1 (EU-Hosting) – bei CH-Mandanten in der Regel Bedrock.
- 03API-Schlüssel oder IAM-Role einrichten, Aufruf-Wrapper in der eigenen Codebase ablegen, input_type=query vs document zwingend setzen.
- 04Qdrant-Collection anlegen mit dimension=1024 (voyage-3) oder 512 (voyage-3-lite), distance=Cosine, Payload-Index auf mandant_id und doc_type.
- 05Eval-Suite gegen Baseline: 30-50 reale Frage/Antwort-Paare in Sprache und Domain des Bestands, Recall@5 und nDCG@10 vergleichen, Differenz quantifizieren.
Wann Voyage AI einsetzen
Voyage AI ist die richtige Wahl, wenn (a) Retrieval-Qualität im Vordergrund steht und Sie bereit sind, einen API-Provider zu nutzen, (b) ein domänenspezifisches Modell (Law oder Finance) einen Recall-Vorteil bringt, (c) EU-Hosting über AWS Bedrock akzeptabel ist, oder (d) die Kombination mit Voyage-Rerank-2 gewünscht ist (sehr günstig und qualitativ stark).
Konkrete Fälle: ein international tätiges Wirtschaftsprüfungs-Büro mit englischsprachiger Mandantschaft, das einen RAG-Assistenten über Prüfberichte und Verbindlichkeits-Memos bauen will. Eine Anwaltskanzlei mit US-orientierter Praxis, die voyage-law-2 für Case-Law-Search nutzt. Ein Vermögensverwalter mit Family-Office-Setup, der voyage-finance-2 für interne Anlage-Research einsetzt. Ein KMU mit grossem Dokumentenbestand und Kostenfokus, das die Voyage-Lite-Variante für Standard-RAG nutzt.
Für Schweizer KMU mit deutsch-französischem Mix ist Voyage AI Mai 2026 zwar gut, aber nicht klar besser als Cohere embed-multilingual-v3 oder BGE-M3. Auf MTEB-DE liegt voyage-3 etwa gleich auf mit BGE-M3. Die wirkliche Stärke spielt Voyage in englisch-dominierten Setups und in den Domain-Modellen aus.
Wann NICHT
Wenn Sie unter Berufsgeheimnis nach StGB Art. 321 arbeiten und Embeddings strikt EU-only oder CH-only fliessen müssen, ist Voyage direkt nicht passend – der Provider sitzt in den USA. Über AWS Bedrock Frankfurt ist EU-Hosting möglich, aber Schweizer Berufsgeheimnis-Auslegung bevorzugt oft Self-Hosting. In dem Fall ist BGE-M3 die bessere Wahl.
Wenn Ihr Bestand mehrheitlich Deutsch ist und Sie keine Domain-Spezialisierung brauchen, ist Cohere embed-multilingual-v3 oder BGE-M3 mindestens gleichwertig und liefert keine US-Bindung. Voyage zahlt sich in DE-Setups nur dann aus, wenn das Voyage-Rerank-Modell ebenfalls genutzt wird (sehr günstig im Kombi-Setup).
Wenn Sie Mehrsprachigkeit mit starkem Italienisch- oder Romanisch-Anteil haben, ist Voyage AI nicht ideal – die mehrsprachige Abdeckung ist gegenüber BGE-M3 oder Cohere etwas schmaler. Italienisch ist gut, Romanisch und Schweizerdeutsch quasi nicht vertreten.
Wenn Sie auf eine null-Konfigurations-Cloud-Lösung mit dem Vertex- oder OpenAI-Standard-SDK bauen, ist Voyage über Bedrock ein Extra-Schritt – Bedrock-Setup, IAM-Policies, separate Authentifizierung. Wer schnellstmöglich Pilot-RAG laufen lassen will und das letzte Prozent Recall nicht braucht, ist mit OpenAI text-embedding-3-small in 30 Minuten produktiv.
Vor- und Nachteile
STÄRKEN
- Sehr starke Retrieval-Qualität, Top-3 auf BEIR und MTEB-EN
- Günstig: USD 0.06 pro 1M Tokens – ein Drittel von OpenAI large
- Domain-Modelle für Law und Finance – Alleinstellungsmerkmal
- EU-Hosting via AWS Bedrock Frankfurt verfügbar
SCHWÄCHEN
- US-Provider – Berufsgeheimnis-Mandate brauchen den Bedrock-Umweg
- Auf Deutsch liegt voyage-3 leicht hinter Cohere embed-multilingual-v3
- input_type-Parameter ist eine häufige Fehlerquelle
- Domain-Modelle sind englisch-zentriert, Deutsch sekundär
Häufige Fragen
Was bedeutet die MongoDB-Übernahme für die API-Stabilität?
Mai 2026 bleibt die Voyage-API unter voyageai.com unverändert nutzbar. MongoDB hat zugesichert, dass Voyage als eigenständiges Angebot bestehen bleibt; die Integration in Atlas erfolgt als zusätzliche Option, nicht als Ersatz. Bei grösseren Mandanten lohnt sich trotzdem ein Vertragsanhang zur API-Verfügbarkeit für mindestens drei Jahre.
Wie gross ist der Qualitätsunterschied zu Cohere embed-v3 auf Deutsch?
In unseren Messungen auf MTEB-DE Mai 2026: Cohere embed-multilingual-v3 führt um 1-2 Punkte nDCG@10. Auf Englisch dreht sich die Reihenfolge – Voyage-3 liegt 1-3 Punkte vor Cohere. Für reine DE-Setups also Cohere bevorzugen; für EN-lastig oder gemischt Voyage.
Sind die Domain-Modelle voyage-law-2 und voyage-finance-2 mehrsprachig?
Begrenzt. Beide sind primär auf US-englische Domain-Daten trainiert; Deutsch wird verstanden, aber nicht optimal. Für Schweizer Juristerei (Bundesgerichts-Urteile, OR, ZGB) ist voyage-3 generalistisch oft besser als voyage-law-2 auf Deutsch. Wenn englische juristische Texte dominieren, schlägt voyage-law-2 alles andere.
Wie hoch sind Rate-Limits auf der Standard-API?
Mai 2026: 300 Requests/Minute und 1M Tokens/Minute auf dem Default-Tier, anhebbar via Sales-Anfrage. Über AWS Bedrock gelten die Bedrock-Modell-Quotas, die in der Region eu-central-1 typischerweise grosszügiger sind. Für Initial-Ingestion grosser Bestände über 1 Mio Dokumente ist eine Tier-Anhebung sinnvoll.
Verwandte Themen
Quellen
PASSEND ZU IHREM STACK?