LLM-PROVIDER · TOOL-VERGLEICH
LLM-Provider im Vergleich: OpenAI, Anthropic, Mistral, Google, Cohere, Meta, DeepSeek, xAI, AWS Bedrock, Azure
Zehn LLM-Provider im direkten Vergleich, sieben Auswahl-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.
Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05
Was ist die Provider-Landschaft Mai 2026?
Sprach-Modelle kommen nicht mehr von einem Anbieter, sondern von einem Markt. Mai 2026 stehen rund zehn ernsthafte Provider zur Wahl – drei US-Hyperscaler (OpenAI, Anthropic, Google), drei spezialisierte API-Anbieter (Mistral aus Paris, Cohere aus Toronto, xAI aus Texas), drei Open-Weight-Vehikel (Meta Llama, DeepSeek, viele Llama-Derivate) und zwei Aggregatoren (AWS Bedrock, Azure OpenAI), die die anderen Modelle hinter einer einheitlichen API hosten.
Für Schweizer KMU ist die Wahl des LLM-Providers die teuerste laufende Entscheidung eines KI-Stacks. Sie bestimmt die Datenresidenz (Daten in der Schweiz, in der EU, in den USA oder in China?), die monatlichen Kosten (USD 0.27 vs. USD 15 pro 1M Output-Tokens), die Reasoning-Qualität (kann das Modell ein komplexes Steuer-Argument durchdenken?) und die rechtliche Stellung gegenüber dem EU AI Act und der revDSG.
Diese Seite ist ein Überblick. Für jeden der wichtigsten Provider existiert eine eigene Deep-Dive-Seite mit Preisen, Modellen, Datenschutz und konkreten Setup-Anleitungen. Klicken Sie auf den Anbieter-Namen in der Tabelle unten, um zur Detail-Seite zu wechseln.
Warum die Wahl wichtig ist
Sieben Achsen entscheiden über Eignung: Hosting-Region, Preis, Kontextfenster, Reasoning, Code-Qualität, Mehrsprachigkeit, AVV/DPA-Verfügbarkeit. Wer die falsche Wahl trifft, bezahlt mit Compliance-Risiko, dreifachen Kosten oder schlechter Antwort-Qualität.
Hosting-Region: Für Treuhand- und Anwaltsmandate ist diese Achse die wichtigste. OpenAI läuft nativ in den USA, über Azure OpenAI gibt es Switzerland-North und Sweden-Central. Anthropic läuft nativ in den USA, über AWS Bedrock auch in eu-central-1 Frankfurt. Google Gemini hat europe-west6 (Zürich!) – der einzige Hyperscaler mit Schweizer Region. Mistral läuft EU-nativ in Paris. DeepSeek hostet ausschliesslich in China – für Mandatsdaten ein absolutes No-Go.
Preis: Mai 2026 reichen Input-Token-Preise von rund USD 0.28/1M (DeepSeek V3.2) bis USD 15/1M (OpenAI o3-pro). Output ist typischerweise 3-5x teurer. Für typische Treuhand-Lasten (200 Anfragen mit je 5.000 Tokens) macht die Wahl zwischen dem aktuellen Claude-Modell Haiku und Claude Opus den Unterschied zwischen CHF 8 und CHF 200 pro Monat.
Kontextfenster: das aktuelle Claude-Spitzenmodell 200k, GPT-4.1 1M (limitiert), Gemini 2.5 Pro 2M, Mistral Large 2 128k. Für RAG-Setups reicht meist 32k. Für „ganzes Dossier in einen Prompt" werden 200k bis 1M wichtig.
Reasoning: o3-pro und Claude Opus mit Extended Thinking dominieren komplexe Reasoning-Tasks. Gemini 2.5 Pro mit Deep Think holt auf. Für reines Klassifizieren und Extrahieren ist Reasoning überzogen – Haiku oder Mistral Small reichen.
Code: Claude Sonnet und Codestral führen bei Code-Generierung. DeepSeek V3.2 überraschend stark. GPT-4o solider Mittelpark.
Mehrsprachigkeit: Anthropic, Google, Mistral exzellent auf DE/FR/IT. OpenAI sehr gut, aber nicht Spitze. xAI Grok schwächer auf Schweizer Hochdeutsch und Schwyzerdütsch.
AVV/DPA: Anthropic, OpenAI, Google, Mistral, Cohere bieten Standard-DPAs an. AWS Bedrock und Azure OpenAI haben Enterprise-AVV mit AVV-Annex und SCCs. DeepSeek-API: kein EU-konformer AVV verfügbar. xAI: rechtliche Lage Mai 2026 unklar, kein dediziertes EU-Tier.
Die zehn Provider im Detail
OpenAI (USA, über Azure-EU auch Schweiz): GPT-4o (USD 2.50 Input / USD 10 Output pro 1M), GPT-4.1 mit 1M Kontext, o3-pro für Reasoning (USD 15/60). Marktführer in Marktanteil und Reichweite. Detail-Seite: openai-gpt-evaluation.
Anthropic (USA, über AWS Bedrock Frankfurt EU): das aktuelle Claude-Modell und 4.7 (Haiku/Sonnet/Opus), Extended Thinking, 200k Kontext. Top in Code, Reasoning, mehrsprachiger Qualität. Detail-Seite: anthropic-claude-evaluation.
Mistral (EU-Paris): Mistral Large 2, Small 3.1, Codestral. EU-Hosting nativ, EUR-Abrechnung. EU-AI-Act Champion, AVV einfach. Detail-Seite: mistral-eu-evaluation.
Google Gemini (GCP, inkl. europe-west6 Zürich): Gemini 2.5 Pro mit 2M Kontext, Flash für hohen Durchsatz. Einziger Hyperscaler mit Schweizer Region. Detail-Seite: google-gemini-evaluation.
Cohere (Toronto, über AWS Bedrock EU): Command R+, R-08-2024, Rerank-3. Enterprise-RAG-fokussiert, sehr gute Mehrsprachigkeit. Detail-Seite: cohere-evaluation.
Meta Llama (Open-Weight, über Groq/Together/Replicate/Self-Host): Llama 4, Llama 3.3 70B Instruct. Kostenlos zum Selbstbetrieb, über Inferenz-Provider sehr günstig. Detail-Seite: meta-llama-evaluation.
DeepSeek (PRC, Hangzhou-Hosting): DeepSeek V3.2 und R1 (Reasoning). Rund USD 0.28/USD 0.42 (V3.2) – extrem günstig. WICHTIG: NICHT für Mandatsdaten via API – China-Hosting, kein EU-AVV. Self-host der offenen Weights ist OK. Detail-Seite: deepseek-evaluation.
xAI Grok (USA): Grok 3, Grok 4. USD 5/15 pro 1M. Twitter/X-Integration. Mai 2026 noch kein EU-Tier, AVV-Status unklar. Für CH-KMU nicht empfehlenswert.
AWS Bedrock (AWS-Regionen inkl. eu-central-1 Frankfurt): Aggregator-Hub für Claude, Mistral Large, Llama, Cohere, AI21, Titan-Embeddings. Enterprise-Default für Mandanten, die ohnehin im AWS-Stack sind.
Azure OpenAI (Azure-Regionen inkl. Switzerland-North und Sweden-Central): GPT-Modelle mit Daten in CH oder EU. Microsoft-Stack-natives Enterprise-Setup, AVV plus SCCs Standard.
Auswahl-Workflow in 7 Schritten
- 01Datenresidenz-Pflicht klären: müssen Daten in der Schweiz bleiben (Azure CH, Vertex Zürich) oder reicht EU (Bedrock, Mistral)? Drittstaaten (US, CN) damit zwingend raus oder rein.
- 02Use-Cases klassifizieren: Triage/Klassifikation (Haiku, Mistral Small), Standard-RAG (Sonnet, Mistral Large, GPT-4o), Reasoning-heavy (o3-pro, Opus, Gemini 2.5 Pro Deep Think).
- 03Kosten-Budget rechnen: erwartete Tokens pro Monat × Modell-Preis. Pro KMU-Setup typisch CHF 10-200/Monat – Modell-Wahl macht 10-20x Differenz.
- 04Mehrsprachen-Profil prüfen: DE/FR/IT dominant → Claude, Mistral, Gemini. EN-only → alle.
- 05AVV/DPA einholen: bei jedem in Frage kommenden Provider die Vorlage abrufen, vom DSB/DPO prüfen lassen, vor Produktion unterschreiben.
- 06Multi-Provider-Setup als Default: LiteLLM oder eigenes Gateway zwischen Anwendung und Provider. Erlaubt jederzeit Fallback und Routing.
- 07PoC mit 30 echten Aufgaben: drei Top-Kandidaten gegen dieselben 30 Aufgaben benchmarken (Qualität + Latenz + Kosten). Erst dann produktiv.
Empfehlung je Anwendungsfall
CH-Treuhand/Anwalt mit Schweizer Datenresidenz-Pflicht: Azure OpenAI Switzerland-North (für GPT-Stack) oder Google Vertex AI europe-west6 Zürich (für Gemini). Beide bieten echte Schweizer Region plus Enterprise-AVV.
CH-KMU, EU-Hosting akzeptabel, beste Reasoning-Qualität: Anthropic Claude Sonnet über AWS Bedrock eu-central-1. Top in DE/FR/IT, AVV einfach via AWS.
CH-KMU mit EU-Vendor-Präferenz: Mistral Large 2 auf La Plateforme Paris. EU-nativ, EUR-Abrechnung, EU-AI-Act-Champion.
RAG-spezialisiert, Enterprise-Setup: Cohere Command R+ über AWS Bedrock. Enterprise-getrimmt für Retrieval, sehr gute Mehrsprachigkeit.
Open-Weight, on-prem-Pflicht, eigene GPU: Llama 4 oder Mistral Large-2-open-weights über Ollama oder vLLM auf Hetzner. Kein Token-Pricing, dafür Hardware-Investition.
Hochvolumige Klassifikations-Tasks, Kostenfokus: Haiku (Claude Haiku, USD 0.80/4 pro 1M) oder Mistral Small 3.1 (EUR 0.20/0.60). Für Triage und Extraktion überzogen, USD 15 für o3-pro.
Multi-Provider-Setup mit Routing: LiteLLM oder Multi-LLM-Gateway. Standard-Anfragen an Haiku/Mistral Small, Reasoning-Anfragen an das aktuelle Claude-Spitzenmodell/o3-pro. Spart 60-80% Kosten ohne Qualitätsverlust.
Forschungs-/Hobby-Setups ohne Mandatsdaten: DeepSeek V3.2 ist extrem günstig und exzellent in Code. ABER: nicht für Mandatsdaten via API – nur self-host der offenen Weights.
Provider, die für CH-KMU ausscheiden
DeepSeek API: Hosting in der Volksrepublik China. Kein EU-AVV möglich, revDSG-konformer Datenexport nicht zu schaffen. Mandatsdaten gehen dort nicht hin. Die offenen Weights kann man on-prem laufen lassen – das ist eine andere Geschichte.
xAI Grok: rechtlicher Status Mai 2026 unklar. Kein dedizierter EU-Tier, kein standardisierter AVV. Für mandatsrelevante Anwendung nicht empfehlenswert.
OpenAI ohne Azure-Bridge: Die direkte OpenAI-API hostet in den USA. Für Schweizer Berufsgeheimnis-Daten ist Standard-OpenAI ein Drittlandtransfer mit ungelöster Schrems-II-Problematik. Lösung: Azure OpenAI Switzerland-North oder Sweden-Central nehmen, nicht api.openai.com direkt.
Anthropic direkt: dasselbe Problem wie OpenAI. Direkte Anthropic-API ist US. Lösung: AWS Bedrock eu-central-1 Frankfurt nehmen.
Self-host ohne Operations-Kapazität: Llama 4 70B braucht eine A100 oder H100, Pflege, Updates, Monitoring. Wer kein DevOps hat, kauft sich mit Self-Host nur Ärger. API ist hier billiger als die Stunden des Inhabers.
Ein Provider für alles: Vendor-Lock-in. Ein KMU sollte mindestens zwei Provider als Fallback haben (z.B. Anthropic primär + Mistral sekundär). Multi-LLM-Gateway erlaubt das in 1-2 Tagen Setup.
Vor- und Nachteile
STÄRKEN
- Schweizer Region verfügbar: Azure OpenAI Switzerland-North + Vertex AI europe-west6 Zürich
- EU-Hosting für fast jeden Provider via Bedrock (eu-central-1) oder Azure
- Open-Weight-Modelle (Llama 4, Mistral, DeepSeek) ermöglichen on-prem ohne Vendor-Lock-in
- Multi-LLM-Routing senkt Kosten um 60-80% bei vergleichbarer Qualität
SCHWÄCHEN
- OpenAI/Anthropic direkt: US-Hosting, Schrems-II-Problem für Berufsgeheimnis
- DeepSeek API: China-Hosting, kein EU-AVV, nicht für Mandatsdaten
- xAI Grok: kein EU-Tier, unklarer AVV-Status, für KMU nicht empfehlenswert
- Self-host (Llama 4 70B, Mistral Large): GPU-Hardware ab CHF 5.000 + Operations-Aufwand
Häufige Fragen
Welcher Provider ist Mai 2026 die beste Allround-Wahl für CH-KMU?
Anthropic Claude Sonnet über AWS Bedrock eu-central-1 Frankfurt. Top-Reasoning, sehr gute Mehrsprachigkeit, EU-Hosting via AWS, AVV-einfach. Für Schweizer-Residenz-Pflicht: Azure OpenAI Switzerland-North mit GPT-4o oder Vertex AI Zürich mit Gemini 2.5 Pro.
Ist DeepSeek wirklich verboten?
Die API ja, für Mandatsdaten. Hosting in China, kein EU-AVV. Die offenen Weights (DeepSeek-V3, R1) sind hingegen permissiv lizenziert und können auf eigener Hardware oder über EU-Inferenz-Provider wie Together AI laufen – dann sind die Daten unter Kontrolle. Es ist die API, nicht das Modell, die das Problem ist.
Lohnt sich Multi-LLM-Routing wirklich?
Ja, fast immer. Ein Treuhand-Stack typisch: 70% einfache Klassifikation (Haiku oder Mistral Small, ~USD 0.80/4 pro 1M), 25% Standard-RAG (Sonnet oder Mistral Large), 5% Reasoning (Opus oder o3-pro). Ohne Routing wären alle Anfragen bei Opus – 5-10x teurer ohne Qualitätsgewinn. LiteLLM oder ein eigenes Gateway zahlt sich in 1-2 Monaten zurück.
Was ändert sich durch den EU AI Act für die Provider-Wahl?
Ab August 2026 (Inkrafttreten Hochrisiko-Bestimmungen) müssen Provider technische Dokumentation, Trainingsdaten-Zusammenfassungen und Risiko-Management bereitstellen. Mistral, Anthropic und Google haben das Mai 2026 weitgehend dokumentiert. DeepSeek und xAI haben das Mai 2026 nicht erfüllt. Für KMU mit Hochrisiko-Einsatz (HR, Schulnoten, Kredit-Scoring) wird das Mai 2026 hinten und vorne wichtig.
Verwandte Themen
Quellen
- Anthropic – Claude Pricing and Models · 2026-05
- OpenAI Pricing – GPT-4o, GPT-4.1, o3-pro · 2026-05
- Mistral La Plateforme – EU Pricing · 2026-04
- Google Vertex AI – Regions (incl. europe-west6 Zurich) · 2026-05
- AWS Bedrock – Available Models and Regions · 2026-05
- Azure OpenAI – Available regions (Switzerland-North) · 2026-05
PASSEND ZU IHREM STACK?