fairlane.systems

MISTRAL LARGE · TECH

Mistral Large 2 und Mistral Small 3.1: das EU-Modell-Paar mit FR/DE/IT-Stärke

Mistral Large 2 (123B) und Mistral Small 3.1 von der französischen Mistral AI. La Plateforme, Azure-EU, AWS Bedrock. Research- oder kommerzielle Lizenz.

Recherche & Faktencheck: · Stand: 2026-05

Was ist Mistral Large 2?

Mistral Large 2 ist das Flaggschiff-Sprachmodell der französischen Firma Mistral AI, ursprünglich im Juli 2024 veröffentlicht und Mai 2026 in der Version 24.11 (mit Updates Februar und Mai 2026) verfügbar. Es ist ein dichtes Transformer-Modell mit 123 Milliarden Parametern und einem Context-Fenster von 128.000 Tokens. Die Lizenz: Mistral Research License für Self-Host (nicht-kommerziell), Mistral Commercial License für kommerzielle Nutzung – beide über mistral.ai zugänglich.

Mistral AI wurde 2023 in Paris gegründet und ist Mai 2026 ein Schlüssel-Akteur im europäischen KI-Markt. Anders als die US-Modelle (das aktuelle GPT-Spitzenmodell, das aktuelle Claude-Spitzenmodell) und chinesische Modelle (DeepSeek, Qwen) hat Mistral seinen Sitz in der EU, mit Hauptquartier in Paris, Rechenzentrums-Partnerschaften in Frankreich und Deutschland und einer expliziten EU-AI-Act-Compliance-Strategie. Für Schweizer Setups mit EU-Daten-Residency-Anforderung ist das ein direktes Argument.

Die Mistral-Modell-Familie Mai 2026 ist breit. Neben Mistral Large 2 (123B, premium) und Mistral Small 3.1 (24B, mid-tier) gibt es Codestral 25 (24B, Code-spezialisiert, NVIDIA-Partnerschaft), Pixtral Large (multimodal, Bild + Text), Ministral 8B (Edge-Variante) und mehrere Reasoning-spezialisierte Varianten. Stand Mai 2026 ist eine kommende Mistral-Large-Generation angekündigt, aber noch nicht released – Updates der bestehenden Modelle sind aber regelmässig.

Mistral Small 3.1 (März 2026, Apache-2.0-Lizenz!) ist eine wichtige Variante. Mit 24 Milliarden Parametern und 128k Context ist es die meist-eingesetzte Open-Weight-Variante für EU-Setups. Performance: nahe an GPT-4o-Mini bei deutlich geringeren Kosten und voller Self-Host-Option. Mistral Small 3.1 ist Apache 2.0 – die saubererste Lizenz für kommerzielle Self-Host-Setups in der Mistral-Familie.

Verfügbarkeit Mai 2026: La Plateforme (Mistral-eigene API, mit Frankreich-Hosting), Azure AI Foundry (Region Frankreich Central, Schweden Central), AWS Bedrock (Region Frankfurt, Paris), Google Vertex (Region europe-west). Self-Host via Hugging Face (mistralai/Mistral-Large-Instruct-2411, mistralai/Mistral-Small-3.1-Instruct).

Warum Mistral für CH-Daten zählt

Mistral ist Mai 2026 die natürliche Erstwahl für Schweizer Setups mit EU-Daten-Residency-Anspruch und FR/DE/IT-Sprach-Anforderung – aus fünf konkreten Gründen.

Erstens: EU-Origin und EU-AI-Act-Compliance. Mistral hat als EU-Firma die strengen EU-Datenschutz- und AI-Act-Pflichten in die Produkt-Strategie integriert. Modell-Karten, technische Dokumentation und Trainings-Daten-Beschreibungen sind nach EU-Standard verfasst. Für den DPIA nach DSGVO Art. 35 / DSG Art. 22 ist die Vorlage einfacher als bei US-Modellen, wo eine TIA für Drittland-Transfer dazukommt.

Zweitens: Sprach-Stärke auf EU-Sprachen. Mistral hat sein Modell mit signifikantem Anteil an Französisch, Deutsch, Italienisch und Spanisch trainiert. Auf MGSM (multilinguale Mathematik) und auf FRA-Recht-Benchmarks ist Mistral Large 2 Mai 2026 die produktiv beste Option unter den Open-Weight-Modellen. Für Schweizer Treuhand-Buros mit Romandie-Bezug oder Tessiner Mandate ist Mistral typisch die richtige Wahl – Apertus ist auf FR/IT-Augenhöhe, aber bei FR-spezifischen juristischen Texten zählt jede Nuance.

Drittens: zwei-Modell-Strategie ist operativ einfach. Mistral Small 3.1 für Standard-Workloads (Klassifikation, Triage, einfache Generierung), Mistral Large 2 für komplexe Reasoning-Fälle. Beide über die gleiche API. Routing über LiteLLM. Die operative Kohaerenz ist höher als bei einem Mix verschiedener Hersteller.

Viertens: Hosting-Optionen in der EU sind zahlreich. La Plateforme in Paris-Region (Frankreich), Azure in Frankreich Central oder Schweden Central, AWS Bedrock in Frankfurt oder Paris, Self-Host in Schweizer Rechenzentrum bei Infomaniak oder eigenem Rack. Diese Vielfalt erlaubt eine genau passende Architektur – von "alle Daten in CH-Rack" bis "EU-Cloud mit SLA".

Fünftens: Mistral Small 3.1 ist Apache 2.0. Das ist die saubererste Lizenz-Konstellation: Self-Host ohne kommerzielle Einschränkungen, ohne Research-Klausel, ohne 700M-MAU-Schranke. Für KMU-Setups mit klarer Lizenz-Diszip ist das attraktiv.

Grenzen: Romansh und Schwizerdütsch sind nicht trainiert. Hier bleibt Apertus die richtige Wahl. Komplexes Reasoning auf Top-Frontier-Niveau (das aktuelle GPT-Spitzenmodell, das aktuelle Claude-Spitzenmodell) liegt noch leicht über Mistral Large 2 – der Unterschied ist Mai 2026 aber kleiner geworden.

Mistral in der Praxis

Architektur. Mistral Large 2 ist ein dichtes Transformer-Decoder-Modell mit Grouped-Query-Attention und Sliding-Window-Attention für effiziente Long-Context-Verarbeitung. 123B Parameter, 128k Context. Mistral Small 3.1 ist ebenfalls dicht (kein MoE), 24B Parameter, 128k Context. Beide unterstützen Tool-Use im OpenAI-Schema, strukturierten JSON-Output und Function-Calling.

Setup-Beispiel via La Plateforme. Direkter API-Zugriff:

```python from mistralai import Mistral import os client = Mistral(api_key=os.environ["MISTRAL_API_KEY"]) response = client.chat.complete( model="mistral-large-latest", messages=[{"role": "user", "content": "Fasse den DSG Art. 6 zusammen."}], ) print(response.choices[0].message.content) ```

La Plateforme bietet Mai 2026 Preise von etwa EUR 2-3 pro 1M Input-Tokens und EUR 6-9 pro 1M Output-Tokens bei Mistral Large 2. Mistral Small 3.1 ist deutlich günstiger: EUR 0.1-0.2 pro 1M Input.

Self-Host-Beispiel mit vLLM. Mistral Small 3.1 auf einer RTX 4090 24GB:

``` docker run --gpus all -p 8000:8000 \ vllm/vllm-openai:v0.6.3 \ --model mistralai/Mistral-Small-3.1-Instruct \ --max-model-len 32768 \ --quantization awq \ --gpu-memory-utilization 0.92 ```

Für Mistral Large 2 (123B) braucht es zwei H100 80GB mit Tensor-Parallel und AWQ-4-Bit-Quantisierung.

Azure AI Foundry. In Region Frankreich Central oder Schweden Central via Azure-OpenAI-kompatibler Endpunkt-Wrapper. Vorteil: Microsoft EU-Vertrag, Standard-Vertragsklauseln nach EU-Modell-Vorlage, SOC2 / ISO 27001 Zertifizierungen vorhanden. Kosten pro 1M Tokens vergleichbar mit La Plateforme.

AWS Bedrock. In Region Frankfurt (eu-central-1) oder Paris (eu-west-3) via bedrock-runtime API mit IAM-Authentifizierung. AWS-DPA und EU-Modell-Standardvertrag verfügbar.

Routing-Architektur Mai 2026. Eine typische Schweizer Multi-Provider-Strategie sieht so aus: LiteLLM-Proxy als Frontend. Drei Provider angemeldet: (a) "mistral-large-eu" via La Plateforme, (b) "mistral-small-local" via vLLM-Self-Host, (c) "apertus-70b" via Swisscom-API oder Self-Host. Routing-Regeln nach Anfrage-Typ: einfache Klassifikation an Mistral Small (kostenoptimal), komplexes FR/DE/IT-Reasoning an Mistral Large 2, RM/Schwizerdütsch oder maximale Souveränität an Apertus.

Vision-Fähigkeit via Pixtral Large. Mistral hat mit Pixtral Large ein Vision-Sprache-Modell veröffentlicht – für Schweizer Beleg-Foto-Workflows und Vertrags-Scan eine Option neben Llama 4 Scout.

Mistral produktiv in 5 Schritten

  1. 01Use-Case-Analyse: welcher Sprach-Mix (FR/DE/IT/EN), welche Workload-Klasse (Klassifikation, Reasoning, Long-Context), welche Daten-Residency-Anforderung (EU oder CH-strikt)?
  2. 02Modell-Wahl: Mistral Small 3.1 für Standard-Workloads und Cost-Sensitivity, Mistral Large 2 für komplexes Reasoning oder mehrsprachige Präzision.
  3. 03Hosting-Pfad: La Plateforme (schnell, FR-Hosting), Azure Frankreich/Schweden (Enterprise-Verträge), AWS Bedrock Frankfurt (vorhandene AWS-Infrastruktur), Self-Host via vLLM (volle Souveränität).
  4. 04LiteLLM-Anbindung: Mistral als Provider eintragen, logische Modell-Namen (mistral-large-eu, mistral-small-local), Routing-Regeln nach Anfrage-Typ und Sensibilität.
  5. 05Use-Case-Benchmark: 50-100 echte CH-typische Anfragen gegen Mistral, Apertus und Claude vergleichen, Treffer-Quote messen, finale Routing-Konfiguration ableiten.

Wann Mistral einsetzen

Mistral ist die richtige Wahl, wenn (a) FR/DE/IT-Sprach-Stärke gefragt ist (Romandie-Mandate, Tessiner Fälle, EU-weite Treuhand-Arbeit), (b) EU-Daten-Residency mit klaren EU-Verträgen verlangt wird, oder (c) eine kostenoptimale Open-Weight-Variante mit Apache-2.0-Lizenz gesucht wird (Mistral Small 3.1).

Konkrete Fälle: Treuhand-Büro in Genf mit FR-sprachiger Mandanten-Kommunikation – Mistral Large 2 via La Plateforme. Anwalts-Kanzlei in Lugano mit IT-FR-DE-Mischmandat – Mistral Large 2 für komplexe Fälle, Mistral Small 3.1 für Standard-Triage, beide über LiteLLM-Routing. EU-weit tätige Beratungs-Boutique mit DSGVO-strenger Kunden-Datenpolitik – Mistral via Azure Frankreich Central mit EU-Modell-Standardvertrag.

Für kostenoptimale Self-Host-Setups in Schweizer KMU ist Mistral Small 3.1 besonders attraktiv. Apache-2.0-Lizenz, 24B Parameter, läuft auf einer einzelnen RTX 4090 oder L40S, Performance nahe GPT-4o-Mini, voll EU-konform. Eine Treuhand mit zehn Mitarbeitenden kann auf einer eigenen Workstation Mistral Small 3.1 betreiben und 80 Prozent der Standard-Workloads damit abdecken.

Wann NICHT

Für Romansh und Schwizerdütsch ist Apertus die natürliche Wahl, nicht Mistral. Mistrals Trainings-Daten haben CH-spezifische Sprach-Variationen nur am Rand erfasst.

Für Setups mit maximaler CH-Daten-Souveränität (alle Daten müssen in der Schweiz bleiben, kein Auslands-Hosting) ist Mistral nur als Self-Host eine Option – La Plateforme und Azure-Frankreich-Hosting sind EU, aber nicht CH. Hier bleibt Apertus mit Swisscom-API oder Self-Host die Erstwahl.

Für Top-Frontier-Reasoning (Mathematik-Olympiade-Niveau, schwierige juristische Argumentations-Kette mit drei bis vier Schritten) ist das aktuelle Claude-Spitzenmodell oder das aktuelle GPT-Spitzenmodell noch leicht voraus. Mistral Large 2 ist nahe an, aber nicht an der Spitze.

Für Long-Context-Workloads über 128k Tokens hinaus ist Llama 4 Scout mit 10M die richtige Wahl, nicht Mistral.

Für reine Hobby-Erkundung ohne Produktiv-Ambition ist die Mistral-Research-License-Klausel beim Self-Host von Mistral Large 2 ein Vorbehalt – Mistral Small 3.1 (Apache 2.0) löst das für KMU-Workloads.

Vor- und Nachteile

STÄRKEN

  • EU-Origin mit klarer EU-AI-Act-Compliance-Strategie
  • Sehr starke FR/DE/IT/EN-Fähigkeit, beste EU-Sprach-Performance unter Open-Weight-Modellen
  • Mistral Small 3.1 ist Apache 2.0 – saubere Lizenz für kommerzielle Self-Host-KMU-Setups
  • Vielzahl von Hosting-Optionen: La Plateforme, Azure EU, AWS Bedrock EU, Self-Host

SCHWÄCHEN

  • Mistral Large 2 verlangt Research- oder kommerzielle Lizenz – komplexer als Apache 2.0
  • Romansh und Schwizerdütsch nicht trainiert – für CH-spezifische Sprach-Fälle bleibt Apertus voraus
  • Top-Frontier-Reasoning leicht hinter dem aktuellen Claude-Spitzenmodell und dem aktuellen GPT-Spitzenmodell
  • Mistral hat US-Investoren – für streng souveräne EU-Setups ein Diskussions-Punkt

Häufige Fragen

Welche Lizenz hat welches Mistral-Modell?

Mai 2026: Mistral 7B (Apache 2.0), Mistral Small 3.1 24B (Apache 2.0!), Codestral 25 (Mistral Non-Production License für Self-Host, kommerziell via API), Mistral Large 2 123B (Mistral Research License für Self-Host nicht-kommerziell, Mistral Commercial License für Produktion), Ministral 8B (Mistral Research License). Für KMU mit Apache-2.0-Präferenz: Mistral 7B oder Mistral Small 3.1.

Wie viel kostet Mistral Large 2 via La Plateforme?

Stand Mai 2026: ca. EUR 2-3 pro 1M Input-Tokens, EUR 6-9 pro 1M Output-Tokens für Mistral Large 2. Mistral Small 3.1 deutlich darunter (EUR 0.1-0.2 Input, EUR 0.3-0.6 Output). Volumen-Discounts auf Anfrage. Vergleich Mai 2026: das aktuelle GPT-Spitzenmodell etwa EUR 4-12 / 1M, das aktuelle Claude-Spitzenmodell etwa EUR 5-25 / 1M, Apertus 70B via Swisscom etwa CHF 0.4-1.5 / 1M.

Kann ich Mistral fine-tunen?

Mistral bietet ein eigenes Fine-Tuning-Programm via La Plateforme (Mistral Fine-tuning API), wo LoRA-Fine-Tunes auf Mistral-Modellen gegen Bezahlung trainiert werden. Self-Host-Fine-Tuning ist bei Apache-2.0-Modellen (Mistral 7B, Mistral Small 3.1) erlaubt. Bei Mistral Large 2 unter Research License ist Fine-Tuning erlaubt für Forschung, Production verlangt die kommerzielle Lizenz.

Wie steht Mistral gegen Apertus?

Auf MMLU und allgemeinem Reasoning sind Mistral Large 2 und Apertus 70B Mai 2026 ungefähr gleichauf (jeweils 80-82 Punkte). Auf reinem Französisch ist Mistral leicht voraus, auf Romansh und Schwizerdütsch ist Apertus klar voraus. EU-Daten-Residency: beide gut (Apertus mit CH-Bonus, Mistral mit FR-/EU-Hosting). Lizenz: Apertus durchgehend Apache 2.0, Mistral nur kleinere Modelle Apache 2.0. Trainings-Daten-Transparenz: Apertus klar voraus.

Verwandte Themen

APERTUS · COMPLIANCEApertus: das offene Schweizer KI-Modell von ETH Zurich, EPFL und CSCS – Stand Mai 2026OPEN-WEIGHT-MODELLE - VERGLEICHOpen-Weight-Modelle im Vergleich: Llama 3.3/4, Mistral, DeepSeek, Qwen, Gemma, Phi-4, Command R, Falcon, GLM, ApertusLLAMA 4 · TECHLlama 4 Scout und Maverick: Metas MoE-Familie mit 10M-Context und 400B-Total-ParameternVLLM · TECHvLLM: Production-Serving für Open-Weight-LLMs mit hoher Throughput und PagedAttentionSELF-HOSTED VS. CLOUD · AI-KONZEPTSelf-Hosted vs. Cloud-LLM: Entscheidungs-Framework für KMU und TreuhandOLLAMA · TECHOllama: lokale LLMs auf eigener Hardware – wo es funktioniert und wo nichtLITELLM · TECHLiteLLM: ein Gateway für 100+ LLM-Anbieter mit einer einzigen API

Quellen

  1. Mistral AI – official models and pricing · 2026-05
  2. Mistral Large 2 – Hugging Face model card · 2026-05
  3. Mistral Small 3.1 – Apache 2.0 release notes · 2026-03
  4. Mistral La Plateforme – API documentation · 2026-05

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen