CH-MEHRSPRACHIGKEIT · COMPLIANCE
KI und Schweizer Mehrsprachigkeit: LLMs für Deutsch, Französisch, Italienisch und Rätoromanisch
Sprachverteilung CH (Stand 2025): DE 62.8%, FR 22.9%, IT 8.2%, RM 0.5%. Welche Modelle die vier Landessprachen plus Schweizerdeutsch beherrschen – Stand Mai 2026.
Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05
Was bedeutet "CH-fähig" bei einem LLM?
Die Schweiz hat vier offizielle Landessprachen. Stand 2025 verteilt sich die Wohnbevölkerung nach Bundesamt für Statistik wie folgt: Deutsch 62.8 Prozent, Französisch 22.9 Prozent, Italienisch 8.2 Prozent, Rätoromanisch 0.5 Prozent. Englisch ist keine Amtssprache, wird aber zunehmend in der Geschäftswelt verwendet (rund 45 Prozent der erwerbstätigen Bevölkerung gibt regelmässige Nutzung an).
Für ein Sprachmodell heisst "CH-fähig" mehr als nur "Deutsch verstehen". Es geht um Hochdeutsch in der Schweizer Variante (Helvetismen: Velo, Trottoir, Coiffeur, parkieren, Treuhand), um Schweizer Eigennamen (Kantone, Gemeinden, kantonale Behörden mit Genitiv-Konstruktionen), um den Dialekt-Hochdeutsch-Wechsel in geschäftlichen Kontexten, und um juristische Fachsprache aus Schweizer Quellen (Fedlex, EDÖB, FINMA). Bei Französisch ist die Trennung zwischen Frankreich-Französisch und Schweizer Romand wichtig (huitante statt quatre-vingts in einigen Kantonen, dejeuner-Bedeutung). Bei Italienisch zählt das Tessiner Italienisch mit römischen Lehnformen und administrativen Begriffen.
Schweizerdeutsch in geschriebener Form ist eine Sonderfrage. Es gibt keine standardisierte Orthografie – Schreibweisen variieren zwischen Kantonen und Generationen. Ein LLM, das auf E-Mails reagieren soll, muss "Gruezi", "Hoi zaeme", "merci villmal" als gültige Anreden erkennen, ohne sie zu übersetzen oder zu "korrigieren". Audio ist noch heikler: Spracherkennung (Whisper large-v3, Apertus Audio) kann Berner, Zürcher und Walliser Dialekt unterschiedlich gut transkribieren.
Warum CH-Mehrsprachigkeit für KI-Projekte zählt
Drei Gründe machen die Sprachfrage zum Risiko-Faktor – nicht zur Nettigkeit.
Erstens: Mandanten-Wirkung. Ein Treuhand-Büro in Genf, Lugano oder Chur kann Mandanten nicht zwingen, auf Deutsch zu kommunizieren. Wenn die KI-gestützte Mandanten-Antwort nur in Hochdeutsch funktioniert, fällt das Büro in der Romandie und im Tessin sofort durch. Schweizer Treuhand-Verbände (TREUHAND SUISSE, EXPERTsuisse, fiduciaire|suisse) sind dreisprachig organisiert – entsprechend müssen unterstützende Werkzeuge das auch sein.
Zweitens: rechtliche Verpflichtung in mehreren Sektoren. Behörden-Kommunikation und Verträge in der mehrsprachigen Schweiz folgen Sprach-Vorgaben (Sprachengesetz SR 441.1, Sprachenverordnung SR 441.11). Banken und Versicherungen müssen kundenrelevante Dokumente in der Mandantensprache anbieten, was bei automatisierter Korrespondenz eine Modell-Wahl mit FR/IT-Qualität erzwingt. Im Strafrecht ist nach BV Art. 31 Abs. 2 die Information in einer verstandenen Sprache Pflicht.
Drittens: Qualität ist nicht symmetrisch. Selbst Top-Modelle (das jeweils aktuelle GPT-Spitzenmodell, das aktuelle Claude-Spitzenmodell, Gemini 2.5) sind in Deutsch deutlich stärker als in Italienisch oder in Schweizer Romand. Wer ein Modell rein nach Englisch-Benchmarks (MMLU, HumanEval) auswählt, riskiert in produktiver CH-Nutzung Fehlerraten 3-5x über der Erwartung. Multilinguale Benchmarks (MGSM, XNLI, Belebele) sind unerlässlich.
Modell-Vergleich CH-Sprachen Stand Mai 2026
Die folgende Übersicht stützt sich auf MGSM-Werte, eigene Evaluations-Lauflisten und öffentliche Benchmark-Tabellen (Hugging Face Open LLM Leaderboard, MMLU-Pro multilingual, SwissLegalBench).
Deutsch (Hochdeutsch CH-Variante): Sehr gut: das jeweils aktuelle GPT-Spitzenmodell, das aktuelle Claude-Spitzenmodell, Gemini 2.5, Mistral Large 2, Apertus 70B. Brauchbar: Llama 4 70B, Command R+, DeepSeek V3. Schwach: kleine 7B-Modelle ohne deutschen Datenanteil. Helvetismen-Erkennung ist bei dem aktuellen Claude-Spitzenmodell und Apertus am besten, weil diese Modelle gezielt mit Schweizer Korpora trainiert wurden (CH-Bundesrats-Protokolle, Tages-Anzeiger, NZZ-Archiv mit Lizenz).
Französisch (mit Schweizer Romand): Spitze: Mistral Large 2 (Mistral AI, Paris – bestes FR/DE-Modell), das aktuelle Claude-Spitzenmodell, das jeweils aktuelle GPT-Spitzenmodell. Apertus 70B liegt auf Augenhöhe mit Mistral für FR, weil EPFL/ETH Zurich Korpora aus der Romandie eingebunden hat. Schweizer Eigennamen (Kantone, communes vaudoises) sind bei Apertus und Mistral am genauesten.
Italienisch (mit Tessiner Italienisch): Solide: das jeweils aktuelle GPT-Spitzenmodell, das aktuelle Claude-Spitzenmodell, Gemini 2.5, Mistral Large 2. Italienisch ist die schwächste der drei dominanten CH-Sprachen in praktisch allen Modellen – Trainings-Daten-Anteil ist 5-8x kleiner als bei Deutsch oder Französisch. Tessiner Italienisch wird oft als toskanisches Italienisch interpretiert; lokale Verwaltungs-Begriffe (Comune politico, Patriziato, Cancelleria dello Stato) sind nicht zuverlässig erfasst.
Rätoromanisch (Sursilvan, Sutsilvan, Surmiran, Puter, Vallader, Rumantsch Grischun): Nur Apertus 70B liefert akzeptable Qualität, weil die ETH Zurich gezielt RM-Korpora der Lia Rumantscha eingebunden hat. Das jeweils aktuelle GPT-Spitzenmodell und das aktuelle Claude-Spitzenmodell erkennen RM, machen aber im Schnitt 30-50 Prozent Fehler in der Flexion. Praktische Empfehlung Mai 2026: RM-Workflows über Apertus und mit menschlicher Endredaktion.
Schweizerdeutsch (Audio): Whisper large-v3 erkennt Berner und Zürcher Dialekt mit Wort-Fehlerrate (WER) 18-25 Prozent, Walliser und Bundner Dialekt mit 35-45 Prozent. Apertus Voice (in Entwicklung Mai 2026, noch nicht produktiv) ist auf RM und CH-DE-Dialekte spezialisiert, aber noch nicht öffentlich. Für produktive Telefon-Transkription ist Whisper plus Re-Editing aktuell Stand der Praxis.
CH-Mehrsprachigkeit prüfen in 6 Schritten
- 01Mandanten- und Use-Case-Sprachen kartieren: welche Anteile DE/FR/IT/RM/EN treten produktiv auf?
- 02Modell-Kandidaten benchmarken auf MGSM und auf 50-100 realen Mandantentexten pro Sprache (synthetisch oder anonymisiert).
- 03Helvetismen-Liste anlegen: 30-50 typische CH-Begriffe (Velo, Treuhand, Bezirksgericht, AHV-Nummer) als Sanity-Check.
- 04Routing-Setup definieren: pro Sprache primäres Modell (Mistral Large 2 für FR, Apertus für RM/CH-DE, das aktuelle Claude-Spitzenmodell für DE/IT) plus Fallback.
- 05Audio-Pipeline: Whisper large-v3 für Telefon-Transkription, mit Wort-Fehlerrate-Tracking pro Dialekt-Region.
- 06Periodischer Re-Test alle 6 Monate, weil neue Modellversionen (Apertus 2, eine kommende Mistral-Large-Generation, das aktuelle Claude-Modell) die Rangliste verschieben.
Wann mehrsprachige Modell-Wahl Pflicht ist
Pflicht ist die mehrsprachige Prüfung in vier Fällen.
Erstens: Mandanten in der Romandie oder im Tessin. Wer Mandanten in den Kantonen Genf, Waadt, Neuenburg, Jura, Fribourg, Wallis, Tessin oder Graubünden bedient, muss FR- bzw. IT-Fähigkeit prüfen. Ein Routing-Setup, das je nach Mandantensprache an Mistral Large 2 (FR), Apertus 70B (RM/CH-DE) oder das aktuelle Claude-Spitzenmodell (DE/IT) verteilt, ist Standard bei Schweizer Beratungs-Boutiquen Mai 2026.
Zweitens: Behörden-Kommunikation und Vertragsentwürfe. Vertragsentwürfe und Schriftverkehr mit Schweizer Behörden müssen in der jeweiligen Amtssprache verfasst sein – fehlerhafte Konjugation oder falsche Begriffe (z.B. "Notar" vs "notaire" vs "notaio" mit kantonalen Unterschieden) fällt sofort auf und untergraebt das Vertrauen.
Drittens: Telefon- und Voicebot-Setups. Eine Schweizer Hotline muss DE/FR/IT bedienen, mindestens. RM-Fähigkeit ist Plus-Punkt, aber selten Pflicht (eingeschränkter Kreis von Sprechern).
Viertens: Audit- und Buchhaltungs-Workflows. Lieferanten-Rechnungen kommen in allen vier Landessprachen plus Englisch. Belegerkennung-OCR mit nachgelagerter LLM-Klassifikation muss alle Sprachen handhaben – was bei kleinen Modellen oft an Italienisch oder RM scheitert.
Wann eine einsprachige Lösung reicht
Drei Konstellationen lassen sich legitim einsprachig fahren.
Ein reines Deutschschweizer Büro mit Mandanten ausschliesslich aus DE-Kantonen (ZH, BE-Mitte, AG, BS, BL, LU, OW, NW, UR, SZ, ZG, SO, SH, TG, AR, AI, SG, GL): hier ist die FR/IT-Fähigkeit eine Reserve, kein produktiver Pfad. Ein Modell mit starkem Deutsch reicht.
Interne Tools ohne Mandanten-Berührung – z.B. Code-Generierung, interne Recherche, technische Dokumentation in Englisch: hier zählt die Englisch-Qualität, Schweizer Mehrsprachigkeit ist sekundär.
Proof-of-Concept-Phase: ein PoC mit Hauptsprache Deutsch ist legitim, solange in der nächsten Phase (Pilot mit echten Mandanten) eine FR/IT-Erweiterung im Roadmap steht.
Dies ist keine Rechtsberatung. Sprachen-Anforderungen aus Sektoren-Regulierung (FINMA, ESTV, KESB) erfordern juristische Beratung – die hier genannten Hinweise sind nicht abschliessend.
Vor- und Nachteile
STÄRKEN
- Apertus deckt RM und CH-DE-Dialekte besser ab als jedes Cloud-Modell
- Mistral Large 2 liefert Top-FR-Qualität mit EU-Hosting-Option
- Multi-Provider-Routing erlaubt pro Sprache das jeweils beste Modell
- Klare Sprach-Compliance (Sprachengesetz, Mandanten-Sprachen-Anspruch) ist erfüllbar
SCHWÄCHEN
- Italienisch bleibt die schwächste der drei dominanten CH-Sprachen über alle Modelle
- Schweizerdeutsch in Audio hat 18-45 Prozent WER – nicht verbatim-tauglich
- Multi-Provider-Routing erhöht operationelle Komplexität und Compliance-Aufwand
- Apertus-Voice noch nicht produktiv – RM-Audio bleibt Mai 2026 schwach
Häufige Fragen
Welches Modell ist Mai 2026 das beste für Schweizer Französisch?
Mistral Large 2 von Mistral AI (Paris) liefert die stärksten Resultate auf Romand-Texten. Apertus 70B ist auf Augenhöhe, mit Vorteilen bei Schweizer Eigennamen und kantonalen Verwaltungs-Begriffen. Das aktuelle Claude-Spitzenmodell ist solide, das jeweils aktuelle GPT-Spitzenmodell leicht dahinter. Für EU-Hosting-Pflicht: Mistral Large 2 über Microsoft Azure Region Schweiz Nord oder über Infomaniak.
Kann Whisper Schweizerdeutsch transkribieren?
Eingeschränkt. Whisper large-v3 transkribiert Berner und Zürcher Dialekt mit WER 18-25 Prozent, Walliser/Bundner Dialekt mit 35-45 Prozent. Das reicht für Stichwort-Erkennung, nicht für wortgenaue Protokolle. Empfehlung: Whisper plus menschliche Endredaktion. Reine CH-DE-Speziallmodelle (Apertus Voice, in Entwicklung Mai 2026) sind noch nicht produktiv verfügbar.
Brauche ich für Italienisch ein eigenes Modell?
Selten. Das aktuelle Claude-Spitzenmodell, das jeweils aktuelle GPT-Spitzenmodell, Mistral Large 2 und Gemini 2.5 decken Italienisch akzeptabel ab. Das Risiko liegt bei Tessiner Verwaltungs-Begriffen (Comune politico, Patriziato, Consiglio di Stato) und kantonalen Eigennamen – hier hilft eine Glossar-Datei in der RAG-Pipeline, die solche Begriffe als Pflicht-Vokabular vorgibt.
Wie viele Mandanten sprechen Rätoromanisch überhaupt?
Etwa 40-60 Tausend Personen, primär in Graubünden. Im Kanton GR ist RM Amtssprache neben DE und IT. Praktisch heisst das: ein Treuhand-Büro in Chur oder im Engadin sollte RM-Korrespondenz mindestens lesen können – was Apertus 70B leistet – und für offizielle Schriftstücke einen RM-Lektor (Lia Rumantscha) zuziehen. Reine RM-Generierung ohne menschliche Endkontrolle ist Mai 2026 nicht produktiv.
Verwandte Themen
Quellen
- Bundesamt für Statistik BFS – Sprachen in der Schweiz (Erhebung 2025) · 2026-05
- Sprachengesetz (SpG, SR 441.1) – Fedlex Volltext · 2026-05
- Apertus Modell-Card ETH Zurich/EPFL/CSCS · 2026-05
- Mistral AI – Mistral Large 2 Modell-Card · 2026-05
- OpenAI Whisper large-v3 Modell-Card · 2026-05
- Lia Rumantscha – RM-Korpora und Sprach-Standards · 2026-05
PASSEND ZU IHREM STACK?