APERTUS · COMPLIANCE

Apertus: das offene Schweizer KI-Modell von ETH Zurich, EPFL und CSCS – Stand Mai 2026

Apertus 8B und 70B, Apache-2.0, von ETH/EPFL/CSCS. Release 2. September 2025, 15T Tokens, 1000+ Sprachen inkl. Schweizerdeutsch und Rätoromanisch. Stand Mai 2026: Praxiserfahrung und Apertus-2-Ausblick.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Was ist Apertus?

Apertus ist das erste vollständig offene grosse Sprachmodell aus der Schweiz. Es wurde von ETH Zurich und EPFL gemeinsam entwickelt, mit Compute-Infrastruktur des Centro Svizzero di Calcolo Scientifico CSCS in Lugano. Der Name "Apertus" ist Latein für "offen" und reflektiert die Veröffentlichungs-Philosophie: Modell-Gewichte, Trainings-Daten-Beschreibung, Trainings-Code und Evaluations-Daten sind unter Apache 2.0 publiziert.

Die erste Release-Welle erfolgte am 2. September 2025 mit zwei Varianten: Apertus-8B (8 Milliarden Parameter, für Edge- und CPU-Inferenz, ca. 16 GB VRAM in fp16) und Apertus-70B (70 Milliarden Parameter, für Cloud-Inferenz, ca. 140 GB VRAM in fp16). Die Modelle wurden auf rund 15 Billionen Tokens trainiert, mit deutlichem Anteil an europäischen Sprachen (Deutsch, Französisch, Italienisch, Englisch) plus 1.000+ weiteren Sprachen. Schweizerdeutsch (Berner, Zürcher, Walliser, Bundner Dialekte) und Rätoromanisch (Sursilvan, Surmiran, Puter, Vallader, Rumantsch Grischun) sind explizit im Trainings-Korpus.

Apertus ist ein "open-weight"-Modell – Gewichte sind frei herunterladbar (HuggingFace, swiss-ai/Apertus-70B und swiss-ai/Apertus-8B). Dazu kommt ein offiziell vom Swisscom betriebenes API-Hosting für kommerzielle Nutzer, das CSCS-Compute-Kapazität nutzt. Das ETH-AI-Center und das EPFL AI Center sind Mai 2026 die akademischen Anker; das CSCS stellt die Trainings-Compute (Alps-Supercomputer mit über 10.000 NVIDIA H100/H200/B200-GPUs).

Warum Apertus für die Schweiz strategisch ist

Vier Gründe machen Apertus zu mehr als nur einem weiteren Open-Weight-Modell.

Erstens: rechtliche Souveränität. Trainings-Daten-Auswahl und Modell-Verhalten unterliegen Schweizer und EU-Recht – insbesondere DSG, EU AI Act, und ETH-internen Daten-Schutz-Standards. Anders als bei US-Modellen (GPT, Claude) oder chinesischen Modellen (DeepSeek, Qwen) gibt es keinen extraterritorialen Zugriffs-Anspruch fremder Behörden auf das Modell oder die Trainings-Daten. Für Mandanten mit hohem Souveränitäts-Anspruch (Berufsgeheimnis, FINMA-Bezug) ist das ein Argument.

Zweitens: Sprach-Abdeckung der Schweiz. Wie im Artikel "KI und Schweizer Mehrsprachigkeit" detailliert: Apertus 70B ist Mai 2026 das einzige Frontier-Modell mit produktiv-tauglicher Rätoromanisch-Fähigkeit und mit Korrektur-Erkennung in CH-Hochdeutsch (Helvetismen, kantonale Eigennamen). Mistral Large 2 ist auf Augenhöhe für FR/DE, aber RM ist Apertus-Domain.

Drittens: Offenheit der Trainings-Daten und Reproduzierbarkeit. Anders als die meisten Open-Weight-Modelle (Llama, Mistral, DeepSeek) publizieren ETH/EPFL die Trainings-Daten-Quellen und das Trainings-Setup vollständig. Das ist relevant für FINMA-AM-08/2024 Säule 3 (Robustheit, Modell-Validierung) und für EU-AI-Act-Art-50 (Transparenz bei General-Purpose-AI). Mai 2026 gilt Apertus als am besten dokumentiertes Frontier-Modell weltweit – auch für US- und EU-Audits attraktiv.

Viertens: Hosting-Optionen in der Schweiz. Apertus läuft via Swisscom-API mit Schweizer Data-Residency, über Infomaniak GPU-Instanzen, oder voll on-premises auf eigener GPU-Hardware (2x H100 80GB minimum für 70B-Inferenz). Für Mandanten mit strenger Daten-Klassifikation ist das voll-souverän umsetzbar – etwas, das bei US-Modellen nicht möglich ist.

Apertus in der Praxis Mai 2026

Modell-Architektur. Apertus ist ein Transformer-Decoder, sehr ähnlich zu Llama 3, mit Grouped-Query-Attention und Rotary Position Embeddings. Context-Window: 128k Tokens bei beiden Varianten. Vocabulary: ~256k Tokens, optimiert für europäische Sprachen plus Romansh. Trainings-Architektur: 15T Tokens auf der ersten Stufe, gefolgt von Supervised Fine-Tuning (SFT) und Direct Preference Optimization (DPO) für Chat-Fähigkeit. RLHF-Komponenten von ETH-internen Annotator-Teams.

Benchmarks Mai 2026. Auf MMLU (englisch, für Vergleichbarkeit) erreicht Apertus-70B etwa 78-82 Punkte (Stand offizielle Modell-Card Sep 2025), vergleichbar mit Llama-3 70B und unter dem jeweils aktuellen GPT-Spitzenmodell/das aktuelle Claude-Spitzenmodell. Auf MGSM (multilingual math) ist Apertus stark in DE/FR/IT, Spitze in RM. Auf SwissLegalBench (Schweizer Recht): Apertus-70B liegt vor Llama-3 70B und nahe an Claude 3.5 Sonnet (Stand 2025), aber unter dem aktuellen Claude-Spitzenmodell (Stand Mai 2026).

Hosting Mai 2026. Drei produktive Pfade.

*Pfad 1: Swisscom-API.* Kommerzielle API mit Schweizer Data-Residency. Preis Mai 2026 nicht öffentlich publiziert, Pilot-Kunden berichten Preis-Korridor 0.4-1.5 CHF pro 1M Tokens für 70B. CSCS-Compute, Token-Kontingente skalierbar. Integration über LiteLLM oder direkte HTTP-API.

*Pfad 2: Infomaniak GPU-Instanzen mit Apertus-Container.* Self-Hosting auf gemieteten H100/L40S-Instanzen. Aufwand mittel: Container-Bereitstellung, vLLM oder TGI als Inference-Server, Monitoring. Kosten ca. CHF 6.000-12.000/Monat für 70B-Setup mit 2x H100.

*Pfad 3: On-premises auf eigener GPU.* Volle Souveränität. Hardware-Investition CHF 80.000-150.000 für 2x H100 80GB plus Server, mit zusätzlichen Strom-, Kühlungs- und Wartungs-Kosten. Lohnt sich ab Workload-Profil von etwa 50M+ Tokens/Monat oder bei hochsensitiven Mandanten (Strafverteidigung, Spital, Vermögens-Beratung).

Apertus 2 (Stand Mai 2026 in Entwicklung). ETH und EPFL haben im Februar 2026 eine Apertus-2-Roadmap kommuniziert. Erwartet sind: erweiterte Multimodalität (Vision/Audio), spezielle Apertus-Voice-Variante mit CH-DE-Dialekt-Fähigkeit, Apertus-Code-Variante für Programmierung, eventuell Apertus-MoE (Mixture-of-Experts) als 200B/active-30B-Modell. Offizielle Release-Daten Stand Mai 2026 nicht bekannt – Spekulationen reichen von Q4 2026 bis Q2 2027. Das CSCS-API-Service bleibt produktiv und wird mit Apertus-2-Veröffentlichung erweitert.

Apertus in einer CH-Strategie einsetzen – 6 Schritte

01Daten-Klassifikation: welche Anteile der Anfragen erfordern Souveränität (Mandanten-Daten, Berufsgeheimnis, FINMA-Bezug)?
02Volumen-Schätzung: wie viele Tokens pro Monat? Unter 5M reicht Swisscom-API, über 50M lohnt sich On-Premises.
03Hosting-Pfad wählen: Swisscom-API (schnell), Infomaniak (mittel), On-Premises (souverän, teuer).
04Routing-Setup: LiteLLM oder Portkey mit Regeln "sensitiv → Apertus, FR → Mistral, hartes Reasoning → Claude".
05Benchmark gegen Use-Case: 50-100 reale Mandanten-Anfragen pro Apertus vs Claude vs Mistral testen, Treffer-Quote messen.
06Periodischer Re-Test alle 6 Monate, Apertus-2-Roadmap prüfen, Routing-Regeln anpassen.

Wann Apertus die richtige Wahl ist

Vier Konstellationen sprechen klar für Apertus.

Erstens: Mandanten mit Berufsgeheimnis-Pflicht (Anwaltskanzleien, Ärzte, Treuhand-Büro mit Wealth-Mandaten, Notariate). Hier ist die volle Datenort-Kontrolle in der Schweiz und die Vermeidung extraterritorialer Zugriffs-Risiken Pflicht. Apertus auf On-Premises oder Swisscom-API mit Schweizer Data-Residency erfüllt das.

Zweitens: Schweizer Sprach-Mix mit RM- oder CH-DE-Komponente. Treuhand-Büro in Graubünden, Beratung in der Engadin-Region, Tessiner Mandate mit Lokal-Dialekt-Berührung, Berner Mandanten-Triage mit Schwizerdütsch-E-Mails. Apertus ist hier produktiv stärker als US-Konkurrenz.

Drittens: Compliance-getriebene Setups mit Audit-Bedarf. FINMA-AM-08/2024 Säule 3 (Modell-Validierung) und EU-AI-Act-Art-50 (Transparenz bei GPAI) verlangen Modell-Dokumentation. Apertus liefert sie out-of-the-box – Modell-Card, Trainings-Daten-Beschreibung, Evaluations-Suite frei verfügbar.

Viertens: Konsolidierte LLM-Strategie mit primärem CH/EU-Hosting. Eine Multi-Provider-Strategie (Apertus + Mistral + Claude-Fallback) ist Mai 2026 die häufigste Konstellation bei Schweizer Beratungs-Boutiquen – Apertus deckt den souveränen Kern, Mistral deckt FR-Spitze und EU-Hosting, Claude bleibt als Top-Frontier-Fallback für schwierige Fälle.

Wann andere Modelle besser sind

Drei Konstellationen sprechen gegen Apertus als Erstwahl.

Komplexe Reasoning-Fälle mit Top-Frontier-Bedarf. Bei sehr schwierigen Reasoning-Aufgaben (Mathematik-Olympiade-Niveau, Komplex-Recht-Argumentation, code-generation-heavy Tasks) liegt Apertus-70B Mai 2026 spürbar hinter dem aktuellen Claude-Spitzenmodell und dem jeweils aktuellen GPT-Spitzenmodell. Wenn solche Fälle dominant sind, das aktuelle Claude-Spitzenmodell oder das jeweils aktuelle GPT-Spitzenmodell als Primär-Modell.

Grösste Effizienz bei kleinem Budget. Apertus-Self-Hosting mit GPU lohnt sich erst ab signifikantem Volumen. Bei < 5M Tokens/Monat ist ein kleines OpenAI-Modell (z.B. GPT-mini-Klasse) oder Claude Haiku deutlich günstiger als 2x-H100-Setup. Hier ist die Souveränitäts-Frage abzuwaegen.

Produktiv-Latenz-kritische Anwendungen. Top-Frontier-Cloud-Modelle (Claude, GPT, Gemini) haben optimierte Inferenz-Pipelines mit < 200ms Time-To-First-Token. Apertus auf 2x H100 erreicht typisch 300-600ms TTFT, abhängig von Setup. Für Echtzeit-Chat-UX kann der Unterschied spürbar sein.

Multi-Provider als beste Praxis. Apertus ist nicht "entweder Apertus oder Cloud-Modell", sondern Bestandteil einer Multi-Provider-Strategie. Ein Routing-Layer (LiteLLM, OpenRouter, Portkey) verteilt nach Anfrage-Typ: hochsensitive Mandanten-Daten an Apertus, FR-spezifische Anfragen an Mistral, Top-Reasoning an Claude, generische Anfragen an günstigere Modelle.

Vor- und Nachteile

STÄRKEN

Volle Schweizer Souveränität über On-Premises oder Swisscom-API mit CH-Data-Residency
Beste RM- und CH-DE-Dialekt-Fähigkeit aller Frontier-Modelle Mai 2026
Apache 2.0 erlaubt Fine-Tuning, Modifikation, kommerzielle Nutzung
Transparente Trainings-Daten erleichtern FINMA-AM-08/2024- und EU-AI-Act-Audits

SCHWÄCHEN

Reasoning-Qualität auf MMLU/Hartem-Math hinter dem aktuellen Claude-Spitzenmodell und dem jeweils aktuellen GPT-Spitzenmodell
On-Premises-Hosting verlangt 2x H100 80GB – Hardware-Investition CHF 80-150k
Apertus-Voice für CH-DE-Audio noch nicht produktiv (erwartet Q4 2026 - Q1 2027)
Latenz auf 2x H100 typisch 300-600ms TTFT – für Echtzeit-Chat oft schwächer als Cloud-Modelle

Häufige Fragen

Was kostet Apertus über die Swisscom-API?

Stand Mai 2026 sind die Preise nicht öffentlich auf einer Standard-Tarif-Seite publiziert. Pilot-Kunden berichten einen Korridor von CHF 0.40-1.50 pro 1M Tokens für Apertus-70B, je nach Volumen-Bindung und SLA. Apertus-8B liegt deutlich darunter (typisch CHF 0.05-0.20 pro 1M Tokens). Vergleich Mai 2026: das jeweils aktuelle GPT-Spitzenmodell über Azure Switzerland North etwa CHF 4-12 pro 1M Tokens, das aktuelle Claude-Spitzenmodell etwa CHF 5-25, Mistral Large 2 etwa CHF 2-8. Apertus ist damit der günstigste Frontier-Pfad mit voller Schweizer Souveränität.

Kann ich Apertus fine-tunen?

Ja. Apache-2.0-Lizenz erlaubt Modifikation und Re-Distribution. Fine-Tuning erfolgt typisch mit LoRA oder QLoRA auf 1-4x H100 80GB. Trainings-Daten müssen Datenschutz-konform aufbereitet sein (DSG Art. 6 Zweckbindung – Mandanten-Daten ohne klare Einwilligung sind problematisch). Praxis Mai 2026: Boutiquen wie LatticeFlow, Inspire AI Schweiz, ETH-Spin-Offs bieten Fine-Tuning-Services für CH-KMU an, mit klarer Datenschutz-Pipeline.

Wann kommt Apertus 2?

Offizielles Release-Datum Stand Mai 2026 nicht kommuniziert. ETH/EPFL haben Februar 2026 eine Roadmap publiziert mit Komponenten Apertus-Voice (CH-DE-Dialekt-Fähigkeit), Apertus-Code (Programmierung), Apertus-Vision (multimodal), eventuell Apertus-MoE (200B/active-30B). Vernünftige Spekulation: Voice und Code zuerst (Q4 2026 - Q1 2027), Vision und MoE später (Q2-Q4 2027). Bis dahin Apertus-8B und 70B als produktive Versionen.

Ist Apertus DSGVO-konform?

Das Modell selbst ist DSGVO-verträglich aufgebaut – Trainings-Daten-Auswahl und Modell-Verhalten unter EU-Recht-Bewusstsein. Das macht Apertus aber nicht automatisch konform; die Verarbeitung von Personendaten durch den Nutzer hängt von dessen Setup ab (Rechtsgrundlage, DPA mit Hosting-Anbieter, Löschpflichten, Auskunfts-Pflichten). Vorteil: Trainings-Daten sind transparent dokumentiert, was Auskunfts-Anfragen nach DSG Art. 25 / DSGVO Art. 15 leichter macht als bei Closed-Weight-Modellen.

Quellen

Apertus Modell-Card ETH Zurich/EPFL/CSCS (HuggingFace) · 2025-09
ETH AI Center – Apertus Pressemeldung · 2025-09
CSCS – Centro Svizzero di Calcolo Scientifico, Alps-Supercomputer · 2026-05
Swisscom – Apertus API for Business · 2026-05
Public AI Network – Apertus Public Compute · 2026-05
EPFL AI Center – Apertus Research Page · 2026-05

PASSEND ZU IHREM STACK?

Dies ist keine Rechtsberatung. Wir evaluieren Apertus für Ihre Mandanten-Workloads, setzen On-Premises- oder Swisscom-API-Hosting auf und bauen Multi-Provider-Routing zwischen Apertus, Mistral und Claude. Erstgespräch kostenlos.

Erstgespräch buchen