OPENAI · LLM-ANBIETER
OpenAI GPT-Modelle aus CH-Treuhand-Sicht: Residency, Pricing, Compliance
OpenAI ist das verbreitetste Modell-Ökosystem. Für CH-Treuhand entscheidend: Daten-Residency via Azure OpenAI und AVV-Posture klären, bevor Mandantendaten fliessen.
Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05
Was ist OpenAI?
OpenAI ist ein US-amerikanisches Forschungslabor mit Sitz in San Francisco, das die GPT-Modellfamilie entwickelt und kommerziell anbietet. Microsoft ist Hauptinvestor und exklusiver Cloud-Partner. Stand Mai 2026 stehen mehrere Linien produktiv im Einsatz (Bezeichnungen und Preise laut OpenAI-Preisliste, vor Einsatz prüfen): GPT-4o (multimodales Allround-Modell, USD 2.50 / 10.00 pro 1M Input/Output-Tokens), GPT-4.1 (Nachfolger mit 1M-Token-Kontext, USD 5 / 15 pro 1M) und o3-pro (Reasoning-Modell, USD 15 / 60 pro 1M). Daneben gibt es Embedding-Modelle (text-embedding-3-small, USD 0.02 pro 1M) und Whisper für Speech-to-Text.
Für Schweizer Treuhand-Büros sind drei Zugangswege relevant: erstens die OpenAI-API direkt (api.openai.com, Verarbeitung in den USA, USD-Abrechnung), zweitens Azure OpenAI Service (Microsoft-Wrapper, EU-Region Niederlande/Schweden, regional auch CH-North verfügbar mit eingeschränktem Modell-Katalog), drittens ChatGPT Enterprise/Team als End-User-Produkt mit eigener Vertragslage. Die drei Pfade unterscheiden sich erheblich in Daten-Residency, AVV-Verfügbarkeit und Modell-Aktualität.
Microsofts CH-North-Region (Zürich) bietet seit Mai 2025 OpenAI-Modelle an, allerdings mit verzögertem Modell-Rollout: GPT-4.1 und o3 sind dort nicht durchgängig verfügbar (Stand Mai 2026), und einzelne Deployment-SKUs werden laufend angepasst (Details auf der Azure-Statusseite prüfen). Praktisch heisst das: Wer GPT-4.1/o3 ohne US-Transfer will, landet meist bei Azure-EU-Regionen (Westeurope/Sweden Central), nicht bei CH-North.
Warum es wichtig ist
Für ein Schweizer Treuhand-Büro ist OpenAI in zwei Welten gleichzeitig zu denken: als Best-of-Breed-Sprachmodell, das in MTEB-Benchmarks, in Code- und in Reasoning-Tasks regelmässig oben mitspielt – und als US-Anbieter mit allen Implikationen, die das nach Art. 16-19 revDSG, nach Art. 6 revFADP und unter US CLOUD Act mit sich bringt.
Die konkreten Implikationen: Eine direkte API-Nutzung über api.openai.com bedeutet Drittlandtransfer in die USA. Ohne ergänzende Massnahmen (Pseudonymisierung der Mandantendaten vor dem Call, Transfer Impact Assessment, EU-SCC im AVV) ist das für Berufsgeheimnis-Daten (StGB Art. 321) nicht haltbar. Mit Azure OpenAI Service ist die Lage besser: Daten werden in der gewählten Region verarbeitet, Microsoft schliesst standardisierte AVV-Verträge auf EU-SCC-Basis, und CH-North-Hosting ist für einige Modelle möglich.
Der zweite Punkt: Modell-Aktualität vs. Region. Wer Mandantendaten in der Schweiz halten will, muss Modell-Kompromisse akzeptieren. Wer GPT-4.1 mit 1M-Kontext will, geht über EU- oder US-Regionen. Diese Entscheidung gehört nicht zum Bauchgefühl, sondern in eine dokumentierte Daten-Klassen-Matrix (siehe Multi-LLM-Routing). Drittens, das Preisbild: USD 5 / 15 pro 1M klingt billig, aber bei einer 50-Mitarbeiter-Treuhand mit 200k Token pro Tag und Person sind das schnell USD 800-1500 pro Monat – Prompt-Caching (bis 90% Ersparnis) und Batch-API (50% Rabatt) sind keine Spielerei, sondern Pflicht.
Wie es funktioniert
OpenAI bietet drei Vertragsebenen mit unterschiedlicher Daten-Posture. Beim Free/Plus-Tier (ChatGPT-Konsumenten) werden Konversationen per Default zum Modelltraining genutzt; das ist für Berufsdaten ausgeschlossen. Beim API-Tier (api.openai.com) ist Training per Default DEAKTIVIERT seit März 2023; Eingaben/Ausgaben werden bis zu 30 Tage zur Missbrauchs-Erkennung gespeichert, danach gelöscht. Zero Data Retention (ZDR, keine Speicherung überhaupt) ist auf Anfrage möglich, jedoch nur für berechtigte Use-Cases mit OpenAI-Sales-Approval und auf ausgewählten Endpoints. Beim Enterprise/Team-Tier (ChatGPT Enterprise, OpenAI Business) gilt eine vertragliche AVV mit EU-SCC, kein Training, und je nach Konfiguration ZDR.
Azure OpenAI Service ist ein eigener Vertragsstapel: Microsoft Customer Agreement plus Azure-Service-Terms plus Online-Services-DPA. Daten werden in der gebuchten Region verarbeitet (nicht standardmässig in den USA repliziert), und das standardmässige Logging für Missbrauchs-Erkennung kann auf Antrag deaktiviert werden (Abuse Monitoring Opt-Out). Modell-Rollout ist verzögert: neue Modelle erscheinen typischerweise 2-4 Wochen nach openai.com, in CH-North bisweilen Monate später.
Technisch ist die OpenAI-API REST-basiert, Standard-Bibliotheken existieren für Python/Node/Go/.NET. Authentifizierung per Bearer-Token. Strukturierte Antworten (JSON-Mode, Tool-Calling) werden gut unterstützt; Function-Calling ist seit 2023 verlässlich. Für Migration auf andere Anbieter empfiehlt sich ein LLM-Gateway (LiteLLM), das die OpenAI-API als Lingua franca nutzt – so bleibt der Code austauschbar.
OpenAI-Entscheidung in 6 Schritten (Treuhand-CIO)
- 01Datenklassen definieren: öffentlich / intern / mandantenbezogen / Berufsgeheimnis. Nur die unteren zwei Klassen sind OpenAI-Kandidaten ohne Zusatzmassnahmen.
- 02Vertragspfad wählen: api.openai.com (US, USD, schnellster Modell-Zugang) vs. Azure OpenAI EU (Niederlande/Schweden, EUR-Abrechnung) vs. Azure OpenAI CH-North (Zürich, eingeschränkter Katalog).
- 03AVV abschliessen plus EU-SCC: Bei Azure über Microsoft Online Services DPA. Bei OpenAI direkt über data privacy form. Beide Verträge ablegen.
- 04TIA dokumentieren: Welche Daten gehen wohin? US CLOUD Act-Risiko bewerten. Ergebnis als PDF im Mandanten-Onboarding-Ordner.
- 05Modell-Mapping: GPT-4o als Standard, GPT-4.1 für 1M-Kontext-Fälle, o3-pro nur für dokumentierte Reasoning-Fälle (10x Kosten). Embedding: text-embedding-3-small.
- 06Cost-Controls aktivieren: Hard-Spend-Cap im OpenAI-Dashboard, Prompt-Caching im Code, Batch-API für nicht-echtzeit-Workloads. Monatliches Kosten-Review.
Wann OpenAI einsetzen
OpenAI ist die richtige Wahl, wenn (a) das höchste verfügbare Allround-Niveau gefordert ist, (b) Mandantendaten vor der Übergabe pseudonymisierbar sind oder ohnehin unkritisch (öffentliche Recherche, Marketing-Texte, Code-Generierung), und (c) Azure OpenAI Service als EU-residenter Pfad akzeptiert ist. Praktische Use-Cases in der Treuhand: Klartext-Zusammenfassungen von Geschäftsberichten, MWST-Recherche zu öffentlichen ESTV-Wegleitungen, E-Mail-Entwürfe an Mandanten (vor Versand redigiert), Code-Generierung für interne Skripte (kein Berufsgeheimnis im Code), o3-pro für komplexe Steuerfälle, in denen Pseudonymisierung möglich ist.
Für RAG-Pipelines ist text-embedding-3-small ein guter Default: USD 0.02 pro 1M Tokens, gute Deutsch-Qualität, 1536 Dimensionen, kompatibel mit Qdrant. Für Multi-LLM-Routing über LiteLLM ist OpenAI das natürliche Backend: Praktisch jede andere API spricht OpenAI-Schema.
Wichtig: Auch bei OpenAI über Azure-EU gilt, dass Microsoft als US-Konzern unter den US CLOUD Act fällt. Für absolute Datensouveränität (Verteidigungssektor, FINMA-relevante Personendaten) bleibt Self-Hosted (Mistral, Llama, Ollama) oder EU-souveräner Provider (Mistral La Plateforme) die saubere Antwort. OpenAI ist die Hochleistungs-Schicht, nicht die Hochsicherheits-Schicht.
Wann NICHT
OpenAI ist die falsche Wahl, wenn (a) Mandantendaten nicht pseudonymisierbar sind und kein Azure-EU-Vertrag besteht, (b) der Use-Case Berufsgeheimnis-Daten (StGB Art. 321) ohne EU-SCC-Absicherung verarbeiten würde, (c) FINMA-relevante Personendaten im Spiel sind und das Auslagerungs-Rundschreiben strikt ausgelegt wird, oder (d) ein einfacher Use-Case (Kategorisierung, einfache Klassifikation) mit einem deutlich günstigeren Modell lösbar ist.
Konkret: Originale Mandanten-Mails, GwG-relevante Identifikationsdaten, Lohnabrechnungen mit AHV-Nummern, anwaltliche Schriftsätze – diese gehören NICHT in einen direkten api.openai.com-Call. Wenn überhaupt OpenAI, dann über Azure OpenAI Service mit AVV plus dokumentiertem TIA, oder über eine Multi-LLM-Routing-Schicht, die Hochsensitives auf Mistral-EU oder Self-Hosted leitet.
Weiterer Fall: Wenn der Use-Case nur Kategorisierung ist (z.B. "Beleg = Reise / Bewirtung / Büro?"), ist GPT-4o Overkill. Llama 3.1 8B auf eigener Hardware oder Mistral Small 3 (USD 0.20 / 0.60 pro 1M) liefert dieselbe Qualität zu einem Bruchteil – und ohne US-Transfer. OpenAI ist gerechtfertigt, wenn das Modell-Niveau wirklich gebraucht wird.
Vor- und Nachteile
STÄRKEN
- Höchstes Allround-Niveau auf MTEB- und Reasoning-Benchmarks
- Grösstes Ecosystem: jede zweite Library spricht OpenAI-API per Default
- 1M-Token-Kontext bei GPT-4.1 für grosse Dokumente
- Azure-Pfad bietet EU- und CH-Residency-Option mit standardisiertem AVV
- Reife Tool-Calling- und JSON-Mode-Unterstützung
SCHWÄCHEN
- US-Anbieter, Mutterkonzern unter US CLOUD Act
- USD-Abrechnung, FX-Risiko für CHF-Büro
- CH-North-Region hat eingeschränkten Modell-Katalog und Rollout-Verzögerung
- ZDR nur auf Antrag mit Sales-Approval, nicht selbst-aktivierbar
- Direct-API ohne Azure-Wrapper hat Default 30-Tage-Logging
Häufige Fragen
Darf ich Mandantendaten an OpenAI senden?
Nicht ohne Vorkehrungen. Direkter API-Call an api.openai.com ist Drittlandtransfer USA und braucht mindestens: schriftliche Mandanten-Information, EU-SCC im AVV (von OpenAI auf Anfrage), TIA, und idealerweise Pseudonymisierung. Sauberer Weg: Azure OpenAI EU-Region oder CH-North. Für Berufsgeheimnis-Daten (StGB 321) ohne Pseudonymisierung: lieber Self-Hosted oder Mistral-EU.
Trainiert OpenAI mit meinen API-Daten?
Nein – auf der API ist Training seit März 2023 per Default deaktiviert. Auf ChatGPT Free/Plus dagegen schon (Opt-Out möglich). Enterprise/Team und Azure OpenAI Service: vertraglich ausgeschlossen. Inputs/Outputs bleiben bis zu 30 Tage zur Missbrauchs-Erkennung; mit ZDR-Antrag auch 0 Tage möglich.
Was kostet GPT-4o monatlich für ein 20-Personen-Treuhand-Büro?
Faustregel: pro Person 80k-150k Tokens pro Tag bei aktivem KI-Einsatz. Bei 20 Personen, 22 Arbeitstagen, durchschnittlich 100k Tokens (70k Input + 30k Output): ca. USD 245/Monat ohne Caching, mit aggressivem Prompt-Caching unter USD 60. Plus Embedding-Kosten für RAG: meist unter USD 20/Monat.
Reicht Azure CH-North für alle Mandanten?
Für Daten-Residency in der Schweiz ja, für Modell-Aktualität nein. CH-North hatte Stand Mai 2026 nicht alle Modelle (kein GPT-4.1 voll, o3 verzögert). Praktischer Workflow: CH-North für sensible Mandanten-Workloads, Azure-Sweden/Westeurope für Allround-Tasks, beide über LiteLLM-Gateway gerouted.
Verwandte Themen
Quellen
PASSEND ZU IHREM STACK?