DEEPSEEK · LLM-ANBIETER

DeepSeek im Schweizer Einsatz: PRC-Anbieter, Self-Host-Option und revDSG-Realität

DeepSeek V3.x und R1 sind extrem günstig und technisch stark – aber Datenfluss nach China. Für Mandantendaten über API nicht empfohlen. Self-Host via HF-Weights als Alternative.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Was ist DeepSeek?

DeepSeek ist ein chinesischer LLM-Anbieter mit Sitz in Hangzhou. Im Mai 2026 sind zwei Modell-Linien aktiv: die DeepSeek-V3-Familie (V3 und das Update V3.2, Allzweck-Chat, OpenAI-kompatibel, MoE-Architektur) und DeepSeek-R1 (Reasoning-Modell mit Chain-of-Thought, im Januar 2025 viel-diskutiert).

Zwei Eigenschaften haben DeepSeek bekannt gemacht: erstens der Preis. DeepSeek V3.2 kostet rund USD 0.28 pro 1M Input-Tokens und USD 0.42 pro 1M Output-Tokens (Stand Mai 2026, api-docs.deepseek.com). DeepSeek-R1 als Reasoning-Modell liegt bei USD 0.55 / USD 2.19. Mit Prompt-Caching gehen Input-Tokens auf USD 0.03 – ein Faktor 10 unter OpenAI. Zweitens die Open-Weight-Strategie: Die Gewichte stehen auf Hugging Face unter einer permissiven Lizenz. Wer die nötige GPU-Hardware hat, kann DeepSeek-V3-671B oder R1 lokal betreiben.

Juristisch ist DeepSeek allerdings ein Sonderfall. Die Server stehen in der Volksrepublik China, das Unternehmen unterliegt dem chinesischen National Intelligence Law von 2017 – chinesische Behörden können Datenzugriff anordnen, ohne den betroffenen Nutzer zu informieren. Die italienische Datenschutzbehörde verhängte 2025 binnen 72 Stunden ein Verbot, der EDSA setzte eine AI-Enforcement-Taskforce auf, und mindestens 13 EU-Jurisdiktionen ermitteln. DeepSeek hat im März 2025 nach Druck aus Suedkorea eine Opt-out-Funktion für Trainingsdaten eingeführt und im EU-Datenschutz-Annex einen EU-Vertreter benannt – das ist nicht GDPR-konform, sondern ein Kompromiss-Versuch.

Warum es wichtig ist

DeepSeek ist die wichtigste Open-Weight-Konkurrenz zu Llama. Drei Punkte machen es interessant – und einer macht es problematisch.

Erster Punkt: DeepSeek-R1 gehört zu den günstigsten Reasoning-Modellen am Markt. Wer Chain-of-Thought für juristische Analyse oder mathematische Beweise braucht, zahlt bei OpenAI o4 oder Claude Sonnet-Reasoning Faktor 5-10 mehr. R1 ist in MATH-500 und GSM8k auf Augenhöhe mit o1 / o4 und kostet einen Bruchteil.

Zweiter Punkt: V3.2 als Allzweck-Modell ist bei vielen Code- und Reasoning-Benchmarks Top-3 – neben dem jeweils aktuellen GPT-Spitzenmodell und Claude Sonnet. Wer Code generieren lässt, ein Backend-Refactoring delegiert oder Schema-Konvertierungen automatisiert, bekommt qualitativ Vergleichbares zu deutlich tieferen Kosten.

Dritter Punkt: Open-Weight. Wer die Hardware-Investition stemmt (8x H200 oder 16x H100 für V3 671B Q4), kann DeepSeek vollständig in der eigenen Infrastruktur betreiben. Damit verschwindet der PRC-Datenfluss. Das ist die einzige Variante, in der DeepSeek für Schweizer Mandantendaten in Frage kommt – und es ist eine teure.

Der Problempunkt: Die DeepSeek-API ist für Mandantendaten unter revDSG/DSGVO de facto nicht nutzbar. Selbst mit der Opt-out-Funktion für Training bleiben Inferenz-Logs in PRC-Rechtsraum. Ein Treuhand-Büro mit Berufsgeheimnis-Pflicht kann das ohne explizite, dokumentierte Einwilligung jedes Mandanten nicht einsetzen – und realistisch wird kein Mandant das unterschreiben. Für interne, nicht-vertrauliche Workloads (Marketing-Texte, öffentliche FAQ, eigener Code-Review) ist die API sinnvoll. Für Mandantendaten: nein.

Wie es funktioniert

API-Pfad: Konto bei platform.deepseek.com, Karte hinterlegen, API-Key generieren. Aufruf identisch zu OpenAI (api_base = https://api.deepseek.com/v1). LiteLLM-Gateway erkennt DeepSeek nativ. Modell-Namen: deepseek-chat (= V3.2) und deepseek-reasoner (= R1). Modell-Aliase können sich mit neuen Releases ändern – die aktuelle Zuordnung vor dem Produktiv-Einsatz auf api-docs.deepseek.com prüfen und Migrationen einplanen.

Pricing Mai 2026: V3.2 USD 0.28/0.42, R1 USD 0.55/2.19 pro 1M Tokens. Cache-Hit gibt 90% Rabatt auf Input (0.03 USD), seit April 2026 firmenweit. Context-Window: V3.2 rund 128-256k Tokens, R1 128k.

Data-Retention der API: Inferenz-Logs werden gespeichert; Opt-out für Trainingsdaten ist verfügbar (Konto-Einstellung "Improve the model for everyone" deaktivieren). DeepSeek behauptet, Privacy-Policy entspricht nun GDPR-Mapping-Standards – die EU-Datenschutzbehörden teilen das nicht. Servers stehen physisch in PRC, Datenfluss EU -> CN ohne adäquate Safeguards.

Self-Host-Pfad: Gewichte auf Hugging Face (deepseek-ai/DeepSeek-V3, deepseek-ai/DeepSeek-R1, deepseek-ai/DeepSeek-V3.2 etc.). Lizenz: DeepSeek License Agreement, kommerzielle Nutzung erlaubt. Hardware für V3 671B Q4-quantisiert: 8x H200 oder 16x H100 (rund USD 36/Stunde Cloud-Miete bei Lambda oder vast.ai). Distillationen (DeepSeek-R1-Distill-Qwen-14B, -32B) laufen auf einer einzelnen A100 80GB und bringen 80% der R1-Qualität. Für KMU-Self-Host sind die Distillationen die realistische Variante.

CIO-Entscheidung: DeepSeek nutzen oder nicht?

01Daten-Klassifikation: Enthält der Workload Mandantendaten, Personendaten oder vertrauliche Geschäftsdaten? Wenn ja: DeepSeek-API ist raus. Prüfen, ob Self-Host oder Distillation in Frage kommt.
02TIA für Drittland-Transfer durchführen, falls API-Nutzung erwogen wird. Realistisches Ergebnis Mai 2026: Risiko nicht akzeptabel für Mandantendaten.
03Bei Self-Host: Hardware-Budget kalkulieren. 8x H200 für V3 671B = enterprise. Distillation 32B auf A100 80GB = realistisch für KMU mit High-Volume.
04Alternativ-Modell prüfen: Llama 3.3 70B liefert vergleichbare Qualität ohne PRC-Fragen, mit besserem Tooling.
05Wenn API trotzdem genutzt wird (interne Tools, öffentliche Daten): Opt-out-Training-Flag setzen, dokumentieren, Anwendungsbereich strikt eingrenzen.
06LiteLLM-Routing konfigurieren: DeepSeek nur für markierte "Tier-0 public"-Workloads, harter Block für alles andere.
07Quartals-Review: EU-Datenschutz-Behörden-Status prüfen, ob Verbote die Anwendung gefährden.

Wann DeepSeek einsetzen

DeepSeek-API ist die richtige Wahl, wenn (a) die Daten nicht vertraulich sind und (b) Reasoning oder Code-Generierung zu sehr niedrigen Kosten gebraucht wird. Konkret: öffentliche FAQ-Generierung, Marketing-Texte ohne Mandantenbezug, interne Code-Reviews ohne PII, mathematische Modellierung mit öffentlichen Daten, Benchmark-Tests vor einer Architektur-Entscheidung.

DeepSeek-Self-Host ist die richtige Wahl, wenn (a) das Volumen so hoch ist, dass eigene GPUs sich rechnen und (b) PRC-Datenfluss vermieden werden muss. Realistisch betrifft das Konzerne oder spezialisierte KMU mit 8x H200 / 16x H100-Budget, nicht eine 5-Personen-Treuhand.

DeepSeek-Distillationen (R1-Distill-Qwen-14B/32B) sind die richtige Wahl, wenn eine KMU ein Reasoning-Modell auf einer A100 80GB betreiben will. Qualität liegt bei 70-80% von R1, bei einer Hardware-Investition von rund CHF 600-1000/Monat (eigene Hetzner-GPU oder Cloud-Miete).

Im Vergleich: Anthropic Claude Sonnet hat bessere juristische Reasoning-Qualität bei ungefähr 30x den Kosten. OpenAI o4 ist bei Coding-Benchmarks gleichauf, kostet aber 10-20x. Für Anwendungen, in denen die Antwort-Qualität im 95.0%- statt 99.5%-Bereich ausreicht, ist DeepSeek das beste Preis-Leistungs-Verhältnis. Das ist mehr Anwendungen als man zuerst denkt.

Wann NICHT

DeepSeek-API ist die falsche Wahl, wenn Mandantendaten, Personendaten oder vertrauliche Geschäftsdaten im Spiel sind. Klares Nein für: Treuhand-Mandate, Anwalts-Mandate, GwG-relevante Sachverhalte, MWST-Daten, Lohnbuchhaltung, KYC, jedes Berufsgeheimnis (StGB Art. 321). Auch nicht über Drittland-Transfer-Impact-Assessment (TIA) sauber zu rechtfertigen – die PRC ist im Mai 2026 nicht als Land mit angemessenem Datenschutz anerkannt, weder vom Bundesrat noch von der EU-Kommission. Standardvertragsklauseln sind theoretisch verfügbar, praktisch aber durch das National Intelligence Law strukturell ausgehöhlt.

Weitere Fälle: Wer eine Anwendung baut, die für die EU öffentlich vermarktet wird, sollte DeepSeek-API vermeiden – Italien, Frankreich, Deutschland haben aktive Verfahren, ein Verbot kann jederzeit kommen. Ein Schweizer Service-Anbieter, der DeepSeek im Backend hat, könnte EU-Kunden verlieren.

DeepSeek-Self-Host hat keine rechtlichen Probleme, aber die KMU-Hardware-Wirklichkeit: 8x H200 sind im 2026 immer noch keine 5-Personen-Büro-Investition. Distillationen sind ein guter Mittelweg, aber dann steht man im Vergleich mit Llama 3.3 70B Self-Host – und Llama hat den breiteren Tooling-Stack.

Für politisch sensible Themen (Geschichte China, Taiwan, Tibet, Hong Kong) zeigt DeepSeek bekannte Zensur-Verhaltensmuster. Wer Texte oder Analysen zu solchen Themen braucht, bekommt verzerrte Ausgaben – DeepSeek ist hier nicht neutral.

Vor- und Nachteile

STÄRKEN

Aggressiv günstig: V3.2 USD 0.28/0.42, R1 USD 0.55/2.19 pro 1M Tokens
Cache-Hit-Rabatt 90%: Input-Tokens ab USD 0.03 pro 1M
Open-Weight via Hugging Face – vollständiger Self-Host möglich
R1-Reasoning auf o1/o4-Niveau zu Bruchteil des Preises
Code-Benchmarks Top-3 neben dem jeweils aktuellen GPT-Spitzenmodell und dem aktuellen Claude-Spitzenmodell

SCHWÄCHEN

PRC-Datenfluss: nicht empfohlen für Mandantendaten unter revDSG/StGB Art. 321
National Intelligence Law: Behördenzugriff ohne Benutzerinformation möglich
Aktive Untersuchungen mehrerer EU-Datenschutzbehörden, Verbots-Risiko
Politische Zensur bei China-sensiblen Themen – Bias dokumentiert
Self-Host für Vollmodelle (671B) Enterprise-Hardware nötig (8x H200)

Häufige Fragen

Kann ich DeepSeek mit Mandantendaten nutzen, wenn der Mandant zustimmt?

Theoretisch ja, praktisch nein. Eine explizite, schriftliche Einwilligung des Mandanten über den Drittland-Transfer nach PRC inklusive Hinweis auf das National Intelligence Law müsste vorliegen – pro Mandat, pro Datenkategorie, jederzeit widerrufbar. Realistisch wird kein Mandant das unterzeichnen, wenn die Information vollständig ist. Und ohne vollständige Information ist die Einwilligung unwirksam (revDSG Art. 6 Abs. 6). Empfehlung: nicht versuchen.

Was kostet eine DeepSeek-R1-Distill-Selbsthostung?

DeepSeek-R1-Distill-Qwen-32B auf einer A100 80GB: bei Hetzner GPU rund CHF 600-700/Monat (GEX44), bei einem Schweizer Anbieter (Infomaniak Public Cloud, Exoscale GPU) etwa CHF 1200-1800/Monat. Bei 2-5 Mio Output-Tokens pro Monat rechnet sich Self-Host gegenüber der API. Unterhalb dieser Schwelle ist die API günstiger – wenn die Compliance-Frage geklärt ist.

Hat DeepSeek einen EU-Vertreter?

Seit März 2025 ja, im EU-Datenschutz-Annex der Privacy Policy benannt. Das erfüllt formal Art. 27 DSGVO, sagt aber nichts über die Rechtmässigkeit des Datentransfers an sich aus. Die laufenden Verfahren in IT/FR/DE/NL/IE/ES drehen genau um diese Frage: ist der Transfer zulässig? Stand Mai 2026 lautet die überwiegende Antwort der DPAs: nein, ohne weitere Safeguards.

Ist DeepSeek-V3.2 zensiert?

Bei politisch sensiblen China-Themen ja, dokumentiert. Tiananmen, Taiwan-Status, Tibet, Hong Kong, Xinjiang – die Modelle weigern sich oder geben Pro-PKP-Linie. Für typische Treuhand- und Code-Workloads bemerkt man das nicht, aber wer Marktanalysen, geopolitische Texte oder Compliance-Analysen mit China-Bezug erstellt, wird Bias erleben. Auch das ist ein revDSG-relevanter Punkt: Beratung mit verzerrter Quelle ist beratungsrechtlich problematisch.

Quellen

DeepSeek API – Pricing Page (USD) · 2026-05
DeepSeek Privacy Policy (data residency PRC) · 2026-04
EU Regulators Scrutinize DeepSeek for Data Privacy Violations (Usercentrics) · 2026-02
IAPP – DeepSeek and the China Data Question (extraterritorial enforcement) · 2026-01
DeepSeek-AI Model Weights on Hugging Face (V3, R1, distillations) · 2026-05

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen