Was auf dem Markt und bei Anbietern passiert. News für den Betriebsalltag. Für professionelle Anwender. Und für strategische Orientierung.
Regulierung
EU AI Act: Hochrisiko-Pflichten ab 2. August 2026 – trotz «Digital Omnibus»-Debatte
Ab dem 2. August 2026 greifen die meisten verbleibenden Pflichten des EU AI Act, inklusive Aufsichtsbefugnisse und nationaler Reallabore; eine Vereinfachung über den «Digital Omnibus» ist diskutiert, aber noch nicht in Kraft. Wer EU-Kunden bedient, sollte August 2026 als verbindlichen Stichtag behandeln.
Zum 2. August 2026 tritt der Grossteil des AI Act in Kraft (Ausnahme Art. 6(1)); Behörden können ab diesem Datum durchsetzen, GPAI-Pflichten gelten ohnehin seit August 2025. Mitgliedstaaten müssen zudem mindestens ein nationales KI-Reallabor betreiben. Bussen reichen bis 15 Mio. EUR bzw. 3 % des weltweiten Jahresumsatzes.
Der «Digital Omnibus» würde Teile der Hochrisiko-Pflichten an die Verfügbarkeit von Normen koppeln und Fristen bis 2. Dezember 2027 bzw. 2. August 2028 (produkt-eingebettete Systeme) strecken. Diese Verschiebung ist jedoch noch nicht beschlossen – Verlass darauf wäre riskant.
Für Schweizer Anbieter gilt der Marktort-Grundsatz: Wer KI-Systeme in der EU in Verkehr bringt oder dort wirken lässt, fällt in den Anwendungsbereich – unabhängig vom Firmensitz. Praktisch heisst das: Risikoklassifizierung, technische Dokumentation, Logging und menschliche Aufsicht jetzt aufsetzen, nicht auf eine mögliche Fristverlängerung warten.
Datenresidenz wird zum Geschäftskriterium: 51 % der Schweizer Firmen verlangen CH/EU-konforme KI
Eine EY-Umfrage zeigt: KI ist in Schweizer Unternehmen etabliert, doch 51 % verlangen, dass KI-Systeme dem Schweizer oder europäischen Datenschutz entsprechen und Daten in der Schweiz oder der EU bleiben.
EY berichtet, dass KI in Schweizer Unternehmen bereits breit verankert ist – viele stehen aber noch am Anfang der Skalierung. Das deutlichste Signal für den Mittelstand: Datenresidenz und Datenschutz-Compliance werden als geschäftskritisch behandelt.
Für Treuhand-, Beratungs- und Kanzlei-Umfelder heisst das: Wer zu Verträgen, Outsourcing, KI-Beschaffung oder Mandantengeheimnis berät, sollte die interne KI-Governance und die Lieferantenprüfung jetzt schärfen. Genau hier setzt eine souveräne, in der Schweiz/EU gehostete KI-Architektur an.
Mistral Medium 3.5: offenes 128B-Modell, das auf vier GPUs selbst gehostet läuft
Mistral hat mit Medium 3.5 ein dichtes 128B-Modell (256k Kontext) unter modifizierter MIT-Lizenz als Open Weights veröffentlicht; es läuft laut Anbieter auf nur vier GPUs. Damit rückt leistungsfähige On-Prem-KI für KMU in realistische Hardware-Reichweite.
Medium 3.5 vereint Instruktionsbefolgung, Reasoning und Coding in einem Gewichtssatz; der Reasoning-Aufwand ist pro Anfrage konfigurierbar. Mistral nennt 77,6 % auf SWE-Bench Verified. Die Gewichte liegen auf Hugging Face, die gehostete API kostet 1,5 USD / 7,5 USD je Mio. Input-/Output-Tokens.
Der praktische Punkt für CH/EU-KMU ist die Lizenz und die Hardware-Schwelle: Eine modifizierte MIT-Lizenz erlaubt kommerzielle Nutzung und Self-Hosting, und «vier GPUs» bedeutet einen einzelnen Server statt eines Clusters. Damit lassen sich vertrauliche Daten (Mandate, Personal, Verträge) lokal verarbeiten, ohne sie an eine externe API zu senden.
Wir empfehlen, die Lizenz-Nuancen («modifiziert») vor produktivem Einsatz juristisch zu prüfen und die «vier GPUs» als optimistische Untergrenze zu lesen – mit Quantisierung und längerem Kontext steigt der Speicherbedarf. Für einen Audit-fähigen On-Prem-Betrieb ist Medium 3.5 dennoch einer der ernsthaftesten offenen Kandidaten dieses Frühjahrs.
EDÖB: Schweizer Datenschutzrecht gilt direkt für KI – ohne Sonderregeln
Der EDÖB bekräftigt, dass das revDSG unmittelbar auf KI-gestützte Datenbearbeitung anwendbar ist: Transparenz, Auskunft über automatisierte Entscheide und DSFA bei hohem Risiko gelten heute. Schweizer KMU brauchen kein KI-Spezialgesetz abzuwarten – die Pflichten bestehen bereits.
Der EDÖB stellt klar: Hersteller, Anbieter und Anwender müssen Transparenz über Zweck, Funktionsweise und Datenquellen schaffen, Nutzer müssen erkennen, wann sie mit einer Maschine sprechen, und Werkzeuge zur Gesichts-, Bild- oder Stimmfälschung sind offenzulegen. Für Bearbeitungen mit hohem Risiko ist eine Datenschutz-Folgenabschätzung Pflicht. Im Januar 2026 unterzeichnete der EDÖB zudem mit über 60 Behörden eine gemeinsame Erklärung gegen KI-generierte Bilder realer Personen ohne Einwilligung.
Für den Mittelstand ist die Botschaft eindeutig: Das im September 2023 in Kraft getretene revDSG reicht aus, um KI-Einsatz heute rechtlich zu erfassen. Wer auf ein künftiges Schweizer KI-Gesetz wartet (Konsultation gegen Ende 2026 erwartet), verkennt die geltende Lage.
Konkret heisst das für Treuhand und Kanzleien: KI-Verarbeitung von Personendaten dokumentieren, automatisierte Entscheide kennzeichnen, ein Recht auf menschliche Überprüfung einräumen und bei sensiblen Mandaten eine DSFA durchführen. Wer KI on-prem oder in einer Schweizer/EU-Cloud betreibt, vereinfacht diese Nachweise erheblich gegenüber einer US-API.
Prompt Injection bleibt 2026 die meistausgenutzte KI-Schwachstelle – mit grösserem Radius bei Agenten
Sicherheitsanalysen für 2026 nennen Prompt Injection als die am häufigsten ausgenutzte KI-Schwachstelle; bei agentischen Systemen (E-Mails senden, DB-Abfragen, Code ausführen) wächst der Schadensradius erheblich. IBM berichtet, dass 97 % der von KI-Vorfällen betroffenen Organisationen keine angemessenen KI-Zugriffskontrollen hatten.
Dokumentierte Fälle illustrieren das Risiko: CVE-2025-53773 erlaubte über versteckte Prompt-Injektion in Pull-Request-Beschreibungen Remote-Code-Execution mit GitHub Copilot (CVSS 9.6), und die «EchoLeak»-Lücke in Microsoft 365 Copilot demonstrierte Zero-Click-Datenabfluss. Mit RAG-Pipelines und Agenten verschiebt sich die Bedrohung von «peinlich» zu «katastrophal».
Für CH/EU-KMU ist die zentrale Lehre, dass das Modell selten das Problem ist – fehlende Zugriffskontrollen, ungeprüfte Tool-Berechtigungen und «Shadow AI» sind es. Ein selbst gehostetes Modell ohne Least-Privilege, Eingangsfilterung und Audit-Logging ist genauso angreifbar wie eine Cloud-API.
Konkrete Massnahmen: Tool-Zugriffe von Agenten strikt nach Least-Privilege begrenzen, untrusted Inhalte (E-Mails, Dokumente, Webseiten) als nicht vertrauenswürdig behandeln und nie ungefiltert in Systemprompts geben, RAG-Quellen segmentieren und sämtliche Agenten-Aktionen protokollieren. Diese Kontrollen sind zugleich die Belege, die EU AI Act (Logging, Aufsicht) und revDSG (Datensicherheit) ohnehin verlangen.
Cohere übernimmt Aleph Alpha – europäische Souveränitäts-KI auf STACKIT-Cloud
Der kanadische KI-Anbieter Cohere fusioniert mit dem Heidelberger Anbieter Aleph Alpha zu einer rund 20-Mrd.-USD-Einheit; getragen von der Schwarz-Gruppe (rund 500 Mio. EUR) und betrieben auf deren souveräner STACKIT-Cloud. Für CH/EU-KMU entsteht damit eine ernstzunehmende Alternative zu US-Hyperscalern für regulierte Workloads.
Die kombinierte Firma zielt explizit auf stark regulierte Branchen – Verteidigung, Energie, Finanzen, Gesundheit, Telekommunikation. Technisch läuft sie auf STACKIT, der souveränen Cloud von Schwarz Digits, womit Datenhaltung und Betrieb in Europa verbleiben. Aleph Alphas Stärken bei kleinen Modellen, europäischen Sprachen und Tokenizern ergänzen Coheres Enterprise-Stack.
Für den Mittelstand ist relevant, dass hier erstmals Kapital, Modell-Know-how und souveräne Infrastruktur gebündelt werden. Das senkt die Hürde, KI ohne Datenabfluss in die USA zu betreiben – ein wiederkehrendes Argument bei Treuhand, Kanzleien und Behörden.
Vorsicht bei der Bewertung: Eine kanadisch-deutsche Einheit ist nicht automatisch «souverän» im engsten Sinn. Wer Datenresidenz und Auftragsverarbeitung ernst nimmt, sollte Vertragsklauseln zu Standort, Sub-Prozessoren und Zugriffsrechten konkret prüfen, statt sich auf das Label zu verlassen.
DeepSeek V4 als Open Weights – starke Benchmarks, aber NIST sieht rund 8 Monate Rückstand
DeepSeek hat V4 (1,6 Bio. Parameter MoE, 1-Mio.-Token-Kontext) mit offenen Gewichten veröffentlicht; eine NIST/CAISI-Evaluation vom Mai 2026 attestiert dem Modell jedoch rund acht Monate Rückstand auf die US-Spitze. Für KMU heisst das: günstig und offen, aber nicht in jedem Fall frontier-gleichwertig.
V4 kommt in zwei Varianten (Pro: 1,6 Bio. / 49 Mrd. aktiv; Flash: 284 Mrd. / 13 Mrd. aktiv), beide mit 1-Mio.-Token-Kontext und neuartiger spärlicher Attention. Die Gewichte liegen auf Hugging Face (V4-Pro unter MIT). Auf Coding- und Mathe-Benchmarks ist V4 stark.
Die NIST/CAISI-Bewertung (1. Mai 2026) liefert das nüchterne Gegengewicht: V4-Pro erreichte einen IRT-Elo von 800±28 gegenüber 1260±28 für GPT-5.5, und auf ARC-AGI-2 nur 46 % gegenüber 79 %. Der Hauptvorteil ist Kosteneffizienz – auf fünf von sieben Benchmarks günstiger als GPT-5.4 mini.
Für CH/EU-Anwender ist die Einordnung wichtiger als die Schlagzeile: Für RAG, Dokumentenanalyse und Routine-Automatisierung kann ein offenes, selbst gehostetes V4 ausreichen und Kosten massiv senken. Für anspruchsvolles Reasoning sollte man die Lücke einplanen. Zudem gelten bei chinesischen Modellen eigene Governance-Fragen (Herkunft der Trainingsdaten, Daten-Compliance) – self-hosted und air-gapped entschärft das technisch, ersetzt aber keine Prüfung.