KOSTEN · KI-AUTOMATION KMU

Was kostet KI-Automation für ein Schweizer KMU? Ehrliche Preise Juni 2026

Von CHF 590 Speedcheck bis CHF 20000 erstes Jahr für ein 5-MA-Treuhand: alle Posten, Server-Mieten, Token-Kosten, Managed-Service.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-06

Worum es geht

Die Frage "Was kostet KI in unserem Büro?" lässt sich nicht mit einer einzigen Zahl beantworten. Sie zerfällt in drei Posten: einmalige Projektkosten, monatliche Infrastruktur, und laufende Token-Kosten pro Anfrage. Wer nur einen dieser Posten betrachtet, plant falsch. Wer alle drei kennt, kann für ein 5-Mitarbeitenden-Treuhandbüro im ersten Jahr verlässlich mit etwa CHF 20000 rechnen – bei einem stufenweisen Vorgehen vom Speedcheck über das KI-Fundament bis zum Komplett-Onboarding mit zwölfmonatigem Managed Service.

Die hier genannten Preise entsprechen dem Stand Juni 2026 für den Schweizer Markt und decken die typische Treuhand/KMU-Konstellation mit 3 bis 15 Mitarbeitenden ab. Sie sind keine Listenpreise einer Software, sondern Honorar-Ranges für Beratungs- und Umsetzungsprojekte plus die transparenten Drittkosten, die ein Kunde direkt trägt. Wir nennen sie hier offen, weil intransparente "auf Anfrage"-Preise das grösste Hindernis für die Verbreitung pragmatischer KI in der Schweiz sind. TYTOS Schweiz nennt im Leitfaden 2026 ein vergleichbares Total von CHF 15000 bis 30000 Einrichtung für ein 20-Mitarbeitenden-KMU; unsere kleineren Pakete liegen darunter, weil sie auf konkrete Engpassthemen fokussieren statt auf Vollabdeckung.

Warum die Aufschlüsselung wichtig ist

Zwei Fehler passieren in CH-KMU regelmässig. Erstens: die Buchung des falschen Pakets. Ein Büro mit 4 Mitarbeitenden und 60 Mandanten bucht eine 90000-Franken-Plattform mit Custom-Modelltraining, weil ein Anbieter "Enterprise-AI" verkauft hat. Das Geld ist weg, das Büro arbeitet drei Monate später wie vorher. Zweitens: das Erschrecken vor versteckten Folgekosten. Ein anderes Büro startet mit einem "Gratis-Pilot" und entdeckt nach sechs Monaten, dass der monatliche Token-Verbrauch CHF 800 erreicht hat, weil niemand das Routing eingestellt hat.

Gegen beide Fehler hilft eine klare Aufschlüsselung. Ein KI-Speedcheck für CHF 590 öffnet die Tür und wird voll angerechnet; ein Readiness-Check (Audit-Light) für CHF 1700 entscheidet, ob ein KI-Fundament für CHF 4800 überhaupt sinnvoll ist. Ein AI-Backend-Pilot für CHF 7800 ist kein Sprung ins Ungewisse, sondern ein klar abgegrenzter 4-bis-6-Wochen-Rahmen mit einem definierten Ausgabe-Artefakt. Ein Komplett-Onboarding über zwölf Monate ist die Wahl für Büros, die nicht selber Operations betreiben wollen.

Der Bezug zur Wertschöpfung kommt im ROI-Rechner (siehe roi-rechner-ki-projekt). Hier geht es um die ehrliche Preisseite – was Sie aus dem Cashflow nehmen müssen, bevor Sie die Ersparnis sehen.

Die Pakete und Posten im Detail

KI-Speedcheck – CHF 590, Türöffner. Kompakter Erst-Check: ein fokussierter Workshop plus schriftliche Kurzeinschätzung mit den drei naheliegendsten Automatisierungs-Ansätzen und einer Empfehlung, ob sich ein tieferer Readiness-Check lohnt. Voll anrechenbar auf jedes Folgepaket. Der günstigste Einstieg – für Büros, die zunächst nur eine ehrliche Aussensicht ohne grosses Budget wollen.

Readiness-Check (Audit-Light) – CHF 1700, 2 Tage. Zwei Workshops von je 3 Stunden, einer mit der Geschäftsleitung, einer mit den Sachbearbeitenden. Ergebnis: schriftlicher Befund mit drei priorisierten Automatisierungs-Kandidaten, Schätzung Aufwand/Nutzen pro Kandidat, Empfehlung zu Datenschutz-Vorarbeiten. Kein Code. Geeignet als Entscheidungs-Grundlage für das nächste Quartal.

KI-Fundament – CHF 4800, 5 Tage. Readiness-Check plus Aufsetzen eines EU-gehosteten Servers (typisch Hetzner Helsinki oder Falkenstein, ca. CHF 30 bis 60 pro Monat direkt auf dem Kunden-Account), Installation eines n8n-Workflows (z.B. E-Mail-Triage oder Belegerkennung), eine 2-stündige Schulung für das Team. Liefert einen produktiven Workflow am Ende der Woche.

AI-Backend-Pilot – CHF 7800, 4 bis 6 Wochen. Vollständige Backend-Pipeline: Multi-LLM-Gateway (LiteLLM), Vektor-DB (Qdrant) mit Erstbefüllung, RAG über bestehende Wegleitungen/Handbücher, 2 bis 3 n8n-Workflows, Monitoring (Grafana + Sentry). Inkludiert die Datenschutz-Folgeabschätzung als ausarbeitetes Dokument. Nicht inkludiert: Schulung, Managed Service.

Komplett-Onboarding – CHF 14500, Pilot + 12 Monate Managed. Der Pilot oben plus zwölf Monate Managed Service Pro (Patching, Monitoring, monatliches Update-Gespräch, kleinere Anpassungen). Geeignet für Büros ohne eigene IT-Person.

Server-Miete – CHF 30 bis 120 pro Monat, direkt auf Kunden-Account. Wir kaufen den Server nicht weiter – er läuft auf dem Hetzner/OVH-Konto des Kunden. So bleibt die Hoheit beim Kunden, und es entsteht keine Abhängigkeit. Typische Konfigurationen: CX22 für Audit-Stage (CHF 7/Mo), CX32 für Standard (CHF 14/Mo), CCX23 für Büros mit lokalem Ollama (CHF 60/Mo), dedicated AX42 bei GPU-Bedarf (ab CHF 120/Mo).

Laufende Token-Kosten – typisch CHF 1 bis 25 pro Monat. Beispiel RAG mit 200 Anfragen pro Monat, Mistral Small 3.1 (Mai 2026: USD 0.20/1M In, USD 0.60/1M Out): rund CHF 1 pro Monat. Bei intensiver Nutzung mit 2000 Anfragen und grösseren Kontexten: bis CHF 25 pro Monat. Anthropic Claude oder OpenAI GPT-4o liegen ca. 5- bis 10-mal höher, deshalb Multi-LLM-Routing.

Managed Service – CHF 600 / 1200 / 2200 pro Monat. Drei Stufen. *Basic* (CHF 600): Patching, Backup-Check, Monitoring-Alerts bearbeiten. *Pro* (CHF 1200): Basic plus monatliches Update-Gespräch 60 Minuten, bis 4 Stunden Anpassungen. *Plus* (CHF 2200): Pro plus garantierte 4h-Reaktion an Werktagen, vierteljährlicher Sicherheits-Review, ROI-Reporting.

Total Beispiel 5-MA-Treuhand, erstes Jahr. KI-Fundament CHF 4800 (rechnet Speedcheck und Readiness-Check an) – also CHF 4800 für die Einstiegs-Stufen – plus AI-Backend-Pilot CHF 7800 – Total Projekt CHF ~12600. Plus 12 Monate Server (CX32: CHF 168) plus Token (CHF 1 x 12 = CHF 12) plus Managed Pro 12 Monate (CHF 14400). Total Jahr 1 = ca. CHF 27180. Wenn das Büro auf Managed Basic geht: rund CHF 20000. Beide Zahlen liegen im Rahmen, den Deloitte 2026 mit Break-Even nach 2 bis 4 Monaten beschreibt.

Buchungs- und Abrechnungs-Ablauf

01Erstgespräch 30 Minuten kostenlos: wir hören zu, fragen nach den drei grössten Zeitfressern, schlagen das passende Paket vor.
02Mit dem KI-Speedcheck (CHF 590) starten, einen Readiness-Check (CHF 1700) buchen oder direkt das KI-Fundament (CHF 4800) – Speedcheck und Readiness-Check werden angerechnet, falls innert 60 Tagen weitergebucht.
03Vertrag und Datenschutz-Erklärung schriftlich, Anzahlung 50 Prozent vor Projektstart, Rest nach Abnahme.
04Server-Konto wird auf den Namen des Kunden eröffnet – Hetzner/OVH/Infomaniak je nach Präferenz. Zahlung läuft direkt zwischen Kunde und Provider.
05Token-Konto bei Mistral/OpenAI/Anthropic ebenfalls auf Kunden-Name – wir setzen Budget-Alerts auf USD 10/20/50 pro Monat als Schutz vor Überraschung.
06Managed Service ab Monat 1 nach Pilot-Abnahme, kuendbar mit 1 Monat zum Monatsende – keine 12-Monats-Lock-Ins.
07Monatliche Rechnung in CHF, MwSt-pflichtig (CH-Niederlassung), Zahlbar netto 30 Tage. Quartals- oder Jahresvorauszahlung gibt 5 Prozent Rabatt.

Welches Paket für welches Profil

Der KI-Speedcheck passt für Büros mit knappem Budget, die mit minimalem Einsatz eine erste Aussensicht wollen, bevor sie sich auf einen grösseren Schritt festlegen. Der Readiness-Check (Audit-Light) passt für Büros, die noch nicht wissen, wo ihre grössten Zeitfresser liegen, und die zuerst eine fundierte Aussensicht wollen – bevor sie investieren. Das KI-Fundament passt für Büros mit einem konkreten Engpass (z.B. E-Mail-Flut, manuelle Belegerfassung) und einer klaren Erwartung an die erste produktive Anwendung. Der AI-Backend-Pilot passt für Büros, die mehrere Workflows automatisieren wollen und bereit sind, in eine eigene Infrastruktur statt in ein SaaS-Abo zu investieren – typisch ab 5 Mitarbeitenden.

Komplett-Onboarding ist der Pfad für Büros mit etablierten Mandantenprozessen, die wissen, dass sie weder Zeit noch Lust haben, eine n8n-Instanz selber zu pflegen. Hier zahlt der Kunde die Ruhe, jeden Monat das System ohne weiteres Zutun laufen zu sehen – und einmal pro Monat eine knappe E-Mail mit "alles grün plus drei Verbesserungs-Vorschläge" zu erhalten.

Server-Miete und Token-Kosten sind nicht optional, sondern Teil jedes Pakets ab dem KI-Fundament. Sie sind aber transparent und gehören dem Kunden – bei Wechsel des Beraters bleibt die Infrastruktur stehen.

Wann nicht buchen

Nicht buchen, wenn das Büro unter 3 Mitarbeitenden hat und keine wiederkehrenden Standardprozesse – der Einrichtungsaufwand übersteigt den Nutzen. Hier ist eine Investition in eine gute Buchhaltungssoftware (Bexio, Klara, Run my Accounts) wertvoller als KI.

Nicht buchen, wenn die Geschäftsleitung KI als Mittel zum Personalabbau positioniert. Die Pakete sind so konzipiert, dass sie Sachbearbeitende entlasten und mehr Mandanten pro Person ermöglichen – nicht weniger Personen. Wer mit der falschen Erwartung startet, bricht das Projekt typisch nach drei Monaten ab und macht die Investition verloren.

Nicht buchen, wenn die Datenschutz-Vorarbeiten (AVV mit LLM-Anbieter, DSFA, aktualisierte Datenschutzerklärung) nicht geleistet werden können oder wollen. Wir liefern die Dokumente im Pilot mit, aber unterschreiben muss sie die Geschäftsleitung. Ohne diese Unterschrift fällt das Büro in die revDSG-Risikozone.

Vor- und Nachteile

STÄRKEN

Drei einmalige Festpreise plus drei klare Managed-Stufen – keine Hourly-Überraschungen
Infrastruktur auf Kunden-Konto – keine Geisel-Lage, jederzeit Beraterwechsel möglich
Token-Kosten üblich unter CHF 25 pro Monat bei Multi-LLM-Routing
Speedcheck und Readiness-Check werden bei Folgebuchung innert 60 Tagen angerechnet

SCHWÄCHEN

Günstigster Einstieg ist der KI-Speedcheck für CHF 590 – darunter und Gratis-"Spielwiesen" gibt es nicht
Server-Miete und Token sind kundenseitige Drittkosten, nicht in den Projektpreisen enthalten
Managed Service ist die Wahl ohne eigene IT-Person – wer das selber stemmen will, zahlt nur die Pilot-Preise
Datenschutz-Vorarbeiten müssen vom Kunden unterzeichnet werden, das nimmt 1 bis 2 Wochen

Häufige Fragen

Warum läuft der Server auf dem Kunden-Account?

Damit es keine Geisel-Situation gibt. Wenn ein Büro nach 8 Monaten nicht mehr mit uns arbeiten will, behält es Server, Daten und n8n-Workflows. Wir übergeben Zugang und Dokumentation und sind aus dem Bild. Das ist eine harte technische Trennung, nicht nur eine Vertragsklausel – und sie ist 2026 ehrlich gesagt ein Differenzierungs-Merkmal gegenüber den meisten Anbietern, die "ihre" Cloud verkaufen.

Was passiert, wenn die Token-Kosten plötzlich steigen?

Budget-Alerts feuern bei Mistral/OpenAI/Anthropic bei USD 10/20/50 pro Monat. Im Managed Service ist eine monatliche Token-Auswertung Teil des Reports – wenn der Verbrauch um mehr als 50 Prozent gegenüber dem Vormonat steigt, kommt eine Mail mit "warum" innert 24h. Typische Ursachen: ein Mitarbeiter benutzt den Chatbot für private Lese-Anfragen, oder ein RAG-Index läuft auf zu grossen Chunks. Beides ist in einer Stunde behoben.

Geht es auch ohne Cloud – rein lokal?

Ja, mit Ollama auf einem dedizierten Server mit GPU. Realistische Kosten: AX42-Server mit RTX-4000 ca. CHF 150 pro Monat, plus den einmaligen Setup-Aufwand. Modellqualität liegt aktuell hinter Cloud-Spitze (Llama 3.3 70B vs. GPT-4o), aber für Treuhand-Standard reicht es. Pflicht ist es bei Mandanten unter Berufsgeheimnis, die dem Cloud-Routing nicht zustimmen wollen – siehe self-hosted-vs-cloud-llm.

Sind die Preise verhandelbar?

Die einmaligen Projektpreise sind Festpreise – kein Hourly-Modell, keine Nachforderungen. Der Managed Service ist verhandelbar nach unten bei Jahresvorauszahlung (5 Prozent) und nach oben bei zusätzlichen SLA-Anforderungen (z.B. 24/7-Bereitschaft ist nicht Standard und kostet ein Vielfaches). Bei mehreren Mandaten in einer Treuhand-Gruppe verhandeln wir Rahmenverträge.

Quellen

TYTOS Schweiz – KI-Automatisierung für Schweizer KMU Leitfaden 2026 · 2026-03
schnellstart.ai – 5 Prozesse zum Sofort-Automatisieren (Frauenfeld Case) · 2026-03
Mistral La Plateforme – Pricing Mai 2026 (Small 3.1, Large 3, Medium 3) · 2026-05
AI Automation Hub Schweiz – Kosten und ROI Berechnung · 2026-02
Hetzner Cloud – Preise CX22/CX32/CCX23/AX42 · 2026-05

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen