fairlane.systems

MANDANTEN-TRIAGE · ANWENDUNGSFALL

KI-Triage für Mandantenanfragen: WhatsApp, E-Mail und Telefon zu strukturierten Vorgängen

KI klassifiziert Mandantenanfragen, sucht Antwort-Bausteine in der internen Wissensbasis und legt einen Entwurf für den Sachbearbeiter bereit.

Recherche & Faktencheck: · Stand: 2026-05

Worum es geht

Eine durchschnittliche Schweizer Treuhand-Praxis mit 10-15 Mitarbeitenden empfängt zwischen 80 und 200 Mandantenanfragen pro Woche. Die Eingangskanaele streuen breit: E-Mail an die generische info@-Adresse, Direktmails an den persönlich bekannten Sachbearbeiter, Anrufe (oft unbeantwortet, weil der Sachbearbeiter im Termin steckt), Mandantenportal-Nachrichten, zunehmend auch WhatsApp-Business und Threema-Work. Die Themen variieren noch stärker: "Wann kommt meine Steuererklärung?", "Ich habe ein Schreiben vom Steueramt Schwyz erhalten - was tun?", "Mein Mitarbeiter geht in Pension - was muss ich melden?", "Brauche ich für den Umsatz im EU-Webshop eine MWST-Nummer in Deutschland?", "Kann ich die Renovierung meiner Eigentumswohnung 2026 noch in der Steuererklärung 2025 abziehen?".

KI-Triage für Mandantenanfragen bedeutet: jede eingehende Nachricht wird automatisch gelesen, dem richtigen Themenfeld und dem richtigen Sachbearbeiter zugeordnet, mit einem Antwort-Entwurf aus der internen Wissensbasis versehen und im Tagesposteingang des Mitarbeiters zur Freigabe abgelegt. Die Maschine bereitet vor, der Mensch entscheidet und versendet.

Der Unterschied zur Lohn-Triage und zur MWST-Vorbereitung: diese Pipeline ist breiter und weniger spezialisiert. Sie deckt das gesamte Anfragen-Spektrum eines Treuhand-Buros ab, nicht nur ein Fachgebiet.

Warum es wichtig ist

Drei Punkte machen die Mandantenanfragen 2026 zum wichtigsten Hebel im Treuhand-Büro.

Erstens: Service-Erwartung. Mandanten erwarten - geformt durch Online-Banking und Plattformen wie Bexio - Reaktionszeiten von wenigen Stunden, nicht von zwei Werktagen. Wer eine Anfrage am Freitagnachmittag schickt und am Dienstag noch keine Antwort hat, beginnt sich nach Alternativen umzusehen. Treuhandsuisse hat 2024 in einer Mitgliederbefragung festgehalten, dass 38% der Mandats-Verluste mit "schlechte Erreichbarkeit" begründet werden.

Zweitens: Personalknappheit (siehe auch Lohn-Triage). Eine Sachbearbeiterin, die täglich 30-40 Anfragen manuell triagiert, bevor sie überhaupt mit Sachbearbeitung beginnen kann, verliert zwei Stunden pro Tag an reine Sortier- und Recherche-Aktivität. Diese zwei Stunden sind die direkte ROI-Quelle der KI-Triage.

Drittens: Berufsgeheimnis. Mandantenanfragen enthalten regelmässig besonders schützenswerte Personendaten (Gesundheit, Einkommen, Familienverhältnisse). Die KI-Pipeline muss diesen Daten denselben Schutz bieten wie ein Aktenschrank im Büro. Konkret bedeutet das: kein Cloud-Modell ohne Auftragsverarbeitungsvertrag und EU-/CH-Hosting, Pseudonymisierung der Mandanten-IDs vor jedem Modell-Call, lokale Vektor-Datenbank für die Mandantenakte, und ein Audit-Log, der jede Modell-Anfrage und jede menschliche Freigabe protokolliert.

Die berufsrechtlichen Pflichten ergeben sich aus den Standesregeln von Treuhandsuisse und EXPERTsuisse - die das Berufsgeheimnis nach StGB Art. 321 zwar nicht direkt anwenden (das gilt nur für Ärzte, Anwälte und einige weitere), aber inhaltlich ein vergleichbares Schutzniveau verlangen.

Wie es funktioniert

Die Pipeline besteht aus fünf Modulen.

Modul 1 - Multi-Channel-Ingestion: n8n empfängt E-Mails über IMAP, Portal-Nachrichten über Webhook, WhatsApp-Business-Nachrichten über die offizielle Meta-Cloud-API, optional Threema-Work-Nachrichten über die Broadcast-API, optional Telefon-Voicemails über Whisper-Transkription. Jeder Eingang erhält eine Vorgangs-ID und wird mit Zeitstempel und Kanal im Audit-Log abgelegt.

Modul 2 - Mandanten-Identifikation: Aus der Absender-E-Mail, der Telefonnummer oder dem Portal-Login wird die Mandantennummer im CRM identifiziert. Wenn der Mandant nicht eindeutig identifizierbar ist, wird die Anfrage als "Eingang ohne Mandanten-Bezug" markiert und an die Empfangsstelle des Buros geleitet.

Modul 3 - Klassifikation: Ein Sprachmodell (Claude Haiku für Standard, Claude Sonnet für schwierige Fälle) ordnet die Nachricht einem von ca. 25 internen Themenfeldern zu: Steuererklärung Privatperson, Steuererklärung Unternehmen, MWST, Lohn, Sozialversicherungen, Buchhaltung-Operativ, Jahresabschluss, Rechtsfragen Erbe, Vorsorge, Immobilien, ESG-Berichterstattung, etc. Zusätzlich wird die Dringlichkeit klassifiziert (Frist-Stichtag im Text, Anwesenheit von Wortern wie "dringend", "Mahnung", "Sperrung").

Modul 4 - RAG-Lookup mit zwei Quellen: Erste Quelle ist die Mandantenakte (lokal in Qdrant, vertraulich): letzte Korrespondenz, offene Vorgänge, vereinbarte Honorar-Rahmen, besondere Vereinbarungen. Zweite Quelle ist die büro-interne Praxis-Bibliothek (lokal in Qdrant, weniger sensibel): Standard-Antworten, interne Wegleitungen, EXPERTsuisse-Fachpublikationen, Treuhandsuisse-Praxisleitfaden, kantonale Steuerwegleitungen. Beide Quellen liefern Top-Passagen, die in den Antwort-Prompt einfliessen.

Modul 5 - Entwurfs-Generierung und Freigabe: Das Sprachmodell formuliert einen Antwort-Entwurf in Sie-Form, mit Zitaten und Frist-Hinweis. Bei Unsicherheit gibt es zurück: "Prüfung Sachbearbeiter erforderlich". Der Entwurf landet im Posteingang des zuständigen Mitarbeiters (Outlook-Entwurf, Mandantenportal-Entwurf oder ein eigener Triage-Posteingang im CRM). Erst nach manueller Freigabe verlässt die Antwort das Buro.

Für wiederkehrende Mandanten lernt das System: nach 50-100 Anfragen kennt der Klassifikator die Themen-Verteilung pro Mandant und kann präziser zuordnen.

Pipeline in 6 Schritten

  1. 01Multi-Channel-Eingang: E-Mail, Portal, WhatsApp-Business, Threema-Work, Voicemail-Transkripte landen via n8n in einem zentralen Triage-Posteingang.
  2. 02Mandanten-Match: CRM-Lookup über E-Mail-Adresse, Telefonnummer oder Portal-Login. Pseudonymisierung der Mandanten-ID vor LLM-Call.
  3. 03Klassifikation: Sprachmodell ordnet einem von 25 Themenfeldern zu, bestimmt Dringlichkeit, erkennt Eskalations-Fälle (Mahnung, Konkurs, Frist < 5 Tage).
  4. 04RAG-Lookup: zwei Quellen parallel - Mandantenakte (vertraulich, lokal) und Praxis-Bibliothek (Wegleitungen, EXPERTsuisse-Publikationen).
  5. 05Entwurfsgenerierung: Antwort-Vorschlag in Sie-Form, mit Quellen, Frist-Hinweis, optional Honorar-Hinweis (z.B. "diese Beratung ist nicht im Pauschal-Rahmen").
  6. 06Freigabe: Entwurf liegt im Posteingang des zuständigen Mitarbeiters. Erst nach manueller Freigabe Versand. Audit-Log dokumentiert Modell-Call, Quellen, Entwurf, Freigeber.

Wann einsetzen

Sinnvoll ab ca. 50 Mandantenanfragen pro Woche, klar wirtschaftlich ab 100. Konkret: ein Treuhand-Büro in St. Gallen mit 14 Mitarbeitenden und 280 aktiven Mandaten, das im Schnitt 160 Anfragen pro Woche bearbeitet; eine Treuhand-Boutique in Genf mit französisch- und deutschsprachigen Mandanten; eine Treuhand-Kanzlei in Zug mit hohem Anteil internationaler Mandanten (englische Kommunikation, vielfache DBA-Konstellationen).

Besonders wirtschaftlich, wenn das Büro (a) ein Mandantenportal betreibt und die Nutzung steigern möchte, (b) WhatsApp-Business eingeführt hat oder einführen möchte, (c) ein hohes Volumen an Standard-Anfragen "wann kommt mein Steuerbescheid" hat.

Wann NICHT

Nicht einsetzen bei sehr kleinen Buros (< 30 Anfragen pro Woche). Der Einrichtungsaufwand übersteigt den Nutzen.

Nicht einsetzen ohne Datenschutz-Vorarbeit. Mandantenanfragen enthalten regelmässig Gesundheitsdaten, Familienverhältnisse und Vermögenslage - alles besonders schützenswerte Personendaten nach Art. 5 lit. c revDSG. Voraussetzungen: schriftlicher AVV mit dem LLM-Anbieter, EU- oder CH-Hosting (Mistral La Plateforme EU, Anthropic via AWS eu-central-1 mit Zero-Retention, lokales Ollama), Pseudonymisierung der Mandanten-IDs vor dem Modell-Call, dokumentierte Datenschutz-Folgeabschätzung (DSFA).

Nicht einsetzen ohne klares Eskalations-Protokoll. Wenn die KI eine sehr dringende Anfrage (Konkurs-Antrag, Steueramt-Mahnung mit Pfändungs-Drohung) auf normalem Triage-Weg verarbeitet, geht Zeit verloren. Im Klassifikator muss eine "Eskalations-Spur" definiert sein, die solche Fälle innerhalb von 15 Minuten direkt an die Geschäftsleitung pushed.

Nicht einsetzen für Anfragen, die rechtsanwaltliche Beratung enthalten. Treuhänder dürfen nach Anwaltsgesetz keine Rechtsberatung im engeren Sinn anbieten. Der Klassifikator muss solche Anfragen erkennen und an den externen Anwalts-Kollegen weiterleiten - nicht selbst inhaltlich beantworten.

Vor- und Nachteile

STÄRKEN

  • Reaktionszeit von 2-3 Werktagen auf 4-8 Stunden gedrückt - direkter Wettbewerbsvorteil
  • Sachbearbeiter sparen 1.5-2 Stunden pro Tag an Sortier- und Recherchearbeit
  • Wiederkehrende Standard-Anfragen ("wo ist meine Steuererklärung") werden zu 80% durch Entwurfs-Vorschlag abgedeckt
  • Audit-Log erfüllt die revDSG-Dokumentationspflicht bei automatisierter Verarbeitung

SCHWÄCHEN

  • Datenschutz-Vorarbeit (AVV, DSFA, Pseudonymisierung) ist substanziell - 2-4 Wochen bevor die erste Pipeline live geht
  • Klassifikator braucht 4-6 Wochen Training mit Sachbearbeiter-Feedback
  • Mandanten-Erwartung kann steigen ("ich erwarte jetzt immer schnelle Antwort") - das Büro muss die SLA bewusst kommunizieren
  • Eskalations-Spur muss sauber definiert sein, sonst gehen dringende Fälle im Triage-Strom unter

Häufige Fragen

Wie wird das Berufsgeheimnis konkret geschützt?

Drei Schichten. Erste Schicht: Pseudonymisierung. Bevor irgendein LLM-Call abläuft, werden Mandantenname, Adresse und alle persönlich identifizierenden Daten durch Platzhalter ersetzt ("Mandant_4711", "Adresse_4711"). Die Zuordnung passiert nur lokal. Zweite Schicht: Hosting. Modelle laufen EU oder CH (Mistral La Plateforme EU, Anthropic AWS eu-central-1 mit Zero-Retention, lokales Ollama). Kein Daten-Transfer nach USA ohne TIA (Transfer-Impact-Assessment). Dritte Schicht: Audit-Log. Jeder Modell-Call wird mit Zeitstempel, Anrufer, Eingangs-Hash und Resultat-Hash protokolliert. Im Anlassfall (EDÖB-Anfrage, Mandanten-Beschwerde) ist nachweisbar, was gespeichert und was gelöscht wurde.

Was passiert bei einer WhatsApp-Anfrage von einem unbekannten Mandanten?

Die Mandanten-Match-Stufe scheitert (keine Telefonnummer im CRM). Die Pipeline markiert "neuer Kontakt", verzichtet auf den vertraulichen RAG-Schritt und beantwortet nur generisch - oder leitet an die Empfangsstelle weiter, die rückruft. Datenschutz-Grundsatz: nie eine Antwort zu Mandantendaten geben, ohne zu wissen, an wen die Antwort geht.

Wie viele falsche Klassifikationen pro Tag sind normal?

In der Einführungsphase 5-10%. Nach 4-6 Wochen Training und Feedback durch die Sachbearbeiter sinkt die Fehlerquote auf 1-3%. Wichtig: die Fehler werden im Audit-Log gesammelt, ein kleines Feedback-UI ("Klassifikation korrekt? Falsch -> richtige Kategorie") lässt die Sachbearbeiter den Klassifikator nachführen. Jeder Fehler ist ein Trainings-Datenpunkt.

Verwandte Themen

LOHN-TRIAGE · ANWENDUNGSFALLKI-Triage in der Lohnbuchhaltung: Mandantenanfragen zu AHV, BVG, Quellensteuer vorsortierenMWST-VORBEREITUNG · ANWENDUNGSFALLKI-Vorbereitung der MWST-Abrechnung: Belege klassifizieren, Vorsteuer-Codes vorschlagen, Saldosteuersatz prüfenBELEG-OCR · ANWENDUNGSFALLKI-Belegerkennung für Schweizer Belege: QR-Rechnung, Quittungen, PDF-Rechnungen strukturiert erfassenBOTS · SERVICEWhatsApp- & Telegram-Bot: KI, die auf den Kanälen antwortet, die Ihre Kundschaft nutztSTGB 321 · COMPLIANCEBerufsgeheimnis (StGB Art. 321) und KI-Nutzung: Was Anwälte, Notare, Ärzte und Revisoren beachten müssen

Quellen

  1. Treuhand|Suisse - Praxisleitfaden für Treuhandunternehmen · 2025-09
  2. EXPERTsuisse - Fachpublikationen Treuhand und Wirtschaftsprüfung · 2025-12
  3. EDÖB - Erläuterungen zur DSFA-Pflicht im KMU-Umfeld · 2025-06
  4. Meta - WhatsApp Business Cloud API Dokumentation · 2026-04
  5. Treuhandsuisse - Mitgliederbefragung 2024 zu Mandats-Bindung · 2024-10

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen