E-MAIL-TRIAGE · ANWENDUNGSFALL

E-Mail-Triage-Automation: Eingangsflut klassifizieren, zuordnen, Entwurf bereitstellen

IMAP-Watcher liest jede Mail, ein EU-LLM klassifiziert (Mandant/Rechnung/Anfrage/Newsletter/Spam), RAG bringt Mandanten-Kontext, Entwurf landet beim Sachbearbeiter. Versand nur per Hand.

Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05

Worum es geht

E-Mail ist 2026 immer noch der Hauptkommunikationskanal zwischen Schweizer Treuhand-Büros, Anwaltskanzleien und KMU. Der Posteingang füllt sich pro Mitarbeitenden mit 60 bis 180 Nachrichten am Tag; die Spannweite reicht von einer Mahnung des Telekom-Anbieters bis zur dringenden Steuerfrist-Anfrage eines Schlüsselmandanten. Das manuelle Sortieren dieser Flut kostet eine Vollzeit-Sachbearbeiterin pro Tag rund 60 bis 90 Minuten – Zeit, die nicht in Beratung oder Bearbeitung fliesst.

E-Mail-Triage-Automation bedeutet: ein automatischer Vorgang liest jede eingehende Mail, klassifiziert sie nach festen Kategorien (Mandantenanfrage, Eingangsrechnung, Newsletter, Spam, Sonstiges), ordnet sie dem richtigen Mandanten zu (per Absender-Adresse oder Inhalt), holt aus der Mandantenakte den relevanten Kontext via RAG, und legt einen Antwort-Entwurf in den Posteingang des zuständigen Sachbearbeiters. Versendet wird erst nach Freigabe durch den Menschen – automatisches Senden ist hier nicht nur unklug, sondern berufsrechtlich problematisch (StGB Art. 321 Berufsgeheimnis).

Das Ziel ist nicht die Automatisierung der Antwort. Das Ziel ist die Automatisierung der Vorarbeit: Sortieren, Zuordnen, Recherchieren, Entwerfen. Die Mitarbeiterin kommt morgens zur Maschine, sieht 80 Mails – und davon 35 mit fertigem Entwurf, der ihr 70 Prozent der Schreibzeit erspart. Die restlichen 45 Mails landen sauber kategorisiert und priorisiert.

Warum es wichtig ist

Drei Punkte machen E-Mail-Triage 2026 zum besten Einstiegs-Anwendungsfall für KI in einem CH-KMU.

Erstens: hoher Hebel. Jede Person in einem Schweizer Büro verbringt 12 bis 18 Stunden pro Woche mit E-Mail-Bearbeitung. Wenn auch nur 30 Prozent dieser Zeit durch Vor-Sortierung und Entwürfe gewonnen werden, kommen pro Mitarbeitenden 4 bis 5 Stunden pro Woche zurück. Bei einem Büro mit 8 Mitarbeitenden sind das 30 bis 40 Stunden pro Woche.

Zweitens: niedriges Risiko. Anders als bei automatisierter Buchung oder direkter Mandantenkommunikation wird in einem sauberen Setup nie etwas automatisch gesendet. Der Worst Case ist ein schlechter Entwurf, den der Mensch verwirft. Es entsteht keine direkte Aussenwirkung – die Schwelle für Pilot-Akzeptanz im Büro ist niedrig.

Drittens: gute Verfügbarkeit der Bausteine. n8n bietet seit Jahren einen produktionsreifen IMAP-Trigger-Node mit Polling oder IDLE-Modus. Microsoft Graph API gibt für Outlook-365-Konten denselben Zugriff. Mistral Small 3.1 (EU-Hosting, USD 0.20/1M In, USD 0.60/1M Out, Stand Mai 2026) reicht für Klassifikation und Entwurf qualitativ aus. Pro Mail kommen so Kosten von rund USD 0.0002 für Klassifikation und USD 0.001 bis 0.002 für Entwurf zusammen – bei 100 Mails am Tag sind das USD 0.20 bis 0.40, etwa CHF 6 bis 12 pro Monat. Das ist weniger als ein Mittagessen.

Aus regulatorischer Sicht: Mandantenanfragen sind Personendaten nach Art. 5 lit. a revDSG. Werden sie an einen US-LLM-Anbieter gesendet, gilt Art. 16-18 DSG (Drittlandtransfer). Mit EU-gehostetem Mistral oder Anthropic Claude via AWS eu-central-1 (Zero-Retention-Vertrag) bleibt der Transfer in akzeptablem Rahmen. Voraussetzung ist eine schriftliche AVV und eine aktualisierte Datenschutzerklärung.

Wie die Pipeline funktioniert

Die Pipeline läuft in fünf Schichten ab. Sie ist bewusst einfach gehalten – komplexe Klassifikatoren-Ketten verschlechtern oft die Zuverlässigkeit.

Schicht 1 – IMAP-Watcher. Ein n8n-Workflow mit dem Email-Trigger-Node lauscht auf den Eingang des Postfachs. IDLE-Modus (sofort) bevorzugt gegenüber Polling (alle 1-5 Minuten). Jede Mail wird mit Vorgangs-ID versehen und in ein Audit-Log eingetragen. Anhänge werden separat ausgepackt und optional an OCR (siehe ai-belegerkennung-ocr) übergeben, falls PDF/Bild erkannt.

Schicht 2 – Klassifikation. Mistral Small 3.1 (oder Claude Haiku als Alternative) erhält Betreff, Absender und die ersten 1000 Zeichen des Bodys. Output ist ein striktes JSON-Objekt: { category: "mandant|rechnung|anfrage|newsletter|spam|sonstiges", confidence: 0.0-1.0, sender_known_client: true|false, urgency: "hoch|mittel|niedrig", language: "de|fr|it|en" }. Bei confidence < 0.6 wird automatisch eskaliert (Schicht 5).

Schicht 3 – Mandanten-Zuordnung. Wenn sender_known_client = true, wird die Mandantennummer über die E-Mail-Adresse in der Bexio/Klara/AbaConnect-API gesucht. Wenn false, sucht ein zweiter LLM-Call im Body nach Firmennamen, Mandanten-Kürzel oder UID, die zuordbar sind. Bleibt die Zuordnung unsicher, wandert die Mail in einen "Unklar"-Ordner und wird einem Triage-Verantwortlichen vorgelegt.

Schicht 4 – RAG-Kontext-Anreicherung. Ein Qdrant-Lookup zieht aus der Mandantenakte die für den Mail-Inhalt passenden Passagen: letzte Korrespondenz, offene Pendenzen, Verträge, MwSt-Stand. Top-5 Passagen werden in den Entwurfs-Prompt eingespeist. Ohne RAG funktioniert die Klassifikation noch – die Entwurfsqualität sinkt dann aber deutlich.

Schicht 5 – Entwurf und Freigabe. Mistral Small 3.1 formuliert einen Antwort-Entwurf in der Sprache der Eingangs-Mail. Sie-Form, höflich, mit konkretem Verweis auf das herangezogene Material. Der Entwurf landet als Outlook-Entwurf (via Microsoft Graph) oder als Gmail-Draft (via Google Workspace API) im Posteingang des zuständigen Sachbearbeiters. Er liest, ergänzt, entscheidet – und sendet erst dann. Audit-Log dokumentiert Eingang, Klassifikation, Entwurf, Freigeber, Sendezeitpunkt.

Edge-Cases. Bei reinen Newslettern oder offensichtlichem Spam wird kein Entwurf erstellt; die Mail wird nur in den entsprechenden Ordner verschoben. Bei Eingangsrechnungen wird der Anhang an die OCR-Pipeline weitergereicht und das Buchungs-Vorbereitungsblatt erstellt – eine separate Pipeline, die hier nur als Andockpunkt zählt. Bei mehrsprachigen Mails (z.B. französische Anfrage von einem Romandie-Mandanten) erkennt der Klassifikator die Sprache und der Entwurf folgt im gleichen Idiom.

Pipeline in 6 Schritten

01Eingang: n8n IMAP-Trigger (oder Microsoft Graph für Outlook 365) verarbeitet jede neue Mail, vergibt Vorgangs-ID, Audit-Log-Eintrag.
02Klassifikation: Mistral Small 3.1 (EU) klassifiziert nach 6 Kategorien plus Sprache, Dringlichkeit, Mandanten-Bekanntheit. Confidence < 0.6 eskaliert sofort.
03Mandanten-Zuordnung: Bexio/Klara/Abacus-API-Lookup per Sender-Adresse, Fallback: LLM-Suche im Body nach Firmenname/UID.
04RAG-Lookup: Qdrant liefert Top-5 Passagen aus Mandantenakte (letzte Korrespondenz, offene Pendenzen, Verträge).
05Entwurf: LLM formuliert Antwort in passender Sprache und Form (Sie/Vous/Lei), mit konkretem Bezug zum Kontext. Bei Unsicherheit: Vermerk an Sachbearbeiter ohne Entwurf.
06Freigabe: Entwurf als Outlook/Gmail-Draft im Posteingang. Mensch liest, ergänzt, sendet manuell. Audit-Log dokumentiert Freigeber und Zeitstempel.

Wann einsetzen

E-Mail-Triage-Automation lohnt sich ab etwa 40 eingehenden Mails pro Tag und Mitarbeitenden. Darunter ist der Setup-Aufwand zu hoch für den Nutzen. Ab 80 Mails am Tag und Mitarbeitenden ist das Projekt typisch innert 3 bis 5 Monaten amortisiert (bei realistischem Billable-Anteil von 40 bis 60 Prozent – siehe roi-rechner-ki-projekt).

Konkrete Konstellationen: ein Treuhand-Büro mit 6 Mitarbeitenden, das pro Tag rund 500 Mails empfängt; eine Anwaltskanzlei mit 4 Anwälten plus 3 Assistenzen und 700 Mails pro Tag; ein KMU-Sales-Team mit 8 Personen und 1000 Mails pro Tag; eine Bauverwaltung mit 12 Sachbearbeitern und vielen Mietanfragen.

Besonders geeignet: Büros mit klar wiederkehrenden Anfragetypen (10 bis 20 Kategorien decken 80 Prozent der Mails ab), Büros mit gepflegter Mandantenakte (RAG-Qualität steigt mit guter Datenbasis), Büros mit Outlook-365 oder Google-Workspace (API-Anbindung ist standard).

Weniger geeignet, aber möglich: Büros mit selbst gehostetem Mail-Server (IMAP funktioniert, aber das Setup dauert länger), Büros mit hohem Anteil hand-individueller Mails (geringere Trefferquote, weil "wiederkehrend" nicht überwiegt).

Wann NICHT einsetzen

Nicht einsetzen, wenn die Datenschutz-Vorarbeiten fehlen. Mandantenmails enthalten Personendaten – ohne AVV mit dem LLM-Anbieter und ohne aktualisierte Datenschutzerklärung ist der Pilot revDSG-rechtswidrig (Art. 9 i.V.m. Art. 19 DSG). Die Vorarbeit nimmt 1 bis 2 Wochen.

Nicht einsetzen, wenn die Geschäftsleitung erwartet, dass Mails automatisch versendet werden. Das ist nicht der Use-Case – automatisches Senden bei Mandantenkorrespondenz verletzt Berufsgeheimnis-Pflichten und ist ein Reputations-Risiko. Wer den vollautomatischen Versand will, ist im falschen Anwendungsfall (vielleicht ein Marketing-Drip statt Triage).

Nicht einsetzen ohne Mensch-im-Loop für mindestens die ersten 6 Wochen. Auch wenn der Klassifikator gut wird: jede Klassifikation muss in der Anlaufphase überprüft werden. Erst wenn über 4 Wochen die Trefferquote stabil über 90 Prozent liegt, kann die manuelle Stichprobe auf z.B. jede 5. Mail reduziert werden.

Nicht einsetzen bei Mandanten unter besonders strengem Berufsgeheimnis (z.B. Anwaltskanzleien mit Strafmandaten) ohne lokales LLM-Routing. Hier ist Ollama auf eigener Hardware die saubere Lösung; ein Cloud-Modell hat unter Anwaltsgeheimnis (BGFA Art. 13) regelmässig nichts verloren.

Vor- und Nachteile

STÄRKEN

60 bis 90 Minuten pro Tag und Mitarbeitenden gespart – der höchste Hebel-Use-Case in CH-KMU
Niedriges Risiko, weil nie automatisch gesendet wird
Bausteine sind seit Jahren produktionsreif (n8n IMAP, Mistral EU, Qdrant)
Token-Kosten unter CHF 15/Monat bei 100 Mails/Tag und EU-Modell

SCHWÄCHEN

Datenschutz-Vorarbeiten müssen vor dem Pilot abgeschlossen sein
RAG-Qualität ist abhängig von der Pflege der Mandantenakte – schlechte Daten = schlechte Entwürfe
Verschlüsselte Mails (S/MIME, PGP) sind nicht direkt verarbeitbar
Erste 6 Wochen erfordern aktives Feedback der Sachbearbeiter, sonst stagniert die Trefferquote

Häufige Fragen

Was passiert mit Mails, die der Klassifikator nicht zuordnen kann?

Sie landen in einem "Unklar"-Ordner und einem Triage-Verantwortlichen. Das ist Absicht – lieber 5 Prozent unklar als 5 Prozent falsch zugeordnet. Bei stabilem Betrieb sinkt der Unklar-Anteil auf 3 bis 8 Prozent. Die Fehlquote (falsch klassifiziert) liegt typisch unter 2 Prozent, weil Mistral Small 3.1 für Deutsch und Französisch sehr robust ist.

Wie lange dauert die Einführung in einem 8-Mitarbeitenden-Büro?

In der Praxis 4 bis 6 Wochen. Woche 1: Datenschutz-Vorarbeiten + Inventur Mail-Typen. Woche 2: Setup IMAP-Trigger, Klassifikator-Prompt, Bexio/Abacus-Anbindung. Woche 3: Schatten-Phase (Klassifikation läuft, aber keine Entwürfe sichtbar). Woche 4-5: Aktive Phase mit Entwürfen, tägliches Feedback der Sachbearbeiter, Prompt-Tuning. Woche 6: Stabil-Betrieb mit Spot-Check.

Was passiert mit Anhängen?

Anhänge werden vom IMAP-Trigger separat extrahiert. PDF und Bild gehen optional an die OCR-Pipeline (siehe ai-belegerkennung-ocr); Office-Dokumente und ZIP werden mit Hinweis im Entwurf erwähnt aber nicht geöffnet. Anhänge grösser als 10MB werden nicht durch das LLM geleitet, sondern nur als Metainformation ("PDF, 12MB, Rechnung_2026-05.pdf") an den Entwurf angefügt.

Kann die Pipeline mit verschlüsselten Mails (S/MIME, PGP) umgehen?

Nicht direkt. Verschlüsselte Mails müssen vor der Klassifikation entschlüsselt werden – entweder durch ein lokales Gateway (z.B. mit dem Postfach-Schlüssel) oder durch manuelle Vorab-Prüfung. In der Praxis ist S/MIME im CH-KMU-Umfeld selten; die meisten Büros arbeiten mit unverschlüsselter Mail plus Cloud-Vertraulichkeit (Office 365 / Google Workspace E2E-fern, aber TLS-in-Transit).

Quellen

n8n – Email Trigger (IMAP) node documentation · 2026-04
Microsoft Graph API – Outlook Messages reference · 2026-03
Mistral AI – La Plateforme pricing Mai 2026 (Small 3.1 USD 0.20/0.60) · 2026-05
n8n.io – Workflow template: AI email automation with RAG · 2026-02
EDÖB – Stellungnahme generative KI und Datenschutz, Update 2026 · 2026-01

PASSEND ZU IHREM STACK?

Wie das in Ihrem Betrieb konkret aussieht – 30 Minuten Erstgespräch.

Erstgespräch buchen