KÜNSTLICHE INTELLIGENZ – WISSEN
KI verstehen, vorher und in Aktion.
Fundiertes Wissen für Geschäftsführung und IT in Unternehmen, Einrichtungen und Institutionen. Damit der Einstieg in den professionellen KI-Einsatz auf Substanz aufsetzt und dann souverän betrieben werden kann.
⌕Wissensdatenbank durchsuchen — den richtigen Artikel findenUNSERE THEMEN:
Grundlagen & Orientierung
Begriffe ohne Jargon erklärt.
Retrieval-Augmented Generation (RAG): Wie KI aus eigenen Dokumenten antwortet
RAG koppelt ein Sprachmodell an eine durchsuchbare Wissensbasis. Antworten kommen mit Quellenangabe, nicht aus dem Training erfunden.
EMBEDDINGS · AI-KONZEPTEmbeddings und Vektoren: Wie Sprache zu Mathematik wird
Embeddings sind Zahlen-Repräsentationen von Text, Bild oder Audio. Sie sind die Grundlage jeder semantischen Suche und jedes RAG-Systems.
PROMPTING · AI-KONZEPTPrompt-Engineering: Grundlagen, Muster, Anti-Patterns
System-Prompt, Few-Shot, strukturierte Outputs, Refusal-Pattern. Was im Mai 2026 noch zählt – und was die Modelle inzwischen intern erledigen.
LLM-GATEWAY · AI-KONZEPTWas ist ein LLM-Gateway? Aufgabe, Bestandteile, Marktstand Mai 2026
Ein LLM-Gateway ist ein zentraler Proxy für Sprachmodell-Aufrufe. Es bündelt Routing, Auth, Rate-Limit, Fallback, Observability und Cost-Tracking.
VEKTOR-INDEX · AI-KONZEPTWas ist ein Vektor-Index? HNSW, IVF, ScaNN und Quantisierung Mai 2026
Ein Vektor-Index ist die Datenstruktur einer Vektor-DB, die ähnliche Embeddings schnell findet. Trade-off zwischen Recall, Latenz und Speicher.
FINE-TUNING vs RAG · AI-KONZEPTFine-Tuning vs RAG: Wann passt welcher Ansatz? Stand Mai 2026
Fine-Tuning ändert Modell-Verhalten dauerhaft, RAG fuettert frisches Wissen. PEFT/LoRA macht FT erschwinglich, RAG bleibt Standard in Compliance.
AI-AGENT · AI-KONZEPTWas ist ein AI-Agent? ReAct, Tool-Use und Production-Patterns Mai 2026
Ein AI-Agent ist ein LLM-System, das selbst Werkzeuge aufruft, plant und mehrstufig handelt. Patterns Mai 2026: Tool-Use, ReAct, LangGraph.
MCP · AI-KONZEPTWas ist MCP (Model Context Protocol)? Standard für Tool-Use Mai 2026
MCP ist ein offener Standard für den Zugriff von LLMs auf Tools, Daten und Server. Anthropic-Spec Nov 2024, Mai 2026 von OpenAI/Google/Microsoft adoptiert.
QUANTISIERUNG · AI-KONZEPTWas ist Quantisierung? Modell-Gewichte komprimieren ohne Qualitätsverlust
Quantisierung speichert Modell-Gewichte mit weniger Bits. Q4_K_M reduziert Llama-70B von 140 GB auf 42 GB bei unter 2% Qualitätsverlust.
TRANSFORMER · AI-KONZEPTWas ist die Transformer-Architektur? Grundlagen, Varianten, Marktstand Mai 2026
Die Transformer-Architektur ist das technische Fundament aller modernen Sprachmodelle. Erklärt: Self-Attention, Encoder-Decoder, Multi-Head, MoE-Trend Mai 2026.
CONTEXT WINDOW · AI-KONZEPTWas ist das Context Window? Token-Limit, Kosten, Recall-Kurve Mai 2026
Das Context Window ist die maximale Token-Menge pro LLM-Anfrage (Input + Output). Mai 2026: 128k-2M je Anbieter, mit klarer Recall-Verlustkurve ab Mitte.
TOKEN · AI-KONZEPTWas ist ein Token? Tokenizer, Kosten, DE-vs-EN Mai 2026
Ein Token ist ein Wortteil – die kleinste Verrechnungs-Einheit eines LLMs. Erklärt: BPE, SentencePiece, Tiktoken, DE-Overhead, Preisbeispiele Mai 2026.
ATTENTION · AI-KONZEPTWas ist der Attention-Mechanismus? Query, Key, Value erklärt Mai 2026
Attention ist das Herzstück moderner Sprachmodelle: jede Position einer Sequenz darf auf alle anderen achten. Erklärt: Q/K/V, Self vs Cross, Multi-Head.
TEMPERATURE / TOP-P · AI-KONZEPTWas sind Temperature und Top-p? LLM-Sampling-Parameter erklärt Mai 2026
Temperature, Top-p und Top-k steuern, wie deterministisch oder kreativ ein LLM antwortet. Faustregeln Mai 2026: 0-0.3 für Fakten, 0.7 für Standard, 1.0+ für Kreativ.
SYSTEM PROMPT · AI-KONZEPTWas ist ein System-Prompt? Rolle, Sicherheit, Best Practices Mai 2026
Ein System-Prompt definiert Rolle, Aufgabe und Verhalten eines LLM vor jeder User-Anfrage. Erklärt: Stadien, Prompt-Injection, Constitutional AI Mai 2026.
LLM-GRUNDLAGEN · AI-KONZEPTWie funktioniert ein LLM? Autocomplete auf Steroiden, erklärt für KMU Mai 2026
Ein Sprachmodell sagt das wahrscheinlich nächste Wortteil voraus. Erklärung in fünf Stationen: Tokenisierung, Embedding, Transformer, Logits, Sampling – ohne Mathematik.
PRETRAINING · AI-KONZEPTWas ist Pretraining? Wie ein LLM seine Grundfähigkeit lernt Mai 2026
Pretraining ist die Selbstlern-Phase, in der ein Sprachmodell Sprache, Grammatik und Faktenwissen aus 10-15 Billionen Tokens Text aufnimmt. Erklärt: Daten-Quellen, Cutoff, Kosten.
RLHF · AI-KONZEPTWas ist RLHF? Reinforcement Learning from Human Feedback erklärt Mai 2026
RLHF macht aus einem rohen Base-Model einen hilfsbereiten Assistenten. Drei Phasen: SFT, Reward Model, PPO. Plus Vergleich mit DPO, Constitutional AI und RLAIF Mai 2026.
MIXTURE OF EXPERTS · AI-KONZEPTWas ist Mixture of Experts (MoE)? Sparse Models erklärt Mai 2026
MoE-Modelle aktivieren pro Token nur einen Bruchteil ihrer Parameter – vergleichbare Qualität bei 5x weniger Compute. Mai 2026: Llama 4 Maverick, die aktuelle DeepSeek-V-Generation, Mixtral.
MULTIMODAL · AI-KONZEPTWas ist multimodale KI? Bild, Audio, Video plus Text Mai 2026
Multimodale Modelle verarbeiten nicht nur Text, sondern auch Bild, Audio und Video. Mai 2026: GPT-4o, Gemini 2.5 Pro, das aktuelle Claude-Spitzenmodell, Llama 4. Use Cases für Belegerkennung und Schadenfotos.
REASONING · AI-KONZEPTWas ist ein Reasoning-Modell? o3, Claude Extended Thinking, die aktuelle DeepSeek-R-Generation Mai 2026
Reasoning-Modelle denken intern in Chain-of-Thought, bevor sie antworten. Mehr Tokens für Denken = bessere Antworten bei Mathe, Code, Logik. Kostet 5-15x mehr als reguläre Modelle.
TOOL-USE · AI-KONZEPTWas ist Tool-Use und Function-Calling? LLM ruft externe APIs auf Mai 2026
Tool-Use macht aus einem Sprachmodell einen Agent: das Modell ruft strukturiert externe APIs auf – Rechner, Datenbank, Web-Search. Mai 2026 Standard mit MCP-Protokoll.
EIGENES MODELL · AI-KONZEPTWie trainiert man ein eigenes KI-Modell? Fine-Tuning, LoRA, QLoRA Mai 2026
Fine-Tuning vs From-Scratch vs RAG: für 95% der KMU ist Fine-Tuning mit LoRA/QLoRA der richtige Weg. Hardware-Bedarf, Kosten USD 5-50k, Tools Mai 2026.
GLOSSAR · KI-BEGRIFFEGlossar KI-Begriffe: 80+ Schlüsselwörter für KMU und Treuhand
Glossar mit über 80 KI-Begriffen von A bis Z. Kurze Definitionen, Querverweise auf vertiefende Seiten. Stand Mai 2026.
FAQ · KI FÜR KMUFAQ KI für KMU: 35 häufige Fragen aus Praxis, Recht und Kosten
Antworten auf die häufigsten KI-Fragen aus Schweizer KMU: Kosten, Datenschutz, Tools, Halluzinationen, FINMA, EU AI Act. Stand Mai 2026.
Grundlagen · WirtschaftlichkeitWas kostet KI im Treuhandbüro wirklich? Total-Cost & Amortisation pro Mandatsgrösse
Kostenarten, Total-Cost-of-Ownership und Amortisationslogik von KI im Treuhandbüro – mit Rechenmethodik statt Versprechen.
Anwendung nach Bereich
Nach Bereich: Vertrieb, HR, Buchhaltung …
WhatsApp- & Telegram-Bot: KI, die auf den Kanälen antwortet, die Ihre Kundschaft nutzt
Funktionierender Bot auf WhatsApp Business oder Telegram, getestet und live. Terminbuchung, FAQ, Lead-Qualifikation, Anbindung an CRM oder RAG-Wissensbasis. Pauschal CHF 1'800.
VOICE · SERVICEVoice-Agent am Telefon: KI, die anruft und angerufen wird
Telefon-Agent mit Whisper STT, LLM und ElevenLabs/Cartesia TTS. Anrufannahme, Terminbuchung, Vorqualifizierung. Latenzbudget unter 800 ms. Pauschal CHF 3'500.
LOHN-TRIAGE · ANWENDUNGSFALLKI-Triage in der Lohnbuchhaltung: Mandantenanfragen zu AHV, BVG, Quellensteuer vorsortieren
KI sortiert eingehende Lohn-Anfragen vor, schlägt Antworten aus Wegleitungen vor und übergibt den Fall mit Kontext an den Sachbearbeiter.
MWST-VORBEREITUNG · ANWENDUNGSFALLKI-Vorbereitung der MWST-Abrechnung: Belege klassifizieren, Vorsteuer-Codes vorschlagen, Saldosteuersatz prüfen
KI klassifiziert Belege nach MWST-Code, schlägt Vorsteuerabzug vor und markiert Saldosteuersatz-Branchen. Der Treuhänder prüft, korrigiert und bucht.
MANDANTEN-TRIAGE · ANWENDUNGSFALLKI-Triage für Mandantenanfragen: WhatsApp, E-Mail und Telefon zu strukturierten Vorgängen
KI klassifiziert Mandantenanfragen, sucht Antwort-Bausteine in der internen Wissensbasis und legt einen Entwurf für den Sachbearbeiter bereit.
BELEG-OCR · ANWENDUNGSFALLKI-Belegerkennung für Schweizer Belege: QR-Rechnung, Quittungen, PDF-Rechnungen strukturiert erfassen
OCR extrahiert aus QR-Rechnungen, Restaurantquittungen und PDF-Rechnungen strukturierte Felder, validiert IBAN und UID und übergibt an das ERP.
JAHRESABSCHLUSS-QS · USE-CASEKI-gestützte Qualitätssicherung beim Jahresabschluss
Anomalien in Buchungssätzen vor der Revision aufspüren: Benford-Test, Saldenvergleich, Periodenabgrenzungen. Mensch entscheidet, KI flaggt.
STEUER-ENTWURF · USE-CASEKI-Entwurf für Steueroptimierung juristischer Personen
Entwurfs-Varianten für Dividende vs Lohn, Beteiligungsabzug, Verlustverrechnung. Steuerberater finalisiert und unterschreibt. NICHT als Endprodukt an Mandanten.
MAHNWESEN · USE-CASEKI-gestütztes Mahnwesen ohne Mandanten-Beziehung zu beschädigen
Stufenmahnung 1-2-3, Stundungsersuche-Triage, persönliche Briefe aus Mandanten-Historie. Bexio/Abacus/Banana-Integration. Treuhänderin entscheidet vor jedem Versand.
GWG-SCREENING · USE-CASEKI-gestütztes GwG-/KYC-Screening: Sanktionslisten, PEP, wirtschaftlich Berechtigte
Onboarding-Daten gegen SECO/OFAC/EU-Listen prüfen, Risiko-Score erstellen, SRO-Meldung-Entwurf vorbereiten. NIEMALS vollautomatisch melden – Mensch entscheidet.
TREUHAND · BRANCHEN-HUBKI für Treuhandbüros in der Schweiz: ein praktischer Leitfaden
Wo künstliche Intelligenz in Treuhand-Buchhaltung, MWST, GwG und Mahnwesen heute wirklich entlastet – ohne das Berufsgeheimnis zu berühren.
ANWALTSKANZLEI · BRANCHEN-HUBKI für Anwaltskanzleien in der Schweiz: was geht, was nicht, und was die SAV-Wegleitung dazu sagt
Wie Schweizer Kanzleien KI in Vertragsanalyse, Praxis-Recherche und Mandantenkommunikation einsetzen – ohne das Berufsgeheimnis nach Art. 13 BGFA zu verletzen.
VERSICHERUNGEN · BRANCHEN-HUBKI für Versicherungen in der Schweiz: Governance, Schadenbearbeitung und Underwriting
Wie Schweizer Versicherer und Broker KI in Schaden, Underwriting und Kundenanfragen einsetzen – innerhalb der FINMA-Aufsichtsmitteilung 08/2024.
ARZTPRAXEN · BRANCHEKI für Arztpraxen: Sprechstunden-Notizen, Korrespondenz, Triage – was rechtlich geht und was nicht
Sprechstundennotizen, KVG-Korrespondenz und Patient-Triage entlasten Hausarztpraxen – Patientendaten sind aber besonders schützenswert und Hochrisiko unter EU AI Act.
ARCHITEKTUR · BRANCHEKI für Architektur- und Planungsbüros: BIM, Bauantrag, Submission – wo Sprachmodelle wirklich Zeit sparen
Bauantragstexte, Submissions-Lesen, Verträge und Recherche-Aufgaben sind in jedem SIA-Büro Stunden-Fresser. Sprachmodelle entlasten messbar – die Statik bleibt aber Ingenieurssache.
HANDWERK · BRANCHEKI für das Schweizer Handwerk: Offerten, Mahnwesen, WhatsApp-Triage – der ROI ist hier am schnellsten
Offerten in 10 Minuten statt 60, Mahnungen automatisch, eingehende WhatsApp-Anfragen vorsortiert – Handwerk holt KI-Nutzen am schnellsten. Setup zahlt sich in 3 bis 6 Monaten zurück.
IMMOBILIEN · BRANCHEKI für Immobilien-Makler und Verwaltungen: Inserate, Mietverträge, Bewerber-Triage – und die GwG-Pflicht
Inserate, Mieter-Vorqualifizierung und Verträge sind in jedem Maklerbüro Routine. KI beschleunigt das deutlich – aber Maklerbüros sind GwG-pflichtig und der Bewerber-Score liegt im EU-AI-Act-Hochrisiko-Bereich.
E-COMMERCE · BRANCHEKI für Schweizer E-Commerce: Produkttexte, Kunden-Triage, Empfehlungs-Engines – und revDSG für Tracking
Mehrsprachige Produkttexte, FAQ-Bots und Empfehlungs-Engines holen Margenpunkte zurück. Profiling-Scores stehen unter EU-AI-Act-Beobachtung, Tracking braucht revDSG-konforme Einwilligung.
E-MAIL-TRIAGE · ANWENDUNGSFALLE-Mail-Triage-Automation: Eingangsflut klassifizieren, zuordnen, Entwurf bereitstellen
IMAP-Watcher liest jede Mail, ein EU-LLM klassifiziert (Mandant/Rechnung/Anfrage/Newsletter/Spam), RAG bringt Mandanten-Kontext, Entwurf landet beim Sachbearbeiter. Versand nur per Hand.
OFFERTEN · ANWENDUNGSFALLKI-gestützte Offerten-Generierung: 2 bis 4 Stunden Arbeit in 20 Minuten
Aus Anfrage -> RAG auf vergangene Offerten (Preisstaffeln, Standardklauseln) -> sauberer Entwurf in Bexio/Klara-Format. Sachbearbeiter prüft und sendet manuell.
CH-MEHRSPRACHIGKEIT · COMPLIANCEKI und Schweizer Mehrsprachigkeit: LLMs für Deutsch, Französisch, Italienisch und Rätoromanisch
Sprachverteilung CH (Stand 2025): DE 62.8%, FR 22.9%, IT 8.2%, RM 0.5%. Welche Modelle die vier Landessprachen plus Schweizerdeutsch beherrschen – Stand Mai 2026.
SWISSDEC ELM · COMPLIANCESwissdec ELM 5.0 und elektronischer Lohnausweis: zertifizierte Lohn-Software, Schnittstellen, KI-Plausibilisierung
Swissdec ELM Standard 5.0 ist Mai 2026 produktiv. Zertifizierte Lohn-Software, Schnittstellen zu AHV, SUVA, Krankenkassen, Pensionskassen, Steuer. KI für Lohnausweis-Plausibilisierung.
MWST · COMPLIANCEMwSt und KI-Automatisierung in der Schweiz: Belegerkennung, MwSt-Code-Vorschlag, Vorsteuer-Optimierung, ESTV-XML
CH-MwSt-Sätze seit 1.1.2024: Standard 8.1%, reduziert 2.6%, Beherbergung 3.8%. KI für Belegerkennung, MwSt-Code-Vorschlag, Vorsteuer-Optimierung. ESTV-Quartalsabrechnung via SuisseTax/ePortal.
BANKEN · BRANCHEN-HUBKI für Schweizer Banken unter FINMA-Aufsicht: Governance, Kreditscoring, AML und Kunden-Triage
Wie Schweizer Banken KI in Kreditscoring, AML/KYC, Sentiment-Analyse und Kunden-Mail-Triage einsetzen – innerhalb von FINMA 08/2024, BankG Art. 47 und revDSG.
VERMÖGENSVERWALTUNG · BRANCHEN-HUBKI für unabhängige Schweizer Vermögensverwalter: Eignungsprüfung, Reporting und Markt-Synthese
Wie FINIG-bewilligte Schweizer Vermögensverwalter KI in Risikoprofilierung, Reporting-Automatisierung und Markt-News-Synthese einsetzen – innerhalb FIDLEG, FINMA 08/2024 und revFADP.
NOTARIAT · BRANCHEN-HUBKI für Schweizer Notariate: Präzedenz-Recherche, ZGB-Vorlagen und Beurkundungs-Vorbereitung
Wie Schweizer Notariate KI in BGE-Recherche, Beurkundungs-Vorbereitung und ZGB-Erbrechts-Vorlagen einsetzen – mit Anonymisierungs-Pflicht und ohne die Beurkundung selbst zu delegieren.
LITIGATION · BRANCHEN-HUBKI für Litigation-Kanzleien: eDiscovery, Aktenanalyse, Schriftsatz-Vorbereitung und CH-Rechtsprechung
Wie Litigation-Kanzleien und Prozessführungs-Boutiquen in der Schweiz KI in eDiscovery, Aktenanalyse, Schriftsatz-Vorbereitung und Praxis-Recherche einsetzen – mit BGFA und StGB 321 als Leitplanken.
ARBEITSMEDIZIN & SOZIALVERSICHERER · BRANCHEN-HUBKI für Schweizer Sozial-, Kranken- und Unfallversicherer und arbeitsmedizinische Dienste
Wie Schweizer KV/UV-Versicherer und arbeitsmedizinische Dienste KI in Schadenmanagement, IV-Antrags-Plausibilisierung und Vertrauensarzt-Dokumentenanalyse einsetzen – bei besonders schützenswerten Personendaten (revFADP Art. 5).
TGA & BAUPLANUNG · BRANCHEN-HUBKI für Bauplanung und TGA: SIA-Norm-Suche, Schemata-Erstellung, Energie-Modellierung und BIM
Wie TGA-Planer und Bauplaner in der Schweiz KI für SIA-Norm-Suche, HLKS-Schemata-Erstellung, Energie-Modellierung und BIM-Anreicherung einsetzen – innerhalb von SIA-Normen, MuKEn 2014 und MMS.
PHARMA & MEDTECH · BRANCHEN-HUBKI für Pharma und MedTech: Regulatorik-RAG, Adverse-Event-Triage und KI als Medizinprodukt
Wie Schweizer Pharma-Unternehmen und MedTech-Hersteller KI in Regulatorik-Recherche, Adverse-Event-Triage und Literatur-Synthese einsetzen – innerhalb von HMG, Swissmedic, ISO 13485, MDR EU 2017/745 und EU AI Act.
Anwendung · BelegverarbeitungQR-Rechnung & eBill/Peppol automatisiert auslesen und verbuchen mit KI
Wie Treuhänder QR-Rechnung, eBill und Peppol-Belege strukturiert auslesen und mit KI-gestützter Kontierung halbautomatisch verbuchen – mit Mensch im Prozess.
AnwendungAutomatische Kontierung & Kontenrahmen KMU: KI-Buchungsvorschläge mit Human-in-the-loop
Wie KI Buchungsvorschläge auf dem Schweizer KMU-Kontenrahmen erzeugt, mit Feedbackschleife und menschlicher Freigabe – und wo die Fehlerquellen liegen.
Anwendung · Lohn & SozialversicherungenKI in Sozialversicherungen: AHV/IV/EO, BVG, Quellensteuer & Swissdec-ELM automatisieren
Wo KI die Schweizer Lohnabrechnung (AHV, ALV, BVG, UVG, Quellensteuer, Swissdec ELM) sinnvoll unterstützt – und wo die Berechnung deterministisch bleiben muss.
Anwendung · Steuern & TreuhandKI-gestützte Steuererklärung & Belegerfassung: Steuersoftware, Dr. Tax und eigener RAG-Workflow
Wie CH-Steuersoftware, OCR-Belegerfassung und ein eigener RAG-Workflow zusammenspielen – inklusive Grenzen, Verantwortung und Datenschutz.
Recht, Compliance, DSGVO
AI Act, Haftung, Mitbestimmung.
revDSG / revFADP und KI: Was das revidierte Schweizer Datenschutzgesetz für LLM-Nutzung bedeutet
Das revidierte DSG ist seit 1.9.2023 in Kraft. Wer LLMs auf Personendaten anwendet, muss Art. 4, 5, 6, 7, 16-18, 19 und 21 beachten.
EU AI ACT · COMPLIANCEEU AI Act 2026: Hochrisiko-Pflichten ab 2. August 2026 – was Schweizer Anbieter jetzt tun müssen
Verordnung (EU) 2024/1689 wird gestaffelt scharf. Verbote seit 2.2.2025, GPAI seit 2.8.2025, Hochrisiko ab 2.8.2026 – auch für CH-Anbieter mit EU-Kunden.
GwG-REVISION · COMPLIANCEGwG-Revision 2026: Erweiterung auf Treuhand-Beratung und FATF-Empfehlungen 16
Der Bundesrat hat 2024 die GwG-Revision verabschiedet. Erweiterung auf Beratungs-Treuhand, neue SRO-Pflichten, FATF-Recommendation 16 – Inkrafttreten H2 2026.
ART. 957a OR · COMPLIANCEArt. 957a OR und KI-Buchungen: Audit-Trail, GeBüV und 10-Jahres-Aufbewahrung
Art. 957a OR verlangt Verlässlichkeit, Vollständigkeit, Nachprüfbarkeit. KI-gestützte Buchungen brauchen Audit-Trail mit Modellversion, Prompt, Quelle, Mensch.
STGB 321 · COMPLIANCEBerufsgeheimnis (StGB Art. 321) und KI-Nutzung: Was Anwälte, Notare, Ärzte und Revisoren beachten müssen
StGB Art. 321 verbietet das Offenbaren von Berufsgeheimnissen. Cloud-LLMs können ein Offenbaren sein. Wann der Einsatz zulässig bleibt.
ISO 42001 · COMPLIANCEISO/IEC 42001: Der internationale Standard für AI-Management-Systeme
ISO/IEC 42001:2023 ist der erste internationale AIMS-Standard. Wer braucht eine Zertifizierung, was sie kostet, welche Annex-A-Kontrollen verpflichtend sind.
TIA · COMPLIANCEDrittlandtransfer und Transfer Impact Assessment (TIA): CH-Daten in US- und PRC-Cloud-LLMs
Art. 16/17 revDSG, EU-US-DPF mit CH-Anhang, EDÖB-TIA-Modul. Wann SCC reichen, wann BCR nötig sind und was bei OpenAI/Anthropic zu prüfen ist.
FINMA · COMPLIANCEFINMA-Awareness: KI-Governance für Banken, Versicherer und Treuhänder mit Vermögensverwaltung
FINMA-Aufsichtsmitteilung 08/2024, Rundschreiben 2023/01 Operative Risiken. Wer ist beaufsichtigt, was die FINMA verlangt, was Best Practice für Nicht-Beaufsichtigte ist.
AUDIT-TRAIL · AI-KONZEPTAI-Audit-Trail-Design: Was Sie loggen müssen, damit eine KI-Antwort revisionsfähig bleibt
Welche Felder müssen pro LLM-Aufruf gespeichert werden, damit Sie nach Art. 957a OR und Berufsgeheimnis sauber sind – und mit welchen Tools.
DSGVO · COMPLIANCEDSGVO und LLMs: Wann die EU-Datenschutz-Grundverordnung CH-Unternehmen direkt trifft
Die DSGVO trifft CH-Firmen nach Art. 3 Abs. 2 immer dann, wenn EU-Kunden im Spiel sind. LLM-Nutzung fasst praktisch alle Risikoartikel an.
DSFA · COMPLIANCEDSFA für KI-Systeme: Datenschutz-Folgenabschätzung nach revDSG Art. 22 und DSGVO Art. 35
Die DSFA ist bei KI mit Profiling, Hochrisiko-Daten oder automatisierten Entscheidungen Pflicht. Methodik: CNIL-PIA + EDPB-Template + AI-Act-Overlay.
KI-HAFTUNG · COMPLIANCEWer haftet bei KI-Fehlern? CH-OR + EU-Produkthaftungsrichtlinie 2024/2853 nach AI-Liability-Direktive-Rückzug
CH-Haftung läuft über OR 41/55/97. EU-AI-Liability-Direktive zurückgezogen Feb 2025. PD 2024/2853 in Kraft 9.12.2024 – Software inkl. KI als Produkt erfasst.
EU AI ACT KMU · COMPLIANCEEU AI Act für KMU: Fristenkalender und Pflichtcheck bis 2.8.2026
Stichtag Hochrisiko-Pflichten: 2. August 2026. Wie ein CH-KMU als Deployer den AIA-Fristenkalender konkret abarbeitet – Inventar, Klassifikation, Schulung.
revDSG · TREUHAND-COMPLIANCErevDSG und KI im Treuhand-Büro: AVV, Datenkategorien, EDÖB-Position, GwG-Praxis
Welche AVV mit OpenAI/Anthropic/Mistral, welche Mandantendaten wohin, EDÖB-Position 2026 zu LLM, Routing nach Sensitivität. Keine Rechtsberatung.
ANONYMISIERUNG · AI-KONZEPTAnonymisierung und Pseudonymisierung: Presidio, Privacera, K-Anonymität, Differential Privacy
Tools und Techniken im Mai 2026 für DSG-konforme PII-Entfernung vor LLM-Verarbeitung: Microsoft Presidio, Privacera, Anonymizer, K-Anonymität und Differential Privacy im Vergleich.
EDÖB · COMPLIANCEEDÖB Meldepflicht und KI-Leitfäden: 72-Stunden-Pflicht nach DSG Art. 24 und aktuelle Empfehlungen 2024-2026
EDÖB-Meldepflicht 72h ab Kenntnisnahme (DSG Art. 24). KI-Stellungnahmen 2024-2026. Adressen, Formulare, Eskalations-Pfad für Schweizer Treuhand-, Anwalts- und KMU-Betriebe.
FINMA AM 08/2024 · COMPLIANCEFINMA-Aufsichtsmitteilung 08/2024 zu KI: vier Säulen Governance, Verantwortlichkeit, Robustheit, Erklärbarkeit
Aufsichtsmitteilung 08/2024 vom 18.12.2024. Treuhand-Bezug: nur GwG-betreute Mandate. Klassische Buchhaltungs-Treuhänder sind nicht FINMA-direkt – aber Best-Practice empfohlen.
Recht & ComplianceDarf ich ChatGPT als Treuhänder nutzen? Datenschutz, DPA & Geschäftsversion (revDSG + ggf. StGB 321)
ChatGPT im Treuhandbüro: Wann revDSG (und ggf. Berufsgeheimnis StGB 321) die Nutzung erlauben - und warum nur Business/Enterprise mit DPA infrage kommt.
Recht & ComplianceEU AI Act für Schweizer KMU 2026: Pflichten, Risikoklassen, Roadmap-Checkliste
Wann die EU-KI-Verordnung 2024/1689 Schweizer Firmen erfasst, welche Risikoklassen gelten und welche Fristen 2026 anstehen.
Datenschutz & DatensouveränitätUS Cloud Act vs. Schweizer Datenstandort: Warum CH/EU-Hosting für Mandantendaten zählt
Der US CLOUD Act erlaubt US-Behörden Zugriff auf Daten von US-Anbietern – auch in CH/EU-Rechenzentren. Was das für Mandantendaten und den Datenstandort bedeutet.
Recht & ComplianceKI-Einsatz in der Revision: Was geht, was die Unabhängigkeit & Prüfqualität verletzt
Wo KI in der eingeschränkten und ordentlichen Revision als Hilfsmittel zulässig ist – und wo Urteilsbildung und Verantwortung beim Revisor bleiben müssen.
Werkzeuge & Anbieter
Anbieter im Vergleich, neutral.
LiteLLM: ein Gateway für 100+ LLM-Anbieter mit einer einzigen API
LiteLLM ist ein Open-Source-Proxy, der OpenAI, Anthropic, Mistral, lokale Modelle und weitere Anbieter hinter einer OpenAI-kompatiblen API bündelt.
QDRANT · TECHQdrant: produktive Vektor-Datenbank für RAG und Semantische Suche
Qdrant ist eine Open-Source-Vektor-Datenbank in Rust. CPU-only, filter-fähig, mit Payload-Indexes und stabilen Kennzahlen unter Mandanten-Last.
N8N · TECHn8n: Workflow-Automation mit 600+ Integrationen, self-hosted unter EU-Recht
n8n ist eine fair-code-lizenzierte Workflow-Plattform mit 600+ Konnektoren, AI-Nodes und voller Self-Hosting-Option auf Docker.
OLLAMA · TECHOllama: lokale LLMs auf eigener Hardware – wo es funktioniert und wo nicht
Ollama ist ein lokaler Runtime für Open-Source-LLMs. Stark für Privacy-Demos und CPU-Klassifikation, langsam für 70B-Modelle ohne GPU.
HETZNER · TECHHetzner als EU-Hosting für CH-Treuhand und KMU: Rechenzentren, Verträge, Kosten
Hetzner Online betreibt Rechenzentren in Falkenstein und Helsinki mit ISO-27001, AVV-Vertrag und Preisen ab EUR 4/Monat für Cloud bis EUR 39/Monat für Dedicated.
DOCKER · TECH-STACKDocker-Orchestrierung für KMU: docker-compose ohne Kubernetes-Overkill
Docker + docker-compose reicht für Single-Host-Setups bis 50 Container. Digest-Pinning, Healthchecks, Restart-Policies, Resource-Limits, non-root.
NGINX · TECH-STACKNginx als Reverse-Proxy: SSL, Rate-Limits und Security-Header für Container-Apps
Nginx 1.28 bedient als Edge-Layer Docker-Backends. Certbot-SSL, gzip/brotli, limit_req-Zonen, Cloudflare-IP-Allowlist, HSTS/CSP, Websocket-Upgrade.
CLOUDFLARE · TECH-STACKCloudflare als DNS, Reverse-Proxy und WAF: SSL-Modi, Cache-Rules, Origin-Certificates
Cloudflare bedient DNS, WAF und DDoS-Schutz für 9+ Fairlane-Domains. Proxied-Modus, Full-Strict-SSL, kostenlose 15-Jahr-Origin-Cert, Cache Rules statt Page Rules.
GRAFANA · TECH-STACKGrafana, Prometheus, Loki: Monitoring-Stack für Container-Apps und LLM-Workflows
Grafana 11 plus Prometheus 3 plus Loki 3 als selbst gehosteter Monitoring-Stack. Metriken via node-exporter und /metrics, Logs via Promtail, Alerts via Alertmanager an Telegram.
BREVO · TECH-STACKBrevo SMTP: Transaktionale E-Mail aus EU-Hosting für KMU-Apps
Brevo (ex-Sendinblue) liefert SMTP-Relay smtp-relay.brevo.com:587 aus FR-Datacentern. DKIM/SPF/DMARC, revDSG-konform, Free 300 Mails/Tag, Paid ab EUR 19/Monat.
OPENAI · LLM-ANBIETEROpenAI GPT-Modelle aus CH-Treuhand-Sicht: Residency, Pricing, Compliance
OpenAI ist das verbreitetste Modell-Ökosystem. Für CH-Treuhand entscheidend: Daten-Residency via Azure OpenAI und AVV-Posture klären, bevor Mandantendaten fliessen.
ANTHROPIC · LLM-ANBIETERAnthropic Claude aus CH-Treuhand-Sicht: Residency, Pricing, Compliance
Anthropic Claude liefert lange Kontexte und vorsichtige Antworten. Für CH-Treuhand ist der Weg über AWS Bedrock Frankfurt der saubere Pfad.
MISTRAL · LLM-ANBIETERMistral AI aus CH-Treuhand-Sicht: EU-Residency, Pricing, Souveränität
Mistral ist das einzige Frontier-Lab mit EU-Sitz. Für CH-Treuhand der kürzeste Pfad zu DSGVO-konformem Modell-Zugang ohne US-CLOUD-Act-Restrisiko.
COHERE · LLM-ANBIETERCohere aus CH-Treuhand-Sicht: RAG-Spezialist mit BYOC-Option
Cohere ist kein Chatbot-Anbieter, sondern der RAG-Spezialist. Rerank 3 ist der Branchen-Standard, embed-multilingual-v3 stark für Deutsch.
GOOGLE GEMINI · LLM-ANBIETERGoogle Gemini im Schweizer Einsatz: Vertex AI, Zurich-Region und Datenfluss
Gemini 2.5 Pro/Flash/Flash-Lite über Vertex AI in europe-west6 (Zurich) oder europe-west3 (Frankfurt). Was das für revDSG, Preis und Modellwahl heisst.
META LLAMA · LLM-ANBIETERMeta Llama im Schweizer Einsatz: Open-Weight-Modell, Self-Host oder Provider
Llama 4 Scout/Maverick und Llama 3.3 70B als Open-Weight-Option. Lizenz, Hardware-Anforderungen, Preise bei Groq/Together/Fireworks und Self-Host-Realität.
DEEPSEEK · LLM-ANBIETERDeepSeek im Schweizer Einsatz: PRC-Anbieter, Self-Host-Option und revDSG-Realität
DeepSeek V3.x und R1 sind extrem günstig und technisch stark – aber Datenfluss nach China. Für Mandantendaten über API nicht empfohlen. Self-Host via HF-Weights als Alternative.
SELF-HOSTED OLLAMA · LLM-ANBIETERSelf-Hosted Ollama als LLM-Anbieter: Wann ersetzt es OpenAI, Anthropic oder Gemini?
Eigenes Ollama auf Hetzner-GPU oder im Büro-Server: rechnet sich ab 2-5 Mio Tokens/Monat, ersetzt Cloud-LLMs für revDSG-sensible Workloads, hat klare Qualitäts-Limits.
VEKTOR-DB · AI-KONZEPTVektor-Datenbanken im Vergleich: Qdrant, Weaviate, Milvus, Pinecone, Chroma, pgvector
Sechs ernsthafte Optionen, drei Architektur-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.
ROUTING · AI-KONZEPTMulti-LLM-Routing: Welches Modell wann, für wieviel
Routing-Regeln nach Sensitivität, Kosten, Latenz und Qualität. Fallback-Chain, semantisches Caching, Cost-Observability. Mai 2026 Pricing.
SELF-HOSTED VS. CLOUD · AI-KONZEPTSelf-Hosted vs. Cloud-LLM: Entscheidungs-Framework für KMU und Treuhand
Wann lohnt sich ein eigenes Sprachmodell auf eigener Hardware, wann ist die Cloud die richtige Wahl? Total Cost of Ownership, Latenz, Datenschutz.
VEKTOR-DATENBANKEN · VERGLEICHVektor-Datenbanken im Vergleich: 10 Optionen für RAG, Suche und Empfehlung
Qdrant, Weaviate, Milvus, Chroma, pgvector, Pinecone, Redis, Vespa, LanceDB und Elasticsearch im neutralen Vergleich, mit Hosting-, Lizenz- und EU-Aspekten.
LLM-GATEWAYS · VERGLEICHLLM-Gateways im Vergleich: 10 Optionen für Routing, Audit und Kosten
LiteLLM, OpenRouter, Portkey, Kong, Cloudflare, Helicone, TrueFoundry, Martian, Bifrost und Apache APISIX im neutralen Vergleich.
WORKFLOW-AUTOMATION · VERGLEICHWorkflow-Automation im Vergleich: 10 Plattformen für KMU und Treuhand
n8n, Make, Zapier, Pipedream, Activepieces, Windmill, Temporal, Airflow, Node-RED und Huginn im neutralen Vergleich.
EMBEDDINGS · TOOL-VERGLEICHEmbedding-Modelle im Vergleich: BGE-M3, E5, OpenAI, Cohere, Voyage, Jina, Mistral, Nomic, mxbai, Gecko
Zehn ernsthafte Embedding-Modelle, vier Auswahl-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.
RERANKER · TOOL-VERGLEICHReranker im Vergleich: Cohere, BGE, Jina, Voyage, ColBERT, mxbai, Mistral, sentence-transformers, RankGPT, FlashRank
Zehn Reranker-Optionen, vier Auswahl-Achsen, +15-30% Recall für RAG-Pipelines. Stand Mai 2026.
LLM-PROVIDER · TOOL-VERGLEICHLLM-Provider im Vergleich: OpenAI, Anthropic, Mistral, Google, Cohere, Meta, DeepSeek, xAI, AWS Bedrock, Azure
Zehn LLM-Provider im direkten Vergleich, sieben Auswahl-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.
LOKALE LLM-RUNTIMES - VERGLEICHLokale LLM-Runtimes im Vergleich: Ollama, vLLM, llama.cpp, LM Studio, LocalAI, TGI, GPT4All, KoboldCpp, Jan, OpenLLM
Zehn ernsthafte Runtimes für lokal betriebene Sprachmodelle, von Hobby-Desktop bis Production-GPU-Serving. Entscheidungs-Matrix Mai 2026.
OPEN-WEIGHT-MODELLE - VERGLEICHOpen-Weight-Modelle im Vergleich: Llama 3.3/4, Mistral, DeepSeek, Qwen, Gemma, Phi-4, Command R, Falcon, GLM, Apertus
Elf Open-Weight-Modell-Familien plus das Schweizer Apertus, im Mai 2026 verfügbar. Lizenz, VRAM-Bedarf, Mehrsprachigkeit, Praxis-Empfehlung.
SOUVERÄNES HOSTING - VERGLEICHSouveränes Hosting im Vergleich: Hetzner, Infomaniak, Exoscale, OVHcloud, Scaleway, Swisscom, Safe Swiss Cloud, netcup, Contabo, On-Prem
Zehn Hosting-Optionen für KI-Workloads in der Schweiz und EU. Datenresidenz, CLOUD Act, GPU-Verfügbarkeit, FINMA-Tauglichkeit. Stand Mai 2026.
GPU-CLOUD · TOOL-VERGLEICHGPU-Cloud-Anbieter im Vergleich: RunPod, Vast.ai, Lambda, CoreWeave, Paperspace, Exoscale, Hetzner, Together, Replicate, Modal
Zehn ernsthafte Optionen für GPU-Stunden, von Auction-Marktplatz bis Enterprise-Premium. Stand Mai 2026 mit aktuellen Preisen pro H100, A100 und RTX 4090.
CONTAINER-DEPLOY · TOOL-VERGLEICHContainer-Deployment im Vergleich: Docker, Podman, Kubernetes, Swarm, Coolify, Dokku, CapRover, Nomad, Portainer, Railway/Render
Zehn Wege, Container auf einem Server zu betreiben – vom einzelnen Docker-Daemon bis Kubernetes-Cluster. Mit klaren KMU-Empfehlungen Mai 2026.
REVERSE-PROXY · TOOL-VERGLEICHReverse-Proxy im Vergleich: nginx, Caddy, Traefik, HAProxy, Apache, Envoy, nginx Proxy Manager, Cloudflare Tunnel
Acht ernsthafte Reverse-Proxy-Optionen im direkten Vergleich. Mit klarer Empfehlung pro Anwendungsfall, Stand Mai 2026.
MONITORING / TOOL-VERGLEICHMonitoring & Observability im Vergleich: Grafana, Loki, Uptime Kuma, Netdata, Zabbix, Datadog, Sentry, ELK, VictoriaMetrics, SigNoz
Zehn ernsthafte Werkzeuge für Metriken, Logs, Traces und Error-Tracking. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro KMU-Szenario. Stand Mai 2026.
LLM-OBSERVABILITY / TOOL-VERGLEICHLLM-Observability im Vergleich: Langfuse, Helicone, LangSmith, Phoenix, Lunary, Portkey, OpenLLMetry, Traceloop, HoneyHive, W&B Weave
Zehn spezialisierte Werkzeuge für Tracing, Cost-Tracking, Prompt-Versionierung und Eval von LLM-Pipelines. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro Szenario. Stand Mai 2026.
DNS / CDN / WAF / TOOL-VERGLEICHDNS, CDN und WAF im Vergleich: Cloudflare, Bunny.net, Fastly, AWS CloudFront, Akamai, Gcore, Infomaniak, DNSimple
Acht ernsthafte Anbieter für DNS, CDN und Web Application Firewall. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.
SMTP-VERGLEICH · TOOL-VERGLEICHTransaktions-Mail-Dienste im Vergleich: Brevo, Postmark, Mailgun, SES, SendGrid, Resend, Mailjet, Infomaniak, SMTP2GO
Neun ernsthafte Optionen für Versand-APIs. Preise, Zustellraten und Datenresidenz für CH-KMU und Treuhand-Büro. Stand Mai 2026.
DB-VERGLEICH · TOOL-VERGLEICHDatenbanken im Vergleich: PostgreSQL, MySQL/MariaDB, SQLite, MongoDB, Redis, ClickHouse, CockroachDB, SurrealDB, DuckDB, Supabase
Zehn ernsthafte Datenbanken für KMU-Setups. Relational vs. NoSQL vs. Columnar, Self-Host vs. Cloud, mit klaren Empfehlungen je Anwendungsfall. Stand Mai 2026.
SECURITY-VERGLEICH · TOOL-VERGLEICHSecurity-Hardening-Tools im Vergleich: CrowdSec, Fail2ban, Wazuh, UFW, Vault, Authentik, WireGuard, Lynis, rkhunter, ClamAV
Zehn Open-Source-Tools für Server-Hardening, Intrusion-Detection, SSO und Secrets-Mgmt im CH-KMU. Klare Empfehlungen je Schutzschicht. Stand Mai 2026.
GIT & CI/CD · TOOL-VERGLEICHGit-Hosting und CI/CD im Vergleich: Gitea, GitLab, Forgejo, GitHub, Drone, Woodpecker, Jenkins, Act, ArgoCD
Neun ernsthafte Werkzeuge für Code-Hosting, Pipelines und GitOps. Self-host vs Cloud, Lernkurve, KMU-Tauglichkeit. Stand Mai 2026.
BOT & VOICE · TOOL-VERGLEICHBausteine für Chat- und Voice-Bots im Vergleich: Whisper, Deepgram, ElevenLabs, Piper, Twilio, Vapi, Retell, WhatsApp, Rasa, Botpress
Zehn Bausteine für Sprach- und Chat-Bots. STT, TTS, Telefonie, Voice-AI-Plattformen und Chatbot-Frameworks im direkten Vergleich. Stand Mai 2026.
RAG-FRAMEWORKS · TOOL-VERGLEICHRAG-Frameworks im Vergleich: LangChain, LlamaIndex, Haystack, DSPy, Semantic Kernel, txtai, RAGFlow, Verba, Flowise, Langflow
Zehn ernsthafte Frameworks für RAG-Pipelines. Code-first, visuelle Builder und akademische Ansätze im direkten Vergleich. Stand Mai 2026.
N8N · MAKE · ZAPIER · DUELLn8n vs Make vs Zapier – was passt für Schweizer KMU?
Drei Workflow-Automatisierungs-Plattformen im Direktvergleich: Self-Hosting, Preis pro 1000 Runs, EU-Datenresidenz, AI-Nodes. Entscheidungshilfe für Treuhand, Anwalt und KMU.
OPENAI · ANTHROPIC · MISTRAL · DUELLOpenAI vs Anthropic vs Mistral – welcher LLM-Provider 2026?
Drei LLM-Anbieter im direkten Vergleich: GPT-Modelle (4o, 4.1, o-Reihe), das aktuelle Claude-Modell, Mistral Large 2/Small 3.1. Preise, EU-Region, DACH-Sprache, Lock-in. Entscheidungshilfe Mai 2026.
QDRANT · WEAVIATE · PGVECTOR · DUELLQdrant vs Weaviate vs pgvector – welche Vektor-DB für KMU-RAG?
Drei Vektor-Datenbanken im Direktvergleich: Self-Host-Aufwand, Skalierungs-Limit, Postgres-Integration, EU-Hosting. Entscheidungshilfe für RAG-Pipelines in CH-KMU.
LITELLM · OPENROUTER · PORTKEY · DUELLLiteLLM vs OpenRouter vs Portkey – welcher LLM-Gateway?
Drei LLM-Gateways im Direktvergleich: Self-Host vs Cloud, Anzahl Provider, Compliance-Routing, EU-Hosting. Entscheidungshilfe für Multi-LLM-Setups in CH-KMU.
HETZNER · INFOMANIAK · EXOSCALE · DUELLHetzner vs Infomaniak vs Exoscale – wo hostet ein CH-Treuhand seine KI?
Drei Hoster im Direktvergleich: CH-Datenresidenz, Preis pro Monat, GPU-Verfügbarkeit, Compliance-Profil. Entscheidungshilfe für KI-Workloads in Schweizer KMU.
OLLAMA vs vLLM vs LLAMA.CPP - DUELLOllama vs vLLM vs llama.cpp - welcher lokale LLM-Server?
Drei Open-Source-Runtimes für lokale Sprachmodelle. Ollama für Einstieg, vLLM für Production-Throughput, llama.cpp als portable Basis - Entscheidungs-Matrix Mai 2026.
LANGCHAIN vs LLAMAINDEX vs HAYSTACK - DUELLLangChain vs LlamaIndex vs Haystack - welcher RAG-Stack 2026?
Drei OSS-Frameworks für Retrieval-Augmented Generation. LangChain breit aber unruhig, LlamaIndex sauber für RAG, Haystack Enterprise-tauglich - Entscheidung Mai 2026.
LANGFUSE vs HELICONE vs LANGSMITH - DUELLLangfuse vs Helicone vs LangSmith - welches LLM-Tracing-Tool?
Drei LLM-Observability-Plattformen. Langfuse als EU-OSS-Standard, Helicone als 5-Minuten-Proxy, LangSmith für LangChain-Stacks - Entscheidung Mai 2026.
RUNPOD vs VAST.AI vs HETZNER GPU - DUELLRunPod vs Vast.ai vs Hetzner GPU - wo trainieren und inferieren 2026?
Drei GPU-Cloud-Modelle. RunPod als seriose On-Demand-Plattform, Vast.ai als Spot-Marktplatz, Hetzner als EU-Reserved-Hosting - Preis- und Profil-Vergleich Mai 2026.
CLOUDFLARE vs BUNNY.NET vs FASTLY - DUELLCloudflare vs Bunny.net vs Fastly - welche Edge-Plattform für KMU?
Drei CDN+DNS+WAF-Anbieter im Vergleich. Cloudflare mit Free-Tier und grösstem Netz, Bunny.net EU-zentriert und sehr günstig, Fastly Enterprise-only - Entscheidung Mai 2026.
JSON & STRUCTURED OUTPUT · AI-KONZEPTOutput-Formatierung und JSON-Modus: Function-Calling, Pydantic, Instructor, Outlines
Strukturierte LLM-Outputs erzwingen: JSON-Mode, Function-Calling, Pydantic-Parsing, Instructor-Lib, Outlines (lokal) und Constrained Decoding für GPT-4.1, das aktuelle Claude-Spitzenmodell, Mistral.
HYBRIDSUCHE · AI-KONZEPTHybridsuche: BM25 plus Vektor mit Reciprocal Rank Fusion in Elasticsearch, Qdrant, OpenSearch
Warum reine Vektorsuche im Treuhand-Kontext oft scheitert und wie BM25 plus Vektor mit RRF oder Weighted Sum Retrieval-Qualität messbar verbessert. Tools: Elasticsearch, Qdrant Hybrid, OpenSearch.
QUERY EXPANSION · AI-KONZEPTQuery Expansion und Rewriting: HyDE, Decomposition, Multi-Query, Step-Back-Prompting
Wie sich kurze Nutzer-Fragen so umformulieren lassen, dass RAG die richtigen Quellen findet: HyDE, Query Decomposition, Multi-Query, Step-Back-Prompting. Wann es hilft, wann nicht.
METADATEN · AI-KONZEPTMetadaten und Filter in RAG: Pre-Filter vs Post-Filter, Qdrant Payload Index, pgvector WHERE
Wie strukturierte Metadaten Mandant, Datum, Vertraulichkeit, Sprache und Quelle pro Chunk filterbar machen: Pre- vs Post-Filter, Qdrant Payload Index, pgvector mit WHERE und time-aware Retrieval.
TREUHAND-SOFTWARE · COMPLIANCESchweizer Treuhand-Software-Landschaft: Marktanteile, API-Offenheit und KI-Reife (Stand Mai 2026)
Bexio, Abacus, Sage 50, KLARA, Run my Accounts, Topal, AbaWeb, Atlanto: wer dominiert in welchem KMU-Segment und welche Tools sind KI-anschlussfähig.
SWISS CLOUD · COMPLIANCESwiss Cloud souverän hosten: Infomaniak, Exoscale, Swisscom, Safe Swiss Cloud, Hostpoint, Cloudsigma im Vergleich
Sechs Schweizer Cloud-Anbieter Mai 2026 im Vergleich: Region, ISO 27001, FINMA-Tauglichkeit, GPU-Verfügbarkeit, Preis. Praxisleitfaden für souveränes Hosting in der Schweiz.
APERTUS · COMPLIANCEApertus: das offene Schweizer KI-Modell von ETH Zurich, EPFL und CSCS – Stand Mai 2026
Apertus 8B und 70B, Apache-2.0, von ETH/EPFL/CSCS. Release 2. September 2025, 15T Tokens, 1000+ Sprachen inkl. Schweizerdeutsch und Rätoromanisch. Stand Mai 2026: Praxiserfahrung und Apertus-2-Ausblick.
WEAVIATE · TECHWeaviate: Open-Source-Vektor-Datenbank mit GraphQL und Multi-Modal-Modulen
Weaviate ist eine Apache-2.0-Vektor-DB in Go mit GraphQL- und REST-API. Mai 2026 v1.30+, EU-Region Frankfurt, native Hybrid-Suche, Multi-Modal-Module für Text und Bild.
MILVUS · TECHMilvus: Cluster-Vektor-Datenbank für mehr als eine Milliarde Vektoren
Milvus ist eine Apache-2.0-Vektor-DB mit getrennter Compute- und Storage-Schicht. GPU-Acceleration, HNSW plus IVF plus DiskANN, für Volumen ab 100 Mio. Vektoren.
CHROMA · TECHChroma: einfachste Vektor-Datenbank für Prototypen und Notebooks
Chroma ist eine Apache-2.0-Vektor-DB mit DuckDB-Backend. Python-API-first, in zehn Minuten produktiv, gut für Prototypen bis 1 Mio. Vektoren. Nicht für Production-Scale.
PGVECTOR · TECHpgvector: Vektor-Suche im bestehenden PostgreSQL mit HNSW und IVFFlat
pgvector ist die PostgreSQL-Extension für Vektor-Suche. Mai 2026 v0.8+ mit HNSW, IVFFlat und Binary-Quantization. ACID, Joins, eine Datenbank für alles.
PINECONE · TECHPinecone: managed Cloud-Vektor-DB ohne Self-Hosting
Pinecone ist eine proprietäre Vektor-DB nur in der Cloud. EU-Region eu-west-1 verfügbar, Serverless seit 2024, Zero-Ops. Vendor-Lock-in und USD-Preisrisiko.
REDIS REDISEARCH · TECHRedis mit RediSearch: Vektor-Index im KV-Store für niedrige Latenz
Redis mit RediSearch-Modul liefert HNSW-Vektor-Index seit Version 2.4. Sinnvoll, wenn Redis schon im Stack ist; weniger Vektor-Features als spezialisierte DBs.
VESPA · TECHVespa: Suchmaschine mit Tensor-Ranking für komplexe Hybrid-Pipelines
Vespa ist eine Apache-2.0-Suchmaschine in Java aus dem Yahoo-Ecosystem. Tensor-Ranking, structured plus Vektor plus Volltext in einer Anfrage. Steile Lernkurve.
LANCEDB · TECHLanceDB: embedded Vektor-DB im columnar Lance-Format für lokale Apps
LanceDB ist eine Apache-2.0-Vektor-DB in Rust mit columnar Lance-Format. Embedded in Python/JS, kein Server nötig, sehr schnell. Gut für Desktop und kleine on-prem.
ELASTICSEARCH KNN · TECHElasticsearch mit kNN: Hybrid Keyword und Vektor-Suche in einer Anfrage
Elasticsearch ab Version 8 bietet native kNN-Vektor-Suche. Mai 2026 v9 mit verbesserter Quantisierung. Stark für Hybrid-Suche, Elastic License v2 / SSPL.
MEILISEARCH · TECHMeilisearch: schnelle Such-Engine mit AI-Search-Mode für Hybrid-Suche
Meilisearch ist eine MIT-Such-Engine in Rust. Mai 2026 v1.10+ mit AI-Search-Mode (BM25+Embedding), Developer-friendly, gut für Search-Bars mit AI-Snippets.
OPENROUTER · TECHOpenRouter: Multi-Modell-Marktplatz für schnellen LLM-Vergleich
OpenRouter ist ein US-Cloud-Gateway mit 200+ LLM-Modellen hinter einer OpenAI-kompatiblen API, Auto-Fallback und 5% Markup auf Token-Preise.
PORTKEY · TECHPortkey: Enterprise-LLM-Gateway mit EU-Hosting und Self-Host-Tier
Portkey ist ein Cloud-Gateway mit Self-Host-Tier, EU-Region Frankfurt, 1.600+ LLMs, Observability, Caching und Guardrails für Enterprise-Compliance.
KONG AI GATEWAY · TECHKong AI Gateway: Kubernetes-natives API-Gateway mit LLM-Plugins
Kong v3.8 erweitert das Open-Source-API-Gateway um AI-Proxy, AI-Prompt-Guard und semantisches Caching – Self-Host auf Kubernetes oder Bare-Metal.
CLOUDFLARE AI GATEWAY · TECHCloudflare AI Gateway: Edge-Proxy für OpenAI, Anthropic, Workers AI
Cloudflare AI Gateway läuft auf Cloudflare-Edge, ist im Workers-Plan kostenlos und bündelt OpenAI, Anthropic, Mistral, Replicate und Workers AI hinter einer API.
HELICONE · TECHHelicone: OSS-Observability für LLM-Calls mit EU-Hosting
Helicone ist ein Apache-2.0-Proxy plus Cloud (EU-Region Frankfurt) für LLM-Cost-Tracking, Caching und Tracing. Setup in unter zehn Minuten.
TRUEFOUNDRY · TECHTrueFoundry: ML-Plattform mit eingebautem LLM-Gateway
TrueFoundry kombiniert Model-Serving, Inference und LLM-Gateway in einer Plattform. Self-Host (Kubernetes) oder Cloud, primär für ML-Teams mit Pipelines.
MARTIAN · TECHMartian: Modell-Router mit Embeddings-Klassifikator pro Anfrage
Martian (withmartian.com) ist ein US-Cloud-Router, der pro Anfrage das beste LLM via Embeddings-Vergleich wählt. Experimentell, USD 0.50-2 pro 1M Tokens Aufschlag.
BIFROST · TECHBifrost: Go-basiertes Self-Host-LLM-Gateway unter 5 ms Overhead
Bifrost (github.com/maximhq/bifrost) ist ein OSS-LLM-Gateway in Go, Self-Host, Mai 2026 v0.5+, ultra-niedrige Latenz für Streaming und Voice-Bots.
APISIX AI · TECHApache APISIX AI: OSS-API-Gateway mit LLM-Plugins (ai-proxy, decorator, rate-limiting)
Apache APISIX v3 ist ein Apache-2.0-API-Gateway mit ai-proxy-, ai-prompt-decorator- und ai-rate-limiting-Plugins. Self-Host, Kubernetes oder Bare-Metal.
LANGFUSE · TECHLangfuse: OSS-Marktführer für LLM-Tracing, Prompt-Mgmt und Eval
Langfuse (MIT, v3+) ist das OSS-Standardwerkzeug für LLM-Tracing, Cost-Tracking, Prompt-Versionierung und Eval. Self-Host oder EU-Cloud Frankfurt.
MAKE · TECHMake (früher Integromat): visuelle Szenarien mit 1.500+ Apps und EU-Hosting-Region
Make ist eine US/EU-Cloud-Plattform für visuelle Automatisierungs-Szenarien, 1.500+ Apps und Operations-basiertes Pricing ab USD 10.59/10k Ops.
ZAPIER · TECHZapier: Industrie-Default mit 7.000+ Apps, US-Cloud und Task-basiertem Pricing
Zapier ist der bekannteste No-Code-Workflow-Anbieter mit 7.000+ App-Integrationen, US-Cloud-only und Starter-Tarif ab USD 19.99/Monat für 750 Tasks.
PIPEDREAM · TECHPipedream: Code-first Workflows mit Python+JS, OSS-Core und Cloud-Sourcing
Pipedream verbindet Cloud-Komfort mit Code-First-Workflows in Python und JavaScript; Free-Tier 100k Credits, Basic ab USD 19/Monat, Core auf GitHub.
ACTIVEPIECES · TECHActivepieces: MIT-lizenzierte Open-Source-Alternative zu Zapier, self-hostbar für KMU
Activepieces ist eine MIT-lizenzierte Workflow-Plattform mit 250+ Pieces, voller Self-Host-Option und Cloud-Tier ab USD 8/Monat.
WINDMILL · TECHWindmill: Script-first Workflows mit TypeScript, Python, Go und Bash unter AGPLv3
Windmill ist eine AGPLv3-Plattform für Code-first-Workflows in TypeScript, Python, Go und Bash mit Approval-Flows, Scheduling und Cloud/Self-Host.
TEMPORAL · TECHTemporal: Durable Execution für mission-critical Workflows in Java, Go, TS, Python
Temporal ist eine MIT-lizenzierte Workflow-as-Code-Plattform mit garantiertem Retry, State und Versioning – für Bestellabwicklung, Payment-Reconciliation und mehr.
APACHE AIRFLOW · TECHApache Airflow: Python-DAGs als Data-Engineering-Default seit 2014, Mai 2026 v3.x
Apache Airflow ist die Standard-Plattform für Daten-Pipelines mit Python-DAGs, Apache 2.0, self-hostbar oder über Astronomer/MWAA als Managed-Service.
NODE-RED · TECHNode-RED: visueller Flow-Editor für IoT, IIoT und Industrie 4.0 mit MQTT-Native-Support
Node-RED ist eine Apache-2.0-Plattform für Flow-basierte Programmierung, ursprünglich von IBM 2013, IoT-/IIoT-Default mit MQTT, Modbus, OPC-UA.
HUGINN · TECHHuginn: älteres Ruby-on-Rails-Tool für Personal-Automation, RSS, Scraping, Notifications
Huginn ist eine MIT-lizenzierte Ruby-on-Rails-Plattform für Personal-Automation, IFTTT-Alternative seit 2013, niche aber stabil.
INNGEST · TECHInngest: Event-driven Workflows für TypeScript und Python mit Durable Execution
Inngest ist eine Apache-2.0-SDK plus Cloud-Plattform für Event-driven Workflows mit Step-Funktionen, Retry, Sleep und Wait-for-Event in TypeScript/Python.
INFOMANIAK · TECHInfomaniak: CH-Hosting in Genf, ISO 27001 + 14001, 100% Wasserkraft, CHF-Preise
Infomaniak betreibt eigene Rechenzentren in Genf, halt 100% CH-Hosting unter CH-Recht, ist ISO 27001 + ISO 14001 zertifiziert und rechnet in CHF.
EXOSCALE · TECHExoscale: CH-Cloud aus Zürich und Lausanne, ISO 27001, A100-GPU verfügbar, FINMA-tauglich
Exoscale betreibt Cloud-Regionen in Zürich, Lausanne, Wien, Frankfurt und Sofia. ISO 27001, AVV/DPA verfügbar, GPU-Workloads mit A100 in CH-Region.
OVHCLOUD · TECHOVHcloud: französischer Hoster mit vier ISO-Zertifikaten, SecNumCloud, A100/H100-Optionen
OVHcloud betreibt Rechenzentren in Roubaix, Strassburg, Frankfurt und London. ISO 27001/27701/27017/27018, SecNumCloud-zertifiziert, GPU mit A100/H100.
SCALEWAY · TECHScaleway: französischer Hoster aus Paris, ISO 27001, gute API, NVIDIA H100 AI-Cluster
Scaleway betreibt Rechenzentren in Paris, Amsterdam und Warschau. ISO 27001, S3-kompatibles Object Storage, H100-Cluster für AI-Training mit transparenten Stundenpreisen.
SWISSCOM CLOUD · TECHSwisscom Cloud: Schweizer Telco-Hoster, ISO 27001 + FINMA-zertifiziert, für Banken und Versicherer
Swisscom Cloud ist die Cloud-Sparte der Swisscom AG. Rechenzentren in Bern und Zürich, ISO 27001, FINMA-Outsourcing-Zertifizierung, mehrsprachiger Support.
SAFE SWISS CLOUD · TECHSafe Swiss Cloud: spezialisierter CH-Hoster in Embrach, FINMA-tauglich, Treuhand-Fokus
Safe Swiss Cloud betreibt ein CH-Rechenzentrum in Embrach (ZH). ISO 27001, FINMA-konform, deutschsprachiger Kundenservice, Fokus auf Schweizer KMU und Treuhand.
RUNPOD · TECHRunPod: GPU-Cloud mit EU-Sweden-Region, A100 ab USD 1.69/h, H100 ab USD 2.59/h
RunPod betreibt GPU-Cloud in Hong Kong, USA und EU-Sweden. A100-80GB ab USD 1.69/h, H100 ab USD 2.59/h. Secure Cloud und Community Cloud Tiers.
VAST.AI · TECHVast.ai: GPU-Auction-Marktplatz, RTX 4090 ab USD 0.31/h, A100 ab USD 0.40/h, weltweit verteilt
Vast.ai ist ein Auction-Marktplatz für GPU-Stunden, mit privaten und professionellen Anbietern weltweit. Billigste Spot-GPUs, ohne SLA und mit schwankender Verfügbarkeit.
LAMBDA LABS · TECHLambda Labs: dedizierte GPU-Cloud USA, A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h
Lambda Labs ist eine US-GPU-Cloud mit ML-Engineer-Fokus. A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h, Reserved-Verträge mit 1-Year/3-Year-Rabatten.
COREWEAVE · TECHCoreWeave: Enterprise-GPU-Cloud USA + UK + Spanien, H100 ab USD 4.25/h, NVIDIA-Premium-Partner
CoreWeave ist eine US-GPU-Cloud mit Enterprise-Schwerpunkt. Standorte in USA-East/West, UK und Spanien. H100 ab USD 4.25/h, H200 ab USD 4.50/h, grosse Cluster mit InfiniBand.
BGE-M3 · TECHBGE-M3: Open-Source-Embeddings für mehrsprachige RAG-Systeme
BGE-M3 von BAAI ist Mai 2026 das stärkste frei verfügbare Embedding-Modell für Schweizer KMU. Apache 2.0, 1024-dim, über 100 Sprachen.
MULTILINGUAL-E5 · TECHmultilingual-e5: schnelles Open-Source-Embedding-Modell für CPU-Setups
Microsofts multilingual-e5 ist ein mDeBERTa-basiertes Embedding-Modell unter MIT-Lizenz, sehr schnell auf CPU und in vier Grössen verfügbar.
VOYAGE AI · TECHVoyage AI: spezialisierte Embedding-API für RAG-Setups
Voyage AI ist ein 2024 von MongoDB übernommener Embedding-Provider. voyage-3 kostet USD 0.06 pro 1M Tokens und gehört Mai 2026 zu den stärksten RAG-Modellen.
JINA EMBEDDINGS · TECHJina Embeddings v3: Berliner Embeddings mit EU-Cloud und Self-Host
Jina Embeddings v3 ist ein mehrsprachiges Apache-2.0-Modell mit 8192 Token Kontext, betrieben aus Berlin und Frankfurt – EU-Datenschutz nativ.
MISTRAL EMBED · TECHMistral Embed: EU-natives Embedding-Modell aus Paris
Mistral Embed kommt aus Paris, kostet EUR 0.10 pro 1M Tokens und ist Mai 2026 das politisch sauberste API-Embedding für EU-AI-Act-strikte Mandate.
NOMIC EMBED · TECHNomic Embed: lokal lauffähiges Open-Source-Embedding-Modell
Nomic Embed v2 ist ein Apache-2.0-Modell mit 768 Dimensionen, transparenter Trainingsdaten-Dokumentation und exzellenter lokaler Performance auf Mac und Linux.
MXBAI-EMBED · TECHmxbai-embed: kompaktes Apache-2.0-Embedding-Modell für Edge-Setups
mxbai-embed-large-v1 von Mixedbread AI ist ein 1024-dimensionales Open-Source-Embedding, ONNX-tauglich und auf Edge-Hardware schnell.
COHERE RERANK · TECHCohere Rerank: Industrie-Standard für RAG-Re-Ranking
Cohere rerank-multilingual-v3.0 ist Mai 2026 der etablierte API-Reranker für RAG-Pipelines. USD 2 pro 1k Queries, EU-Hosting via AWS Bedrock Frankfurt.
BGE-RERANKER · TECHBGE-Reranker-v2-m3: Open-Source-Reranker für mehrsprachige RAG-Setups
BGE-Reranker-v2-m3 von BAAI ist Mai 2026 der stärkste frei verfügbare Cross-Encoder-Reranker – Apache 2.0, mehrsprachig, sehr nahe an Cohere-Qualität.
FLASHRANK · TECHFlashRank: ultraschneller Reranker auf CPU via ONNX-Runtime
FlashRank ist eine MIT-lizenzierte Python-Library mit kleinen Cross-Encoder-Modellen, ONNX-optimiert, unter 100 ms auf CPU.
VLLM · TECHvLLM: Production-Serving für Open-Weight-LLMs mit hoher Throughput und PagedAttention
vLLM ist ein Apache-2.0 Inference-Server für Linux mit GPU. PagedAttention und Continuous Batching liefern bis zu 20x mehr Durchsatz als Hobby-Runtimes.
LLAMA.CPP · TECHllama.cpp: die portable C/C++-Inferenz-Bibliothek unter Ollama, LM Studio und KoboldCpp
llama.cpp ist die MIT-lizenzierte Basis-Bibliothek für lokale Sprachmodelle. Läuft auf jeder Plattform – CPU, CUDA, Metal, ROCm, Vulkan. GGUF-Format-Standard.
LM STUDIO · TECHLM Studio: Desktop-App für lokale LLMs auf Mac, Windows und Linux
LM Studio ist eine grafische Desktop-Anwendung zur Erkundung lokaler Open-Weight-Modelle. Hobby-grade, gut für Demo und Pilotphase, nicht für Multi-User-Production.
LOCALAI · TECHLocalAI: OpenAI-API-kompatibler Allrounder für LLM, TTS, STT und Vision in einer Box
LocalAI ist ein MIT-lizenzierter Self-Hosting-Server, der LLM, Bild, Audio und Embeddings unter einer OpenAI-API bündelt. Bare-Metal oder Docker.
TGI · TECHText Generation Inference (TGI): Production-Serving aus dem Hugging-Face-Universum
TGI ist Hugging Faces Apache-2.0-Inference-Server für Production-Workloads mit Continuous Batching, Flash-Attention und direkter Anbindung an den Hugging-Face-Hub.
LLAMA 4 · TECHLlama 4 Scout und Maverick: Metas MoE-Familie mit 10M-Context und 400B-Total-Parametern
Llama 4 Scout (17B aktiv, 10M Context) und Maverick (17B aktiv, 128 Experten, 400B total) – released 5. April 2026 unter Llama Community License.
MISTRAL LARGE · TECHMistral Large 2 und Mistral Small 3.1: das EU-Modell-Paar mit FR/DE/IT-Stärke
Mistral Large 2 (123B) und Mistral Small 3.1 von der französischen Mistral AI. La Plateforme, Azure-EU, AWS Bedrock. Research- oder kommerzielle Lizenz.
QWEN 3 · TECHQwen 2.5 und Qwen 3: Alibabas Open-Weight-Familie mit Mathe- und Code-Stärke
Qwen 2.5 und Qwen 3 von Alibaba Cloud. Apache-2.0 für kleinere Modelle. Stark multilingual, führend in Mathe und Code. Self-Host löst die PRC-Frage.
DEEPSEEK · TECHDeepSeek (V- und R-Linie): das chinesische MoE-Reasoning-Modell mit Self-Host-Option
Die DeepSeek-V- und R-Modelle unter DeepSeek License. Self-Host via Hugging Face. Sehr starkes Reasoning, sehr günstig zu betreiben. API-Nutzung Warnung bei Mandantendaten. Modell-Versionen ändern sich laufend – aktuelle Bezeichnungen vor Einsatz prüfen.
APERTUS · TECHApertus als Tool: das Schweizer LLM von ETH, EPFL und CSCS in der Praxis betreiben
Apertus 8B und 70B unter Apache 2.0. Self-Host, Swisscom-API oder HuggingFace. 15T Tokens, 1000+ Sprachen inkl. Schweizerdeutsch und Rätoromanisch.
PROMETHEUS · TECHPrometheus: CNCF-Time-Series-DB für Metriken, Pull-Modell und PromQL
Prometheus 3.x als CNCF-graduierter Industrie-Standard für Metrik-Sammlung. Pull-Modell, PromQL, Service-Discovery. Self-host, Apache 2.0, KMU-tauglich.
LOKI · TECHLoki: Log-Aggregation als KMU-freundliche Elasticsearch-Alternative
Loki 3.x von Grafana Labs als Companion-Logsystem. Indexiert nur Labels, nicht Volltext. AGPL-3, Self-host oder Grafana Cloud. Mai 2026 mit Bloom-Filtern.
UPTIME KUMA · TECHUptime Kuma: KMU-Uptime-Page mit HTTP-, TCP-, Ping- und Docker-Checks
Uptime Kuma als selbst gehostete Uptime-Page. MIT-Lizenz, Setup in 5 Minuten, 13+ Monitor-Typen, öffentliche Status-Page, KMU-Liebling Mai 2026.
NETDATA · TECHNetdata: leichter Per-Host-Agent mit polierten Default-Dashboards
Netdata als Per-Host-Agent mit Hybrid-Cloud-Aggregation. GPL-3 plus Cloud-Tier, Footprint unter 100 MB, sehr schöne Out-of-the-Box-Dashboards. KMU-Liebling.
SIGNOZ · TECHSigNoz: OpenTelemetry-natives APM mit Metriken, Logs und Traces in einem
SigNoz als reife Open-Source-Alternative zu Datadog. MIT-Lizenz, OpenTelemetry-First, ClickHouse-Backend, Self-host oder Cloud. Mai 2026 KMU-Wahl.
GITEA · TECHGitea: leichtgewichtiger Self-host-Git-Server mit Gitea Actions
Gitea 1.22 als KMU-Default für selbst gehostetes Git. MIT-Lizenz, Single-Binary, Gitea Actions integriert, Container-Registry, Mai 2026 reif und stabil.
GITLAB · TECHGitLab: vollständige DevOps-Plattform mit CI/CD, Registry und Security
GitLab 17 als All-in-one-DevOps-Plattform. Community Edition MIT, Enterprise proprietär. Self-host oder Cloud. Sehr umfangreich, aber ressourcenhungrig.
DRONE CI · TECHDrone CI: Container-natives CI-System mit reduzierter Community-Aktivität
Drone CI als Container-natives CI-System. Apache 2.0, Self-host. Mai 2026: stabilisiert, geringere Entwicklungsaktivität. Migrations-Pfad zu Woodpecker.
WOODPECKER CI · TECHWoodpecker CI: aktiver Drone-Fork als KMU-Standard für Gitea und Forgejo
Woodpecker CI 3.x als sehr aktiver Drone-Fork. Apache 2.0, Container-native YAML-Pipelines, Mai 2026 KMU-Default-CI für Self-host neben Gitea/Forgejo.
JENKINS · TECHJenkins: der CI-Veteran mit 2000+ Plugins, hoher Lernkurve, geringer Modernität
Jenkins als aeltester CI-Server (seit 2011). MIT-Lizenz, Java-basiert, 2000+ Plugins. Sehr mächtig, aber schwer zu warten. Mai 2026 nicht für Neuanlagen empfohlen.
WHISPER · TECHWhisper: das Open-Source-STT-Modell von OpenAI für mehrsprachige Transkription
Whisper ist OpenAIs MIT-lizenziertes Spracherkennungs-Modell. Lokal lauffähig via whisper.cpp, faster-whisper oder WhisperX, oder über die API zu USD 0.006/min. Stand Mai 2026 mit large-v3 und turbo-v3.
DEEPGRAM · TECHDeepgram: proprietäre STT-API mit der niedrigsten Latenz im Markt
Deepgram bietet Speech-to-Text als US-Cloud-API zu USD 0.0043/min Nova-2 mit Sub-300-ms-Latenz. Englisch-stark, Schweizerdeutsch schwach, kein EU-Tier Mai 2026.
ELEVENLABS · TECHElevenLabs: die Branchen-Referenz für natürliche TTS-Stimmen und Voice-Cloning
ElevenLabs liefert proprietäre TTS-Cloud-API mit den natürlichsten Stimmen Mai 2026. Starter USD 5/Mo, Creator USD 99/Mo. turbo-v2.5 für Sub-400-ms-Telefonie-Latenz, 30+ Sprachen, Voice-Cloning verfügbar.
PIPER TTS · TECHPiper: das open-source lokale TTS-System für Datenschutz-sensible Anwendungen
Piper ist ein MIT-lizenziertes lokales Text-zu-Sprache-System auf ONNX-Basis. Kostenlos, voll lokal, sehr schnell auf CPU. Mai 2026 mit guten DE-Stimmen, Hobby-Qualität, gut für interne Tools.
TWILIO · TECHTwilio: der globale Telefonie-Standard für programmierbare Voice- und SMS-Anwendungen
Twilio bietet programmierbare Telefonie und SMS als API. USA-Hauptsitz mit EU-Region (Ireland, Frankfurt) für Datenresidenz. CH-Festnetz-Minute USD 0.0085. Standard für Voice-Agenten.
LANGCHAIN · TECHLangChain: das Industrie-Default-Framework für LLM-Anwendungen, mit allen Stärken und Schwächen
LangChain ist Mai 2026 in v0.4+ das meistgenutzte LLM-Framework. MIT-Lizenz, Python und JavaScript, hunderte Integrationen. Stark beim Prototyping, kritisiert für Code-Qualität und Stabilität.
LLAMAINDEX · TECHLlamaIndex: das saubere RAG-Framework für Code-first-Teams
LlamaIndex ist Mai 2026 in v0.10+ das sauberste RAG-Framework. MIT-Lizenz, Python und TypeScript, klarere API als LangChain. Mit LlamaCloud Mai 2026 auch als Managed-Tier verfügbar.
HAYSTACK · TECHHaystack: das Enterprise-RAG-Framework von deepset aus Berlin
Haystack ist Mai 2026 in v2.x das Enterprise-fokussierte RAG-Framework. Apache 2.0, Python, deepset AG (DE-Origin). Saubere Pipeline-Abstraktion, kommerzieller Support, Banken-tauglich.
DSPY · TECHDSPy: Programmieren statt Prompten – der Stanford-Ansatz für LLM-Pipelines
DSPy ist Mai 2026 in v2.5+ ein MIT-Framework aus Stanford. Statt Prompts zu schreiben, definieren Sie Aufgaben – das System optimiert die Prompts automatisch. Production-fähig für komplexe Multi-Step-Pipelines.
RAGFLOW · TECHRAGFlow: das self-hostbare RAG-Komplettsystem mit Web-UI
RAGFlow ist Mai 2026 in v0.15+ ein Open-Source RAG-Komplettsystem von Infiniflow (Apache 2.0). Self-host, fertige Web-UI, Document-Parsing, Chunking, Vektor-DB, Chat. Chinesische Origin, voll selbsthostbar.
POSTMARK · TECH-STACKPostmark: höchste Zustellrate für transaktionale E-Mails aus den USA
Postmark (ActiveCampaign/Wildbit) ist der Spezialist für reine Transaktions-Mails. EUR 15/Monat für 10.000 Mails, Zustellrate > 99 Prozent, Inbound-Routing inklusive. US-Hosting, TIA erforderlich.
MAILGUN · TECH-STACKMailgun: API-starker Versand mit EU-Region Frankfurt für Entwickler-Teams
Mailgun (Sinch) ist der Entwickler-Klassiker für Transaktions-Mail. EUR 35/Monat für 50.000 Mails, API-stark mit SDKs in 8 Sprachen, EU-Region Frankfurt für DSGVO-Setups, Webhook + Routing.
AMAZON SES · TECH-STACKAmazon SES: USD 0,10 pro 1.000 Mails, EU-Regions inkl. Zürich
AWS Simple Email Service ist der Preis-Sieger bei Versand-APIs. USD 0,10 pro 1.000 Mails, EU-Regions Frankfurt/Irland/Zürich, kein Dashboard out-of-the-box, integriert mit AWS-Stack.
SENDGRID · TECH-STACKSendGrid (Twilio): klassischer Marktführer für Transaktions- und Marketing-Mail
SendGrid ist seit 2009 der US-Marktführer. USD 19,95/Monat für 50.000 Mails, EU-Region verfügbar, breite Twilio/Salesforce/HubSpot-Integration, Marketing- plus Transactional-Streams.
RESEND · TECH-STACKResend: developer-first Mail-API mit React-Email-Templates
Resend ist die neue developer-first Mail-API von den React-Email-Machern. Free 3.000 Mails/Monat, Pro USD 20 für 50.000 Mails, US-Hosting mit EU-Region in Beta seit Mai 2026.
MAILJET · TECH-STACKMailjet (Pathwire/Sinch): EU-First-Versand aus Paris für DSGVO-Setups
Mailjet ist der EU-First-Pendant zu Mailgun. Hosting in Paris, EUR 15/Monat für 15.000 Mails, DSGVO + AVV im Vertrag, gleicher Sinch-Konzern wie Mailgun. Ideal für CH-KMU ohne TIA.
INFOMANIAK · TECH-STACKInfomaniak Mail-Sender: reines CH-Hosting für Treuhand-Berufsgeheimnis
Infomaniak ist der einzige Anbieter mit reinem CH-Hosting in Genf und Sion. CH-DSG- und revDSG-konform, kombiniert mit Hosting und DNS, perfekt für CH-Treuhand und Anwalt-Kanzleien.
SMTP2GO · TECH-STACKSMTP2GO: Multi-Region-Versand aus Neuseeland, EU und USA
SMTP2GO ist eine pragmatische Mail-Versand-Plattform mit Multi-Region-Routing. USD 15/Monat für 10.000 Mails, klare Dashboards, einfaches Setup, EU-Region wählbar für DSGVO-Setups.
MAILERSEND · TECH-STACKMailerSend: Template-Editor und gute API mit EU-Region
MailerSend (litauischer MailerLite-Spin-off) ist eine moderne Mail-Versand-Plattform mit Drag-and-Drop-Template-Editor. USD 30/Monat für 50.000 Mails, EU-Region Frankfurt, klare API, gute DX.
POSTGRESQL · TECHPostgreSQL: relationale Standard-Datenbank für CH-KMU und KI-Stacks
PostgreSQL 17 ist im Mai 2026 die Industrie-Default-Datenbank: JSON, Full-Text-Search, pgvector und PostGIS in einem System. MIT-ähnliche Lizenz, self-host-fähig.
MYSQL & MARIADB · TECHMySQL und MariaDB: der klassische LAMP-Stack 2026 ehrlich bewertet
MySQL (GPL-2, Oracle) und MariaDB (BSL/GPL-2, MariaDB Foundation) sind die LAMP-Klassiker. Im Mai 2026 ist MariaDB 11 stabil, eine ernsthafte OSS-Alternative zu MySQL 8.4.
SQLITE · TECHSQLite: die Einzeldatei-Datenbank für Single-Tenant, Mobile und Edge
SQLite ist eine Public-Domain-Embedded-DB als Einzeldatei. Im Mai 2026 produktiv im Einsatz bei Fairlane und Realty51, mit Litestream-Replikation in S3. Sehr schnell, sehr robust.
MONGODB · TECHMongoDB: die Dokumenten-Datenbank zwischen SSPL, Atlas und Voyage-AI-Integration
MongoDB ist die bekannteste Dokumenten-DB. SSPL-Lizenz, Self-Host oder Atlas Cloud. Mai 2026 mit Voyage-AI-Integration für natives Embedding und Vector-Search.
REDIS · TECHRedis als Cache-Layer: KV-Store, Sessions, Rate-Limits, Pub/Sub
Redis 8 ist im Mai 2026 der KV- und Cache-Standard. SSPL seit 2024 (alternativ Valkey unter BSD). Sehr schnell, Mikrosekunden-Latenz, niemals als Haupt-DB.
CLICKHOUSE · TECHClickHouse: columnar-Analytics-Datenbank für Aggregate über Milliarden Zeilen
ClickHouse 25 ist im Mai 2026 die schnellste OSS-Columnar-DB für OLAP-Workloads. Apache 2.0, Self-Host oder Cloud. 100x schneller als Postgres bei Aggregaten.
COCKROACHDB · TECHCockroachDB: verteiltes Postgres-kompatibles SQL für Multi-Region-Setups
CockroachDB ist verteilte ACID-DB mit Postgres-Wire-Protokoll. BSL mit Apache-2.0-Konversion nach 3 Jahren. Self-Host oder Cloud, Multi-Region-tauglich.
SURREALDB · TECHSurrealDB: Multi-Modell-Datenbank in Rust mit Document, Graph und Time-Series
SurrealDB 2.x ist im Mai 2026 stabil. BSL mit 4-Jahres-Apache-2.0-Konversion, Rust-basiert, Multi-Modell relational + Dokument + Graph + Zeit-Reihen.
DUCKDB · TECHDuckDB: embedded columnar OLAP-Datenbank für lokale Datenanalyse
DuckDB 1.x ist im Mai 2026 stabil. MIT-Lizenz, embedded, columnar, perfekt für Datenanalyse lokal -- Pandas-Ersatz und Treuhand-Reporting-Tool.
SUPABASE · TECHSupabase: Postgres-basierter Backend-as-a-Service mit EU-Region Frankfurt
Supabase ist Apache-2.0-Open-Source-Postgres mit Auth, Storage, Realtime und Edge-Functions. EU-Cloud Frankfurt oder Self-Host. Schnelle Inbetriebnahme für MVPs.
CROWDSEC · TECHCrowdSec: Open-Source-WAF mit kollaborativer Blocklist für KMU-Server
CrowdSec ist die MIT-lizensierte Intrusion-Detection mit Crowd-Sourced Threat-Intelligence aus 100k+ Servern. Mai 2026 KMU-Marktführer mit AI-Bouncer.
FAIL2BAN · TECHFail2ban: klassisches Log-basiertes IP-Banning für Linux-Server
Fail2ban ist der GPL-2-Klassiker für Intrusion-Detection seit 2004. Einfach, stabil, ohne Crowdsource-Layer. Mai 2026 v1.x stabil, Vorgänger von CrowdSec.
WAZUH · TECHWazuh: SIEM, EDR und Compliance-Plattform für regulierte Mittelstand
Wazuh ist die GPL-2-SIEM-Plattform mit File-Integrity, Vulnerability-Detection und PCI-DSS-/HIPAA-Reports. Mai 2026 die Wahl für 50+ Mitarbeitende-Kanzleien.
HASHICORP VAULT · TECHHashiCorp Vault: Industrie-Standard für Secrets-Management seit 2015
Vault ist der Marktführer für Secrets-Mgmt. Seit 2023 unter BSL 1.1 (nicht mehr MPL-2). Self-host und Cloud. Sehr mächtig, Setup 5-15 Tage.
OPENBAO · TECHOpenBao: Linux-Foundation-Fork von HashiCorp Vault unter MPL-2.0
OpenBao ist der MPL-2.0-Fork von Vault unter Linux-Foundation-Governance. Mai 2026 v2+ aktiv, direkter Ersatz für Vault-BSL-Migration.
AUTHELIA · TECHAuthelia: leichter SSO- und 2FA-Authorization-Proxy für nginx und Traefik
Authelia ist die Apache-2.0-Open-Source-Lösung für SSO+2FA+Authorization-Proxy. Go-basiert, unter 30 MB Footprint, sehr KMU-tauglich.
AUTHENTIK · TECHAuthentik: modernes Identity-Provider-System mit SAML, OIDC, LDAP und SCIM
Authentik ist das MIT-lizensierte IdP-System (plus Enterprise) für SAML/OIDC/LDAP/SCIM. Self-host und Cloud, Mai 2026 v2025+ aktiv.
WIREGUARD · TECHWireGuard: modernes VPN im Linux-Kernel für Home-Office und Remote-Admin
WireGuard ist das GPL-2-VPN im Linux-Kernel. 4000 Zeilen Code, 3-10x schneller als OpenVPN. KMU-Default 2026 für Remote-Zugang.
CLAMAV · TECHClamAV: Open-Source-Antivirus für Mail-Server und Upload-Scanning
ClamAV ist der GPL-2-Antivirus-Klassiker für Mail-Server-Gateway und Datei-Upload-Scanning. Update-Hub mit ClamSubmit-Community.
BITWARDEN · TECHBitwarden: Password-Manager, Secrets-Manager und Passkey-Authentificator mit EU-Cloud
Bitwarden ist die GPL-3-OSS-Lösung für Passwörter und Secrets-Mgmt. Self-host und EU-Cloud Frankfurt. Plus Passkey-Native-Auth.
Werkzeuge · Microsoft 365 CopilotMicrosoft 365 Copilot für Schweizer Treuhänder: Datenresidenz, Flex Routing & revDSG-Checkliste
Datenresidenz, EU Data Boundary, Flex Routing, kein Training auf Tenant-Daten und revDSG-Auftragsbearbeitung – was beim Copilot-Einsatz mit Mandantendaten wirklich gilt.
Werkzeuge · KI-Buchhaltung SchweizAccounto, Bexio (Kontera-KI) & KLARA: KI-Buchhaltung im Vergleich für Treuhandbüros
Neutraler Vergleich Schweizer KI-Buchhaltung (Accounto, bexio/Kontera, KLARA, Abacus): Belegerkennung, Automatisierung, Treuhand-Kollaboration, CH-Datenstandort.
Einführung & Umsetzung
Von Pilot zu Produktion, Kosten.
AI-Readiness Audit: Wo Ihr Betrieb heute mit KI steht – in ein bis fünf Tagen geklärt
Stack-Scan, Datenschutz-Check, drei priorisierte Use-Cases. Bericht plus 90-Min-Debriefing. Light ab CHF 1700, Deep CHF 3900.
SERVER & INFRASTRUKTUR · SERVICEServer & Infrastruktur: Ubuntu, Docker, Monitoring – aufgesetzt, gehärtet, übergeben
Eigener Server auf Hetzner oder DigitalOcean. Ubuntu 24.04, Docker, nginx, SSL, Fail2ban, CrowdSec, Monitoring. Pauschal ab CHF 1200.
MULTI-LLM GATEWAY · SERVICEMulti-LLM Gateway: Acht Anbieter, ein Eingang, Compliance-Routing
LiteLLM-Gateway mit Auth, Routing nach Kosten/Tempo/Datenschutz, Nutzungs-Dashboard. Modul ab CHF 1000, Projekt mit Observability CHF 4500.
RAG MIT EIGENEM WISSEN · SERVICERAG mit eigenem Wissen: Antworten aus Ihren Dokumenten – mit Quelle, nicht erfunden
Durchsuchbare Wissensbasis mit Chat. PII-Schwärzung, Zitat-Prüfung, DE/FR/IT/EN. Pilot bis 10000 Docs CHF 3500, Production ab CHF 8500.
n8n · SERVICEn8n Workflow-Automation: Routine raus, Köpfe frei
Self-hosted n8n auf Ihrem Server plus fertige Workflows. Rechnungs-Triage, Lead-Routing, Mail-Klassifikation, tägliche Zusammenfassung – dokumentiert und übergeben.
MANAGED · SERVICEManaged Service & Monitoring: Wir betreiben es weiter, Sie nutzen es
Monitoring, Updates, Sicherheits-Patches, Reaktion bei Störungen. Drei Stufen: Basic CHF 600/Mo, Pro CHF 1'200/Mo, Plus CHF 2'200/Mo. Definierte Reaktionszeiten.
EIGENES LLM · KOSTENWas kostet ein eigenes LLM? Total Cost of Ownership im Mai 2026
Hardware, Strom, DevOps, Wartung: alle TCO-Bausteine für ein selbst gehostetes Sprachmodell mit konkreten Zahlen in CHF und USD für Mai 2026.
RAG-PILOT · KOSTENWas kostet ein RAG-Pilot? Drei Stufen: 1k, 10k, 100k Dokumente
Konkrete Kostenrechnung für einen RAG-Pilot in der Schweiz: Embedding, Vektor-DB, LLM-Inferenz, Einrichtungs-Aufwand. Drei Volumen-Stufen mit Zahlen in CHF.
GPU-PREISE · KOSTENGPU-Kosten-Rechner 2026: T4, L4, A10, A40, A100, H100, H200 im Vergleich
Welche GPU passt zu welchem Modell, was kostet sie bei welchem Anbieter, On-Demand vs. Reserved? Mai-2026-Preise von AWS, GCP, Azure, Hetzner, RunPod, Vast.ai.
TOKEN-PRICING · KOSTENToken-Kosten erklärt: Input, Output, Cache, Provider-Vergleich Mai 2026
Was ist ein Token, wie unterscheidet sich Input- von Output-Pricing, was kostet 1 Million Tokens bei welchem Anbieter? Tabelle mit allen relevanten Modellen.
BREAK-EVEN · KOSTENCloud-API vs. Self-Host: ab welchem Token-Volumen lohnt sich was?
Break-Even-Analyse mit Zahlen Mai 2026. 1M / 10M / 100M / 1B Token pro Monat: wo kreuzen sich Cloud-Kurve und Self-Host-Kurve? Plus Hidden Costs.
KOSTEN · KI-AUTOMATION KMUWas kostet KI-Automation für ein Schweizer KMU? Ehrliche Preise Juni 2026
Von CHF 590 Speedcheck bis CHF 20000 erstes Jahr für ein 5-MA-Treuhand: alle Posten, Server-Mieten, Token-Kosten, Managed-Service.
ROI · KI-PROJEKTROI-Rechner für KI-Projekte: Wie Sie Mai 2026 ehrlich kalkulieren
Formel, Beispiel-Rechnung Treuhand-Mahnwesen (Break-Even Monat 3), Frauenfeld-Case mit 7 bis 8 Wochen ROI – und die Stolperfalle "Zeitersparnis ist nicht linear Geld".
STRUCTURED EXTRACTION · AI-KONZEPTStructured Extraction mit Grounding: Cite-The-Source aus PDFs und Mails
Daten aus PDFs und Mails extrahieren mit Belegen: Gemini Citation API, Anthropic with_citations, manuelle Citation-Linker und Audit-Trail-Bezug.
BEXIO API · INTEGRATIONBexio API: KI-Integration in die Schweizer Treuhand-Buchhaltung
Die Bexio REST API verbindet Schweizer KMU-Buchhaltung mit KI-Workflows. OAuth 2.0, Schweizer Hosting, ein klares Datenmodell.
ABACUS API · INTEGRATIONAbacus API: KI-Anbindung an die Schweizer ERP-Plattform
Die Abacus Web-Services verbinden ERP, Lohn und Buchhaltung mit KI-Workflows. REST-Endpunkte, SOAP-Legacy, On-Prem oder Cloud.
SAP B1 · INTEGRATIONSAP Business One: KI-Integration über DI-API und Service-Layer
SAP Business One ist das KMU-ERP von SAP. Zwei APIs: DI-API (Java/.NET, low-level) und Service-Layer (REST, modern). KI-Anbindung über den Service-Layer.
SAGE 50 · INTEGRATIONSage 50: KI-Integration über die Sage Connect REST API
Sage 50 ist die KMU-Buchhaltung von Sage in DACH. Die Sage Connect API wurde Mai 2026 modernisiert und ist heute eine REST-Schnittstelle mit OAuth 2.0.
MS GRAPH · INTEGRATIONMicrosoft 365 Graph API: Mail, Kalender, Teams und SharePoint als KI-Quelle
Die Microsoft Graph API ist das zentrale Tor zu Microsoft 365. OAuth 2.0, granulare Permissions, Throttling-Limits. Das Werkzeug für KI im Microsoft-Stack.
GOOGLE WORKSPACE · INTEGRATIONGoogle Workspace: Gmail, Calendar, Drive und Docs als KI-Quelle
Google Workspace APIs bieten Zugang zu Gmail, Kalender, Drive, Docs und Sheets. Mai 2026 GA: AppSheet und Vertex AI Connect für KI-Workflows.
SHAREPOINT · INTEGRATIONSharePoint und OneDrive: Dokumenten-RAG-Quelle für Treuhand und Kanzlei
SharePoint und OneDrive bilden den Dokumenten-Speicher der meisten CH-Kanzleien. REST-API und Graph für KI-Indexierung, CSOM als Legacy.
SSO · INTEGRATIONSSO mit SAML 2.0 und OIDC: Ein Login für Bexio, Microsoft 365 und KI-Apps
SAML 2.0 für Enterprise, OIDC für moderne Apps. IdPs: Entra, Google, Keycloak, Authelia. Mai 2026: Passkeys und SCIM für User-Provisioning.
WEBHOOKS · INTEGRATIONWebhooks und ereignisbasierte Integration: HMAC, Idempotency, Retry
Webhooks ersetzen Polling durch Push-Events. HMAC-Signatur, Replay-Protection, Idempotency-Keys. Mai 2026 Best Practices für robuste Pipelines.
REST · GRAPHQL · INTEGRATIONREST vs GraphQL: Welche API-Architektur für KI-Integrationen?
REST dominiert Mai 2026, GraphQL für komplexe Datenmodelle. OpenAPI 3.1, MCP-Server für LLM-Zugriff. Tools: FastAPI, Express, tRPC.
CHUNKING · AI-KONZEPTChunking-Strategien für RAG: Fixed-Size, Recursive, Semantic, Late-Chunking
Wie Sie Dokumente für RAG schneiden: Fixed-Size, Recursive, Semantic, Document-based und Late-Chunking im Vergleich plus Faustregeln für Verträge, Tabellen und mehrsprachige Texte.
DOCUMENT LOADERS · AI-KONZEPTDocument Loaders: PDF, DOCX, XLSX, EML, HTML, Markdown sauber in RAG einlesen
Welche Tools welche Dokumentformate verlustfrei in eine RAG-Pipeline überführen: Unstructured.io, LlamaParse, MarkItDown (Microsoft, Mai 2026), PyMuPDF und pandoc im Direktvergleich.
OCR · AI-KONZEPTOCR für Belege und Verträge: Tesseract, AWS Textract, Azure DI, Google DocAI, Mistral OCR, Reducto
Welche OCR-Engine für gescannte Verträge, Belege und Formulare im Mai 2026 sinnvoll ist: Genauigkeit, Preis, EU-Hosting, DSG-Tauglichkeit und Use-Case-Empfehlungen.
PDF-TABELLEN · AI-KONZEPTPDF-Tabellen-Extraktion: Camelot, Tabula, pdfplumber, Table Transformer, Marker
Welches Tool im Mai 2026 Bilanz-Tabellen, MWST-Aufstellungen und Lohnabrechnungen verlustfrei aus PDFs holt: Camelot, Tabula, pdfplumber, Microsoft Table Transformer und Marker im Direktvergleich.
EMAIL-ARCHIVE · AI-KONZEPTE-Mail-Archive indexieren: IMAP, EWS, Microsoft Graph, MBOX und DSG-Konformität
Wie Sie 5 bis 10 Jahre Mandanten-Korrespondenz für RAG indexieren: IMAP, EWS, Microsoft Graph, MBOX-Imports, Anhang-Extraktion, Threading-Erhaltung, DSG- und Berufsgeheimnis-konform.
DATENBEREINIGUNG · AI-KONZEPTDatenbereinigung vor RAG: Duplikate, Boilerplate, OCR-Artefakte, Charset-Issues, Watermarks
Warum 30 Prozent jedes RAG-Korpus Müll ist und wie Sie ihn aussortieren: Duplikat-Erkennung, Header/Footer-Stripping, OCR-Korrektur, Encoding-Reparatur und Watermark-Entfernung mit cleanlab und dedupe.io.
OLLAMA · ANLEITUNGOllama installieren: Schritt-für-Schritt-Anleitung für Mac, Linux und Windows (Mai 2026)
Praktische Anleitung zur Installation von Ollama 0.5+ auf macOS, Linux und Windows mit Modell-Download, REST-API-Test, Quantisierung Q4_K_M, Systemd-Setup und GPU-Beschleunigung.
RAG · ANLEITUNGRAG-Pilot in 7 Tagen: Von 50 PDFs zur funktionierenden Wissensbasis (Mai 2026)
Tag-für-Tag Anleitung von 50 PDFs zu funktionierender Retrieval-Augmented-Generation mit pgvector, BGE-M3, LiteLLM, Streamlit-UI und Ragas-Eval. Budget CHF 800-1500.
N8N · ANLEITUNGn8n self-host plus Bexio-Integration: vom Docker-Compose zum Mahnstatus-Workflow (Mai 2026)
Anleitung für n8n in EU-Hosting mit Postgres-Backend, Bexio-OAuth-App, Webhook-Empfang und einem fertigen Workflow "Bei neuer Rechnung prüfe Mahnstatus". Production-ready.
BREVO · ANLEITUNGBrevo SMTP einrichten: DNS, DKIM, DMARC, Nodemailer-Test und Bounce-Webhooks (Mai 2026)
Schritt-für-Schritt Anleitung von DNS-Records über Hetzner-Firewall-Whitelisting bis Nodemailer-Test, mit Production-Tipps für dedizierte IP und Bounce-Webhook in n8n.
CLOUDFLARE · ANLEITUNGCloudflare mit eigener Domain einrichten: DNS, SSL, WAF, Workers KV und Tunnel (Mai 2026)
Anleitung von der Domain-Registrierung über Nameserver-Wechsel, SSL-Modi, DNS-Records, Page-Rules, Workers KV, WAF-Regeln und Cloudflare-Tunnel für Origin-Schutz.
BACKUP · ANLEITUNGBackup-Strategie 3-2-1 für KMU: restic, rclone, Backblaze B2 und Wiederherstellungs-Drills (Mai 2026)
Konkretes Setup für KMU mit Linux-Server, Bexio-Cloud und Office-365: restic für Files, mysqldump für DB, rclone für Cloud, Object Lock auf Backblaze B2. Budget CHF 30-50/Monat.
LITELLM · ANLEITUNGLiteLLM-Gateway installieren: Docker, config.yaml, Virtual Keys, Cost-Tracking und Langfuse (Mai 2026)
Anleitung von leerem Server zu produktivem LiteLLM-Proxy mit 5 Providern (OpenAI, Anthropic, Mistral, Gemini, Ollama), Virtual Keys mit Budget-Limit, PostgreSQL-Audit-Log und Langfuse-Tracing.
UmsetzungPrompt-Bibliothek für Treuhänder: erprobte Prompts für Buchhaltung, MwSt & Korrespondenz
Sichere, wiederverwendbare Prompt-Muster für den Treuhand-Alltag – mit klaren Grenzen, ohne Mandantendaten in unsichere Tools.
Umsetzung · Mandantenportal & RAGMandantenportal mit KI-Assistent: sicherer Self-Service-Chat auf eigenem Treuhand-Wissen (RAG)
Mandantenportal mit RAG-Chatbot auf eigenem Kanzleiwissen: Zugriffskontrolle, Mandantentrennung, revDSG, Halluzinationsbegrenzung und Eskalation an den Menschen.
Risiken & Grenzen
Was schiefgeht, was KI nicht kann.
Halluzinationen begrenzen: Fünf Gegenmittel gegen erfundene KI-Antworten
Warum Sprachmodelle plausibel-falsche Antworten produzieren, welche fünf Mittel das eindaemmen und wie Sie Halluzinationen messbar machen.
SHADOW AI · COMPLIANCESchatten-KI im Unternehmen: Wenn Mitarbeiter ChatGPT privat für Mandantendaten nutzen
Cyberhaven 2026: 32 % der ChatGPT-Nutzung läuft über Privat-Accounts. 39,7 % der Dateneingaben enthalten sensible Daten. Folgen + Gegenmittel.
BACKUP · SICHERHEITBackup-Strategien 3-2-1 und 3-2-1-1-0: So sichern Sie ein KMU revisionsfest
Drei Kopien, zwei Medien, eine Offsite, eine Offline, null Verifizier-Fehler. Tools, Cloud-Ziele und DSG-Aspekte für Mai 2026.
DISASTER RECOVERY · SICHERHEITDisaster Recovery, RTO und RPO: Was ein KMU-Treuhand wirklich vorhalten muss
Wie lange darf der Ausfall dauern, wie viele Daten dürfen verloren gehen? Vier DR-Strategien mit Mai-2026-Preisen und Tooling.
RBAC · SICHERHEITRBAC und Rechtemanagement: Wer darf in einem Treuhand-System was sehen?
Role-Based Access Control vs ABAC, Least Privilege, Mandanten-Trennung. Tools wie Authelia, Authentik, Keycloak und Entra im KMU-Vergleich.
SECRETS · SICHERHEITSecrets-Management mit Vault: API-Keys, DB-Passwörter und JWT-Secrets richtig verwalten
Keine .env-Files in Git, keine Klartext-Backups. HashiCorp Vault, Bitwarden Secrets, 1Password, AWS und Entra im KMU-Vergleich.
PENTEST · SICHERHEITPentest und Vulnerability-Scans: Was ein KMU jährlich prüfen muss
Manueller Pentest, automatisierte Scans, Bug-Bounty und OWASP LLM Top 10. Schweizer Anbieter, OSS-Tools und realistische Preise Mai 2026.
INCIDENT RESPONSE · SICHERHEIT & BETRIEBIncident-Response-Playbook: 6-Phasen-Modell nach NIST SP 800-61 für KMU
Strukturierte Reaktion auf Sicherheitsvorfälle in sechs Phasen, mit DSG-konformer 72-Stunden-Meldung an den EDÖB und Werkzeugen wie TheHive, Wazuh und MISP.
LOGGING · SICHERHEIT & BETRIEBLogging und Audit-Trail: revisionsfeste Protokollierung nach OR Art. 957a für KMU
Unveränderliche Logs mit 10-jähriger Aufbewahrung nach OR 957a, WORM-Storage und Hash-Chain. Tools Mai 2026: Loki, Wazuh, GrayLog, Elasticsearch.
DDoS · SICHERHEIT & BETRIEBDDoS-Schutz mit Cloudflare: Layer 3, 4 und 7 für KMU-Web-Anwendungen 2026
Volumetrische und Application-Layer-DDoS-Angriffe mit Cloudflare Free, Pro oder Business absichern. Stand Mai 2026 inkl. KI-orchestrierter Angriffe.
TLS · SICHERHEIT & BETRIEBSSL/TLS-Zertifikate mit Lets Encrypt: TLS 1.3, HTTP/3 und Auto-Renew für KMU 2026
Kostenlose TLS-Zertifikate mit 90-Tage-Gültigkeit, Auto-Renew via Certbot oder Caddy, TLS 1.3 plus HTTP/3 als Standard 2026.
FIREWALL · SICHERHEIT & BETRIEBFirewall und CrowdSec: mehrschichtiger Schutz für KMU-Server 2026
Netzwerk-Firewall (ufw/nftables) plus Application-Schutz mit CrowdSec, der Open-Source-Nachfolger von Fail2ban mit Crowd-Sourced Threat-Intel.
HALLUZINATIONS-MESSUNG · AI-KONZEPTHalluzinationen erkennen und messen: Metriken, Benchmarks und Self-Consistency
Wie Sie Halluzinationen in KI-Antworten reproduzierbar messen: TruthfulQA, HaluEval, FActScore, Selbstkonsistenz und Citation-Grounding-Checks.
EVAL-FRAMEWORKS · AI-KONZEPTEval-Frameworks für LLMs: DeepEval, OpenAI Evals, Promptfoo, Ragas, TruLens im Vergleich
Welches LLM-Evaluation-Framework wann: DeepEval, OpenAI Evals, Promptfoo, Inspect (UK AISI), Ragas, TruLens, MLflow LLM Evaluate und Phoenix Evals.
GOLDEN DATASET · AI-KONZEPTGolden Dataset aufbauen: 50-500 Test-Beispiele für KMU richtig erstellen
Stratified Sampling, Edge-Cases, Adversarial-Set, quartalsweise Auffrischung und Annotations-Guidelines für ein belastbares Test-Set in der Treuhand-Praxis.
LLM-AS-A-JUDGE · AI-KONZEPTLLM-as-a-Judge: KI bewertet KI – Methoden, Bias-Fallen, Grenzen
GPT-4 und Claude als Eval-Richter, Pairwise vs Pointwise Scoring, Position-Bias und Self-Preference, G-Eval Paper, wann Menschen unverzichtbar bleiben.
REGRESSION TESTING · AI-KONZEPTRegression Testing für LLMs: CI/CD, Snapshot-Tests und Modell-Update-Drift erkennen
CI/CD-Integration von LLM-Tests, Snapshot-Testing für Prompts, Diff-Testing zwischen Modell-Versionen am Beispiel das aktuelle Claude-Modell zu 4.7 Treuhand-Pipeline.
RED-TEAMING · AI-KONZEPTRed-Teaming für KI: Jailbreaks, Prompt-Injection und OWASP LLM Top 10 v2.0
Adversarial Prompts, DAN-Mode, Prompt-Injection (direkt und indirekt), OWASP LLM Top 10 v2.0 und Mai-2026-Tools: PyRIT, Garak, Promptfoo Red-Team.
BIAS & FAIRNESS · AI-KONZEPTBias- und Fairness-Audits für KI: Schweizer Gleichstellung, EU AI Act Art. 10, BBQ und StereoSet
Wie KMU Bias in LLM-Outputs messen: Schweizer Gleichstellungsrecht, EU AI Act Art. 10, BBQ-Benchmark, StereoSet, CrowS-Pairs und ein Treuhand-Beispiel zu Sprach-Akzent.
KI-KPIS · AI-KONZEPTKI-Qualität messen: KPIs für RAG, Latenz, Kosten und User-Satisfaction
KMU-Dashboard für KI-Qualität: Faithfulness, Answer Relevancy, Context Precision, Context Recall, Latency, Cost-per-Query, User-Satisfaction.
Mensch & Organisation
Arbeitsplätze, Akzeptanz, Wandel.
KI für HR und Personalvermittlung in der Schweiz: CV-Screening, Voicebot-Interviews und Mitarbeiter-FAQ
Wie HR-Abteilungen und Personaldienstleister KI in CV-Screening, Stelleninserate, Interview-Voicebots und Mitarbeiter-FAQ einsetzen – mit Bias-Audit, revFADP und EU-AI-Act-Hochrisiko-Pflichten.
Mensch & OrganisationSchatten-KI im Treuhandbüro: Richtlinie, Tool-Freigabeliste & Mitarbeiter-Schulung
Wie Treuhandbüros unkontrollierte KI-Nutzung in den Griff bekommen: interne Richtlinie, Freigabeliste, Schulung und revDSG-Bezug.
Trends & Einordnung
Was neu ist, was Hype.
Trend Agentic AI 2026: Was MCP, Computer Use und Multi-Agent-Frameworks wirklich leisten
Mai 2026: 1500+ MCP-Server, Computer Use produktiv, AutoGen 0.4 und CrewAI im KMU-Test. Was funktioniert und wo Token-Kosten ausser Kontrolle geraten.
MULTIMODAL · TREND 2026Trend Multimodale LLMs 2026: Bild, Audio und Video als Standard-Eingaben
Mai 2026: GPT-4o, das aktuelle Claude-Spitzenmodell und Gemini 2.5 Pro lesen Bilder, hören Sprache und verstehen Video. Was das für Treuhand und Beleg-Workflows konkret heisst.
EDGE AI · TREND 2026Trend Edge AI 2026: On-Device-Modelle für Smartphone, Laptop und Mandanten-App
Mai 2026: Apple Intelligence, Phi-4 und Llama 3.2 laufen lokal auf Geräten. Was das für Datenschutz, Latenz und Offline-Fähigkeit von KMU-Apps bedeutet.
REASONING · TREND 2026Trend Reasoning-Modelle 2026: o3, R1, Extended Thinking und der Test-Time-Compute-Boom
Mai 2026: OpenAI o3, Claude mit Extended Thinking, Gemini 2.5 Pro Thinking und DeepSeek-R1. Wann sich der mehrfache Token-Preis für KMU rechnet.
OPEN-WEIGHT · TREND 2026Trend Open-Weight vs Closed-Source 2026: Wie nahe sind Llama 4, DeepSeek und Mistral an GPT und Claude?
Mai 2026: Open-Weight schliesst die Lücke. Die aktuelle DeepSeek-V-Generation erreicht GPT-4o, Llama 4 Maverick liegt bei Claude Sonnet. Was Lizenz und Hosting bedeuten.
EU AI ACT · TREND 2026Trend EU-KI-Regulierung 2026: Fristen, GPAI-Pflichten und was die Schweiz daraus macht
Mai 2026: Verbote seit Februar 2025 wirksam, GPAI-Modelle seit August 2025 verpflichtet, Hochrisiko ab August 2026. CH-Anbindung über Marktzugang.
ENERGIE & CO2 · TREND 2026Trend Energie und CO2 von KI 2026: Was eine Anfrage wirklich verbraucht und wo die Schweiz steht
Mai 2026: 0.3 Wh pro GPT-4-Anfrage, 500t CO2 fürs GPT-4-Training, Rechenzentren +35% YoY. CH-Vorteil: Wasserkraft und Wärmenutzung.
Trends & VergleichTREUHAND|SUISSE GPT vs. eigene KI-Infrastruktur: Datenschutz, Vendor-Lock-in, Kosten
Neutraler Vergleich: Verbands-KI TREUHAND|SUISSE GPT gegenüber anbieterunabhängigem Multi-LLM-Gateway mit eigener RAG auf Kanzleidaten.