KÜNSTLICHE INTELLIGENZ – WISSEN

KI verstehen, vorher und in Aktion.

Fundiertes Wissen für Geschäftsführung und IT in Unternehmen, Einrichtungen und Institutionen. Damit der Einstieg in den professionellen KI-Einsatz auf Substanz aufsetzt und dann souverän betrieben werden kann.

⌕Wissensdatenbank durchsuchen — den richtigen Artikel finden

UNSERE THEMEN:

01 · START HIER

Grundlagen & OrientierungBegriffe ohne Jargon erklärt.26 ARTIKEL

Anwendung nach BereichNach Bereich: Vertrieb, HR, Buchhaltung …34 ARTIKEL

Recht, Compliance, DSGVOAI Act, Haftung, Mitbestimmung.21 ARTIKEL

Werkzeuge & AnbieterAnbieter im Vergleich, neutral.170 ARTIKEL

Einführung & UmsetzungVon Pilot zu Produktion, Kosten.39 ARTIKEL

Risiken & GrenzenWas schiefgeht, was KI nicht kann.20 ARTIKEL

Mensch & OrganisationArbeitsplätze, Akzeptanz, Wandel.2 ARTIKEL

08 · LIVELIVE

Trends & EinordnungWas neu ist, was Hype.TÄGLICH AKTUELL

01 · START HIER

Grundlagen & Orientierung

26 Themen

Begriffe ohne Jargon erklärt.

RAG · AI-KONZEPT

Retrieval-Augmented Generation (RAG): Wie KI aus eigenen Dokumenten antwortet

RAG koppelt ein Sprachmodell an eine durchsuchbare Wissensbasis. Antworten kommen mit Quellenangabe, nicht aus dem Training erfunden.

EMBEDDINGS · AI-KONZEPT

Embeddings und Vektoren: Wie Sprache zu Mathematik wird

Embeddings sind Zahlen-Repräsentationen von Text, Bild oder Audio. Sie sind die Grundlage jeder semantischen Suche und jedes RAG-Systems.

PROMPTING · AI-KONZEPT

Prompt-Engineering: Grundlagen, Muster, Anti-Patterns

System-Prompt, Few-Shot, strukturierte Outputs, Refusal-Pattern. Was im Mai 2026 noch zählt – und was die Modelle inzwischen intern erledigen.

LLM-GATEWAY · AI-KONZEPT

Was ist ein LLM-Gateway? Aufgabe, Bestandteile, Marktstand Mai 2026

Ein LLM-Gateway ist ein zentraler Proxy für Sprachmodell-Aufrufe. Es bündelt Routing, Auth, Rate-Limit, Fallback, Observability und Cost-Tracking.

VEKTOR-INDEX · AI-KONZEPT

Was ist ein Vektor-Index? HNSW, IVF, ScaNN und Quantisierung Mai 2026

Ein Vektor-Index ist die Datenstruktur einer Vektor-DB, die ähnliche Embeddings schnell findet. Trade-off zwischen Recall, Latenz und Speicher.

FINE-TUNING vs RAG · AI-KONZEPT

Fine-Tuning vs RAG: Wann passt welcher Ansatz? Stand Mai 2026

Fine-Tuning ändert Modell-Verhalten dauerhaft, RAG fuettert frisches Wissen. PEFT/LoRA macht FT erschwinglich, RAG bleibt Standard in Compliance.

AI-AGENT · AI-KONZEPT

Was ist ein AI-Agent? ReAct, Tool-Use und Production-Patterns Mai 2026

Ein AI-Agent ist ein LLM-System, das selbst Werkzeuge aufruft, plant und mehrstufig handelt. Patterns Mai 2026: Tool-Use, ReAct, LangGraph.

MCP · AI-KONZEPT

Was ist MCP (Model Context Protocol)? Standard für Tool-Use Mai 2026

MCP ist ein offener Standard für den Zugriff von LLMs auf Tools, Daten und Server. Anthropic-Spec Nov 2024, Mai 2026 von OpenAI/Google/Microsoft adoptiert.

QUANTISIERUNG · AI-KONZEPT

Was ist Quantisierung? Modell-Gewichte komprimieren ohne Qualitätsverlust

Quantisierung speichert Modell-Gewichte mit weniger Bits. Q4_K_M reduziert Llama-70B von 140 GB auf 42 GB bei unter 2% Qualitätsverlust.

TRANSFORMER · AI-KONZEPT

Was ist die Transformer-Architektur? Grundlagen, Varianten, Marktstand Mai 2026

Die Transformer-Architektur ist das technische Fundament aller modernen Sprachmodelle. Erklärt: Self-Attention, Encoder-Decoder, Multi-Head, MoE-Trend Mai 2026.

CONTEXT WINDOW · AI-KONZEPT

Was ist das Context Window? Token-Limit, Kosten, Recall-Kurve Mai 2026

Das Context Window ist die maximale Token-Menge pro LLM-Anfrage (Input + Output). Mai 2026: 128k-2M je Anbieter, mit klarer Recall-Verlustkurve ab Mitte.

TOKEN · AI-KONZEPT

Was ist ein Token? Tokenizer, Kosten, DE-vs-EN Mai 2026

Ein Token ist ein Wortteil – die kleinste Verrechnungs-Einheit eines LLMs. Erklärt: BPE, SentencePiece, Tiktoken, DE-Overhead, Preisbeispiele Mai 2026.

ATTENTION · AI-KONZEPT

Was ist der Attention-Mechanismus? Query, Key, Value erklärt Mai 2026

Attention ist das Herzstück moderner Sprachmodelle: jede Position einer Sequenz darf auf alle anderen achten. Erklärt: Q/K/V, Self vs Cross, Multi-Head.

TEMPERATURE / TOP-P · AI-KONZEPT

Was sind Temperature und Top-p? LLM-Sampling-Parameter erklärt Mai 2026

Temperature, Top-p und Top-k steuern, wie deterministisch oder kreativ ein LLM antwortet. Faustregeln Mai 2026: 0-0.3 für Fakten, 0.7 für Standard, 1.0+ für Kreativ.

SYSTEM PROMPT · AI-KONZEPT

Was ist ein System-Prompt? Rolle, Sicherheit, Best Practices Mai 2026

Ein System-Prompt definiert Rolle, Aufgabe und Verhalten eines LLM vor jeder User-Anfrage. Erklärt: Stadien, Prompt-Injection, Constitutional AI Mai 2026.

LLM-GRUNDLAGEN · AI-KONZEPT

Wie funktioniert ein LLM? Autocomplete auf Steroiden, erklärt für KMU Mai 2026

Ein Sprachmodell sagt das wahrscheinlich nächste Wortteil voraus. Erklärung in fünf Stationen: Tokenisierung, Embedding, Transformer, Logits, Sampling – ohne Mathematik.

PRETRAINING · AI-KONZEPT

Was ist Pretraining? Wie ein LLM seine Grundfähigkeit lernt Mai 2026

Pretraining ist die Selbstlern-Phase, in der ein Sprachmodell Sprache, Grammatik und Faktenwissen aus 10-15 Billionen Tokens Text aufnimmt. Erklärt: Daten-Quellen, Cutoff, Kosten.

RLHF · AI-KONZEPT

Was ist RLHF? Reinforcement Learning from Human Feedback erklärt Mai 2026

RLHF macht aus einem rohen Base-Model einen hilfsbereiten Assistenten. Drei Phasen: SFT, Reward Model, PPO. Plus Vergleich mit DPO, Constitutional AI und RLAIF Mai 2026.

MIXTURE OF EXPERTS · AI-KONZEPT

Was ist Mixture of Experts (MoE)? Sparse Models erklärt Mai 2026

MoE-Modelle aktivieren pro Token nur einen Bruchteil ihrer Parameter – vergleichbare Qualität bei 5x weniger Compute. Mai 2026: Llama 4 Maverick, die aktuelle DeepSeek-V-Generation, Mixtral.

MULTIMODAL · AI-KONZEPT

Was ist multimodale KI? Bild, Audio, Video plus Text Mai 2026

Multimodale Modelle verarbeiten nicht nur Text, sondern auch Bild, Audio und Video. Mai 2026: GPT-4o, Gemini 2.5 Pro, das aktuelle Claude-Spitzenmodell, Llama 4. Use Cases für Belegerkennung und Schadenfotos.

REASONING · AI-KONZEPT

Was ist ein Reasoning-Modell? o3, Claude Extended Thinking, die aktuelle DeepSeek-R-Generation Mai 2026

Reasoning-Modelle denken intern in Chain-of-Thought, bevor sie antworten. Mehr Tokens für Denken = bessere Antworten bei Mathe, Code, Logik. Kostet 5-15x mehr als reguläre Modelle.

TOOL-USE · AI-KONZEPT

Was ist Tool-Use und Function-Calling? LLM ruft externe APIs auf Mai 2026

Tool-Use macht aus einem Sprachmodell einen Agent: das Modell ruft strukturiert externe APIs auf – Rechner, Datenbank, Web-Search. Mai 2026 Standard mit MCP-Protokoll.

EIGENES MODELL · AI-KONZEPT

Wie trainiert man ein eigenes KI-Modell? Fine-Tuning, LoRA, QLoRA Mai 2026

Fine-Tuning vs From-Scratch vs RAG: für 95% der KMU ist Fine-Tuning mit LoRA/QLoRA der richtige Weg. Hardware-Bedarf, Kosten USD 5-50k, Tools Mai 2026.

GLOSSAR · KI-BEGRIFFE

Glossar KI-Begriffe: 80+ Schlüsselwörter für KMU und Treuhand

Glossar mit über 80 KI-Begriffen von A bis Z. Kurze Definitionen, Querverweise auf vertiefende Seiten. Stand Mai 2026.

FAQ · KI FÜR KMU

FAQ KI für KMU: 35 häufige Fragen aus Praxis, Recht und Kosten

Antworten auf die häufigsten KI-Fragen aus Schweizer KMU: Kosten, Datenschutz, Tools, Halluzinationen, FINMA, EU AI Act. Stand Mai 2026.

Grundlagen · Wirtschaftlichkeit

Was kostet KI im Treuhandbüro wirklich? Total-Cost & Amortisation pro Mandatsgrösse

Kostenarten, Total-Cost-of-Ownership und Amortisationslogik von KI im Treuhandbüro – mit Rechenmethodik statt Versprechen.

Anwendung nach Bereich

34 Themen

Nach Bereich: Vertrieb, HR, Buchhaltung …

BOTS · SERVICE

WhatsApp- & Telegram-Bot: KI, die auf den Kanälen antwortet, die Ihre Kundschaft nutzt

Funktionierender Bot auf WhatsApp Business oder Telegram, getestet und live. Terminbuchung, FAQ, Lead-Qualifikation, Anbindung an CRM oder RAG-Wissensbasis. Pauschal CHF 1'800.

VOICE · SERVICE

Voice-Agent am Telefon: KI, die anruft und angerufen wird

Telefon-Agent mit Whisper STT, LLM und ElevenLabs/Cartesia TTS. Anrufannahme, Terminbuchung, Vorqualifizierung. Latenzbudget unter 800 ms. Pauschal CHF 3'500.

LOHN-TRIAGE · ANWENDUNGSFALL

KI-Triage in der Lohnbuchhaltung: Mandantenanfragen zu AHV, BVG, Quellensteuer vorsortieren

KI sortiert eingehende Lohn-Anfragen vor, schlägt Antworten aus Wegleitungen vor und übergibt den Fall mit Kontext an den Sachbearbeiter.

MWST-VORBEREITUNG · ANWENDUNGSFALL

KI-Vorbereitung der MWST-Abrechnung: Belege klassifizieren, Vorsteuer-Codes vorschlagen, Saldosteuersatz prüfen

KI klassifiziert Belege nach MWST-Code, schlägt Vorsteuerabzug vor und markiert Saldosteuersatz-Branchen. Der Treuhänder prüft, korrigiert und bucht.

MANDANTEN-TRIAGE · ANWENDUNGSFALL

KI-Triage für Mandantenanfragen: WhatsApp, E-Mail und Telefon zu strukturierten Vorgängen

KI klassifiziert Mandantenanfragen, sucht Antwort-Bausteine in der internen Wissensbasis und legt einen Entwurf für den Sachbearbeiter bereit.

BELEG-OCR · ANWENDUNGSFALL

KI-Belegerkennung für Schweizer Belege: QR-Rechnung, Quittungen, PDF-Rechnungen strukturiert erfassen

OCR extrahiert aus QR-Rechnungen, Restaurantquittungen und PDF-Rechnungen strukturierte Felder, validiert IBAN und UID und übergibt an das ERP.

JAHRESABSCHLUSS-QS · USE-CASE

KI-gestützte Qualitätssicherung beim Jahresabschluss

Anomalien in Buchungssätzen vor der Revision aufspüren: Benford-Test, Saldenvergleich, Periodenabgrenzungen. Mensch entscheidet, KI flaggt.

STEUER-ENTWURF · USE-CASE

KI-Entwurf für Steueroptimierung juristischer Personen

Entwurfs-Varianten für Dividende vs Lohn, Beteiligungsabzug, Verlustverrechnung. Steuerberater finalisiert und unterschreibt. NICHT als Endprodukt an Mandanten.

MAHNWESEN · USE-CASE

KI-gestütztes Mahnwesen ohne Mandanten-Beziehung zu beschädigen

Stufenmahnung 1-2-3, Stundungsersuche-Triage, persönliche Briefe aus Mandanten-Historie. Bexio/Abacus/Banana-Integration. Treuhänderin entscheidet vor jedem Versand.

GWG-SCREENING · USE-CASE

KI-gestütztes GwG-/KYC-Screening: Sanktionslisten, PEP, wirtschaftlich Berechtigte

Onboarding-Daten gegen SECO/OFAC/EU-Listen prüfen, Risiko-Score erstellen, SRO-Meldung-Entwurf vorbereiten. NIEMALS vollautomatisch melden – Mensch entscheidet.

TREUHAND · BRANCHEN-HUB

KI für Treuhandbüros in der Schweiz: ein praktischer Leitfaden

Wo künstliche Intelligenz in Treuhand-Buchhaltung, MWST, GwG und Mahnwesen heute wirklich entlastet – ohne das Berufsgeheimnis zu berühren.

ANWALTSKANZLEI · BRANCHEN-HUB

KI für Anwaltskanzleien in der Schweiz: was geht, was nicht, und was die SAV-Wegleitung dazu sagt

Wie Schweizer Kanzleien KI in Vertragsanalyse, Praxis-Recherche und Mandantenkommunikation einsetzen – ohne das Berufsgeheimnis nach Art. 13 BGFA zu verletzen.

VERSICHERUNGEN · BRANCHEN-HUB

KI für Versicherungen in der Schweiz: Governance, Schadenbearbeitung und Underwriting

Wie Schweizer Versicherer und Broker KI in Schaden, Underwriting und Kundenanfragen einsetzen – innerhalb der FINMA-Aufsichtsmitteilung 08/2024.

ARZTPRAXEN · BRANCHE

KI für Arztpraxen: Sprechstunden-Notizen, Korrespondenz, Triage – was rechtlich geht und was nicht

Sprechstundennotizen, KVG-Korrespondenz und Patient-Triage entlasten Hausarztpraxen – Patientendaten sind aber besonders schützenswert und Hochrisiko unter EU AI Act.

ARCHITEKTUR · BRANCHE

KI für Architektur- und Planungsbüros: BIM, Bauantrag, Submission – wo Sprachmodelle wirklich Zeit sparen

Bauantragstexte, Submissions-Lesen, Verträge und Recherche-Aufgaben sind in jedem SIA-Büro Stunden-Fresser. Sprachmodelle entlasten messbar – die Statik bleibt aber Ingenieurssache.

HANDWERK · BRANCHE

KI für das Schweizer Handwerk: Offerten, Mahnwesen, WhatsApp-Triage – der ROI ist hier am schnellsten

Offerten in 10 Minuten statt 60, Mahnungen automatisch, eingehende WhatsApp-Anfragen vorsortiert – Handwerk holt KI-Nutzen am schnellsten. Setup zahlt sich in 3 bis 6 Monaten zurück.

IMMOBILIEN · BRANCHE

KI für Immobilien-Makler und Verwaltungen: Inserate, Mietverträge, Bewerber-Triage – und die GwG-Pflicht

Inserate, Mieter-Vorqualifizierung und Verträge sind in jedem Maklerbüro Routine. KI beschleunigt das deutlich – aber Maklerbüros sind GwG-pflichtig und der Bewerber-Score liegt im EU-AI-Act-Hochrisiko-Bereich.

E-COMMERCE · BRANCHE

KI für Schweizer E-Commerce: Produkttexte, Kunden-Triage, Empfehlungs-Engines – und revDSG für Tracking

Mehrsprachige Produkttexte, FAQ-Bots und Empfehlungs-Engines holen Margenpunkte zurück. Profiling-Scores stehen unter EU-AI-Act-Beobachtung, Tracking braucht revDSG-konforme Einwilligung.

E-MAIL-TRIAGE · ANWENDUNGSFALL

E-Mail-Triage-Automation: Eingangsflut klassifizieren, zuordnen, Entwurf bereitstellen

IMAP-Watcher liest jede Mail, ein EU-LLM klassifiziert (Mandant/Rechnung/Anfrage/Newsletter/Spam), RAG bringt Mandanten-Kontext, Entwurf landet beim Sachbearbeiter. Versand nur per Hand.

OFFERTEN · ANWENDUNGSFALL

KI-gestützte Offerten-Generierung: 2 bis 4 Stunden Arbeit in 20 Minuten

Aus Anfrage -> RAG auf vergangene Offerten (Preisstaffeln, Standardklauseln) -> sauberer Entwurf in Bexio/Klara-Format. Sachbearbeiter prüft und sendet manuell.

CH-MEHRSPRACHIGKEIT · COMPLIANCE

KI und Schweizer Mehrsprachigkeit: LLMs für Deutsch, Französisch, Italienisch und Rätoromanisch

Sprachverteilung CH (Stand 2025): DE 62.8%, FR 22.9%, IT 8.2%, RM 0.5%. Welche Modelle die vier Landessprachen plus Schweizerdeutsch beherrschen – Stand Mai 2026.

SWISSDEC ELM · COMPLIANCE

Swissdec ELM 5.0 und elektronischer Lohnausweis: zertifizierte Lohn-Software, Schnittstellen, KI-Plausibilisierung

Swissdec ELM Standard 5.0 ist Mai 2026 produktiv. Zertifizierte Lohn-Software, Schnittstellen zu AHV, SUVA, Krankenkassen, Pensionskassen, Steuer. KI für Lohnausweis-Plausibilisierung.

MWST · COMPLIANCE

MwSt und KI-Automatisierung in der Schweiz: Belegerkennung, MwSt-Code-Vorschlag, Vorsteuer-Optimierung, ESTV-XML

CH-MwSt-Sätze seit 1.1.2024: Standard 8.1%, reduziert 2.6%, Beherbergung 3.8%. KI für Belegerkennung, MwSt-Code-Vorschlag, Vorsteuer-Optimierung. ESTV-Quartalsabrechnung via SuisseTax/ePortal.

BANKEN · BRANCHEN-HUB

KI für Schweizer Banken unter FINMA-Aufsicht: Governance, Kreditscoring, AML und Kunden-Triage

Wie Schweizer Banken KI in Kreditscoring, AML/KYC, Sentiment-Analyse und Kunden-Mail-Triage einsetzen – innerhalb von FINMA 08/2024, BankG Art. 47 und revDSG.

VERMÖGENSVERWALTUNG · BRANCHEN-HUB

KI für unabhängige Schweizer Vermögensverwalter: Eignungsprüfung, Reporting und Markt-Synthese

Wie FINIG-bewilligte Schweizer Vermögensverwalter KI in Risikoprofilierung, Reporting-Automatisierung und Markt-News-Synthese einsetzen – innerhalb FIDLEG, FINMA 08/2024 und revFADP.

NOTARIAT · BRANCHEN-HUB

KI für Schweizer Notariate: Präzedenz-Recherche, ZGB-Vorlagen und Beurkundungs-Vorbereitung

Wie Schweizer Notariate KI in BGE-Recherche, Beurkundungs-Vorbereitung und ZGB-Erbrechts-Vorlagen einsetzen – mit Anonymisierungs-Pflicht und ohne die Beurkundung selbst zu delegieren.

LITIGATION · BRANCHEN-HUB

KI für Litigation-Kanzleien: eDiscovery, Aktenanalyse, Schriftsatz-Vorbereitung und CH-Rechtsprechung

Wie Litigation-Kanzleien und Prozessführungs-Boutiquen in der Schweiz KI in eDiscovery, Aktenanalyse, Schriftsatz-Vorbereitung und Praxis-Recherche einsetzen – mit BGFA und StGB 321 als Leitplanken.

ARBEITSMEDIZIN & SOZIALVERSICHERER · BRANCHEN-HUB

KI für Schweizer Sozial-, Kranken- und Unfallversicherer und arbeitsmedizinische Dienste

Wie Schweizer KV/UV-Versicherer und arbeitsmedizinische Dienste KI in Schadenmanagement, IV-Antrags-Plausibilisierung und Vertrauensarzt-Dokumentenanalyse einsetzen – bei besonders schützenswerten Personendaten (revFADP Art. 5).

TGA & BAUPLANUNG · BRANCHEN-HUB

KI für Bauplanung und TGA: SIA-Norm-Suche, Schemata-Erstellung, Energie-Modellierung und BIM

Wie TGA-Planer und Bauplaner in der Schweiz KI für SIA-Norm-Suche, HLKS-Schemata-Erstellung, Energie-Modellierung und BIM-Anreicherung einsetzen – innerhalb von SIA-Normen, MuKEn 2014 und MMS.

PHARMA & MEDTECH · BRANCHEN-HUB

KI für Pharma und MedTech: Regulatorik-RAG, Adverse-Event-Triage und KI als Medizinprodukt

Wie Schweizer Pharma-Unternehmen und MedTech-Hersteller KI in Regulatorik-Recherche, Adverse-Event-Triage und Literatur-Synthese einsetzen – innerhalb von HMG, Swissmedic, ISO 13485, MDR EU 2017/745 und EU AI Act.

Anwendung · Belegverarbeitung

QR-Rechnung & eBill/Peppol automatisiert auslesen und verbuchen mit KI

Wie Treuhänder QR-Rechnung, eBill und Peppol-Belege strukturiert auslesen und mit KI-gestützter Kontierung halbautomatisch verbuchen – mit Mensch im Prozess.

Anwendung

Automatische Kontierung & Kontenrahmen KMU: KI-Buchungsvorschläge mit Human-in-the-loop

Wie KI Buchungsvorschläge auf dem Schweizer KMU-Kontenrahmen erzeugt, mit Feedbackschleife und menschlicher Freigabe – und wo die Fehlerquellen liegen.

Anwendung · Lohn & Sozialversicherungen

KI in Sozialversicherungen: AHV/IV/EO, BVG, Quellensteuer & Swissdec-ELM automatisieren

Wo KI die Schweizer Lohnabrechnung (AHV, ALV, BVG, UVG, Quellensteuer, Swissdec ELM) sinnvoll unterstützt – und wo die Berechnung deterministisch bleiben muss.

Anwendung · Steuern & Treuhand

KI-gestützte Steuererklärung & Belegerfassung: Steuersoftware, Dr. Tax und eigener RAG-Workflow

Wie CH-Steuersoftware, OCR-Belegerfassung und ein eigener RAG-Workflow zusammenspielen – inklusive Grenzen, Verantwortung und Datenschutz.

Recht, Compliance, DSGVO

21 Themen

AI Act, Haftung, Mitbestimmung.

revDSG · COMPLIANCE

revDSG / revFADP und KI: Was das revidierte Schweizer Datenschutzgesetz für LLM-Nutzung bedeutet

Das revidierte DSG ist seit 1.9.2023 in Kraft. Wer LLMs auf Personendaten anwendet, muss Art. 4, 5, 6, 7, 16-18, 19 und 21 beachten.

EU AI ACT · COMPLIANCE

EU AI Act 2026: Hochrisiko-Pflichten ab 2. August 2026 – was Schweizer Anbieter jetzt tun müssen

Verordnung (EU) 2024/1689 wird gestaffelt scharf. Verbote seit 2.2.2025, GPAI seit 2.8.2025, Hochrisiko ab 2.8.2026 – auch für CH-Anbieter mit EU-Kunden.

GwG-REVISION · COMPLIANCE

GwG-Revision 2026: Erweiterung auf Treuhand-Beratung und FATF-Empfehlungen 16

Der Bundesrat hat 2024 die GwG-Revision verabschiedet. Erweiterung auf Beratungs-Treuhand, neue SRO-Pflichten, FATF-Recommendation 16 – Inkrafttreten H2 2026.

ART. 957a OR · COMPLIANCE

Art. 957a OR und KI-Buchungen: Audit-Trail, GeBüV und 10-Jahres-Aufbewahrung

Art. 957a OR verlangt Verlässlichkeit, Vollständigkeit, Nachprüfbarkeit. KI-gestützte Buchungen brauchen Audit-Trail mit Modellversion, Prompt, Quelle, Mensch.

STGB 321 · COMPLIANCE

Berufsgeheimnis (StGB Art. 321) und KI-Nutzung: Was Anwälte, Notare, Ärzte und Revisoren beachten müssen

StGB Art. 321 verbietet das Offenbaren von Berufsgeheimnissen. Cloud-LLMs können ein Offenbaren sein. Wann der Einsatz zulässig bleibt.

ISO 42001 · COMPLIANCE

ISO/IEC 42001: Der internationale Standard für AI-Management-Systeme

ISO/IEC 42001:2023 ist der erste internationale AIMS-Standard. Wer braucht eine Zertifizierung, was sie kostet, welche Annex-A-Kontrollen verpflichtend sind.

TIA · COMPLIANCE

Drittlandtransfer und Transfer Impact Assessment (TIA): CH-Daten in US- und PRC-Cloud-LLMs

Art. 16/17 revDSG, EU-US-DPF mit CH-Anhang, EDÖB-TIA-Modul. Wann SCC reichen, wann BCR nötig sind und was bei OpenAI/Anthropic zu prüfen ist.

FINMA · COMPLIANCE

FINMA-Awareness: KI-Governance für Banken, Versicherer und Treuhänder mit Vermögensverwaltung

FINMA-Aufsichtsmitteilung 08/2024, Rundschreiben 2023/01 Operative Risiken. Wer ist beaufsichtigt, was die FINMA verlangt, was Best Practice für Nicht-Beaufsichtigte ist.

AUDIT-TRAIL · AI-KONZEPT

AI-Audit-Trail-Design: Was Sie loggen müssen, damit eine KI-Antwort revisionsfähig bleibt

Welche Felder müssen pro LLM-Aufruf gespeichert werden, damit Sie nach Art. 957a OR und Berufsgeheimnis sauber sind – und mit welchen Tools.

DSGVO · COMPLIANCE

DSGVO und LLMs: Wann die EU-Datenschutz-Grundverordnung CH-Unternehmen direkt trifft

Die DSGVO trifft CH-Firmen nach Art. 3 Abs. 2 immer dann, wenn EU-Kunden im Spiel sind. LLM-Nutzung fasst praktisch alle Risikoartikel an.

DSFA · COMPLIANCE

DSFA für KI-Systeme: Datenschutz-Folgenabschätzung nach revDSG Art. 22 und DSGVO Art. 35

Die DSFA ist bei KI mit Profiling, Hochrisiko-Daten oder automatisierten Entscheidungen Pflicht. Methodik: CNIL-PIA + EDPB-Template + AI-Act-Overlay.

KI-HAFTUNG · COMPLIANCE

Wer haftet bei KI-Fehlern? CH-OR + EU-Produkthaftungsrichtlinie 2024/2853 nach AI-Liability-Direktive-Rückzug

CH-Haftung läuft über OR 41/55/97. EU-AI-Liability-Direktive zurückgezogen Feb 2025. PD 2024/2853 in Kraft 9.12.2024 – Software inkl. KI als Produkt erfasst.

EU AI ACT KMU · COMPLIANCE

EU AI Act für KMU: Fristenkalender und Pflichtcheck bis 2.8.2026

Stichtag Hochrisiko-Pflichten: 2. August 2026. Wie ein CH-KMU als Deployer den AIA-Fristenkalender konkret abarbeitet – Inventar, Klassifikation, Schulung.

revDSG · TREUHAND-COMPLIANCE

revDSG und KI im Treuhand-Büro: AVV, Datenkategorien, EDÖB-Position, GwG-Praxis

Welche AVV mit OpenAI/Anthropic/Mistral, welche Mandantendaten wohin, EDÖB-Position 2026 zu LLM, Routing nach Sensitivität. Keine Rechtsberatung.

ANONYMISIERUNG · AI-KONZEPT

Anonymisierung und Pseudonymisierung: Presidio, Privacera, K-Anonymität, Differential Privacy

Tools und Techniken im Mai 2026 für DSG-konforme PII-Entfernung vor LLM-Verarbeitung: Microsoft Presidio, Privacera, Anonymizer, K-Anonymität und Differential Privacy im Vergleich.

EDÖB · COMPLIANCE

EDÖB Meldepflicht und KI-Leitfäden: 72-Stunden-Pflicht nach DSG Art. 24 und aktuelle Empfehlungen 2024-2026

EDÖB-Meldepflicht 72h ab Kenntnisnahme (DSG Art. 24). KI-Stellungnahmen 2024-2026. Adressen, Formulare, Eskalations-Pfad für Schweizer Treuhand-, Anwalts- und KMU-Betriebe.

FINMA AM 08/2024 · COMPLIANCE

FINMA-Aufsichtsmitteilung 08/2024 zu KI: vier Säulen Governance, Verantwortlichkeit, Robustheit, Erklärbarkeit

Aufsichtsmitteilung 08/2024 vom 18.12.2024. Treuhand-Bezug: nur GwG-betreute Mandate. Klassische Buchhaltungs-Treuhänder sind nicht FINMA-direkt – aber Best-Practice empfohlen.

Recht & Compliance

Darf ich ChatGPT als Treuhänder nutzen? Datenschutz, DPA & Geschäftsversion (revDSG + ggf. StGB 321)

ChatGPT im Treuhandbüro: Wann revDSG (und ggf. Berufsgeheimnis StGB 321) die Nutzung erlauben - und warum nur Business/Enterprise mit DPA infrage kommt.

Recht & Compliance

EU AI Act für Schweizer KMU 2026: Pflichten, Risikoklassen, Roadmap-Checkliste

Wann die EU-KI-Verordnung 2024/1689 Schweizer Firmen erfasst, welche Risikoklassen gelten und welche Fristen 2026 anstehen.

Datenschutz & Datensouveränität

US Cloud Act vs. Schweizer Datenstandort: Warum CH/EU-Hosting für Mandantendaten zählt

Der US CLOUD Act erlaubt US-Behörden Zugriff auf Daten von US-Anbietern – auch in CH/EU-Rechenzentren. Was das für Mandantendaten und den Datenstandort bedeutet.

Recht & Compliance

KI-Einsatz in der Revision: Was geht, was die Unabhängigkeit & Prüfqualität verletzt

Wo KI in der eingeschränkten und ordentlichen Revision als Hilfsmittel zulässig ist – und wo Urteilsbildung und Verantwortung beim Revisor bleiben müssen.

Werkzeuge & Anbieter

170 Themen

Anbieter im Vergleich, neutral.

LITELLM · TECH

LiteLLM: ein Gateway für 100+ LLM-Anbieter mit einer einzigen API

LiteLLM ist ein Open-Source-Proxy, der OpenAI, Anthropic, Mistral, lokale Modelle und weitere Anbieter hinter einer OpenAI-kompatiblen API bündelt.

QDRANT · TECH

Qdrant: produktive Vektor-Datenbank für RAG und Semantische Suche

Qdrant ist eine Open-Source-Vektor-Datenbank in Rust. CPU-only, filter-fähig, mit Payload-Indexes und stabilen Kennzahlen unter Mandanten-Last.

N8N · TECH

n8n: Workflow-Automation mit 600+ Integrationen, self-hosted unter EU-Recht

n8n ist eine fair-code-lizenzierte Workflow-Plattform mit 600+ Konnektoren, AI-Nodes und voller Self-Hosting-Option auf Docker.

OLLAMA · TECH

Ollama: lokale LLMs auf eigener Hardware – wo es funktioniert und wo nicht

Ollama ist ein lokaler Runtime für Open-Source-LLMs. Stark für Privacy-Demos und CPU-Klassifikation, langsam für 70B-Modelle ohne GPU.

HETZNER · TECH

Hetzner als EU-Hosting für CH-Treuhand und KMU: Rechenzentren, Verträge, Kosten

Hetzner Online betreibt Rechenzentren in Falkenstein und Helsinki mit ISO-27001, AVV-Vertrag und Preisen ab EUR 4/Monat für Cloud bis EUR 39/Monat für Dedicated.

DOCKER · TECH-STACK

Docker-Orchestrierung für KMU: docker-compose ohne Kubernetes-Overkill

Docker + docker-compose reicht für Single-Host-Setups bis 50 Container. Digest-Pinning, Healthchecks, Restart-Policies, Resource-Limits, non-root.

NGINX · TECH-STACK

Nginx als Reverse-Proxy: SSL, Rate-Limits und Security-Header für Container-Apps

Nginx 1.28 bedient als Edge-Layer Docker-Backends. Certbot-SSL, gzip/brotli, limit_req-Zonen, Cloudflare-IP-Allowlist, HSTS/CSP, Websocket-Upgrade.

CLOUDFLARE · TECH-STACK

Cloudflare als DNS, Reverse-Proxy und WAF: SSL-Modi, Cache-Rules, Origin-Certificates

Cloudflare bedient DNS, WAF und DDoS-Schutz für 9+ Fairlane-Domains. Proxied-Modus, Full-Strict-SSL, kostenlose 15-Jahr-Origin-Cert, Cache Rules statt Page Rules.

GRAFANA · TECH-STACK

Grafana, Prometheus, Loki: Monitoring-Stack für Container-Apps und LLM-Workflows

Grafana 11 plus Prometheus 3 plus Loki 3 als selbst gehosteter Monitoring-Stack. Metriken via node-exporter und /metrics, Logs via Promtail, Alerts via Alertmanager an Telegram.

BREVO · TECH-STACK

Brevo SMTP: Transaktionale E-Mail aus EU-Hosting für KMU-Apps

Brevo (ex-Sendinblue) liefert SMTP-Relay smtp-relay.brevo.com:587 aus FR-Datacentern. DKIM/SPF/DMARC, revDSG-konform, Free 300 Mails/Tag, Paid ab EUR 19/Monat.

OPENAI · LLM-ANBIETER

OpenAI GPT-Modelle aus CH-Treuhand-Sicht: Residency, Pricing, Compliance

OpenAI ist das verbreitetste Modell-Ökosystem. Für CH-Treuhand entscheidend: Daten-Residency via Azure OpenAI und AVV-Posture klären, bevor Mandantendaten fliessen.

ANTHROPIC · LLM-ANBIETER

Anthropic Claude aus CH-Treuhand-Sicht: Residency, Pricing, Compliance

Anthropic Claude liefert lange Kontexte und vorsichtige Antworten. Für CH-Treuhand ist der Weg über AWS Bedrock Frankfurt der saubere Pfad.

MISTRAL · LLM-ANBIETER

Mistral AI aus CH-Treuhand-Sicht: EU-Residency, Pricing, Souveränität

Mistral ist das einzige Frontier-Lab mit EU-Sitz. Für CH-Treuhand der kürzeste Pfad zu DSGVO-konformem Modell-Zugang ohne US-CLOUD-Act-Restrisiko.

COHERE · LLM-ANBIETER

Cohere aus CH-Treuhand-Sicht: RAG-Spezialist mit BYOC-Option

Cohere ist kein Chatbot-Anbieter, sondern der RAG-Spezialist. Rerank 3 ist der Branchen-Standard, embed-multilingual-v3 stark für Deutsch.

GOOGLE GEMINI · LLM-ANBIETER

Google Gemini im Schweizer Einsatz: Vertex AI, Zurich-Region und Datenfluss

Gemini 2.5 Pro/Flash/Flash-Lite über Vertex AI in europe-west6 (Zurich) oder europe-west3 (Frankfurt). Was das für revDSG, Preis und Modellwahl heisst.

META LLAMA · LLM-ANBIETER

Meta Llama im Schweizer Einsatz: Open-Weight-Modell, Self-Host oder Provider

Llama 4 Scout/Maverick und Llama 3.3 70B als Open-Weight-Option. Lizenz, Hardware-Anforderungen, Preise bei Groq/Together/Fireworks und Self-Host-Realität.

DEEPSEEK · LLM-ANBIETER

DeepSeek im Schweizer Einsatz: PRC-Anbieter, Self-Host-Option und revDSG-Realität

DeepSeek V3.x und R1 sind extrem günstig und technisch stark – aber Datenfluss nach China. Für Mandantendaten über API nicht empfohlen. Self-Host via HF-Weights als Alternative.

SELF-HOSTED OLLAMA · LLM-ANBIETER

Self-Hosted Ollama als LLM-Anbieter: Wann ersetzt es OpenAI, Anthropic oder Gemini?

Eigenes Ollama auf Hetzner-GPU oder im Büro-Server: rechnet sich ab 2-5 Mio Tokens/Monat, ersetzt Cloud-LLMs für revDSG-sensible Workloads, hat klare Qualitäts-Limits.

VEKTOR-DB · AI-KONZEPT

Vektor-Datenbanken im Vergleich: Qdrant, Weaviate, Milvus, Pinecone, Chroma, pgvector

Sechs ernsthafte Optionen, drei Architektur-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.

ROUTING · AI-KONZEPT

Multi-LLM-Routing: Welches Modell wann, für wieviel

Routing-Regeln nach Sensitivität, Kosten, Latenz und Qualität. Fallback-Chain, semantisches Caching, Cost-Observability. Mai 2026 Pricing.

SELF-HOSTED VS. CLOUD · AI-KONZEPT

Self-Hosted vs. Cloud-LLM: Entscheidungs-Framework für KMU und Treuhand

Wann lohnt sich ein eigenes Sprachmodell auf eigener Hardware, wann ist die Cloud die richtige Wahl? Total Cost of Ownership, Latenz, Datenschutz.

VEKTOR-DATENBANKEN · VERGLEICH

Vektor-Datenbanken im Vergleich: 10 Optionen für RAG, Suche und Empfehlung

Qdrant, Weaviate, Milvus, Chroma, pgvector, Pinecone, Redis, Vespa, LanceDB und Elasticsearch im neutralen Vergleich, mit Hosting-, Lizenz- und EU-Aspekten.

LLM-GATEWAYS · VERGLEICH

LLM-Gateways im Vergleich: 10 Optionen für Routing, Audit und Kosten

LiteLLM, OpenRouter, Portkey, Kong, Cloudflare, Helicone, TrueFoundry, Martian, Bifrost und Apache APISIX im neutralen Vergleich.

WORKFLOW-AUTOMATION · VERGLEICH

Workflow-Automation im Vergleich: 10 Plattformen für KMU und Treuhand

n8n, Make, Zapier, Pipedream, Activepieces, Windmill, Temporal, Airflow, Node-RED und Huginn im neutralen Vergleich.

EMBEDDINGS · TOOL-VERGLEICH

Embedding-Modelle im Vergleich: BGE-M3, E5, OpenAI, Cohere, Voyage, Jina, Mistral, Nomic, mxbai, Gecko

Zehn ernsthafte Embedding-Modelle, vier Auswahl-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.

RERANKER · TOOL-VERGLEICH

Reranker im Vergleich: Cohere, BGE, Jina, Voyage, ColBERT, mxbai, Mistral, sentence-transformers, RankGPT, FlashRank

Zehn Reranker-Optionen, vier Auswahl-Achsen, +15-30% Recall für RAG-Pipelines. Stand Mai 2026.

LLM-PROVIDER · TOOL-VERGLEICH

LLM-Provider im Vergleich: OpenAI, Anthropic, Mistral, Google, Cohere, Meta, DeepSeek, xAI, AWS Bedrock, Azure

Zehn LLM-Provider im direkten Vergleich, sieben Auswahl-Achsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.

LOKALE LLM-RUNTIMES - VERGLEICH

Lokale LLM-Runtimes im Vergleich: Ollama, vLLM, llama.cpp, LM Studio, LocalAI, TGI, GPT4All, KoboldCpp, Jan, OpenLLM

Zehn ernsthafte Runtimes für lokal betriebene Sprachmodelle, von Hobby-Desktop bis Production-GPU-Serving. Entscheidungs-Matrix Mai 2026.

OPEN-WEIGHT-MODELLE - VERGLEICH

Open-Weight-Modelle im Vergleich: Llama 3.3/4, Mistral, DeepSeek, Qwen, Gemma, Phi-4, Command R, Falcon, GLM, Apertus

Elf Open-Weight-Modell-Familien plus das Schweizer Apertus, im Mai 2026 verfügbar. Lizenz, VRAM-Bedarf, Mehrsprachigkeit, Praxis-Empfehlung.

SOUVERÄNES HOSTING - VERGLEICH

Souveränes Hosting im Vergleich: Hetzner, Infomaniak, Exoscale, OVHcloud, Scaleway, Swisscom, Safe Swiss Cloud, netcup, Contabo, On-Prem

Zehn Hosting-Optionen für KI-Workloads in der Schweiz und EU. Datenresidenz, CLOUD Act, GPU-Verfügbarkeit, FINMA-Tauglichkeit. Stand Mai 2026.

GPU-CLOUD · TOOL-VERGLEICH

GPU-Cloud-Anbieter im Vergleich: RunPod, Vast.ai, Lambda, CoreWeave, Paperspace, Exoscale, Hetzner, Together, Replicate, Modal

Zehn ernsthafte Optionen für GPU-Stunden, von Auction-Marktplatz bis Enterprise-Premium. Stand Mai 2026 mit aktuellen Preisen pro H100, A100 und RTX 4090.

CONTAINER-DEPLOY · TOOL-VERGLEICH

Container-Deployment im Vergleich: Docker, Podman, Kubernetes, Swarm, Coolify, Dokku, CapRover, Nomad, Portainer, Railway/Render

Zehn Wege, Container auf einem Server zu betreiben – vom einzelnen Docker-Daemon bis Kubernetes-Cluster. Mit klaren KMU-Empfehlungen Mai 2026.

REVERSE-PROXY · TOOL-VERGLEICH

Reverse-Proxy im Vergleich: nginx, Caddy, Traefik, HAProxy, Apache, Envoy, nginx Proxy Manager, Cloudflare Tunnel

Acht ernsthafte Reverse-Proxy-Optionen im direkten Vergleich. Mit klarer Empfehlung pro Anwendungsfall, Stand Mai 2026.

MONITORING / TOOL-VERGLEICH

Monitoring & Observability im Vergleich: Grafana, Loki, Uptime Kuma, Netdata, Zabbix, Datadog, Sentry, ELK, VictoriaMetrics, SigNoz

Zehn ernsthafte Werkzeuge für Metriken, Logs, Traces und Error-Tracking. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro KMU-Szenario. Stand Mai 2026.

LLM-OBSERVABILITY / TOOL-VERGLEICH

LLM-Observability im Vergleich: Langfuse, Helicone, LangSmith, Phoenix, Lunary, Portkey, OpenLLMetry, Traceloop, HoneyHive, W&B Weave

Zehn spezialisierte Werkzeuge für Tracing, Cost-Tracking, Prompt-Versionierung und Eval von LLM-Pipelines. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro Szenario. Stand Mai 2026.

DNS / CDN / WAF / TOOL-VERGLEICH

DNS, CDN und WAF im Vergleich: Cloudflare, Bunny.net, Fastly, AWS CloudFront, Akamai, Gcore, Infomaniak, DNSimple

Acht ernsthafte Anbieter für DNS, CDN und Web Application Firewall. Sieben Entscheidungsachsen, eine konkrete Empfehlung pro Anwendungsfall. Stand Mai 2026.

SMTP-VERGLEICH · TOOL-VERGLEICH

Transaktions-Mail-Dienste im Vergleich: Brevo, Postmark, Mailgun, SES, SendGrid, Resend, Mailjet, Infomaniak, SMTP2GO

Neun ernsthafte Optionen für Versand-APIs. Preise, Zustellraten und Datenresidenz für CH-KMU und Treuhand-Büro. Stand Mai 2026.

DB-VERGLEICH · TOOL-VERGLEICH

Datenbanken im Vergleich: PostgreSQL, MySQL/MariaDB, SQLite, MongoDB, Redis, ClickHouse, CockroachDB, SurrealDB, DuckDB, Supabase

Zehn ernsthafte Datenbanken für KMU-Setups. Relational vs. NoSQL vs. Columnar, Self-Host vs. Cloud, mit klaren Empfehlungen je Anwendungsfall. Stand Mai 2026.

SECURITY-VERGLEICH · TOOL-VERGLEICH

Security-Hardening-Tools im Vergleich: CrowdSec, Fail2ban, Wazuh, UFW, Vault, Authentik, WireGuard, Lynis, rkhunter, ClamAV

Zehn Open-Source-Tools für Server-Hardening, Intrusion-Detection, SSO und Secrets-Mgmt im CH-KMU. Klare Empfehlungen je Schutzschicht. Stand Mai 2026.

GIT & CI/CD · TOOL-VERGLEICH

Git-Hosting und CI/CD im Vergleich: Gitea, GitLab, Forgejo, GitHub, Drone, Woodpecker, Jenkins, Act, ArgoCD

Neun ernsthafte Werkzeuge für Code-Hosting, Pipelines und GitOps. Self-host vs Cloud, Lernkurve, KMU-Tauglichkeit. Stand Mai 2026.

BOT & VOICE · TOOL-VERGLEICH

Bausteine für Chat- und Voice-Bots im Vergleich: Whisper, Deepgram, ElevenLabs, Piper, Twilio, Vapi, Retell, WhatsApp, Rasa, Botpress

Zehn Bausteine für Sprach- und Chat-Bots. STT, TTS, Telefonie, Voice-AI-Plattformen und Chatbot-Frameworks im direkten Vergleich. Stand Mai 2026.

RAG-FRAMEWORKS · TOOL-VERGLEICH

RAG-Frameworks im Vergleich: LangChain, LlamaIndex, Haystack, DSPy, Semantic Kernel, txtai, RAGFlow, Verba, Flowise, Langflow

Zehn ernsthafte Frameworks für RAG-Pipelines. Code-first, visuelle Builder und akademische Ansätze im direkten Vergleich. Stand Mai 2026.

N8N · MAKE · ZAPIER · DUELL

n8n vs Make vs Zapier – was passt für Schweizer KMU?

Drei Workflow-Automatisierungs-Plattformen im Direktvergleich: Self-Hosting, Preis pro 1000 Runs, EU-Datenresidenz, AI-Nodes. Entscheidungshilfe für Treuhand, Anwalt und KMU.

OPENAI · ANTHROPIC · MISTRAL · DUELL

OpenAI vs Anthropic vs Mistral – welcher LLM-Provider 2026?

Drei LLM-Anbieter im direkten Vergleich: GPT-Modelle (4o, 4.1, o-Reihe), das aktuelle Claude-Modell, Mistral Large 2/Small 3.1. Preise, EU-Region, DACH-Sprache, Lock-in. Entscheidungshilfe Mai 2026.

QDRANT · WEAVIATE · PGVECTOR · DUELL

Qdrant vs Weaviate vs pgvector – welche Vektor-DB für KMU-RAG?

Drei Vektor-Datenbanken im Direktvergleich: Self-Host-Aufwand, Skalierungs-Limit, Postgres-Integration, EU-Hosting. Entscheidungshilfe für RAG-Pipelines in CH-KMU.

LITELLM · OPENROUTER · PORTKEY · DUELL

LiteLLM vs OpenRouter vs Portkey – welcher LLM-Gateway?

Drei LLM-Gateways im Direktvergleich: Self-Host vs Cloud, Anzahl Provider, Compliance-Routing, EU-Hosting. Entscheidungshilfe für Multi-LLM-Setups in CH-KMU.

HETZNER · INFOMANIAK · EXOSCALE · DUELL

Hetzner vs Infomaniak vs Exoscale – wo hostet ein CH-Treuhand seine KI?

Drei Hoster im Direktvergleich: CH-Datenresidenz, Preis pro Monat, GPU-Verfügbarkeit, Compliance-Profil. Entscheidungshilfe für KI-Workloads in Schweizer KMU.

OLLAMA vs vLLM vs LLAMA.CPP - DUELL

Ollama vs vLLM vs llama.cpp - welcher lokale LLM-Server?

Drei Open-Source-Runtimes für lokale Sprachmodelle. Ollama für Einstieg, vLLM für Production-Throughput, llama.cpp als portable Basis - Entscheidungs-Matrix Mai 2026.

LANGCHAIN vs LLAMAINDEX vs HAYSTACK - DUELL

LangChain vs LlamaIndex vs Haystack - welcher RAG-Stack 2026?

Drei OSS-Frameworks für Retrieval-Augmented Generation. LangChain breit aber unruhig, LlamaIndex sauber für RAG, Haystack Enterprise-tauglich - Entscheidung Mai 2026.

LANGFUSE vs HELICONE vs LANGSMITH - DUELL

Langfuse vs Helicone vs LangSmith - welches LLM-Tracing-Tool?

Drei LLM-Observability-Plattformen. Langfuse als EU-OSS-Standard, Helicone als 5-Minuten-Proxy, LangSmith für LangChain-Stacks - Entscheidung Mai 2026.

RUNPOD vs VAST.AI vs HETZNER GPU - DUELL

RunPod vs Vast.ai vs Hetzner GPU - wo trainieren und inferieren 2026?

Drei GPU-Cloud-Modelle. RunPod als seriose On-Demand-Plattform, Vast.ai als Spot-Marktplatz, Hetzner als EU-Reserved-Hosting - Preis- und Profil-Vergleich Mai 2026.

CLOUDFLARE vs BUNNY.NET vs FASTLY - DUELL

Cloudflare vs Bunny.net vs Fastly - welche Edge-Plattform für KMU?

Drei CDN+DNS+WAF-Anbieter im Vergleich. Cloudflare mit Free-Tier und grösstem Netz, Bunny.net EU-zentriert und sehr günstig, Fastly Enterprise-only - Entscheidung Mai 2026.

JSON & STRUCTURED OUTPUT · AI-KONZEPT

Output-Formatierung und JSON-Modus: Function-Calling, Pydantic, Instructor, Outlines

Strukturierte LLM-Outputs erzwingen: JSON-Mode, Function-Calling, Pydantic-Parsing, Instructor-Lib, Outlines (lokal) und Constrained Decoding für GPT-4.1, das aktuelle Claude-Spitzenmodell, Mistral.

HYBRIDSUCHE · AI-KONZEPT

Hybridsuche: BM25 plus Vektor mit Reciprocal Rank Fusion in Elasticsearch, Qdrant, OpenSearch

Warum reine Vektorsuche im Treuhand-Kontext oft scheitert und wie BM25 plus Vektor mit RRF oder Weighted Sum Retrieval-Qualität messbar verbessert. Tools: Elasticsearch, Qdrant Hybrid, OpenSearch.

QUERY EXPANSION · AI-KONZEPT

Query Expansion und Rewriting: HyDE, Decomposition, Multi-Query, Step-Back-Prompting

Wie sich kurze Nutzer-Fragen so umformulieren lassen, dass RAG die richtigen Quellen findet: HyDE, Query Decomposition, Multi-Query, Step-Back-Prompting. Wann es hilft, wann nicht.

METADATEN · AI-KONZEPT

Metadaten und Filter in RAG: Pre-Filter vs Post-Filter, Qdrant Payload Index, pgvector WHERE

Wie strukturierte Metadaten Mandant, Datum, Vertraulichkeit, Sprache und Quelle pro Chunk filterbar machen: Pre- vs Post-Filter, Qdrant Payload Index, pgvector mit WHERE und time-aware Retrieval.

TREUHAND-SOFTWARE · COMPLIANCE

Schweizer Treuhand-Software-Landschaft: Marktanteile, API-Offenheit und KI-Reife (Stand Mai 2026)

Bexio, Abacus, Sage 50, KLARA, Run my Accounts, Topal, AbaWeb, Atlanto: wer dominiert in welchem KMU-Segment und welche Tools sind KI-anschlussfähig.

SWISS CLOUD · COMPLIANCE

Swiss Cloud souverän hosten: Infomaniak, Exoscale, Swisscom, Safe Swiss Cloud, Hostpoint, Cloudsigma im Vergleich

Sechs Schweizer Cloud-Anbieter Mai 2026 im Vergleich: Region, ISO 27001, FINMA-Tauglichkeit, GPU-Verfügbarkeit, Preis. Praxisleitfaden für souveränes Hosting in der Schweiz.

APERTUS · COMPLIANCE

Apertus: das offene Schweizer KI-Modell von ETH Zurich, EPFL und CSCS – Stand Mai 2026

Apertus 8B und 70B, Apache-2.0, von ETH/EPFL/CSCS. Release 2. September 2025, 15T Tokens, 1000+ Sprachen inkl. Schweizerdeutsch und Rätoromanisch. Stand Mai 2026: Praxiserfahrung und Apertus-2-Ausblick.

WEAVIATE · TECH

Weaviate: Open-Source-Vektor-Datenbank mit GraphQL und Multi-Modal-Modulen

Weaviate ist eine Apache-2.0-Vektor-DB in Go mit GraphQL- und REST-API. Mai 2026 v1.30+, EU-Region Frankfurt, native Hybrid-Suche, Multi-Modal-Module für Text und Bild.

MILVUS · TECH

Milvus: Cluster-Vektor-Datenbank für mehr als eine Milliarde Vektoren

Milvus ist eine Apache-2.0-Vektor-DB mit getrennter Compute- und Storage-Schicht. GPU-Acceleration, HNSW plus IVF plus DiskANN, für Volumen ab 100 Mio. Vektoren.

CHROMA · TECH

Chroma: einfachste Vektor-Datenbank für Prototypen und Notebooks

Chroma ist eine Apache-2.0-Vektor-DB mit DuckDB-Backend. Python-API-first, in zehn Minuten produktiv, gut für Prototypen bis 1 Mio. Vektoren. Nicht für Production-Scale.

PGVECTOR · TECH

pgvector: Vektor-Suche im bestehenden PostgreSQL mit HNSW und IVFFlat

pgvector ist die PostgreSQL-Extension für Vektor-Suche. Mai 2026 v0.8+ mit HNSW, IVFFlat und Binary-Quantization. ACID, Joins, eine Datenbank für alles.

PINECONE · TECH

Pinecone: managed Cloud-Vektor-DB ohne Self-Hosting

Pinecone ist eine proprietäre Vektor-DB nur in der Cloud. EU-Region eu-west-1 verfügbar, Serverless seit 2024, Zero-Ops. Vendor-Lock-in und USD-Preisrisiko.

REDIS REDISEARCH · TECH

Redis mit RediSearch: Vektor-Index im KV-Store für niedrige Latenz

Redis mit RediSearch-Modul liefert HNSW-Vektor-Index seit Version 2.4. Sinnvoll, wenn Redis schon im Stack ist; weniger Vektor-Features als spezialisierte DBs.

VESPA · TECH

Vespa: Suchmaschine mit Tensor-Ranking für komplexe Hybrid-Pipelines

Vespa ist eine Apache-2.0-Suchmaschine in Java aus dem Yahoo-Ecosystem. Tensor-Ranking, structured plus Vektor plus Volltext in einer Anfrage. Steile Lernkurve.

LANCEDB · TECH

LanceDB: embedded Vektor-DB im columnar Lance-Format für lokale Apps

LanceDB ist eine Apache-2.0-Vektor-DB in Rust mit columnar Lance-Format. Embedded in Python/JS, kein Server nötig, sehr schnell. Gut für Desktop und kleine on-prem.

ELASTICSEARCH KNN · TECH

Elasticsearch mit kNN: Hybrid Keyword und Vektor-Suche in einer Anfrage

Elasticsearch ab Version 8 bietet native kNN-Vektor-Suche. Mai 2026 v9 mit verbesserter Quantisierung. Stark für Hybrid-Suche, Elastic License v2 / SSPL.

MEILISEARCH · TECH

Meilisearch: schnelle Such-Engine mit AI-Search-Mode für Hybrid-Suche

Meilisearch ist eine MIT-Such-Engine in Rust. Mai 2026 v1.10+ mit AI-Search-Mode (BM25+Embedding), Developer-friendly, gut für Search-Bars mit AI-Snippets.

OPENROUTER · TECH

OpenRouter: Multi-Modell-Marktplatz für schnellen LLM-Vergleich

OpenRouter ist ein US-Cloud-Gateway mit 200+ LLM-Modellen hinter einer OpenAI-kompatiblen API, Auto-Fallback und 5% Markup auf Token-Preise.

PORTKEY · TECH

Portkey: Enterprise-LLM-Gateway mit EU-Hosting und Self-Host-Tier

Portkey ist ein Cloud-Gateway mit Self-Host-Tier, EU-Region Frankfurt, 1.600+ LLMs, Observability, Caching und Guardrails für Enterprise-Compliance.

KONG AI GATEWAY · TECH

Kong AI Gateway: Kubernetes-natives API-Gateway mit LLM-Plugins

Kong v3.8 erweitert das Open-Source-API-Gateway um AI-Proxy, AI-Prompt-Guard und semantisches Caching – Self-Host auf Kubernetes oder Bare-Metal.

CLOUDFLARE AI GATEWAY · TECH

Cloudflare AI Gateway: Edge-Proxy für OpenAI, Anthropic, Workers AI

Cloudflare AI Gateway läuft auf Cloudflare-Edge, ist im Workers-Plan kostenlos und bündelt OpenAI, Anthropic, Mistral, Replicate und Workers AI hinter einer API.

HELICONE · TECH

Helicone: OSS-Observability für LLM-Calls mit EU-Hosting

Helicone ist ein Apache-2.0-Proxy plus Cloud (EU-Region Frankfurt) für LLM-Cost-Tracking, Caching und Tracing. Setup in unter zehn Minuten.

TRUEFOUNDRY · TECH

TrueFoundry: ML-Plattform mit eingebautem LLM-Gateway

TrueFoundry kombiniert Model-Serving, Inference und LLM-Gateway in einer Plattform. Self-Host (Kubernetes) oder Cloud, primär für ML-Teams mit Pipelines.

MARTIAN · TECH

Martian: Modell-Router mit Embeddings-Klassifikator pro Anfrage

Martian (withmartian.com) ist ein US-Cloud-Router, der pro Anfrage das beste LLM via Embeddings-Vergleich wählt. Experimentell, USD 0.50-2 pro 1M Tokens Aufschlag.

BIFROST · TECH

Bifrost: Go-basiertes Self-Host-LLM-Gateway unter 5 ms Overhead

Bifrost (github.com/maximhq/bifrost) ist ein OSS-LLM-Gateway in Go, Self-Host, Mai 2026 v0.5+, ultra-niedrige Latenz für Streaming und Voice-Bots.

APISIX AI · TECH

Apache APISIX AI: OSS-API-Gateway mit LLM-Plugins (ai-proxy, decorator, rate-limiting)

Apache APISIX v3 ist ein Apache-2.0-API-Gateway mit ai-proxy-, ai-prompt-decorator- und ai-rate-limiting-Plugins. Self-Host, Kubernetes oder Bare-Metal.

LANGFUSE · TECH

Langfuse: OSS-Marktführer für LLM-Tracing, Prompt-Mgmt und Eval

Langfuse (MIT, v3+) ist das OSS-Standardwerkzeug für LLM-Tracing, Cost-Tracking, Prompt-Versionierung und Eval. Self-Host oder EU-Cloud Frankfurt.

MAKE · TECH

Make (früher Integromat): visuelle Szenarien mit 1.500+ Apps und EU-Hosting-Region

Make ist eine US/EU-Cloud-Plattform für visuelle Automatisierungs-Szenarien, 1.500+ Apps und Operations-basiertes Pricing ab USD 10.59/10k Ops.

ZAPIER · TECH

Zapier: Industrie-Default mit 7.000+ Apps, US-Cloud und Task-basiertem Pricing

Zapier ist der bekannteste No-Code-Workflow-Anbieter mit 7.000+ App-Integrationen, US-Cloud-only und Starter-Tarif ab USD 19.99/Monat für 750 Tasks.

PIPEDREAM · TECH

Pipedream: Code-first Workflows mit Python+JS, OSS-Core und Cloud-Sourcing

Pipedream verbindet Cloud-Komfort mit Code-First-Workflows in Python und JavaScript; Free-Tier 100k Credits, Basic ab USD 19/Monat, Core auf GitHub.

ACTIVEPIECES · TECH

Activepieces: MIT-lizenzierte Open-Source-Alternative zu Zapier, self-hostbar für KMU

Activepieces ist eine MIT-lizenzierte Workflow-Plattform mit 250+ Pieces, voller Self-Host-Option und Cloud-Tier ab USD 8/Monat.

WINDMILL · TECH

Windmill: Script-first Workflows mit TypeScript, Python, Go und Bash unter AGPLv3

Windmill ist eine AGPLv3-Plattform für Code-first-Workflows in TypeScript, Python, Go und Bash mit Approval-Flows, Scheduling und Cloud/Self-Host.

TEMPORAL · TECH

Temporal: Durable Execution für mission-critical Workflows in Java, Go, TS, Python

Temporal ist eine MIT-lizenzierte Workflow-as-Code-Plattform mit garantiertem Retry, State und Versioning – für Bestellabwicklung, Payment-Reconciliation und mehr.

APACHE AIRFLOW · TECH

Apache Airflow: Python-DAGs als Data-Engineering-Default seit 2014, Mai 2026 v3.x

Apache Airflow ist die Standard-Plattform für Daten-Pipelines mit Python-DAGs, Apache 2.0, self-hostbar oder über Astronomer/MWAA als Managed-Service.

NODE-RED · TECH

Node-RED: visueller Flow-Editor für IoT, IIoT und Industrie 4.0 mit MQTT-Native-Support

Node-RED ist eine Apache-2.0-Plattform für Flow-basierte Programmierung, ursprünglich von IBM 2013, IoT-/IIoT-Default mit MQTT, Modbus, OPC-UA.

HUGINN · TECH

Huginn: älteres Ruby-on-Rails-Tool für Personal-Automation, RSS, Scraping, Notifications

Huginn ist eine MIT-lizenzierte Ruby-on-Rails-Plattform für Personal-Automation, IFTTT-Alternative seit 2013, niche aber stabil.

INNGEST · TECH

Inngest: Event-driven Workflows für TypeScript und Python mit Durable Execution

Inngest ist eine Apache-2.0-SDK plus Cloud-Plattform für Event-driven Workflows mit Step-Funktionen, Retry, Sleep und Wait-for-Event in TypeScript/Python.

INFOMANIAK · TECH

Infomaniak: CH-Hosting in Genf, ISO 27001 + 14001, 100% Wasserkraft, CHF-Preise

Infomaniak betreibt eigene Rechenzentren in Genf, halt 100% CH-Hosting unter CH-Recht, ist ISO 27001 + ISO 14001 zertifiziert und rechnet in CHF.

EXOSCALE · TECH

Exoscale: CH-Cloud aus Zürich und Lausanne, ISO 27001, A100-GPU verfügbar, FINMA-tauglich

Exoscale betreibt Cloud-Regionen in Zürich, Lausanne, Wien, Frankfurt und Sofia. ISO 27001, AVV/DPA verfügbar, GPU-Workloads mit A100 in CH-Region.

OVHCLOUD · TECH

OVHcloud: französischer Hoster mit vier ISO-Zertifikaten, SecNumCloud, A100/H100-Optionen

OVHcloud betreibt Rechenzentren in Roubaix, Strassburg, Frankfurt und London. ISO 27001/27701/27017/27018, SecNumCloud-zertifiziert, GPU mit A100/H100.

SCALEWAY · TECH

Scaleway: französischer Hoster aus Paris, ISO 27001, gute API, NVIDIA H100 AI-Cluster

Scaleway betreibt Rechenzentren in Paris, Amsterdam und Warschau. ISO 27001, S3-kompatibles Object Storage, H100-Cluster für AI-Training mit transparenten Stundenpreisen.

SWISSCOM CLOUD · TECH

Swisscom Cloud: Schweizer Telco-Hoster, ISO 27001 + FINMA-zertifiziert, für Banken und Versicherer

Swisscom Cloud ist die Cloud-Sparte der Swisscom AG. Rechenzentren in Bern und Zürich, ISO 27001, FINMA-Outsourcing-Zertifizierung, mehrsprachiger Support.

SAFE SWISS CLOUD · TECH

Safe Swiss Cloud: spezialisierter CH-Hoster in Embrach, FINMA-tauglich, Treuhand-Fokus

Safe Swiss Cloud betreibt ein CH-Rechenzentrum in Embrach (ZH). ISO 27001, FINMA-konform, deutschsprachiger Kundenservice, Fokus auf Schweizer KMU und Treuhand.

RUNPOD · TECH

RunPod: GPU-Cloud mit EU-Sweden-Region, A100 ab USD 1.69/h, H100 ab USD 2.59/h

RunPod betreibt GPU-Cloud in Hong Kong, USA und EU-Sweden. A100-80GB ab USD 1.69/h, H100 ab USD 2.59/h. Secure Cloud und Community Cloud Tiers.

VAST.AI · TECH

Vast.ai: GPU-Auction-Marktplatz, RTX 4090 ab USD 0.31/h, A100 ab USD 0.40/h, weltweit verteilt

Vast.ai ist ein Auction-Marktplatz für GPU-Stunden, mit privaten und professionellen Anbietern weltweit. Billigste Spot-GPUs, ohne SLA und mit schwankender Verfügbarkeit.

LAMBDA LABS · TECH

Lambda Labs: dedizierte GPU-Cloud USA, A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h

Lambda Labs ist eine US-GPU-Cloud mit ML-Engineer-Fokus. A100-40GB ab USD 1.10/h, H100 ab USD 2.49/h, Reserved-Verträge mit 1-Year/3-Year-Rabatten.

COREWEAVE · TECH

CoreWeave: Enterprise-GPU-Cloud USA + UK + Spanien, H100 ab USD 4.25/h, NVIDIA-Premium-Partner

CoreWeave ist eine US-GPU-Cloud mit Enterprise-Schwerpunkt. Standorte in USA-East/West, UK und Spanien. H100 ab USD 4.25/h, H200 ab USD 4.50/h, grosse Cluster mit InfiniBand.

BGE-M3 · TECH

BGE-M3: Open-Source-Embeddings für mehrsprachige RAG-Systeme

BGE-M3 von BAAI ist Mai 2026 das stärkste frei verfügbare Embedding-Modell für Schweizer KMU. Apache 2.0, 1024-dim, über 100 Sprachen.

MULTILINGUAL-E5 · TECH

multilingual-e5: schnelles Open-Source-Embedding-Modell für CPU-Setups

Microsofts multilingual-e5 ist ein mDeBERTa-basiertes Embedding-Modell unter MIT-Lizenz, sehr schnell auf CPU und in vier Grössen verfügbar.

VOYAGE AI · TECH

Voyage AI: spezialisierte Embedding-API für RAG-Setups

Voyage AI ist ein 2024 von MongoDB übernommener Embedding-Provider. voyage-3 kostet USD 0.06 pro 1M Tokens und gehört Mai 2026 zu den stärksten RAG-Modellen.

JINA EMBEDDINGS · TECH

Jina Embeddings v3: Berliner Embeddings mit EU-Cloud und Self-Host

Jina Embeddings v3 ist ein mehrsprachiges Apache-2.0-Modell mit 8192 Token Kontext, betrieben aus Berlin und Frankfurt – EU-Datenschutz nativ.

MISTRAL EMBED · TECH

Mistral Embed: EU-natives Embedding-Modell aus Paris

Mistral Embed kommt aus Paris, kostet EUR 0.10 pro 1M Tokens und ist Mai 2026 das politisch sauberste API-Embedding für EU-AI-Act-strikte Mandate.

NOMIC EMBED · TECH

Nomic Embed: lokal lauffähiges Open-Source-Embedding-Modell

Nomic Embed v2 ist ein Apache-2.0-Modell mit 768 Dimensionen, transparenter Trainingsdaten-Dokumentation und exzellenter lokaler Performance auf Mac und Linux.

MXBAI-EMBED · TECH

mxbai-embed: kompaktes Apache-2.0-Embedding-Modell für Edge-Setups

mxbai-embed-large-v1 von Mixedbread AI ist ein 1024-dimensionales Open-Source-Embedding, ONNX-tauglich und auf Edge-Hardware schnell.

COHERE RERANK · TECH

Cohere Rerank: Industrie-Standard für RAG-Re-Ranking

Cohere rerank-multilingual-v3.0 ist Mai 2026 der etablierte API-Reranker für RAG-Pipelines. USD 2 pro 1k Queries, EU-Hosting via AWS Bedrock Frankfurt.

BGE-RERANKER · TECH

BGE-Reranker-v2-m3: Open-Source-Reranker für mehrsprachige RAG-Setups

BGE-Reranker-v2-m3 von BAAI ist Mai 2026 der stärkste frei verfügbare Cross-Encoder-Reranker – Apache 2.0, mehrsprachig, sehr nahe an Cohere-Qualität.

FLASHRANK · TECH

FlashRank: ultraschneller Reranker auf CPU via ONNX-Runtime

FlashRank ist eine MIT-lizenzierte Python-Library mit kleinen Cross-Encoder-Modellen, ONNX-optimiert, unter 100 ms auf CPU.

VLLM · TECH

vLLM: Production-Serving für Open-Weight-LLMs mit hoher Throughput und PagedAttention

vLLM ist ein Apache-2.0 Inference-Server für Linux mit GPU. PagedAttention und Continuous Batching liefern bis zu 20x mehr Durchsatz als Hobby-Runtimes.

LLAMA.CPP · TECH

llama.cpp: die portable C/C++-Inferenz-Bibliothek unter Ollama, LM Studio und KoboldCpp

llama.cpp ist die MIT-lizenzierte Basis-Bibliothek für lokale Sprachmodelle. Läuft auf jeder Plattform – CPU, CUDA, Metal, ROCm, Vulkan. GGUF-Format-Standard.

LM STUDIO · TECH

LM Studio: Desktop-App für lokale LLMs auf Mac, Windows und Linux

LM Studio ist eine grafische Desktop-Anwendung zur Erkundung lokaler Open-Weight-Modelle. Hobby-grade, gut für Demo und Pilotphase, nicht für Multi-User-Production.

LOCALAI · TECH

LocalAI: OpenAI-API-kompatibler Allrounder für LLM, TTS, STT und Vision in einer Box

LocalAI ist ein MIT-lizenzierter Self-Hosting-Server, der LLM, Bild, Audio und Embeddings unter einer OpenAI-API bündelt. Bare-Metal oder Docker.

TGI · TECH

Text Generation Inference (TGI): Production-Serving aus dem Hugging-Face-Universum

TGI ist Hugging Faces Apache-2.0-Inference-Server für Production-Workloads mit Continuous Batching, Flash-Attention und direkter Anbindung an den Hugging-Face-Hub.

LLAMA 4 · TECH

Llama 4 Scout und Maverick: Metas MoE-Familie mit 10M-Context und 400B-Total-Parametern

Llama 4 Scout (17B aktiv, 10M Context) und Maverick (17B aktiv, 128 Experten, 400B total) – released 5. April 2026 unter Llama Community License.

MISTRAL LARGE · TECH

Mistral Large 2 und Mistral Small 3.1: das EU-Modell-Paar mit FR/DE/IT-Stärke

Mistral Large 2 (123B) und Mistral Small 3.1 von der französischen Mistral AI. La Plateforme, Azure-EU, AWS Bedrock. Research- oder kommerzielle Lizenz.

QWEN 3 · TECH

Qwen 2.5 und Qwen 3: Alibabas Open-Weight-Familie mit Mathe- und Code-Stärke

Qwen 2.5 und Qwen 3 von Alibaba Cloud. Apache-2.0 für kleinere Modelle. Stark multilingual, führend in Mathe und Code. Self-Host löst die PRC-Frage.

DEEPSEEK · TECH

DeepSeek (V- und R-Linie): das chinesische MoE-Reasoning-Modell mit Self-Host-Option

Die DeepSeek-V- und R-Modelle unter DeepSeek License. Self-Host via Hugging Face. Sehr starkes Reasoning, sehr günstig zu betreiben. API-Nutzung Warnung bei Mandantendaten. Modell-Versionen ändern sich laufend – aktuelle Bezeichnungen vor Einsatz prüfen.

APERTUS · TECH

Apertus als Tool: das Schweizer LLM von ETH, EPFL und CSCS in der Praxis betreiben

Apertus 8B und 70B unter Apache 2.0. Self-Host, Swisscom-API oder HuggingFace. 15T Tokens, 1000+ Sprachen inkl. Schweizerdeutsch und Rätoromanisch.

PROMETHEUS · TECH

Prometheus: CNCF-Time-Series-DB für Metriken, Pull-Modell und PromQL

Prometheus 3.x als CNCF-graduierter Industrie-Standard für Metrik-Sammlung. Pull-Modell, PromQL, Service-Discovery. Self-host, Apache 2.0, KMU-tauglich.

LOKI · TECH

Loki: Log-Aggregation als KMU-freundliche Elasticsearch-Alternative

Loki 3.x von Grafana Labs als Companion-Logsystem. Indexiert nur Labels, nicht Volltext. AGPL-3, Self-host oder Grafana Cloud. Mai 2026 mit Bloom-Filtern.

UPTIME KUMA · TECH

Uptime Kuma: KMU-Uptime-Page mit HTTP-, TCP-, Ping- und Docker-Checks

Uptime Kuma als selbst gehostete Uptime-Page. MIT-Lizenz, Setup in 5 Minuten, 13+ Monitor-Typen, öffentliche Status-Page, KMU-Liebling Mai 2026.

NETDATA · TECH

Netdata: leichter Per-Host-Agent mit polierten Default-Dashboards

Netdata als Per-Host-Agent mit Hybrid-Cloud-Aggregation. GPL-3 plus Cloud-Tier, Footprint unter 100 MB, sehr schöne Out-of-the-Box-Dashboards. KMU-Liebling.

SIGNOZ · TECH

SigNoz: OpenTelemetry-natives APM mit Metriken, Logs und Traces in einem

SigNoz als reife Open-Source-Alternative zu Datadog. MIT-Lizenz, OpenTelemetry-First, ClickHouse-Backend, Self-host oder Cloud. Mai 2026 KMU-Wahl.

GITEA · TECH

Gitea: leichtgewichtiger Self-host-Git-Server mit Gitea Actions

Gitea 1.22 als KMU-Default für selbst gehostetes Git. MIT-Lizenz, Single-Binary, Gitea Actions integriert, Container-Registry, Mai 2026 reif und stabil.

GITLAB · TECH

GitLab: vollständige DevOps-Plattform mit CI/CD, Registry und Security

GitLab 17 als All-in-one-DevOps-Plattform. Community Edition MIT, Enterprise proprietär. Self-host oder Cloud. Sehr umfangreich, aber ressourcenhungrig.

DRONE CI · TECH

Drone CI: Container-natives CI-System mit reduzierter Community-Aktivität

Drone CI als Container-natives CI-System. Apache 2.0, Self-host. Mai 2026: stabilisiert, geringere Entwicklungsaktivität. Migrations-Pfad zu Woodpecker.

WOODPECKER CI · TECH

Woodpecker CI: aktiver Drone-Fork als KMU-Standard für Gitea und Forgejo

Woodpecker CI 3.x als sehr aktiver Drone-Fork. Apache 2.0, Container-native YAML-Pipelines, Mai 2026 KMU-Default-CI für Self-host neben Gitea/Forgejo.

JENKINS · TECH

Jenkins: der CI-Veteran mit 2000+ Plugins, hoher Lernkurve, geringer Modernität

Jenkins als aeltester CI-Server (seit 2011). MIT-Lizenz, Java-basiert, 2000+ Plugins. Sehr mächtig, aber schwer zu warten. Mai 2026 nicht für Neuanlagen empfohlen.

WHISPER · TECH

Whisper: das Open-Source-STT-Modell von OpenAI für mehrsprachige Transkription

Whisper ist OpenAIs MIT-lizenziertes Spracherkennungs-Modell. Lokal lauffähig via whisper.cpp, faster-whisper oder WhisperX, oder über die API zu USD 0.006/min. Stand Mai 2026 mit large-v3 und turbo-v3.

DEEPGRAM · TECH

Deepgram: proprietäre STT-API mit der niedrigsten Latenz im Markt

Deepgram bietet Speech-to-Text als US-Cloud-API zu USD 0.0043/min Nova-2 mit Sub-300-ms-Latenz. Englisch-stark, Schweizerdeutsch schwach, kein EU-Tier Mai 2026.

ELEVENLABS · TECH

ElevenLabs: die Branchen-Referenz für natürliche TTS-Stimmen und Voice-Cloning

ElevenLabs liefert proprietäre TTS-Cloud-API mit den natürlichsten Stimmen Mai 2026. Starter USD 5/Mo, Creator USD 99/Mo. turbo-v2.5 für Sub-400-ms-Telefonie-Latenz, 30+ Sprachen, Voice-Cloning verfügbar.

PIPER TTS · TECH

Piper: das open-source lokale TTS-System für Datenschutz-sensible Anwendungen

Piper ist ein MIT-lizenziertes lokales Text-zu-Sprache-System auf ONNX-Basis. Kostenlos, voll lokal, sehr schnell auf CPU. Mai 2026 mit guten DE-Stimmen, Hobby-Qualität, gut für interne Tools.

TWILIO · TECH

Twilio: der globale Telefonie-Standard für programmierbare Voice- und SMS-Anwendungen

Twilio bietet programmierbare Telefonie und SMS als API. USA-Hauptsitz mit EU-Region (Ireland, Frankfurt) für Datenresidenz. CH-Festnetz-Minute USD 0.0085. Standard für Voice-Agenten.

LANGCHAIN · TECH

LangChain: das Industrie-Default-Framework für LLM-Anwendungen, mit allen Stärken und Schwächen

LangChain ist Mai 2026 in v0.4+ das meistgenutzte LLM-Framework. MIT-Lizenz, Python und JavaScript, hunderte Integrationen. Stark beim Prototyping, kritisiert für Code-Qualität und Stabilität.

LLAMAINDEX · TECH

LlamaIndex: das saubere RAG-Framework für Code-first-Teams

LlamaIndex ist Mai 2026 in v0.10+ das sauberste RAG-Framework. MIT-Lizenz, Python und TypeScript, klarere API als LangChain. Mit LlamaCloud Mai 2026 auch als Managed-Tier verfügbar.

HAYSTACK · TECH

Haystack: das Enterprise-RAG-Framework von deepset aus Berlin

Haystack ist Mai 2026 in v2.x das Enterprise-fokussierte RAG-Framework. Apache 2.0, Python, deepset AG (DE-Origin). Saubere Pipeline-Abstraktion, kommerzieller Support, Banken-tauglich.

DSPY · TECH

DSPy: Programmieren statt Prompten – der Stanford-Ansatz für LLM-Pipelines

DSPy ist Mai 2026 in v2.5+ ein MIT-Framework aus Stanford. Statt Prompts zu schreiben, definieren Sie Aufgaben – das System optimiert die Prompts automatisch. Production-fähig für komplexe Multi-Step-Pipelines.

RAGFLOW · TECH

RAGFlow: das self-hostbare RAG-Komplettsystem mit Web-UI

RAGFlow ist Mai 2026 in v0.15+ ein Open-Source RAG-Komplettsystem von Infiniflow (Apache 2.0). Self-host, fertige Web-UI, Document-Parsing, Chunking, Vektor-DB, Chat. Chinesische Origin, voll selbsthostbar.

POSTMARK · TECH-STACK

Postmark: höchste Zustellrate für transaktionale E-Mails aus den USA

Postmark (ActiveCampaign/Wildbit) ist der Spezialist für reine Transaktions-Mails. EUR 15/Monat für 10.000 Mails, Zustellrate > 99 Prozent, Inbound-Routing inklusive. US-Hosting, TIA erforderlich.

MAILGUN · TECH-STACK

Mailgun: API-starker Versand mit EU-Region Frankfurt für Entwickler-Teams

Mailgun (Sinch) ist der Entwickler-Klassiker für Transaktions-Mail. EUR 35/Monat für 50.000 Mails, API-stark mit SDKs in 8 Sprachen, EU-Region Frankfurt für DSGVO-Setups, Webhook + Routing.

AMAZON SES · TECH-STACK

Amazon SES: USD 0,10 pro 1.000 Mails, EU-Regions inkl. Zürich

AWS Simple Email Service ist der Preis-Sieger bei Versand-APIs. USD 0,10 pro 1.000 Mails, EU-Regions Frankfurt/Irland/Zürich, kein Dashboard out-of-the-box, integriert mit AWS-Stack.

SENDGRID · TECH-STACK

SendGrid (Twilio): klassischer Marktführer für Transaktions- und Marketing-Mail

SendGrid ist seit 2009 der US-Marktführer. USD 19,95/Monat für 50.000 Mails, EU-Region verfügbar, breite Twilio/Salesforce/HubSpot-Integration, Marketing- plus Transactional-Streams.

RESEND · TECH-STACK

Resend: developer-first Mail-API mit React-Email-Templates

Resend ist die neue developer-first Mail-API von den React-Email-Machern. Free 3.000 Mails/Monat, Pro USD 20 für 50.000 Mails, US-Hosting mit EU-Region in Beta seit Mai 2026.

MAILJET · TECH-STACK

Mailjet (Pathwire/Sinch): EU-First-Versand aus Paris für DSGVO-Setups

Mailjet ist der EU-First-Pendant zu Mailgun. Hosting in Paris, EUR 15/Monat für 15.000 Mails, DSGVO + AVV im Vertrag, gleicher Sinch-Konzern wie Mailgun. Ideal für CH-KMU ohne TIA.

INFOMANIAK · TECH-STACK

Infomaniak Mail-Sender: reines CH-Hosting für Treuhand-Berufsgeheimnis

Infomaniak ist der einzige Anbieter mit reinem CH-Hosting in Genf und Sion. CH-DSG- und revDSG-konform, kombiniert mit Hosting und DNS, perfekt für CH-Treuhand und Anwalt-Kanzleien.

SMTP2GO · TECH-STACK

SMTP2GO: Multi-Region-Versand aus Neuseeland, EU und USA

SMTP2GO ist eine pragmatische Mail-Versand-Plattform mit Multi-Region-Routing. USD 15/Monat für 10.000 Mails, klare Dashboards, einfaches Setup, EU-Region wählbar für DSGVO-Setups.

MAILERSEND · TECH-STACK

MailerSend: Template-Editor und gute API mit EU-Region

MailerSend (litauischer MailerLite-Spin-off) ist eine moderne Mail-Versand-Plattform mit Drag-and-Drop-Template-Editor. USD 30/Monat für 50.000 Mails, EU-Region Frankfurt, klare API, gute DX.

POSTGRESQL · TECH

PostgreSQL: relationale Standard-Datenbank für CH-KMU und KI-Stacks

PostgreSQL 17 ist im Mai 2026 die Industrie-Default-Datenbank: JSON, Full-Text-Search, pgvector und PostGIS in einem System. MIT-ähnliche Lizenz, self-host-fähig.

MYSQL & MARIADB · TECH

MySQL und MariaDB: der klassische LAMP-Stack 2026 ehrlich bewertet

MySQL (GPL-2, Oracle) und MariaDB (BSL/GPL-2, MariaDB Foundation) sind die LAMP-Klassiker. Im Mai 2026 ist MariaDB 11 stabil, eine ernsthafte OSS-Alternative zu MySQL 8.4.

SQLITE · TECH

SQLite: die Einzeldatei-Datenbank für Single-Tenant, Mobile und Edge

SQLite ist eine Public-Domain-Embedded-DB als Einzeldatei. Im Mai 2026 produktiv im Einsatz bei Fairlane und Realty51, mit Litestream-Replikation in S3. Sehr schnell, sehr robust.

MONGODB · TECH

MongoDB: die Dokumenten-Datenbank zwischen SSPL, Atlas und Voyage-AI-Integration

MongoDB ist die bekannteste Dokumenten-DB. SSPL-Lizenz, Self-Host oder Atlas Cloud. Mai 2026 mit Voyage-AI-Integration für natives Embedding und Vector-Search.

REDIS · TECH

Redis als Cache-Layer: KV-Store, Sessions, Rate-Limits, Pub/Sub

Redis 8 ist im Mai 2026 der KV- und Cache-Standard. SSPL seit 2024 (alternativ Valkey unter BSD). Sehr schnell, Mikrosekunden-Latenz, niemals als Haupt-DB.

CLICKHOUSE · TECH

ClickHouse: columnar-Analytics-Datenbank für Aggregate über Milliarden Zeilen

ClickHouse 25 ist im Mai 2026 die schnellste OSS-Columnar-DB für OLAP-Workloads. Apache 2.0, Self-Host oder Cloud. 100x schneller als Postgres bei Aggregaten.

COCKROACHDB · TECH

CockroachDB: verteiltes Postgres-kompatibles SQL für Multi-Region-Setups

CockroachDB ist verteilte ACID-DB mit Postgres-Wire-Protokoll. BSL mit Apache-2.0-Konversion nach 3 Jahren. Self-Host oder Cloud, Multi-Region-tauglich.

SURREALDB · TECH

SurrealDB: Multi-Modell-Datenbank in Rust mit Document, Graph und Time-Series

SurrealDB 2.x ist im Mai 2026 stabil. BSL mit 4-Jahres-Apache-2.0-Konversion, Rust-basiert, Multi-Modell relational + Dokument + Graph + Zeit-Reihen.

DUCKDB · TECH

DuckDB: embedded columnar OLAP-Datenbank für lokale Datenanalyse

DuckDB 1.x ist im Mai 2026 stabil. MIT-Lizenz, embedded, columnar, perfekt für Datenanalyse lokal -- Pandas-Ersatz und Treuhand-Reporting-Tool.

SUPABASE · TECH

Supabase: Postgres-basierter Backend-as-a-Service mit EU-Region Frankfurt

Supabase ist Apache-2.0-Open-Source-Postgres mit Auth, Storage, Realtime und Edge-Functions. EU-Cloud Frankfurt oder Self-Host. Schnelle Inbetriebnahme für MVPs.

CROWDSEC · TECH

CrowdSec: Open-Source-WAF mit kollaborativer Blocklist für KMU-Server

CrowdSec ist die MIT-lizensierte Intrusion-Detection mit Crowd-Sourced Threat-Intelligence aus 100k+ Servern. Mai 2026 KMU-Marktführer mit AI-Bouncer.

FAIL2BAN · TECH

Fail2ban: klassisches Log-basiertes IP-Banning für Linux-Server

Fail2ban ist der GPL-2-Klassiker für Intrusion-Detection seit 2004. Einfach, stabil, ohne Crowdsource-Layer. Mai 2026 v1.x stabil, Vorgänger von CrowdSec.

WAZUH · TECH

Wazuh: SIEM, EDR und Compliance-Plattform für regulierte Mittelstand

Wazuh ist die GPL-2-SIEM-Plattform mit File-Integrity, Vulnerability-Detection und PCI-DSS-/HIPAA-Reports. Mai 2026 die Wahl für 50+ Mitarbeitende-Kanzleien.

HASHICORP VAULT · TECH

HashiCorp Vault: Industrie-Standard für Secrets-Management seit 2015

Vault ist der Marktführer für Secrets-Mgmt. Seit 2023 unter BSL 1.1 (nicht mehr MPL-2). Self-host und Cloud. Sehr mächtig, Setup 5-15 Tage.

OPENBAO · TECH

OpenBao: Linux-Foundation-Fork von HashiCorp Vault unter MPL-2.0

OpenBao ist der MPL-2.0-Fork von Vault unter Linux-Foundation-Governance. Mai 2026 v2+ aktiv, direkter Ersatz für Vault-BSL-Migration.

AUTHELIA · TECH

Authelia: leichter SSO- und 2FA-Authorization-Proxy für nginx und Traefik

Authelia ist die Apache-2.0-Open-Source-Lösung für SSO+2FA+Authorization-Proxy. Go-basiert, unter 30 MB Footprint, sehr KMU-tauglich.

AUTHENTIK · TECH

Authentik: modernes Identity-Provider-System mit SAML, OIDC, LDAP und SCIM

Authentik ist das MIT-lizensierte IdP-System (plus Enterprise) für SAML/OIDC/LDAP/SCIM. Self-host und Cloud, Mai 2026 v2025+ aktiv.

WIREGUARD · TECH

WireGuard: modernes VPN im Linux-Kernel für Home-Office und Remote-Admin

WireGuard ist das GPL-2-VPN im Linux-Kernel. 4000 Zeilen Code, 3-10x schneller als OpenVPN. KMU-Default 2026 für Remote-Zugang.

CLAMAV · TECH

ClamAV: Open-Source-Antivirus für Mail-Server und Upload-Scanning

ClamAV ist der GPL-2-Antivirus-Klassiker für Mail-Server-Gateway und Datei-Upload-Scanning. Update-Hub mit ClamSubmit-Community.

BITWARDEN · TECH

Bitwarden: Password-Manager, Secrets-Manager und Passkey-Authentificator mit EU-Cloud

Bitwarden ist die GPL-3-OSS-Lösung für Passwörter und Secrets-Mgmt. Self-host und EU-Cloud Frankfurt. Plus Passkey-Native-Auth.

Werkzeuge · Microsoft 365 Copilot

Microsoft 365 Copilot für Schweizer Treuhänder: Datenresidenz, Flex Routing & revDSG-Checkliste

Datenresidenz, EU Data Boundary, Flex Routing, kein Training auf Tenant-Daten und revDSG-Auftragsbearbeitung – was beim Copilot-Einsatz mit Mandantendaten wirklich gilt.

Werkzeuge · KI-Buchhaltung Schweiz

Accounto, Bexio (Kontera-KI) & KLARA: KI-Buchhaltung im Vergleich für Treuhandbüros

Neutraler Vergleich Schweizer KI-Buchhaltung (Accounto, bexio/Kontera, KLARA, Abacus): Belegerkennung, Automatisierung, Treuhand-Kollaboration, CH-Datenstandort.

Einführung & Umsetzung

39 Themen

Von Pilot zu Produktion, Kosten.

AI-READINESS AUDIT · SERVICE

AI-Readiness Audit: Wo Ihr Betrieb heute mit KI steht – in ein bis fünf Tagen geklärt

Stack-Scan, Datenschutz-Check, drei priorisierte Use-Cases. Bericht plus 90-Min-Debriefing. Light ab CHF 1700, Deep CHF 3900.

SERVER & INFRASTRUKTUR · SERVICE

Server & Infrastruktur: Ubuntu, Docker, Monitoring – aufgesetzt, gehärtet, übergeben

Eigener Server auf Hetzner oder DigitalOcean. Ubuntu 24.04, Docker, nginx, SSL, Fail2ban, CrowdSec, Monitoring. Pauschal ab CHF 1200.

MULTI-LLM GATEWAY · SERVICE

Multi-LLM Gateway: Acht Anbieter, ein Eingang, Compliance-Routing

LiteLLM-Gateway mit Auth, Routing nach Kosten/Tempo/Datenschutz, Nutzungs-Dashboard. Modul ab CHF 1000, Projekt mit Observability CHF 4500.

RAG MIT EIGENEM WISSEN · SERVICE

RAG mit eigenem Wissen: Antworten aus Ihren Dokumenten – mit Quelle, nicht erfunden

Durchsuchbare Wissensbasis mit Chat. PII-Schwärzung, Zitat-Prüfung, DE/FR/IT/EN. Pilot bis 10000 Docs CHF 3500, Production ab CHF 8500.

n8n · SERVICE

n8n Workflow-Automation: Routine raus, Köpfe frei

Self-hosted n8n auf Ihrem Server plus fertige Workflows. Rechnungs-Triage, Lead-Routing, Mail-Klassifikation, tägliche Zusammenfassung – dokumentiert und übergeben.

MANAGED · SERVICE

Managed Service & Monitoring: Wir betreiben es weiter, Sie nutzen es

Monitoring, Updates, Sicherheits-Patches, Reaktion bei Störungen. Drei Stufen: Basic CHF 600/Mo, Pro CHF 1'200/Mo, Plus CHF 2'200/Mo. Definierte Reaktionszeiten.

EIGENES LLM · KOSTEN

Was kostet ein eigenes LLM? Total Cost of Ownership im Mai 2026

Hardware, Strom, DevOps, Wartung: alle TCO-Bausteine für ein selbst gehostetes Sprachmodell mit konkreten Zahlen in CHF und USD für Mai 2026.

RAG-PILOT · KOSTEN

Was kostet ein RAG-Pilot? Drei Stufen: 1k, 10k, 100k Dokumente

Konkrete Kostenrechnung für einen RAG-Pilot in der Schweiz: Embedding, Vektor-DB, LLM-Inferenz, Einrichtungs-Aufwand. Drei Volumen-Stufen mit Zahlen in CHF.

GPU-PREISE · KOSTEN

GPU-Kosten-Rechner 2026: T4, L4, A10, A40, A100, H100, H200 im Vergleich

Welche GPU passt zu welchem Modell, was kostet sie bei welchem Anbieter, On-Demand vs. Reserved? Mai-2026-Preise von AWS, GCP, Azure, Hetzner, RunPod, Vast.ai.

TOKEN-PRICING · KOSTEN

Token-Kosten erklärt: Input, Output, Cache, Provider-Vergleich Mai 2026

Was ist ein Token, wie unterscheidet sich Input- von Output-Pricing, was kostet 1 Million Tokens bei welchem Anbieter? Tabelle mit allen relevanten Modellen.

BREAK-EVEN · KOSTEN

Cloud-API vs. Self-Host: ab welchem Token-Volumen lohnt sich was?

Break-Even-Analyse mit Zahlen Mai 2026. 1M / 10M / 100M / 1B Token pro Monat: wo kreuzen sich Cloud-Kurve und Self-Host-Kurve? Plus Hidden Costs.

KOSTEN · KI-AUTOMATION KMU

Was kostet KI-Automation für ein Schweizer KMU? Ehrliche Preise Juni 2026

Von CHF 590 Speedcheck bis CHF 20000 erstes Jahr für ein 5-MA-Treuhand: alle Posten, Server-Mieten, Token-Kosten, Managed-Service.

ROI · KI-PROJEKT

ROI-Rechner für KI-Projekte: Wie Sie Mai 2026 ehrlich kalkulieren

Formel, Beispiel-Rechnung Treuhand-Mahnwesen (Break-Even Monat 3), Frauenfeld-Case mit 7 bis 8 Wochen ROI – und die Stolperfalle "Zeitersparnis ist nicht linear Geld".

STRUCTURED EXTRACTION · AI-KONZEPT

Structured Extraction mit Grounding: Cite-The-Source aus PDFs und Mails

Daten aus PDFs und Mails extrahieren mit Belegen: Gemini Citation API, Anthropic with_citations, manuelle Citation-Linker und Audit-Trail-Bezug.

BEXIO API · INTEGRATION

Bexio API: KI-Integration in die Schweizer Treuhand-Buchhaltung

Die Bexio REST API verbindet Schweizer KMU-Buchhaltung mit KI-Workflows. OAuth 2.0, Schweizer Hosting, ein klares Datenmodell.

ABACUS API · INTEGRATION

Abacus API: KI-Anbindung an die Schweizer ERP-Plattform

Die Abacus Web-Services verbinden ERP, Lohn und Buchhaltung mit KI-Workflows. REST-Endpunkte, SOAP-Legacy, On-Prem oder Cloud.

SAP B1 · INTEGRATION

SAP Business One: KI-Integration über DI-API und Service-Layer

SAP Business One ist das KMU-ERP von SAP. Zwei APIs: DI-API (Java/.NET, low-level) und Service-Layer (REST, modern). KI-Anbindung über den Service-Layer.

SAGE 50 · INTEGRATION

Sage 50: KI-Integration über die Sage Connect REST API

Sage 50 ist die KMU-Buchhaltung von Sage in DACH. Die Sage Connect API wurde Mai 2026 modernisiert und ist heute eine REST-Schnittstelle mit OAuth 2.0.

MS GRAPH · INTEGRATION

Microsoft 365 Graph API: Mail, Kalender, Teams und SharePoint als KI-Quelle

Die Microsoft Graph API ist das zentrale Tor zu Microsoft 365. OAuth 2.0, granulare Permissions, Throttling-Limits. Das Werkzeug für KI im Microsoft-Stack.

GOOGLE WORKSPACE · INTEGRATION

Google Workspace: Gmail, Calendar, Drive und Docs als KI-Quelle

Google Workspace APIs bieten Zugang zu Gmail, Kalender, Drive, Docs und Sheets. Mai 2026 GA: AppSheet und Vertex AI Connect für KI-Workflows.

SHAREPOINT · INTEGRATION

SharePoint und OneDrive: Dokumenten-RAG-Quelle für Treuhand und Kanzlei

SharePoint und OneDrive bilden den Dokumenten-Speicher der meisten CH-Kanzleien. REST-API und Graph für KI-Indexierung, CSOM als Legacy.

SSO · INTEGRATION

SSO mit SAML 2.0 und OIDC: Ein Login für Bexio, Microsoft 365 und KI-Apps

SAML 2.0 für Enterprise, OIDC für moderne Apps. IdPs: Entra, Google, Keycloak, Authelia. Mai 2026: Passkeys und SCIM für User-Provisioning.

WEBHOOKS · INTEGRATION

Webhooks und ereignisbasierte Integration: HMAC, Idempotency, Retry

Webhooks ersetzen Polling durch Push-Events. HMAC-Signatur, Replay-Protection, Idempotency-Keys. Mai 2026 Best Practices für robuste Pipelines.

REST · GRAPHQL · INTEGRATION

REST vs GraphQL: Welche API-Architektur für KI-Integrationen?

REST dominiert Mai 2026, GraphQL für komplexe Datenmodelle. OpenAPI 3.1, MCP-Server für LLM-Zugriff. Tools: FastAPI, Express, tRPC.

CHUNKING · AI-KONZEPT

Chunking-Strategien für RAG: Fixed-Size, Recursive, Semantic, Late-Chunking

Wie Sie Dokumente für RAG schneiden: Fixed-Size, Recursive, Semantic, Document-based und Late-Chunking im Vergleich plus Faustregeln für Verträge, Tabellen und mehrsprachige Texte.

DOCUMENT LOADERS · AI-KONZEPT

Document Loaders: PDF, DOCX, XLSX, EML, HTML, Markdown sauber in RAG einlesen

Welche Tools welche Dokumentformate verlustfrei in eine RAG-Pipeline überführen: Unstructured.io, LlamaParse, MarkItDown (Microsoft, Mai 2026), PyMuPDF und pandoc im Direktvergleich.

OCR · AI-KONZEPT

OCR für Belege und Verträge: Tesseract, AWS Textract, Azure DI, Google DocAI, Mistral OCR, Reducto

Welche OCR-Engine für gescannte Verträge, Belege und Formulare im Mai 2026 sinnvoll ist: Genauigkeit, Preis, EU-Hosting, DSG-Tauglichkeit und Use-Case-Empfehlungen.

PDF-TABELLEN · AI-KONZEPT

PDF-Tabellen-Extraktion: Camelot, Tabula, pdfplumber, Table Transformer, Marker

Welches Tool im Mai 2026 Bilanz-Tabellen, MWST-Aufstellungen und Lohnabrechnungen verlustfrei aus PDFs holt: Camelot, Tabula, pdfplumber, Microsoft Table Transformer und Marker im Direktvergleich.

EMAIL-ARCHIVE · AI-KONZEPT

E-Mail-Archive indexieren: IMAP, EWS, Microsoft Graph, MBOX und DSG-Konformität

Wie Sie 5 bis 10 Jahre Mandanten-Korrespondenz für RAG indexieren: IMAP, EWS, Microsoft Graph, MBOX-Imports, Anhang-Extraktion, Threading-Erhaltung, DSG- und Berufsgeheimnis-konform.

DATENBEREINIGUNG · AI-KONZEPT

Datenbereinigung vor RAG: Duplikate, Boilerplate, OCR-Artefakte, Charset-Issues, Watermarks

Warum 30 Prozent jedes RAG-Korpus Müll ist und wie Sie ihn aussortieren: Duplikat-Erkennung, Header/Footer-Stripping, OCR-Korrektur, Encoding-Reparatur und Watermark-Entfernung mit cleanlab und dedupe.io.

OLLAMA · ANLEITUNG

Ollama installieren: Schritt-für-Schritt-Anleitung für Mac, Linux und Windows (Mai 2026)

Praktische Anleitung zur Installation von Ollama 0.5+ auf macOS, Linux und Windows mit Modell-Download, REST-API-Test, Quantisierung Q4_K_M, Systemd-Setup und GPU-Beschleunigung.

RAG · ANLEITUNG

RAG-Pilot in 7 Tagen: Von 50 PDFs zur funktionierenden Wissensbasis (Mai 2026)

Tag-für-Tag Anleitung von 50 PDFs zu funktionierender Retrieval-Augmented-Generation mit pgvector, BGE-M3, LiteLLM, Streamlit-UI und Ragas-Eval. Budget CHF 800-1500.

N8N · ANLEITUNG

n8n self-host plus Bexio-Integration: vom Docker-Compose zum Mahnstatus-Workflow (Mai 2026)

Anleitung für n8n in EU-Hosting mit Postgres-Backend, Bexio-OAuth-App, Webhook-Empfang und einem fertigen Workflow "Bei neuer Rechnung prüfe Mahnstatus". Production-ready.

BREVO · ANLEITUNG

Brevo SMTP einrichten: DNS, DKIM, DMARC, Nodemailer-Test und Bounce-Webhooks (Mai 2026)

Schritt-für-Schritt Anleitung von DNS-Records über Hetzner-Firewall-Whitelisting bis Nodemailer-Test, mit Production-Tipps für dedizierte IP und Bounce-Webhook in n8n.

CLOUDFLARE · ANLEITUNG

Cloudflare mit eigener Domain einrichten: DNS, SSL, WAF, Workers KV und Tunnel (Mai 2026)

Anleitung von der Domain-Registrierung über Nameserver-Wechsel, SSL-Modi, DNS-Records, Page-Rules, Workers KV, WAF-Regeln und Cloudflare-Tunnel für Origin-Schutz.

BACKUP · ANLEITUNG

Backup-Strategie 3-2-1 für KMU: restic, rclone, Backblaze B2 und Wiederherstellungs-Drills (Mai 2026)

Konkretes Setup für KMU mit Linux-Server, Bexio-Cloud und Office-365: restic für Files, mysqldump für DB, rclone für Cloud, Object Lock auf Backblaze B2. Budget CHF 30-50/Monat.

LITELLM · ANLEITUNG

LiteLLM-Gateway installieren: Docker, config.yaml, Virtual Keys, Cost-Tracking und Langfuse (Mai 2026)

Anleitung von leerem Server zu produktivem LiteLLM-Proxy mit 5 Providern (OpenAI, Anthropic, Mistral, Gemini, Ollama), Virtual Keys mit Budget-Limit, PostgreSQL-Audit-Log und Langfuse-Tracing.

Umsetzung

Prompt-Bibliothek für Treuhänder: erprobte Prompts für Buchhaltung, MwSt & Korrespondenz

Sichere, wiederverwendbare Prompt-Muster für den Treuhand-Alltag – mit klaren Grenzen, ohne Mandantendaten in unsichere Tools.

Umsetzung · Mandantenportal & RAG

Mandantenportal mit KI-Assistent: sicherer Self-Service-Chat auf eigenem Treuhand-Wissen (RAG)

Mandantenportal mit RAG-Chatbot auf eigenem Kanzleiwissen: Zugriffskontrolle, Mandantentrennung, revDSG, Halluzinationsbegrenzung und Eskalation an den Menschen.

Risiken & Grenzen

20 Themen

Was schiefgeht, was KI nicht kann.

HALLUZINATIONEN · AI-KONZEPT

Halluzinationen begrenzen: Fünf Gegenmittel gegen erfundene KI-Antworten

Warum Sprachmodelle plausibel-falsche Antworten produzieren, welche fünf Mittel das eindaemmen und wie Sie Halluzinationen messbar machen.

SHADOW AI · COMPLIANCE

Schatten-KI im Unternehmen: Wenn Mitarbeiter ChatGPT privat für Mandantendaten nutzen

Cyberhaven 2026: 32 % der ChatGPT-Nutzung läuft über Privat-Accounts. 39,7 % der Dateneingaben enthalten sensible Daten. Folgen + Gegenmittel.

BACKUP · SICHERHEIT

Backup-Strategien 3-2-1 und 3-2-1-1-0: So sichern Sie ein KMU revisionsfest

Drei Kopien, zwei Medien, eine Offsite, eine Offline, null Verifizier-Fehler. Tools, Cloud-Ziele und DSG-Aspekte für Mai 2026.

DISASTER RECOVERY · SICHERHEIT

Disaster Recovery, RTO und RPO: Was ein KMU-Treuhand wirklich vorhalten muss

Wie lange darf der Ausfall dauern, wie viele Daten dürfen verloren gehen? Vier DR-Strategien mit Mai-2026-Preisen und Tooling.

RBAC · SICHERHEIT

RBAC und Rechtemanagement: Wer darf in einem Treuhand-System was sehen?

Role-Based Access Control vs ABAC, Least Privilege, Mandanten-Trennung. Tools wie Authelia, Authentik, Keycloak und Entra im KMU-Vergleich.

SECRETS · SICHERHEIT

Secrets-Management mit Vault: API-Keys, DB-Passwörter und JWT-Secrets richtig verwalten

Keine .env-Files in Git, keine Klartext-Backups. HashiCorp Vault, Bitwarden Secrets, 1Password, AWS und Entra im KMU-Vergleich.

PENTEST · SICHERHEIT

Pentest und Vulnerability-Scans: Was ein KMU jährlich prüfen muss

Manueller Pentest, automatisierte Scans, Bug-Bounty und OWASP LLM Top 10. Schweizer Anbieter, OSS-Tools und realistische Preise Mai 2026.

INCIDENT RESPONSE · SICHERHEIT & BETRIEB

Incident-Response-Playbook: 6-Phasen-Modell nach NIST SP 800-61 für KMU

Strukturierte Reaktion auf Sicherheitsvorfälle in sechs Phasen, mit DSG-konformer 72-Stunden-Meldung an den EDÖB und Werkzeugen wie TheHive, Wazuh und MISP.

LOGGING · SICHERHEIT & BETRIEB

Logging und Audit-Trail: revisionsfeste Protokollierung nach OR Art. 957a für KMU

Unveränderliche Logs mit 10-jähriger Aufbewahrung nach OR 957a, WORM-Storage und Hash-Chain. Tools Mai 2026: Loki, Wazuh, GrayLog, Elasticsearch.

DDoS · SICHERHEIT & BETRIEB

DDoS-Schutz mit Cloudflare: Layer 3, 4 und 7 für KMU-Web-Anwendungen 2026

Volumetrische und Application-Layer-DDoS-Angriffe mit Cloudflare Free, Pro oder Business absichern. Stand Mai 2026 inkl. KI-orchestrierter Angriffe.

TLS · SICHERHEIT & BETRIEB

SSL/TLS-Zertifikate mit Lets Encrypt: TLS 1.3, HTTP/3 und Auto-Renew für KMU 2026

Kostenlose TLS-Zertifikate mit 90-Tage-Gültigkeit, Auto-Renew via Certbot oder Caddy, TLS 1.3 plus HTTP/3 als Standard 2026.

FIREWALL · SICHERHEIT & BETRIEB

Firewall und CrowdSec: mehrschichtiger Schutz für KMU-Server 2026

Netzwerk-Firewall (ufw/nftables) plus Application-Schutz mit CrowdSec, der Open-Source-Nachfolger von Fail2ban mit Crowd-Sourced Threat-Intel.

HALLUZINATIONS-MESSUNG · AI-KONZEPT

Halluzinationen erkennen und messen: Metriken, Benchmarks und Self-Consistency

Wie Sie Halluzinationen in KI-Antworten reproduzierbar messen: TruthfulQA, HaluEval, FActScore, Selbstkonsistenz und Citation-Grounding-Checks.

EVAL-FRAMEWORKS · AI-KONZEPT

Eval-Frameworks für LLMs: DeepEval, OpenAI Evals, Promptfoo, Ragas, TruLens im Vergleich

Welches LLM-Evaluation-Framework wann: DeepEval, OpenAI Evals, Promptfoo, Inspect (UK AISI), Ragas, TruLens, MLflow LLM Evaluate und Phoenix Evals.

GOLDEN DATASET · AI-KONZEPT

Golden Dataset aufbauen: 50-500 Test-Beispiele für KMU richtig erstellen

Stratified Sampling, Edge-Cases, Adversarial-Set, quartalsweise Auffrischung und Annotations-Guidelines für ein belastbares Test-Set in der Treuhand-Praxis.

LLM-AS-A-JUDGE · AI-KONZEPT

LLM-as-a-Judge: KI bewertet KI – Methoden, Bias-Fallen, Grenzen

GPT-4 und Claude als Eval-Richter, Pairwise vs Pointwise Scoring, Position-Bias und Self-Preference, G-Eval Paper, wann Menschen unverzichtbar bleiben.

REGRESSION TESTING · AI-KONZEPT

Regression Testing für LLMs: CI/CD, Snapshot-Tests und Modell-Update-Drift erkennen

CI/CD-Integration von LLM-Tests, Snapshot-Testing für Prompts, Diff-Testing zwischen Modell-Versionen am Beispiel das aktuelle Claude-Modell zu 4.7 Treuhand-Pipeline.

RED-TEAMING · AI-KONZEPT

Red-Teaming für KI: Jailbreaks, Prompt-Injection und OWASP LLM Top 10 v2.0

Adversarial Prompts, DAN-Mode, Prompt-Injection (direkt und indirekt), OWASP LLM Top 10 v2.0 und Mai-2026-Tools: PyRIT, Garak, Promptfoo Red-Team.

BIAS & FAIRNESS · AI-KONZEPT

Bias- und Fairness-Audits für KI: Schweizer Gleichstellung, EU AI Act Art. 10, BBQ und StereoSet

Wie KMU Bias in LLM-Outputs messen: Schweizer Gleichstellungsrecht, EU AI Act Art. 10, BBQ-Benchmark, StereoSet, CrowS-Pairs und ein Treuhand-Beispiel zu Sprach-Akzent.

KI-KPIS · AI-KONZEPT

KI-Qualität messen: KPIs für RAG, Latenz, Kosten und User-Satisfaction

KMU-Dashboard für KI-Qualität: Faithfulness, Answer Relevancy, Context Precision, Context Recall, Latency, Cost-per-Query, User-Satisfaction.

Mensch & Organisation

2 Themen

Arbeitsplätze, Akzeptanz, Wandel.

HR · BRANCHEN-HUB

KI für HR und Personalvermittlung in der Schweiz: CV-Screening, Voicebot-Interviews und Mitarbeiter-FAQ

Wie HR-Abteilungen und Personaldienstleister KI in CV-Screening, Stelleninserate, Interview-Voicebots und Mitarbeiter-FAQ einsetzen – mit Bias-Audit, revFADP und EU-AI-Act-Hochrisiko-Pflichten.

Mensch & Organisation

Schatten-KI im Treuhandbüro: Richtlinie, Tool-Freigabeliste & Mitarbeiter-Schulung

Wie Treuhandbüros unkontrollierte KI-Nutzung in den Griff bekommen: interne Richtlinie, Freigabeliste, Schulung und revDSG-Bezug.

08 · LIVE

Trends & Einordnung

TÄGLICH AKTUELL8 Themen

Was neu ist, was Hype.

AGENTIC AI · TREND 2026

Wie das auf Ihren Stack passt – in 30 Minuten geklärt.

Erstgespräch buchen