MEILISEARCH · TECH
Meilisearch: schnelle Such-Engine mit AI-Search-Mode für Hybrid-Suche
Meilisearch ist eine MIT-Such-Engine in Rust. Mai 2026 v1.10+ mit AI-Search-Mode (BM25+Embedding), Developer-friendly, gut für Search-Bars mit AI-Snippets.
Recherche & Faktencheck: DuneDive LLC · Stand: 2026-05
Was ist Meilisearch?
Meilisearch ist eine Open-Source-Suchmaschine unter MIT-Lizenz, geschrieben in Rust. Sie wurde 2018 von Meilisearch SAS gestartet und positioniert sich explizit als Alternative zu Elasticsearch und Algolia für Developer, die schnelle Volltext-Suche ohne grosse Konfiguration brauchen. Stand Mai 2026 ist Version 1.10+ aktuell. Seit Version 1.6 (2024) bietet Meilisearch native Vektor-Suche; seit 1.10 (Anfang 2026) den AI-Search-Mode als Hybrid aus BM25 und Embedding-Suche in einer einzigen Anfrage.
Meilisearchs Identität ist explizit Developer-zentriert. Die API ist REST mit JSON, die Doku ist konsequent in englischer Klartext gehalten, das SDK existiert für JavaScript/TypeScript, Python, Ruby, PHP, Go, Rust, Java, .NET, Dart, Swift. Setup ist im 60-Sekunden-Bereich – Docker-Container starten, Master-Key setzen, dokumente indexieren. Konfiguration ist minimal: typo-tolerance, ranking-rules, stop-words, synonyms – alles per JSON-Settings-API, kein YAML, keine komplexen Schema-Definitionen.
Der typische Anwendungsfall ist die Search-Bar in einer Web- oder Mobile-App. Ein Benutzer tippt, Meilisearch liefert relevante Treffer in unter 50 ms, mit Typo-Tolerance, Synonym-Auflösung, Highlight-Snippets und Facetten-Filtern. Mit dem AI-Search-Mode kommt eine semantische Komponente dazu: Anfragen wie „wie eröffne ich eine GmbH" liefern Treffer, in denen das Wort „eröffne" gar nicht vorkommt, sondern „gründen", „registrieren" oder „aufsetzen".
Meilisearch Cloud ist die Managed-Variante seit 2023, mit AWS-Regionen in den USA, Europa (Frankfurt, Ireland) und Asien. Self-Hosted läuft als Single-Binary auf jeder Plattform – Mac, Linux, Windows, Docker – und braucht weder Cluster noch Coordinator-Stack.
Für CH-Treuhand- und KMU-Setups passt Meilisearch in ein klares Profil: Search-Bars in eigenen Web-Apps, semantische Filter-Suche über Mandanten-Datensätze, AI-Snippets als UX-Element. Wer eine reine RAG-Pipeline mit hoher Embedding-Qualität baut, ist mit Qdrant oder pgvector besser bedient – Meilisearch ist die UX-Schicht über dem Datenbestand, nicht das tiefe Retrieval-Backbone.
Warum es wichtig ist
Viele CH-Treuhand- und KMU-Apps brauchen eine Such-Funktion, in der ein Benutzer schnell ein Dokument, einen Mandanten oder eine Akte findet – nicht eine RAG-Pipeline mit langer Generierungs-Latenz. Eine Such-Bar mit Autovervollständigung, Typo-Tolerance und semantischem Boost ist eine andere Anforderung als RAG-Retrieval, und sie hat ein anderes optimales Tool.
Drei Eigenschaften machen Meilisearch für diesen Anwendungsfall stark. Erstens: Latenz. Meilisearch liefert Suchergebnisse typisch unter 50 ms, oft unter 10 ms – für eine Search-Bar mit Live-Update bei jedem Tastendruck (Search-as-you-type) ist das Pflicht. Elasticsearch ist hier oft langsamer (50-100 ms wegen Java-Overhead), Qdrant ist gut, aber nicht auf interaktive Search-Bars zugeschnitten.
Zweitens: Typo-Tolerance, Synonyms und Highlight out-of-the-box. Meilisearch verteilt diese Werkzeuge in der API ohne komplizierte Setup-Phase. Eine deutsche Treuhand-App, in der Benutzer „Muller" tippen und „Müller" treffen sollen, oder „MWST" und „Mehrwertsteuer", funktioniert direkt – keine Tokenizer-Konfiguration, keine Lucene-Analyzer.
Drittens: AI-Search-Mode (seit v1.10). Eine semantische Komponente kann optional hinzugeschaltet werden, ohne dass die UX sich ändert. Suche „wie eröffne ich eine GmbH" liefert Treffer mit „gründen" und „registrieren", ohne dass der Entwickler eine zweite Pipeline bauen muss. Embedding-Modelle werden via OpenAI, Cohere, HuggingFace, Ollama oder Mistral konfiguriert; ein Embedder ist ein JSON-Eintrag in den Settings.
Die Schwäche: Meilisearch ist nicht für RAG-Pipelines mit langen Kontext-Chunks gebaut. Wer 8000-Token-Chunks aus PDFs vektorisiert und genauen Recall sucht, ist mit einer dedizierten Vektor-DB besser bedient. Meilisearchs AI-Search-Mode ist optimiert für kurze Search-Queries und kurze Dokument-Snippets (Titel, Untertitel, ein paar Sätze), nicht für 8000-Token-Chunks.
Lizenz MIT – kein Lock-in, kein SaaS-Repackaging-Verbot, freie Forks. Für eigene Plattformen mit Meilisearch als Such-Backend ist das eine angenehme Lizenz-Situation gegenüber Elasticsearch oder Redis.
Wie es funktioniert
Installation: docker run -p 7700:7700 -e MEILI_MASTER_KEY=... getmeili/meilisearch:v1.10. Auf Linux/Mac via curl-Installer; auf Windows als Binary. Persistente Daten in einem gemounteten Volume.
Index anlegen via POST /indexes mit JSON: POST /indexes { "uid": "docs", "primaryKey": "id" }
Ein Index existiert sofort; Schema entsteht implizit beim ersten Insert. Für Treuhand-Use-Cases typisch ein Index pro Use-Case (mandanten, belege, dossiers).
Dokumente hinzufügen via POST /indexes/docs/documents: [ { "id": 1, "title": "Rechnung Müller", "content": "Beleg für Mandant 42, April 2026", "mandant_id": 42, "datum": "2026-04-01" }, { "id": 2, "title": "Quittung Tankstelle", "content": "Spesen Mandant 42, Tank 80 CHF", "mandant_id": 42, "datum": "2026-04-02" } ]
Meilisearch verarbeitet asynchron via Task-Queue; eine Task-ID wird zurückgeliefert, Status prüfbar.
Settings konfigurieren – Volltext-Tuning: PUT /indexes/docs/settings { "searchableAttributes": ["title", "content"], "filterableAttributes": ["mandant_id", "datum"], "sortableAttributes": ["datum"], "rankingRules": ["words", "typo", "proximity", "attribute", "sort", "exactness"], "synonyms": { "MWST": ["Mehrwertsteuer"], "OR": ["Obligationenrecht"] } }
Filterable und sortable Attributes erlauben Facetten-Filter; synonyms lösen Domain-spezifische Begriffe auf.
AI-Search-Mode aktivieren via Embedder: PATCH /indexes/docs/settings { "embedders": { "default": { "source": "openAi", "apiKey": "...", "model": "text-embedding-3-small", "documentTemplate": "Titel {{doc.title}} Inhalt {{doc.content}}" } } }
Alternativ source: "huggingFace" mit lokalem Modell, source: "ollama" mit lokalem Ollama-Endpoint, source: "userProvided" mit extern berechneten Vektoren.
Suche mit Hybrid: POST /indexes/docs/search { "q": "Müller Belege April", "filter": "mandant_id = 42", "hybrid": { "embedder": "default", "semanticRatio": 0.5 }, "attributesToHighlight": ["title", "content"], "limit": 10 }
semanticRatio: 0 ist reine BM25-Suche, 1 ist reine Vektor-Suche, 0.5 ist gemischt. Highlight liefert Snippets mit markierten Treffer-Stellen – direkt für UI verwendbar.
Multi-Tenant: ein Index pro Mandant oder filterableAttributes mit mandant_id. API-Tenant-Tokens (seit v1.4) erlauben mandanten-scoped Such-Keys.
Backup via Dump-API: POST /dumps erstellt einen Snapshot des gesamten Meilisearch-Stands.
Meilisearch in 5 Schritten produktiv
- 01Installation: docker run mit getmeili/meilisearch-Image, MEILI_MASTER_KEY setzen, persistentes Volume. Single-Binary alternativ auf Hetzner-Server.
- 02Index anlegen via API: POST /indexes mit uid und primaryKey. Settings konfigurieren: searchableAttributes, filterableAttributes, synonyms, stop-words.
- 03AI-Search-Mode optional: PATCH /indexes/<uid>/settings mit embedders-Konfiguration. OpenAI, HuggingFace, Ollama oder userProvided je nach Datenschutz-Anforderung.
- 04Ingestion: POST /indexes/<uid>/documents in Batches von 1000 Dokumenten. Asynchron via Task-Queue; Status via /tasks/<id> prüfen.
- 05Backup und Monitoring: POST /dumps für vollständigen Snapshot; Prometheus-Metriken via /metrics-Endpoint; Search-Latency und Index-Grösse beobachten.
Wann Meilisearch einsetzen
Meilisearch passt für (a) Search-Bars und Search-as-you-type-Funktionen in Web- oder Mobile-Apps, (b) UX-orientierte Suche mit Highlight, Typo-Tolerance und Facetten, (c) Hybrid-Suche für kurze Such-Queries und Dokument-Snippets, oder (d) interne Apps, in denen Such-UX wichtiger ist als tiefes Vektor-Retrieval.
Konkrete Fälle: eine Treuhand-Plattform mit Such-Bar für alle Mandanten, Belege und Akten – Benutzer tippt, sofortige Resultate mit Highlight. Eine Wissensbasis-App für interne FAQs, in der Mitarbeitende „MWST Quartal 1" tippen und semantisch passende Antworten erhalten. Ein Dokumenten-Management-System, in dem Suche nach „Müller" auch „Muller" und „Müller" findet (Unicode-Normalisierung out-of-the-box).
Für Web-Shops mit Produktsuche ist Meilisearch sehr stark – Algolia-Äquivalent als Open-Source. Facetten-Filter, Synonyms, Boost-Regeln, Pagination sind im Standard-Funktionsumfang.
Meilisearch Cloud (Managed) ist seit 2023 verfügbar mit AWS-Regionen Frankfurt und Ireland. Für DACH-Kunden ohne TIA-Aufwand eine Option. Self-Hosted auf Hetzner Helsinki/Falkenstein oder Infomaniak für strikte CH-Hosting-Anforderungen – Meilisearch ist ein Single-Binary, das auf 2 GB RAM läuft. Eine CHF 5-Hetzner-CX11-Instanz reicht für mittlere Search-Workloads.
Kombination mit RAG: Meilisearch kann als Initial-Retrieval-Schicht in einer RAG-Pipeline dienen, mit dedizierter Vektor-DB als Deep-Retrieval-Schicht. Search-Bar findet relevante Dokumente schnell, RAG-Pipeline arbeitet auf vorgefiltertem Set. Diese zwei-stufige Architektur passt zu Plattformen, in denen UX und tiefe AI-Antworten beide nötig sind.
Wann NICHT
Für reine RAG-Pipelines mit langen Kontext-Chunks (4000-8000 Tokens) ist Meilisearch nicht das ideale Tool. Der AI-Search-Mode ist auf Such-UX optimiert, nicht auf hochpräzise Embedding-Retrieval. Wer 100.000 PDF-Chunks vektorisiert und genauen semantischen Recall braucht, ist mit Qdrant, Weaviate oder pgvector besser bedient.
Für sehr grosse Datenmengen (> 10 Mio. Dokumente) wird Meilisearch teuer im RAM-Verbrauch. Volltext-Index plus Vektor-Index beide im RAM kosten 4-8 GB pro Mio. Dokumente. Bei 100 Mio. Dokumenten ist Elasticsearch oder Milvus die wirtschaftlichere Wahl.
Wenn das Use-Case komplexe Multi-Signal-Ranking-Pipelines mit ML-Modellen braucht (Cross-Encoder als Second-Phase, Tensor-Operationen, Multi-Vektor-Ranking), ist Vespa der bessere Pfad. Meilisearch hat Ranking-Rules, aber keine Tensor-Algebra.
Für Multi-Modal mit Bild-Embeddings ist Meilisearch nicht eingerichtet. Vektor-Suche existiert, aber primär für Text-Embeddings. Wer Bilder im selben Index sucht, geht zu Weaviate oder selbst-gebauten Embedding-Pipelines mit Qdrant.
Für Log-Analyse oder Time-Series-Search ist Elasticsearch die ausgereiftere Wahl. Meilisearch hat keine Aggregations-Pipelines für Logs, keine Time-Series-Indizes.
Wenn das Team bereits Algolia-Erfahrung hat und ein Managed-Service mit identischem Feature-Set sucht: Algolia ist proprietär, hat ähnliche API-Stuktur, aber kein Self-Host-Option. Meilisearch ist die Open-Source-Alternative; ein Pfadwechsel ist nicht ohne Code-Anpassung möglich.
Vor- und Nachteile
STÄRKEN
- MIT-Lizenz – kein Lock-in, kein SaaS-Repackaging-Verbot
- Setup in 60 Sekunden, Single-Binary ohne Cluster-Komplexität
- Sehr niedrige Latenz unter 50 ms für Search-as-you-type
- AI-Search-Mode mit Hybrid BM25+Embedding seit v1.10
SCHWÄCHEN
- Nicht für lange RAG-Chunks optimiert – AI-Mode ist UX-Search-fokussiert
- Skaliert auf 10+ Mio. Dokumente teuer im RAM-Verbrauch
- Kein Tensor-Ranking oder Cross-Encoder-Modelle wie bei Vespa
- Multi-Modal mit Bild-Embeddings nicht eingerichtet
Häufige Fragen
Wie unterscheidet sich Meilisearch von Algolia?
Meilisearch ist MIT-Open-Source und self-hostable; Algolia ist proprietär, Cloud-only. Feature-Set überlappt zu ca. 80% – Search-as-you-type, Typo-Tolerance, Facetten, Synonyme. Algolia hat mehr Enterprise-Features (Personalisierung, A/B-Testing); Meilisearch hat mit AI-Search-Mode seit 1.10 native Hybrid-Suche. Preisstruktur sehr unterschiedlich: Algolia ab USD 50/Monat Cloud-only, Meilisearch kostenlos self-hosted oder Meilisearch Cloud ab USD 30/Monat.
Welche Embedder unterstützt Meilisearch v1.10?
Stand Mai 2026: OpenAI (text-embedding-3-small/large), Cohere, HuggingFace (jedes sentence-transformers-Modell), Ollama (lokale Modelle via Ollama-Server), Mistral AI, REST (generischer HTTP-Endpoint), userProvided (extern berechnete Vektoren). Für CH-Treuhand mit Datenschutz-Bedarf: Ollama oder HuggingFace lokal.
Wie viel RAM braucht Meilisearch?
Faustregel: ca. 2-4 GB RAM pro 1 Mio. Dokumente mit moderaten Feldgrössen. Mit AI-Search-Mode plus Vektoren der Dimension 1536 zusätzlich 6 GB pro Mio. Vektoren. Ein 5-Personen-Treuhand-Setup mit 100.000 Dokumenten plus Volltext und Vektoren läuft komfortabel auf 4 GB RAM. Bei 10 Mio. Dokumenten plant man 32-64 GB RAM ein.
Verwandte Themen
Quellen
PASSEND ZU IHREM STACK?