Zum Hauptinhalt springen
Die Evolution von FileMaster MCP

Von der Kundenanfrage zur Enterprise-Suche

Erfahrene Mitarbeiter gehen in Rente, ihr Wissen steckt in tausenden Dokumenten. Die Windows-Suche? Mühselig bis unmöglich. So entstand im Sommer 2025 die Idee zu FileMaster.

Das Problem

  • Erfahrene Mitarbeiter gehen in Rente - ihr Wissen geht mit
  • Tausende Dokumente mit wertvollem Know-how
  • Junge Kollegen müssen Dokumente manuell sichten
  • Windows-Suche: mühselig bis unmöglich

Die Lösung

  • KI-gestützte Wissensextraktion aus bestehenden Daten
  • Natürliche Sprache: Fragen statt Suchbegriffe
  • Semantische Suche findet auch Synonyme
  • Antworten in Millisekunden statt Stunden
8
Entwicklungsphasen
179
Commits
19K
Lines of Code
14
MCP-Tools
Entwickelt mit Claude Code

Die 8 Phasen der Evolution

Jede Phase brachte fundamentale Verbesserungen - von der Grundarchitektur bis zur Enterprise-reifen KI-Suche. Geschätzte Entwicklungszeit ohne KI-Unterstützung: 12-18 Monate.

Phase 1v1.0

Genesis

Die Grundsteinlegung

  • MCP-Server Architektur
  • OAuth 2.0 Integration
  • FTS5 Volltext-Suche
  • PDF, Word, Excel Support
  • Multi-User Fähigkeit

~50 Docs/Min | ~500ms Suche

Solide Basis für alle weiteren Entwicklungen

Phase 2v2.0

Enterprise Security

Unternehmensreife Sicherheit

  • Windows ACL Integration
  • Multi-Share Support
  • Tesseract OCR (gescannte PDFs)
  • DSGVO Audit Logging
  • Two-Layer Security

~80 Docs/Min | ~400ms Suche

8 Entwicklungsphasen für robuste ACL-Integration

Phase 3v2.1 - v2.2

RAG Integration

KI-gestützte semantische Suche

  • Semantic Search mit Vector Embeddings
  • Document Chunking
  • Hybrid Search (FTS5 + RAG)
  • Ollama Integration
  • Background Indexing

~200 Docs/Min | ~200ms Suche | 40x schnelleres Indexing

Synonym-Matching: 'Virenschutz' findet 'Endpoint Protection'

Phase 4v2.3 - v2.5

Production Ready

Enterprise Deployment

  • Docker Hub Publishing
  • Qdrant Vector Database
  • Ansible One-Command Deployment
  • OpenWebUI Integration
  • Claude 4.5 Sonnet Support

~260 Docs/Min | ~150ms Suche

Erstes Produktiv-Deployment bei Kunde erfolgreich

Phase 5v2.6

Performance Optimierung

10x schnellere Indexierung

  • Multi-Threading (4 parallel Workers)
  • Batch Embeddings (100 concurrent)
  • Queue-basierte Verarbeitung
  • External GPU Optimization
  • 750k+ Dokumente im Produktiveinsatz

940 Docs/Min | <100ms Suche | 4x schneller

Vollindexierung in 12h statt 2+ Tage

Phase 6v2.7

ACL-Fingerprinting

Intelligente Berechtigungsoptimierung

  • ACL-Fingerprinting Engine
  • Mustererkennung über Millionen ACLs
  • Reduktion auf wenige Tausend Fingerprints
  • Drastisch schnellere Berechtigungsprüfung
  • Speicheroptimierung im laufenden Betrieb

Millionen ACLs → ~Tausend Fingerprints

Mustererkennung reduziert Millionen ACLs auf wenige Tausend

Phase 7v2.8

Security Hardening

Enterprise-Security nach Team-Review

  • JWT Signatur-Verifikation (CRITICAL Fix)
  • SQL Injection Prevention (Subquery-Blocking, CTE-Blocking)
  • OAuth Token-Expiration & Cleanup
  • PowerShell Command Injection Prevention
  • Rate Limiting auf Auth-Endpoints

10+ Security-Patches · Fail-Closed ACL

Alle hardcoded Secrets entfernt, Security Headers & XSS Prevention

Phase 8v2.9

Enterprise Architecture

Modularisierung & Testing

  • 21 Lib-Module extrahiert (config, database, auth, search, acl, ...)
  • Thread Safety (db_lock, auth_lock, stats_lock)
  • pytest-Infrastruktur mit 101+ Tests
  • Structured Logging (print() komplett ersetzt)
  • Multi-threaded Vector Sync (10x schneller)

21 Module · 101+ Tests · 14 MCP-Tools

Vom Monolith zur modularen Enterprise-Architektur

Praxiserprobt

Bereit für den Unternehmenseinsatz

FileMaster MCP ist für den produktiven Einsatz in mittelständischen Unternehmen mit umfangreichen Dokumentenbeständen konzipiert und erprobt.

Typische Anwendungsbereiche

1 Mio.+
Dokumente indexierbar
Qualitätsmanagement & Dokumentation
Auftragsabwicklung & Projektdaten
Lieferanten- & Kundenkorrespondenz
Technische Zeichnungen & Spezifikationen
Verträge & Zertifikate

Unterstützte Dateitypen

PDF79%
Excel11%
Word4%
Text/Log4%
Andere2%

Multi-Format Support: PDF, Word, Excel, Text, Logs und 20+ weitere Formate werden automatisch indexiert und durchsuchbar gemacht.

Performance

Messbare Verbesserungen

Kontinuierliche Optimierung durch Multi-Threading, GPU-Beschleunigung und intelligentes Caching.

>1 Mio.
Dokumentenkapazität
getestet mit 750.000
<100ms
Suchantwortzeit
auch bei großen Beständen
940/Min
Indexierung
mit GPU-Unterstützung
3-fach
Hybrid Search
FTS5 + RAG + Semantisch
Technologie

Tech-Stack Evolution

Schritt für Schritt zur modernen KI-Architektur - jede Erweiterung baut auf soliden Grundlagen auf.

Prototyp
Python + FastAPI + SQLite FTS5
KI-Integration
+ PyTorch + Vector Embeddings
Production
+ Ollama + Qdrant + Docker
Optimierung
+ Multi-Threading + GPU-Cluster
Security
+ JWT + Rate Limiting + Fail-Closed ACL
Enterprise
+ 21 Lib-Module + pytest + Structured Logging

Architektur-Highlights

Triple-Hybrid Search: FTS5 + RAG + Semantisch
Qdrant Vector Database mit 768-dim Embeddings
14 MCP-Tools für intelligente Dokumentenverwaltung
21 modulare Lib-Packages, 101+ automatisierte Tests
Security Hardening: JWT, SQL Injection, Rate Limiting
Thread Safety mit expliziten Locking-Mechanismen
Windows ACL Two-Layer Security (Fail-Closed)
DSGVO-konformes Audit Logging & Structured Logging

Bereit für intelligente Dokumentensuche?

Erleben Sie FileMaster MCP live in einer Demo mit Ihren eigenen Dokumenten. 100% lokal, 100% DSGVO-konform.

Fragen zur Integration?

Wir beraten Sie gerne, wie FileMaster MCP in Ihre bestehende IT-Infrastruktur passt.