Selbstgehostete KI für den Servicedesk

Heute kündigen wir Znuny-LLM an, ein kostenloses Open-Source-Add-on, das die Unterstützung durch Large Language Models direkt in die Agenten- und Administratoroberfläche von Znuny integriert — vollständig in Ihrer kontrollierten Infrastruktur. Voraussetzung ist Znuny 7.3 oder neuer.

Znuny-LLM verbindet sich mit einem selbstgehosteten LLM-Stack Ihrer Wahl. Standardmäßig spricht das Paket mit Ollama, funktioniert aber ebenso mit jedem OpenAI-kompatiblen Endpunkt — einschließlich Azure OpenAI für Kunden, die einen verwalteten Dienst innerhalb ihres bestehenden Microsoft-Mandanten bevorzugen. In beiden Fällen entscheiden Sie, wohin die Ticketdaten gelangen. Es gibt keine gemeinsame SaaS-Ebene, kein Drittanbieter-Gateway und keine Telemetrie, die Ihre Umgebung verlassen.

Was die Erweiterung leistet

Das Paket fügt eine Reihe LLM-gestützter Funktionen hinzu, die sich in den Arbeitsalltag eines Servicedesks einfügen, ohne die Art und Weise zu verändern, wie Agenten durch Tickets navigieren.

Automatische Ticket-Klassifizierung. Sobald die erste Nachricht eines Kunden eintrifft, schlägt das LLM Queue, Typ, Service und SLA aus den für das Ticket tatsächlich zulässigen Werten vor. Das Ergebnis erscheint in einem Seitenleisten-Widget der Ticket-Ansicht, mit einer Daumen-hoch- / Daumen-runter-Bewertung pro Feld. Bestätigte Bewertungen werden gespeichert und als Few-Shot-Beispiele bei nachfolgenden Klassifizierungsaufrufen verwendet — das Modell lernt also aus Ihren realen Daten, ohne dass ein erneutes Training nötig wäre.

Extraktion in dynamische Felder über Klartextregeln. Administratoren beschreiben in natürlicher Sprache, was aus dem Ticket-Inhalt extrahiert werden soll — beispielsweise eine Rechnungsnummer in einem bestimmten Format, eine Bestell- oder Seriennummer — und das LLM schreibt den Wert bei jedem neuen Artikel in das vorgesehene dynamische Feld. Keine Regex-Pflege, kein separater Parser pro Format.

Mehrsprachige Ticketzusammenfassungen. Jedes Ticket erhält eine kurze, sachliche Zusammenfassung in zwei bis vier Sätzen, die bei neuen Artikeln und Aktualisierungen neu erzeugt wird. Zusammenfassungen werden pro Sprache gespeichert und in der vom Agenten bevorzugten Sprache angezeigt — Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch und Portugiesisch — sodass ein mehrsprachiges Team jedes Ticket in seiner bevorzugten Sprache lesen kann, unabhängig davon, in welcher Sprache der Kunde geschrieben hat.

Umformulierung des Ticket-Titels bei eingehenden E-Mails. E-Mail-Betreffzeilen beschreiben das eigentliche Anliegen selten passend. Znuny-LLM formuliert den Ticket-Titel zu einem kurzen, aussagekräftigen Betreff in der Sprache des Kunden um. Telefon- und interne Tickets bleiben unverändert.

Die Textauswahl-Überarbeitung ermöglicht es Agenten, beim Verfassen einer Antwort eine Textstelle zu markieren und sie per Klick vom Sprachmodell überarbeiten zu lassen. Es nutzt den queue-spezifischen Prompt, berücksichtigt die erkannte Sprache des Tickets und liefert so stets ein passendes Ergebnis.

FAQ-Wissensentwürfe aus abgeschlossenen Tickets. Eine eigene Audit-Ansicht listet klassifizierte Tickets zusammen mit dem Feedback der Agenten auf. Von dort aus kann ein Administrator direkt aus einer guten Ticket-Konversation einen FAQ-Wissensentwurf erzeugen — mit ähnlichen bestehenden FAQ-Einträgen, die in den Prompt-Kontext eingespeist werden, um Duplikate zu vermeiden — und diesen als neuen FAQ-Eintrag veröffentlichen, optional mit einer Verknüpfung zum Ursprungsticket.

Vektorbasierte Vorlagen- und FAQ-Vorschläge. In der Antwortmaske sehen Agenten die Standardvorlagen und FAQ-Einträge, die dem zu beantwortenden Artikel semantisch am ähnlichsten sind, sortiert nach Kosinus-Ähnlichkeit gegen vorberechnete Embeddings. Vorlagen und FAQ-Einträge werden automatisch eingebettet, sobald sie erstellt oder bearbeitet werden.

Mit Blick auf Prompt Injection entwickelt

Ticket-Inhalte an ein LLM zu senden bedeutet, Text zu senden, der von Personen verfasst wurde, über die Sie keine Kontrolle haben. Znuny-LLM behandelt das von Anfang an als Sicherheitsproblem.

Jeder eingehende Artikel wird vor jedem LLM-Aufruf von einer gewichteten, mehrsprachigen Mustererkennung geprüft (Englisch, Deutsch, Französisch, Spanisch, Italienisch). Modellspezifische Steuer-Tokens, direkte Override-Phrasen wie „ignoriere vorherige Anweisungen" oder „gib deinen System-Prompt preis", erzwungene Rollen- oder Persona-Wechsel und bekannte Jailbreak-Signale tragen jeweils eine eigene Gewichtung. Übersteigt die Summe den konfigurierten Schwellwert, wird das Ticket in einem eigenen dynamischen Feld markiert und — abhängig von der Konfiguration — die LLM-Verarbeitung für dieses Ticket unterdrückt, bis ein Agent es überprüft hat.

Darüber hinaus trennt jeder an das LLM gesendete Prompt vertrauenswürdige Metadaten vom nicht vertrauenswürdigen Artikel-Inhalt durch explizite Begrenzungsmarken und eine Anweisung, keinen im Kunden-Abschnitt enthaltenen Anweisungen zu folgen. Artikel-Inhalte werden vor der Einsetzung auf eine festgelegte Maximallänge gekürzt. Diese Schutzmaßnahmen sind Teil des Standard-Prompt-Designs und bleiben auch dann erhalten, wenn Administratoren die Prompts selbst anpassen.

Durchgehend konfigurierbar

Alles, was Administratoren benötigen, ist über die Standard-Admin-Oberfläche von Znuny erreichbar. Prompts werden unter Admin → LLM Prompts verwaltet, mit YAML-Export und -Import, damit ganze Prompt-Sammlungen sauber zwischen Umgebungen wandern können. Extraktionsregeln liegen unter Admin → LLM Extraction Rules. Das Modul Admin → LLM Audit & FAQ ist der Ort, an dem klassifizierte Tickets geprüft, bedarfsgesteuert Erklärungen zur Klassifizierung erzeugt und gute Tickets zu FAQ-Entwürfen werden. Backend-Auswahl, Modell-Überschreibungen pro Funktion, Rate Limits, Ähnlichkeitsschwellwerte und der Schwellwert der Injection-Erkennung sind allesamt Einstellungen in der Systemkonfiguration.

Modell-Überschreibungen pro Funktion bedeuten, dass für die Klassifizierung ein kleineres, günstigeres Modell laufen kann, während ein größeres die FAQ-Wissensentwürfe übernimmt — oder dass verschiedene Webservices vollständig an unterschiedliche Backends geroutet werden. Das Design setzt nirgends ein einzelnes Modell für jede Aufgabe voraus.

Verfügbarkeit

Znuny-LLM ist ab dem 8. Juli über das Znuny Open Source Repository verfügbar. Bestehende Installationen können das Paket ohne Unterbrechung installieren — die benötigten dynamischen Felder, Datenbanktabellen und Webservices werden automatisch angelegt — und standardmäßig aktive Funktionen lassen sich einzeln abschalten, wenn ein schrittweiser Rollout bevorzugt wird.

Technische Details, Deployment-Schritte und die vollständige Referenz der Systemkonfiguration finden Sie in der Paket-Dokumentation.


Sign Up For Our Newsletter

Bleiben Sie auf dem Laufenden mit Expertentipps, Updates und Einblicken in das Servicemanagement und Znuny.

Sign up now
and stay up-to-date!

We use rapidmail to send our newsletter. When you subscribe, you consent to the entered data being forwarded to rapidmail. Please also see the GTC and data privacy statement.