TaskMonkey Handbuch

Sources und Entries

Wie Inhalte in eine Knowledge Base kommen und wie sie zerschnitten werden.

Eine KB wird durch Sources befüllt. Jede Source wird beim Import in Entries zerschnitten — die eigentlich durchsuchbaren Einheiten.

Source hinzufügen

/manage/knowledge-sources/add unter der KB, zu der du importieren willst.

Felder:

  • URL: die Quelle, aus der importiert wird
  • Beschreibung: interner Name
  • Refresh-Intervall (optional): wenn sich die Quelle ändert und automatisch re-importiert werden soll

Typische Quellen:

Quelltyp Beispiel
Öffentliche Website https://kunde.de/faq
PDF im Web https://kunde.de/preisliste.pdf
Sitemap https://kunde.de/sitemap.xml — importiert alle dort gelisteten Seiten
Hochgeladene Datei per Formular, bei Upload wird eine interne URL erzeugt

Import-Ablauf

  1. Du legst die Source an → Status pending.
  2. Die Plattform ruft die URL ab → Status processing.
  3. Inhalt wird zerschnitten und als Entries gespeichert → Status completed.

Fehler (404, Timeout, Parsing-Problem) → Status failed. Fehlertext siehst du im UI.

Wie zerschnitten wird

Die Import-Logik versucht, Entries an semantischen Grenzen zu trennen:

  • Überschriften (H1, H2, H3) starten einen neuen Entry
  • Sehr lange Abschnitte werden auf ~500 Tokens Länge begrenzt
  • Navigation, Footer, Cookie-Banner werden gefiltert

Das Ergebnis sind Einheiten, die man als Ganzes lesen kann, ohne den Kontext zu verlieren.

Entries ansehen und editieren

/manage/knowledge-entries — Liste aller Entries, filter-/sortierbar. Einzelnen Entry öffnen:

  • Titel: das erste Überschriften-Segment
  • Keywords: optionale zusätzliche Begriffe (verbessern Suche)
  • Content: der eigentliche Text
  • Source URL: woher der Entry stammt

Du kannst Entries manuell bearbeiten — typisch, um:

  • Störrische Formulierungen zu glätten
  • Synonyme als Keywords hinzuzufügen
  • Entries zusammenzuführen, die beim Import fälschlich getrennt wurden

Manuell bearbeitete Entries werden bei einem Re-Import nicht überschrieben — sonst würdest du deine Handarbeit jedes Mal verlieren.

Re-Import

Unter der Source: Button Aktualisieren. Lädt die Quelle neu, vergleicht mit bestehenden Entries, fügt Neues hinzu, markiert Gelöschtes (überschreibt aber keine manuell editierten Entries).

Für automatischen Re-Import: Refresh-Intervall bei der Source setzen.

Source löschen

Löscht alle Entries dieser Source mit. Andere Sources in derselben KB bleiben unberührt.

Strategie für gute Qualität

Wenige hochwertige Sources sind besser als viele mittelmäßige.

  • Lieber eine gepflegte FAQ-Seite als die ganze Website
  • Irrelevante Seiten (Impressum, AGB) rausnehmen, wenn sie keine Nutzerfragen beantworten
  • Bei Firmeninfos: ein zentrales Dokument statt zehn Blog-Posts

Nach Änderungen

Änderungen an Entries sind sofort live. Das nächste Such-Tool-Aufruf findet die neuen/editierten Einträge.

Teste nach größeren Änderungen:

tm test-tool searchProductKnowledge query="deine Testfrage"
Zuletzt aktualisiert: 2026-04-19