Sources und Entries
Wie Inhalte in eine Knowledge Base kommen und wie sie zerschnitten werden.
Eine KB wird durch Sources befüllt. Jede Source wird beim Import in Entries zerschnitten — die eigentlich durchsuchbaren Einheiten.
Source hinzufügen
/manage/knowledge-sources/add unter der KB, zu der du importieren willst.
Felder:
- URL: die Quelle, aus der importiert wird
- Beschreibung: interner Name
- Refresh-Intervall (optional): wenn sich die Quelle ändert und automatisch re-importiert werden soll
Typische Quellen:
| Quelltyp | Beispiel |
|---|---|
| Öffentliche Website | https://kunde.de/faq |
| PDF im Web | https://kunde.de/preisliste.pdf |
| Sitemap | https://kunde.de/sitemap.xml — importiert alle dort gelisteten Seiten |
| Hochgeladene Datei | per Formular, bei Upload wird eine interne URL erzeugt |
Import-Ablauf
- Du legst die Source an → Status
pending. - Die Plattform ruft die URL ab → Status
processing. - Inhalt wird zerschnitten und als Entries gespeichert → Status
completed.
Fehler (404, Timeout, Parsing-Problem) → Status failed. Fehlertext siehst du im UI.
Wie zerschnitten wird
Die Import-Logik versucht, Entries an semantischen Grenzen zu trennen:
- Überschriften (H1, H2, H3) starten einen neuen Entry
- Sehr lange Abschnitte werden auf ~500 Tokens Länge begrenzt
- Navigation, Footer, Cookie-Banner werden gefiltert
Das Ergebnis sind Einheiten, die man als Ganzes lesen kann, ohne den Kontext zu verlieren.
Entries ansehen und editieren
/manage/knowledge-entries — Liste aller Entries, filter-/sortierbar. Einzelnen Entry öffnen:
- Titel: das erste Überschriften-Segment
- Keywords: optionale zusätzliche Begriffe (verbessern Suche)
- Content: der eigentliche Text
- Source URL: woher der Entry stammt
Du kannst Entries manuell bearbeiten — typisch, um:
- Störrische Formulierungen zu glätten
- Synonyme als Keywords hinzuzufügen
- Entries zusammenzuführen, die beim Import fälschlich getrennt wurden
Manuell bearbeitete Entries werden bei einem Re-Import nicht überschrieben — sonst würdest du deine Handarbeit jedes Mal verlieren.
Re-Import
Unter der Source: Button Aktualisieren. Lädt die Quelle neu, vergleicht mit bestehenden Entries, fügt Neues hinzu, markiert Gelöschtes (überschreibt aber keine manuell editierten Entries).
Für automatischen Re-Import: Refresh-Intervall bei der Source setzen.
Source löschen
Löscht alle Entries dieser Source mit. Andere Sources in derselben KB bleiben unberührt.
Strategie für gute Qualität
Wenige hochwertige Sources sind besser als viele mittelmäßige.
- Lieber eine gepflegte FAQ-Seite als die ganze Website
- Irrelevante Seiten (Impressum, AGB) rausnehmen, wenn sie keine Nutzerfragen beantworten
- Bei Firmeninfos: ein zentrales Dokument statt zehn Blog-Posts
Nach Änderungen
Änderungen an Entries sind sofort live. Das nächste Such-Tool-Aufruf findet die neuen/editierten Einträge.
Teste nach größeren Änderungen:
tm test-tool searchProductKnowledge query="deine Testfrage"