TaskMonkey Handbuch

Datei-Uploads

Bilder und PDFs in den Chat hängen — was passiert dahinter.

Du kannst Dateien direkt in den Chat ziehen oder übers Paperclip-Icon anhängen. Das Modell sieht den Inhalt abhängig vom Typ unterschiedlich.

Unterstützte Formate

Format Verarbeitung
JPEG, PNG, WebP Direkt als Bild ans Modell (Vision)
HEIC / HEIF Wird serverseitig zu JPEG konvertiert
PDF Text extrahiert, als Platzhalter referenziert

Bild-Uploads

Bilder werden base64-encodiert und als image_url-Inhalt an das LLM geschickt. Das Modell kann dann „sehen" — Diagramme beschreiben, Text aus Screenshots lesen, Objekte erkennen.

Kosten: Bilder verbrauchen deutlich mehr Tokens als Text. Halte sie so klein wie möglich.

PDF-Uploads

PDFs werden nicht direkt ans Modell geschickt (zu groß). Stattdessen:

  1. Server extrahiert den Text.
  2. Der Text wird in der DB gespeichert, mit einem eindeutigen PDF-Key.
  3. Das Modell sieht einen Platzhalter wie <PDF:abc-123>.
  4. Wenn ein Tool den Platzhalter in seinen Args stehen hat, löst der ToolRunner ihn beim Aufruf zum echten Inhalt auf.

Das spart massiv Tokens und erlaubt, das PDF über mehrere Tool-Aufrufe hinweg zu benutzen, ohne es jedes Mal neu zu schicken.

Siehe auch Platzhalter-Referenz.

Größen-Limits

  • Bilder: praktisch begrenzt durch PHP upload_max_filesize (typisch 10 MB)
  • PDFs: dasselbe Limit gilt für den Upload, der extrahierte Text ist danach irrelevant

Wenn dein Workspace häufig große PDFs bekommt, lass den Betreiber die Limits anpassen.

Mehrere Dateien pro Nachricht

Aktuell unterstützt: ein Upload pro Nachricht. Willst du mehrere, sende mehrere Nachrichten hintereinander — das Modell kann dann im Verlauf auf alle zugreifen.

Mehrere Bilder in einer Nachricht sind auf der Roadmap.

Sicherheit

Hochgeladene Dateien werden:

  • im Workspace isoliert abgelegt
  • mit der chat_id verknüpft
  • nach Aufbewahrungsfrist (konfigurierbar) automatisch gelöscht

Sensible Dokumente kannst du im Chat verwenden, aber halte im Hinterkopf, dass sie ggf. an den externen LLM-Provider (OpenAI, Anthropic) übertragen werden. Bei Geheimhaltungs-Anforderungen sprich mit dem Betreiber über On-Premise-Modelle.

Zuletzt aktualisiert: 2026-04-19