Erfahren Sie, wie das Hochladen von PDF-Dateien während des Chats verwendet werden kann.
Temporärer Dokumentabruf (Tmp Doc Retrieval) ermöglicht es der Pipeline, relevante Inhalte aus vom Benutzer hochgeladenen Dokumenten während einer Konversation in der Chat-Benutzeroberfläche abzurufen. Diese Funktion ist besonders nützlich, wenn Benutzerfragen beantwortet werden, die auf konversationsspezifischen Dokumenten beruhen, die in Echtzeit hochgeladen werden. Sie verbessert den Kontext für Antworten, indem sie Informationen direkt aus vom Benutzer bereitgestellten Dateien einbezieht.

Um die TMP Doc Retrieval-Funktion verwenden zu können, muss sie zuerst aktiviert und ordnungsgemäß konfiguriert werden. Navigieren Sie zu den Einstellungen Ihres Projekts, gehen Sie zum Tab „PDF-Upload“ und aktivieren Sie die Option „Datei-Upload zulassen“. Stellen Sie außerdem sicher, dass die maximale Dateigröße, die maximale Ordnergröße und die Spracheinstellungen konfiguriert sind. Richten Sie die Extraktionskonfiguration ein, indem Sie einen PDF-Extraktor auswählen und bei Bedarf die erforderlichen Umgebungsvariablen und LLM-Einstellungen angeben. Konfigurieren Sie die Transformationseinstellungen, indem Sie einen LLM-Anbieter auswählen, den API-Schlüssel eingeben und ein Modell auswählen. Nach der vollständigen Einrichtung können Benutzer Dokumente zur Beantwortung von Fragen in die Chat-Benutzeroberfläche hochladen.

Nach der Aktivierung kann die Projektpipeline den Strategieschritt zum Abrufen integrieren. Dieser Schritt bietet mehrere Konfigurationsoptionen zur Feinabstimmung des Abrufvorgangs: Mit „Zu erfassende Einträge“ können Sie angeben, wie viele ähnliche Einträge pro Abfrage abgerufen werden sollen; „TF-IDF Minimum Data Frequency“ passt den Schwellenwert für die Häufigkeit von Term Frequency-Inverse Document Frequency (TF-IDF) an, um die Ergebnisfilterung zu verbessern; und „Sucheingabe“ passt die für die Abfrage verwendete Sucheingabe an. Standardmäßig wird die Frage des Benutzers verwendet, sie kann jedoch geändert werden, um Abfragevariationen oder benutzerdefinierte Ausgaben früherer Schritte zu berücksichtigen.

Wenn Benutzer Dokumente hochladen, wird der ETL-Vorbereitungsprozess in Echtzeit in der Chat-Oberfläche angezeigt. Auf diese Weise können Benutzer den Fortschritt der Dokumentenanalyse verfolgen, und die Pipeline beginnt erst mit der Strategieausführung, wenn der Prozess abgeschlossen ist. Benutzer können die angehängten Dateinamen auch im aktuellen Chat einsehen, was für Transparenz darüber sorgt, welche Dokumente zur Generierung von Antworten verwendet werden. Um die Geschwindigkeit zu erhöhen, kann das System Extraktionen und Transformationen der angegebenen Dokumente je nach Organisation, hochgeladenen Dateien und Konfigurationseinstellungen intern zwischenspeichern. Zwischengespeicherte Dateien ermöglichen es dem System, Teile des ETL-Prozesses zu überspringen und die Antwortzeiten erheblich zu verlängern. Die Chat-spezifischen Dateien werden auf MiniO gespeichert und nach zwei Wochen gelöscht, um Speicherplatz freizugeben. Die entsprechende Konversation wird archiviert (Abschnitt „Daten hochladen“).