Vai al contenuto principale

Chat con documenti

Il passo successivo nell'elaborazione delle informazioni

Invece di fare affidamento su set di dati pubblici e conoscenze generali, "Chat con Documenti" genera risposte e analisi contestualizzate basate sulle tue fonti interne fidate. Carica i tuoi documenti e usa questi documenti come base per rispondere alle domande nella chat!

Risoluzione dei limiti dei dati

Se fai domande a un modello linguistico, dipendi dal set di dati su cui è stato addestrato. In genere è informazioni prese da internet. Fonti non pubbliche probabilmente non sono presenti in questo set. Usando i tuoi documenti come fonte per la chat, sai che il modello dispone delle informazioni necessarie per rispondere alle tue domande.

Possibilità con i tuoi documenti

Puoi porre domande sui tuoi documenti, come elencare i punti principali di un documento o riassumerlo. Puoi anche far eseguire analisi specifiche al modello linguistico utilizzando il tuo set di dati.

Svantaggi della chat basata sui documenti

Il caricamento e l’elaborazione dei documenti comportano passaggi extra che non devi fare se puoi ottenere una risposta adeguata anche senza il contesto di informazioni specifiche. Inoltre, impiega più tempo generare una risposta perché prima bisogna estrarre le informazioni necessarie dal documento prima di inviare la richiesta al modello linguistico.

Dietro le quinte della chat con documenti

Il testo dai documenti che carichi viene estratto dal documento e suddiviso in pezzi. Questi pezzi hanno un numero fisso di caratteri (1024 caratteri) e abbiamo anche impostato un overlap (128 caratteri) tra i pezzi. Ogni frammento di testo viene memorizzato come vettore in un database vettoriale. Ad ogni domanda viene effettuata una selezione dai dati in base alla somiglianza con la domanda posta.

Processo di selezione dei frammenti di documento

I pezzi di testo sono già stati convertiti in vettori. I vettori hanno diverse dimensioni che indicano quanto è “simile” questo testo ad altri testi. Pensaci come al sistema di colori RGB. Un colore con valore RGB simile è anche un colore simile ma leggermente diverso. Il database vettoriale ci permette di recuperare i pezzi di testo ordinati e filtrati in base alla domanda posta. Selezioniamo al massimo 100 pezzi di testo di 1024 caratteri da inviare insieme alla domanda.

Modelli adatti per chat basate sui documenti

Abbiamo selezionato modelli con una grande finestra contestuale per consentire di chattare con i documenti. Vogliamo poter inviare al massimo 100 frammenti di testo da 1024 caratteri. Questo è più di 100.000 caratteri. Per questo, preferisci utilizzare un modello linguistico di alta qualità dalla catalogo centrale dei modelli.

Modelli adatti

I modelli adatti sono modelli con spazio contestuale sufficiente e buona analisi dei documenti, come i modelli di alta qualità di OpenAI, Claude, Google o European AI.

Seleziona uno o più documenti

Puoi attivare la modalità file facendo clic sull'icona a clip sul lato destro della barra delle domande. Puoi scegliere fino a 10 file per chattare.

I file caricati vengono elaborati prima. Una volta elaborati, AI-School può usare il contenuto nella chat, negli assistenti e nei flussi di lavoro. Se l’elaborazione fallisce, il file ottiene uno status di errore e devi caricarlo di nuovo o elaborarlo di nuovo.

Modelli linguistici adatti

Nel momento in cui inizi a chattare con documenti, viene verificato se il modello linguistico è adatto per chat con documenti. Se non lo è, viene automaticamente selezionato un modello idoneo dall'attuale catalogo.

Chat con documenti

Puoi chattare con questi documenti finché la modalità file resta attiva.

Gestione dei file e nuova elaborazione

In Gestione file vedi i file caricati o creati da AI-School. Per i file PDF puoi utilizzare nel menù azioni una nuova elaborazione del file. Questo sostituisce l'estrazione di testo esistente con una nuova elaborazione.

Con i PDF, AI-School può utilizzare lo strato di testo normale e, quando necessario, eseguire un’analisi PDF più approfondita. Questa analisi è utile soprattutto per:

  • PDF scansionati
  • moduli compilati
  • risposte manoscritte
  • scelte cerchiate o sottolineate
  • tabelle, figure e altre informazioni visive

Con file PDF grandi l’elaborazione può richiedere più tempo. AI-School divide grandi documenti in parti dove necessario, in modo che anche PDF lunghi possano essere elaborati.

Selezionare file esistenti

Quando un modulo o un flusso di lavoro richiede un file, non devi solo caricare nuovi file, ma puoi anche scegliere file esistenti tramite l'amministratore multimediale. Così non devi caricare ripetutamente una domanda, un modello di correzione o un altro documento sorgente.

I file aggiunti tramite un modulo di questo tipo appaiono tra i file dell’assistente della chat. Non vengono automaticamente selezionati per domande di chat normali, a meno che non li abiliti tu stesso.

Elaborazione per singolo file

Oltre alla chat con documenti, AI-School offre anche la possibilità di applicare una prompt separata a ciascun documento e ricevere risposte individuali. Questa funzione si chiama Elaborazione per file.

Elaborazione per file

Questa funzione può essere utilizzata in combinazione con "Chat con file".

scenario possibile

Un esempio pratico di utilizzo di "Elaborazione per file":

  1. Carichi la prova e il modello di risposta e li abiliti in Chat con file
  2. Carichi diverse prove inviate e le abiliti in Elaborazione per file
  3. Formuli una prompt, che viene applicata a tutti i file individualmente

In questo modo puoi ad esempio far valutare automaticamente tutte le prove inviate in base al modello di risposta.

Numero massimo di file

Esiste un massimo di 30 file per la funzione "Elaborazione per file".

Tipi di file supportati

AI-School supporta diversi tipi di file per la chat con documenti:

  • file PDF con estensione .pdf
  • file Word con estensione .docx
  • file CSV con estensione .csv
  • file JSON con estensione .json
  • file di testo con estensione .txt
  • file Markdown con estensione .md
  • file audio e video con estensioni 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'

Chat con file audio o video

Per la chat con file audio o video, AI-School usa il modello Whisper di OpenAI.

Dopo l’estrazione del testo, può essere utilizzato un modello di testo idoneo per controllare e correggere punteggio e ortografia.

Quindi segue la stessa procedura di estrazione da PDF o Word.

Whisper ha un limite di 25 MB per file audio o video. Manteniamo quindi lo stesso limite anche per il caricamento di nuovi file.

File che puoi scaricare come esempio

Grosso documento storico