Chat met documenten

De volgende stap in informatieverwerking

In plaats van te vertrouwen op openbare datasets en algemene kennis, genereert "Chat met Documenten" context-specifieke antwoorden en analyses op basis van jouw vertrouwde interne bronnen. Upload jouw documenten en gebruik deze documenten als basis voor het beantwoorden van vragen in de chat!

Oplossen van gegevensbeperkingen

Als je vragen stelt aan een taalmodel ben je afhankelijk van de dataset waarmee het model is getraind. Dit is over het algemeen informatie die van het internet is gehaald. Niet-openbare bronnen staan waarschijnlijk niet in deze dataset. Door jouw documenten als bron voor de chat te gebruiken, weet je zeker dat het model over de informatie beschikt die jij nodig hebt voor het beantwoorden van jouw vragen.

Mogelijkheden met jouw documenten

Je kunt vragen stellen over jouw documenten zoals het opnoemen van de hoofdpunten van een document of het samenvatten van het document. Ook kun je specifieke analyses laten uitvoeren door het taalmodel met behulp van jouw eigen dataset.

Nadelen van documentgebaseerd chatten

Het uploaden van documenten en het verwerken hiervan zijn extra stappen die je niet hoeft te zetten als je ook zonder de context van specifieke informatie prima antwoord kunt krijgen. Ook duurt het langer om een antwoord te genereren omdat er eerst de benodigde informatie uit het document moet worden opgehaald voordat het verzoek naar het taalmodel kan worden gestuurd.

Achter de schermen van chatten met documenten

De tekst uit de documenten die jij uploadt, wordt uit het document gehaald en opgedeeld in stukken. Deze stukken hebben een vast aantal tekens (1024 tekens) en we hebben ook een overlap ingesteld (128 tekens) tussen de stukken. Elk brokje tekst wordt opgeslagen als een vector in een vector database. Bij elke vraag wordt uit deze gegevens een selectie gemaakt op basis van gelijkenis met de vraag die wordt gesteld.

Selectieproces van documentfragmenten

De stukjes tekst zijn al omgezet in vectoren. Vectoren hebben meerdere dimensies die aangeven hoe “gelijk” deze tekst is aan andere tekst. Denk aan het RGB kleurensysteem. Een kleur met een vergelijkbare RGB waarde is ook een vergelijkbare kleur maar net anders. De vector database stelt ons dus in staat om de stukken tekst gerangschikt en gefilterd op te halen op basis van de vraag die wordt gesteld. We selecteren maximaal 100 stukken tekst van 1024 tekens om mee te sturen met de vraag.

Geschikte modellen voor documentgebaseerd chatten

We hebben modellen geselecteerd met een groot contextvenster om het mogelijk te maken om te chatten met documenten. We willen maximaal 100 stukken tekst van 1024 tekens mee kunnen sturen. Dit zijn meer dan 100.000 tekens. Gebruik hiervoor bij voorkeur een hoogwaardig taalmodel uit de centrale modelcatalogus.

Geschikte modellen

Geschikte modellen zijn modellen met voldoende contextruimte en goede documentanalyse, zoals de hoge-kwaliteitmodellen van OpenAI, Claude, Google of Europese AI.

Selecteer een of meerdere documenten

Je kunt de bestandsmodus aanzetten door op de paperclip te klikken aan de rechterkant van de vraagbalk. Je kunt dat tot 10 bestanden kiezen om mee te chatten.

Bestanden die je uploadt worden eerst verwerkt. Zodra de verwerking klaar is, kan AI-School de inhoud gebruiken in de chat, in assistenten en in workflows. Als de verwerking mislukt, krijgt het bestand een foutstatus en moet je het bestand opnieuw uploaden of opnieuw laten verwerken.

Geschikte taalmodellen

Op het moment dat je gaat chatten met documenten, wordt gecontroleerd of het taalmodel geschikt is voor chatten met documenten. Als dit niet het geval is, dan wordt automatisch een geschikt model uit de actuele catalogus geselecteerd.

Chat met documenten

Je chat met deze documenten zolang de bestandsmodus aanstaan.

Bestanden beheren en opnieuw verwerken

In Bestandsbeheer zie je de bestanden die je hebt geupload of die door AI-School zijn gemaakt. Bij PDF-bestanden kun je via het actiemenu een bestand opnieuw verwerken. Dit vervangt de bestaande tekstextractie door een nieuwe verwerking.

Bij PDF's kan AI-School de gewone tekstlaag gebruiken en, wanneer dat nodig is, een uitgebreidere PDF-analyse uitvoeren. Deze analyse is vooral nuttig bij:

gescande PDF's
ingevulde formulieren
handgeschreven antwoorden
omcirkelde of onderstreepte keuzes
tabellen, figuren en andere visuele informatie

Bij grote PDF's kan de verwerking langer duren. AI-School splitst grote documenten waar nodig op in delen, zodat ook langere PDF's verwerkt kunnen worden.

Bestaande bestanden kiezen

Wanneer een formulier of workflow om een bestand vraagt, kun je niet alleen nieuwe bestanden uploaden, maar ook bestaande bestanden kiezen via de mediabeheerder. Zo hoef je een toets, nakijkmodel of ander brondocument niet telkens opnieuw te uploaden.

Bestanden die via zo'n formulier worden toegevoegd, verschijnen bij de assistentbestanden van de chat. Ze worden niet automatisch geselecteerd voor gewone chatvragen, tenzij je ze daar zelf inschakelt.

Tekst naar document

Met Tekst naar document kun je vanuit de chat documenten laten maken. Deze modus is bedoeld voor twee soorten documenten:

Vrij document — AI-School maakt een opgemaakt HTML-document dat je steeds verder kunt verbeteren met vervolgprompts.
Template — je kiest een Word-template met vaste invulvelden. AI-School vult dan het bijbehorende formulier op basis van de chat.

Lees de volledige uitleg in Documenten maken.

Als er geen documenttemplates beschikbaar zijn, start AI-School direct met een vrij document. Als er wel templates zijn ingesteld, kies je eerst tussen Vrij document en één van de beschikbare templates.

Vrij document maken

Bij een vrij document staat links de chat en rechts de documentvoorvertoning. Iedere prompt maakt een nieuwe versie van het document. Je kunt terug naar eerdere versies via de versiebalk naast de voorvertoning.

In de instellingen kun je onder andere kiezen voor:

document of presentatie
staand of liggend
logo links, midden, rechts of geen logo
logoformaat
documentstijl

De opmaak gebruikt de branding van de school of omgeving. Als er geen eigen branding is ingesteld, valt AI-School terug op de standaardhuisstijl.

Gebruik annotaties om precies aan te wijzen welk deel van het document aangepast moet worden. De annotaties worden met je volgende prompt meegestuurd, zodat je bijvoorbeeld gericht kunt zeggen dat een titel, blok of tabel anders moet.

Je kunt ook bestanden toevoegen aan de documentprompt, bijvoorbeeld een opname van een vergadering, een PDF of een bestaand Word-document. De AI gebruikt die inhoud dan als context voor het nieuwe document.

Vrije documenten kun je exporteren als PDF. De PDF gebruikt dezelfde documentrichting als de ingestelde voorvertoning.

Template invullen

Bij een template verschijnt rechts een formulier. De AI vult velden zodra informatie uit de chat beschikbaar is. Je kunt de velden daarna zelf controleren en aanpassen voordat je het document genereert.

Voorbeelden:

Je uploadt een opname van een vergadering en vraagt om vergadernotulen. De AI vult deelnemers, agendapunten en actiepunten in.
Je kiest een brief-template en beschrijft de ontvanger, het onderwerp en de boodschap. De AI vult het formulier en maakt daarna het Word-document.
Je kiest een toets-template en geeft onderwerp, leerjaar, niveau en duur door.

Na het genereren kun je het Word-document bekijken en downloaden. De opmaak komt uit het Word-template, zodat het document bewerkbaar blijft.

Controleer het formulier

Templatevelden kunnen automatisch worden ingevuld, maar controleer het formulier altijd voordat je het document genereert. Vooral datums, namen, actiepunten en bedragen vragen vaak om een laatste menselijke controle.

Per bestand verwerken

Naast het chatten met documenten, biedt AI-School ook de mogelijkheid om een prompt apart toe te passen op elk document en individuele antwoorden te ontvangen. Deze functie heet Per bestand verwerken.

Per bestand verwerken

Deze functie kan worden gebruikt in combinatie met "Chat met bestanden".

Mogelijk scenario

Een praktisch voorbeeld van het gebruik van "Per bestand verwerken":

Je uploadt de toets en het antwoordmodel en zet deze aan bij Chat met bestanden
Je uploadt meerdere ingeleverde toetsen en zet deze aan bij Per bestand verwerken
Je formuleert een prompt, die toegepast wordt op alle bestanden individueel van elkaar

Op deze manier kun je bijvoorbeeld alle ingeleverde toetsen automatisch laten beoordelen op basis van het antwoordmodel.

Maximum aantal bestanden

Er geldt een maximum van 30 bestanden voor de functie "Per bestand verwerken".

Ondersteunde bestandstypen

AI-School ondersteunt verschillende bestandstypen voor het chatten met documenten:

PDF bestanden uitkomend op .pdf
Word bestanden uitkomend op .docx
CSV bestanden uitkomend op .csv
JSON bestanden uitkomend op .json
Tekst bestanden uitkomend op .txt
Markdown bestanden uitkomend op .md
Audio en video bestanden met de extensies 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' of 'webm'

Chatten met audio of video bestanden

Voor het chatten met audio of video bestanden laat AI-School het bestand eerst transcriberen via de ingestelde transcriptieprovider, bijvoorbeeld OpenAI of Europese AI. De concrete modellen komen uit de centrale modelcatalogus.

Bij gesprekken kan de transcriptie ook tijdsblokken en sprekerlabels bevatten wanneer het gekozen transcriptiemodel dat ondersteunt. Daarna kan een geschikt tekstmodel worden gebruikt om interpunctie, spelling, sprekerlabels en vaktermen te corrigeren.

Daarna volgt dezelfde procedure als extractie uit PDF of Word documenten.

Audio- en videomodellen hebben provider- en modelafhankelijke limieten voor bestandsgrootte en duur. Lange bestanden kunnen daarom anders verwerkt worden dan korte bestanden. Als verwerking mislukt, controleer dan de bestandsstatus en probeer het bestand opnieuw te verwerken of in kleinere delen aan te leveren.

Bestanden die je als voorbeeld kunt downloaden

Groot geschiedenis document

Oplossen van gegevensbeperkingen​

Mogelijkheden met jouw documenten​

Nadelen van documentgebaseerd chatten​

Achter de schermen van chatten met documenten​

Selectieproces van documentfragmenten​

Geschikte modellen voor documentgebaseerd chatten​

Selecteer een of meerdere documenten​

Bestanden beheren en opnieuw verwerken​

Bestaande bestanden kiezen​

Tekst naar document​

Vrij document maken​

Template invullen​

Per bestand verwerken​

Mogelijk scenario​

Ondersteunde bestandstypen​

Chatten met audio of video bestanden​

Bestanden die je als voorbeeld kunt downloaden​

Oplossen van gegevensbeperkingen

Mogelijkheden met jouw documenten

Nadelen van documentgebaseerd chatten

Achter de schermen van chatten met documenten

Selectieproces van documentfragmenten

Geschikte modellen voor documentgebaseerd chatten

Selecteer een of meerdere documenten

Bestanden beheren en opnieuw verwerken

Bestaande bestanden kiezen

Tekst naar document

Vrij document maken

Template invullen

Per bestand verwerken

Mogelijk scenario

Ondersteunde bestandstypen

Chatten met audio of video bestanden

Bestanden die je als voorbeeld kunt downloaden