Gå til hovedinnhold

Chat med dokumenter

Neste steg i informasjonsbehandling

I stedet for å stole på åpne datasett og generell kunnskap, genererer "Chat med dokumenter" kontekstspesifikke svar og analyser basert på dine betrodde interne kilder. Last opp dine dokumenter og bruk disse dokumentene som grunnlag for å svare på spørsmål i chatten!

Løse databegrensninger

Når du stiller spørsmål til en språkmodell, er du avhengig av datasettet modellen er trent på. Dette er vanligvis informasjon hentet fra internett. Ikke-offentlige kilder er sannsynligvis ikke i dette datasettet. Ved å bruke dokumentene dine som kilde for chatten, sørger du for at modellen har den informasjonen du trenger for å besvare dine spørsmål.

Muligheter med dokumentene dine

Du kan stille spørsmål om dokumentene dine, for eksempel å nevne hovedpunktene i et dokument eller å oppsummere dokumentet. Du kan også få språkmodellen til å utføre spesifikke analyser ved hjelp av ditt eget datasett.

Ulemper ved dokumentbasert chat

Opplasting av dokumenter og behandlingen av dem er ekstra steg som du slipper hvis du også kan få et tilfredsstillende svar uten kontekst av spesifikk informasjon. Det tar også lengre tid å generere et svar fordi nødvendig informasjon må hentes fra dokumentet før forespørselen kan sendes til språkmodellen.

Bak kulissene ved chat med dokumenter

Teksten fra dokumentene du laster opp blir hentet ut av dokumentet og delt opp i biter. Disse bitene har et fast antall tegn (1024 tegn) og vi har også en overlapping satt (128 tegn) mellom bitene. Hver bitetekst lagres som en vektor i en vektor-database. Ved hvert spørsmål blir disse dataene filtrert og valgt basert på likhet med spørsmålet som stilles.

Utvelgelsesprosess for dokumentfragmenter

Biter av tekstene er allerede omgjort til vektorer. Vektorene har flere dimensjoner som angir hvor "lik" denne teksten er i forhold til annen tekst. Tenk på RGB-fargesystemet. En farge med tilsvarende RGB-verdi er også en tilsvarende farge, men litt annerledes. Vektor-databasen gjør det mulig for oss å hente ut biter av tekst ordnet og filtrert basert på spørsmålet som stilles. Vi velger maksimalt 100 tekstbiter på 1024 tegn å ta med i forespørselen.

Passende modeller for dokumentbasert chat

Vi har valgt modeller med et stort kontekstvindu for å gjøre det mulig å chatte med dokumenter. Vi ønsker å kunne sende maksimalt 100 biter av 1024 tegn. Dette er mer enn 100 000 tegn. Bruk derfor helst en høy-kvalitets språkmodell fra den sentrale modellkatalogen.

Passende modeller

Passende modeller er modeller med tilstrekkelig kontekstmasse og god dokumentanalyse, som høy-kvalitetsmodellene fra OpenAI, Claude, Google eller European AI.

Velg ett eller flere dokumenter

Du kan aktivere filmodus ved å klikke på binders-ikonet til høyre i spørsmålspanelet. Du kan velge opptil 10 filer å chatte med.

Filer du laster opp, blir først behandlet. Når behandlingen er ferdig, kan AI-School bruke innholdet i chatten, i assistenter og i arbeidsflyter. Hvis behandlingen mislykkes, får filen en feilkode og du må laste opp filen på nytt eller be om ny behandling.

Passende språkmodeller

Når du begynner å chatte med dokumenter, blir det sjekket om språkmodellen er egnet for chat med dokumenter. Hvis ikke, velges automatisk et passende modell fra den aktuelle katalogen.

Chat med dokumenter

Du chatter med disse dokumentene så lenge filmodus er på.

Administrere filer og ny behandling

I Filbehandling ser du filene du har lastet opp eller som AI-School har laget. For PDF-filer kan du via handlingsmenyen behandle en fil på nytt. Dette erstatter eksisterende tekstanalyse med en ny prosess.

For PDF-er kan AI-School bruke den vanlige tekstlaget og, når det er nødvendig, gjennomføre en mer omfattende PDF-analyse. Denne analysen er spesielt nyttig ved:

  • skannede PDF-er
  • utfylte skjemaer
  • håndskrevne svar
  • omkryssede eller understrekte valg
  • tabeller, figurer og annen visuell informasjon

Ved store PDF-er kan behandlingen ta lengre tid. AI-School deler store dokumenter opp i deler der det er nødvendig, slik at også lengre PDF-er kan behandles.

Velg eksisterende filer

Når et skjema eller arbeidsflyt ber om en fil, kan du ikke bare laste opp nye filer, men også velge eksisterende filer via mediabehandleren. Slik trenger du ikke å laste opp et prøvemål, rettningsmodell eller annet kilde-dokument hver gang.

Filer som legges til via et slikt skjema, vises blant assistentfiler for chatten. De blir ikke automatisk valgt for vanlige chat-spørsmål, med mindre du selv aktiverer dem.

Behandle per fil

I tillegg til å chatte med dokumenter, tilbyr AI-School også muligheten til å bruke en prompt separat på hvert dokument og få individuelle svar. Denne funksjonen kalles Behandle per fil.

Behandle per fil

Denne funksjonen kan brukes i kombinasjon med "Chat med filer".

Mulig scenario

Et praktisk eksempel på bruk av "Behandle per fil":

  1. Du laster opp testen og svarmodellen og setter disse til ved Chat med filer
  2. Du laster opp flere innleverte tester og setter disse til ved Behandle per fil
  3. Du formulerer en prompt, som blir anvendt på alle filer individuelt

På denne måten kan du for eksempel få alle innsendte tester automatisk vurdert basert på svarmodellen.

Maks antall filer

Det gjelder en maksgrense på 30 filer for funksjonen "Behandle per fil".

Støttede filtyper

AI-School støtter ulike filtyper for chat med dokumenter:

  • PDF-filer som ender på .pdf
  • Word-filer som ender på .docx
  • CSV-filer som ender på .csv
  • JSON-filer som ender på .json
  • Tekstfiler som ender på .txt
  • Markdown-filer som ender på .md
  • Lyd- og videofiler med utvidelsene 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' eller 'webm'

Chat med lyd eller videofiler

For chat med lyd eller videofiler bruker AI-School OpenAI-modellen Whisper.

Etter tekstuttrekking kan et passende tekstmodell brukes for å kontrollere og korrigere interpunktion og rettskrivning.

Deretter følger samme prosedyre som ved uttrekking fra PDF- eller Word-dokumenter.

Whisper har en grense på 25 MB per lyd- eller videofil. Vi følger derfor samme grense ved opplasting av nye filer.

Filer du kan laste ned som eksempel

Groot historia dokument