Tekst-til-tale-modeller
AI-School støtter tekst-til-tale-modeller som konverterer tekst til lyd. Disse modellene brukes i Tekst til lyd på dashbordet og i funksjoner som genererer lyd fra en chat.
Nåværende katalog
| Leverandør | Modell | Merknad |
|---|---|---|
| OpenAI | GPT-4o mini TTS | Naturlig klingende tale med god styring av tone og stil. |
| Gemini 3.1 Flash TTS Preview | Nytt Gemini-taleprodukt med presis styring av stil, tempo og tone. | |
| Europeisk AI | Voxtral Mini TTS | Europeisk tekst-til-tale basert på Mistral Voxtral Mini. |
Claude har ingen egen tekst-til-tale-modell i katalogen. Hvis Claude som leverandør er aktivert, forblir talemodellene avhengig av andre konfigurerte tilbydere.
Hva et taleprodukt bestemmer
Et taleprodukt bestemmer hvordan teksten uttales og hvilke muligheter som er tilgjengelige. Tenk på:
- de tilgjengelige stemmene;
- språkene en stem støtter;
- kvaliteten og naturligheten i uttalen;
- måten instruksjoner om tempo, tone, aksent og uttale følges opp på.
Stemmer og språk
Tilgjengelige stemmer varierer mellom leverandører. AI-School viser i tekst til lyd kun stemmer som passer til valgte språk, eller stemmer som er egnet for flere språk. Hvis en stem er ment for bare visse språk, står språket ved stemmen.
OpenAI og Google støtter de fleste språk i katalogen. Voxtral Mini TTS støtter et mindre sett språk, inkludert nederlandsk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.
Systeemprompt
Ved tekst til lyd kan systeemprompten brukes for å styre uttale og stil. Du kan for eksempel indikere at nederlandsk skal høres naturlig ut, at termer som AI, AI-School, ChatGPT og OpenAI kan uttales på engelsk, eller at Claude skal høres som et fransk navn.
Preferanser
Brukere kan lagre sine tekst-til-lyd-innstillinger som personlige preferanser. Dermed trenger ikke modell, språk, stemme og uttaleinstruksjoner å velges på nytt hver gang.