Tekst-til-tale-modeller
AI-School understøtter tekst-til-tale-modeller, som kan omdanne tekst til lyd. Disse modeller bruges i Tekst til audio på dashboards og i funktioner, der genererer lyd fra en chat.
Nuværende katalog
| Udbyder | Model | Bemærkning |
|---|---|---|
| OpenAI | GPT-4o mini TTS | Naturligt klingende tale med god styring af tone og stil. |
| Gemini 3.1 Flash TTS Preview | Nyt Gemini-talesystem med præcis styring af stil, tempo og tone. | |
| Europæisk AI | Voxtral Mini TTS | Europæisk text-to-speech baseret på Mistral Voxtral Mini. |
Claude har ikke nogen egen tekst-til-tale-model i kataloget. Hvis Claude er aktiveret som udbyder, forbliver tale-modellerne afhængige af de øvrige konfigurerede udbydere.
Hvad et tale-model bestemmer
Et tale-model bestemmer, hvordan teksten udtales og hvilke muligheder der er tilgængelige. Tænk på:
- de tilgængelige stemmer;
- de sprog, en stemme understøtter;
- kvaliteten og naturligheden af udtalelsen;
- den måde, instruktioner om tempo, tone, aksent og udtale følges op på.
Stemmer og sprog
Tilgængelige stemmer varierer efter udbyder. AI-School viser ved tekst til audio kun stemmer, der passer til det valgte sprog, eller stemmer der er egnede til flere sprog. Hvis en stemme kun er beregnet til visse sprog, står det på stemmens navn med.
OpenAI og Google understøtter de fleste sprog i kataloget. Voxtral Mini TTS understøtter et mindre sæt sprog, herunder dansk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.
Systemprompt
Ved tekst til audio kan systemprompten bruges til at styre udtale og stil. Du kan for eksempel angive, at dansk skal lyde naturligt, at termer som AI, AI-School, ChatGPT og OpenAI må udtales på engelsk, eller at Claude skal lyde som et fransk navn.
Præferencer
Brugere kan gemme deres tekst-til-audio-indstillinger som personlige præferencer. Så behøver model, sprog, stemme og udtaleinstruktioner ikke vælges igen og igen.