Tekst-til-tale-modeller

AI-School understøtter tekst-til-tale-modeller, som kan omdanne tekst til lyd. Disse modeller bruges i Tekst til audio på dashboards og i funktioner, der genererer lyd fra en chat.

Nuværende katalog

Udbyder	Model	Bemærkning
OpenAI	GPT-4o mini TTS	Naturligt klingende tale med god styring af tone og stil.
Google	Gemini 3.1 Flash TTS Preview	Nyt Gemini-talesystem med præcis styring af stil, tempo og tone.
Europæisk AI	Voxtral Mini TTS	Europæisk text-to-speech baseret på Mistral Voxtral Mini.

Claude har ikke nogen egen tekst-til-tale-model i kataloget. Hvis Claude er aktiveret som udbyder, forbliver tale-modellerne afhængige af de øvrige konfigurerede udbydere.

Hvad et tale-model bestemmer

Et tale-model bestemmer, hvordan teksten udtales og hvilke muligheder der er tilgængelige. Tænk på:

de tilgængelige stemmer;
de sprog, en stemme understøtter;
kvaliteten og naturligheden af udtalelsen;
den måde, instruktioner om tempo, tone, aksent og udtale følges op på.

Stemmer og sprog

Tilgængelige stemmer varierer efter udbyder. AI-School viser ved tekst til audio kun stemmer, der passer til det valgte sprog, eller stemmer der er egnede til flere sprog. Hvis en stemme kun er beregnet til visse sprog, står det på stemmens navn med.

OpenAI og Google understøtter de fleste sprog i kataloget. Voxtral Mini TTS understøtter et mindre sæt sprog, herunder dansk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.

Systemprompt

Ved tekst til audio kan systemprompten bruges til at styre udtale og stil. Du kan for eksempel angive, at dansk skal lyde naturligt, at termer som AI, AI-School, ChatGPT og OpenAI må udtales på engelsk, eller at Claude skal lyde som et fransk navn.

Præferencer

Brugere kan gemme deres tekst-til-audio-indstillinger som personlige præferencer. Så behøver model, sprog, stemme og udtaleinstruktioner ikke vælges igen og igen.

Nuværende katalog​

Hvad et tale-model bestemmer​

Stemmer og sprog​

Systemprompt​

Præferencer​

Nuværende katalog

Hvad et tale-model bestemmer

Stemmer og sprog

Systemprompt

Præferencer