Gå til hovedindhold

Tekst-til-tale-modeller

AI-School understøtter tekst-til-tale-modeller, som kan omdanne tekst til lyd. Disse modeller bruges i Tekst til audio på dashboards og i funktioner, der genererer lyd fra en chat.

Nuværende katalog

UdbyderModelBemærkning
OpenAIGPT-4o mini TTSNaturligt klingende tale med god styring af tone og stil.
GoogleGemini 3.1 Flash TTS PreviewNyt Gemini-talesystem med præcis styring af stil, tempo og tone.
Europæisk AIVoxtral Mini TTSEuropæisk text-to-speech baseret på Mistral Voxtral Mini.

Claude har ikke nogen egen tekst-til-tale-model i kataloget. Hvis Claude er aktiveret som udbyder, forbliver tale-modellerne afhængige af de øvrige konfigurerede udbydere.

Hvad et tale-model bestemmer

Et tale-model bestemmer, hvordan teksten udtales og hvilke muligheder der er tilgængelige. Tænk på:

  • de tilgængelige stemmer;
  • de sprog, en stemme understøtter;
  • kvaliteten og naturligheden af udtalelsen;
  • den måde, instruktioner om tempo, tone, aksent og udtale følges op på.

Stemmer og sprog

Tilgængelige stemmer varierer efter udbyder. AI-School viser ved tekst til audio kun stemmer, der passer til det valgte sprog, eller stemmer der er egnede til flere sprog. Hvis en stemme kun er beregnet til visse sprog, står det på stemmens navn med.

OpenAI og Google understøtter de fleste sprog i kataloget. Voxtral Mini TTS understøtter et mindre sæt sprog, herunder dansk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.

Systemprompt

Ved tekst til audio kan systemprompten bruges til at styre udtale og stil. Du kan for eksempel angive, at dansk skal lyde naturligt, at termer som AI, AI-School, ChatGPT og OpenAI må udtales på engelsk, eller at Claude skal lyde som et fransk navn.

Præferencer

Brugere kan gemme deres tekst-til-audio-indstillinger som personlige præferencer. Så behøver model, sprog, stemme og udtaleinstruktioner ikke vælges igen og igen.