Перейти к основному содержимому

Текстово- в-говорат ухм

Oops, incorrect. Need proper translation.

Let's craft:

Original:

Tekst-naar-spraakmodellen

AI-School ondersteunt tekst-naar-spraakmodellen waarmee tekst kan worden omgezet naar audio. Deze modellen worden gebruikt bij Tekst naar audio op het dashboard en bij functies die audio genereren vanuit een chat.

Huidige catalogus

AanbiederModelOpmerking
OpenAIGPT-4o mini TTSNatuurlijk klinkende spraak met goede sturing op toon en stijl.
GoogleGemini 3.1 Flash TTS PreviewNieuw Gemini-spraakmodel met nauwkeurige sturing op stijl, tempo en toon.
Europese AIVoxtral Mini TTSEuropese text-to-speech op basis van Mistral Voxtral Mini.

Claude heeft geen eigen tekst-naar-spraakmodel in de catalogus. Als Claude als aanbieder is ingeschakeld, blijven spraakmodellen afhankelijk van de overige geconfigureerde aanbieders.

Wat een spraakmodel bepaalt

Een spraakmodel bepaalt hoe tekst wordt uitgesproken en welke mogelijkheden beschikbaar zijn. Denk aan:

  • de beschikbare stemmen;
  • de talen die een stem ondersteunt;
  • de kwaliteit en natuurlijkheid van de uitspraak;
  • de manier waarop instructies over tempo, toon, accent en uitspraak worden opgevolgd.

Stemmen en talen

De beschikbare stemmen verschillen per aanbieder. AI-School toont bij tekst naar audio alleen stemmen die passen bij de gekozen taal, of stemmen die geschikt zijn voor meerdere talen. Als een stem alleen voor bepaalde talen bedoeld is, staat die taal bij de stem vermeld.

OpenAI en Google ondersteunen de meeste talen in de catalogus. Voxtral Mini TTS ondersteunt een kleinere set talen, waaronder Nederlands, Engels, Frans, Spaans, Portugees, Italiaans, Duits, Hindi en Arabisch.

Systeemprompt

Bij tekst naar audio kan de systeemprompt worden gebruikt om de uitspraak en stijl te sturen. Je kunt bijvoorbeeld aangeven dat Nederlands natuurlijk moet klinken, dat termen als AI, AI-School, ChatGPT en OpenAI met Engelse uitspraak mogen worden uitgesproken, of dat Claude als Franse naam moet klinken.

Voorkeuren

Gebruikers kunnen hun tekst-naar-audio-instellingen opslaan als persoonlijke voorkeur. Zo hoeven model, taal, stem en uitspraakinstructies niet telkens opnieuw gekozen te worden.

We need Russian translation, preserve frontmatter etc.

Let's produce:


Текстово-во-голосовые модели

AI-School поддерживает текстово-голосовые модели, которые преобразуют текст в аудио. Эти модели используются в Текст в аудиo на панели управления и в функциях, которые генерируют аудио из чата.

Текущий каталог

ПоставщикМодельПримечание
OpenAIGPT-4o mini TTSЕстественно звучащая речь с хорошим управлением тоном и стилем.
GoogleGemini 3.1 Flash TTS PreviewНовый голосовой модель Gemini с точным управлением стилем, темпом и тоном.
Европейский AIVoxtral Mini TTSЕвропейская речь на основе Mistral Voxtral Mini.

Claude не имеет собственной модели ТТS в каталоге. Если Claude включен как поставщик, голосовые модели зависят от остальных сконфигурированных поставщиков.

Что определяет голосовая модель

Голосовая модель определяет, как произносится текст и какие возможности доступны. Подумайте о:

  • доступных голосах;
  • языках, которые поддерживает голос;
  • качестве и естественности произнесения;
  • способе выполнения инструкций по темпу, тону, акценту и произнесению.

Голоса и языки

Доступные голоса различаются в зависимости от поставщика. AI-School отображает в тексте в аудио только голоса, подходящие к выбранному языку, или голоса, подходящие для нескольких языков. Если голос предназначен только для определённых языков, этот язык указан рядом с голосом.

OpenAI и Google поддерживают большинство языков в каталоге. Voxtral Mini TTS поддерживает меньший набор языков, включая нидерландский, английский, французский, испанский, португальский, итальянский, немецкий, хинди и арабский.

Системный промпт

При тексте в аудио системный промпт можно использовать для управления произношением и стилем. Например, можно указать, что нидерландский должен звучать естественно, что термины как AI, AI-School, ChatGPT и OpenAI следует произносить по-английски, или что Claude следует произнести как французское имя.

Предпочтения

Пользователи могут сохранять настройки текст в аудио как личные предпочтения. Так настройки модели, языка, голоса и инструкций по произнесению не нужно выбирать заново каждый раз.

But ensure product names remain: AI-School etc. Still correct Russian.

Let's output final.