Перейти до основного змісту

Текстово-озвучувальні моделі

AI-School підтримує текстово-озвучувальні моделі, які перетворюють текст на аудіо. Ці моделі використовуються у розділі Текст до аудіо на дашборді та у функціях, що генерують аудіо з чату.

Поточний каталог

ПостачальникМодельПримітка
OpenAIGPT-4o mini TTSПриродньо звучить мова з гарним керуванням тоном і стилем.
GoogleGemini 3.1 Flash TTS PreviewНовий мовний модель Gemini з точним керуванням стилем, темпом та отонами.
Європейський AIVoxtral Mini TTSЄвропейське text-to-speech на основі Mistral Voxtral Mini.

Claude не має власної моделі текст-у-мову в каталозі. Якщо Claude увімкнено як постачальник, голосові моделі залежать від інших налаштованих постачальників.

Що визначає мовна модель

Мовна модель визначає, як вимовляється текст і які можливості доступні. Подумайте про:

  • доступні голоси;
  • мови, які підтримує голос;
  • якість і природність вимови;
  • спосіб, у який дотримуються інструкції щодо темпу, тону, акценту й вимови.

Голоси та мови

Доступні голоси відрізняються залежно від постачальника. AI-School показує у тексті до аудіо лише ті голоси, що підходять до обраної мови, або голоси, що підходять для кількох мов. Якщо голос призначено лише для певних мов, ця мова зазначається біля голосу.

OpenAI і Google підтримують більшість мов у каталозі. Voxtral Mini TTS підтримує меншу кількість мов, зокрема нідерландську, англійську, французьку, іспанську, португальську, італійську, німецьку, хінді та арабську.

Системна промпт

У тексті до аудіо системна промпт може використовуватись для керування вимовою та стилем. Наприклад, можна вказати, що нідерландська має звучати природно, що терміни як AI, AI-School, ChatGPT та OpenAI мають вимовлятися англійською, або що Claude має звучати як французьке ім’я.

Вподобання

Користувачі можуть зберігати свої налаштування тексту-у-аудіо як персональні вподобання. Так модель, мова, голос та інструкції щодо вимови не потрібно обирати заново щоразу.