Перейти к основному содержимому

Текст в речь

С помощью Текст в речь вы конвертируете текст в аудиофайл. Это удобно для сценариев, обучающих видео, аудиоматериалов, текстов для чтения вслух и языкового обучения.

Начало работы на панели управления

На панели управления выберите в поле ввода Текст в речь. Это кнопка с иконкой чата, стрелкой и иконкой звуковой волны. Затем появится большое поле ввода для текста, который вы хотите произнести.

Выбор текст в речь на панели управления

Поле ввода становится больше, чтобы удобнее было вводить длинные скрипты. Затем можно ввести текст и сгенерировать аудио.

Настройки

Через кнопку настроек рядом с полем ввода можно изменить параметры речи.

НастройкаОписание
МодельВыберите модель преобразования текста в речь.
ЯзыкВыберите язык, на котором текст должен быть произнесён.
ГолосВыберите голос, подходящий для выбранного языка.
Системная подсказкаЗадайте инструкции по произношению, тону, темпу, акценту и специфическим терминам.
Стильовая справкаДобавьте дополнительные указания по желаемому стилю речи.

Список голосов фильтруется по выбранному языку. Если голос предназначен только для некоторых языков, вы увидите этот язык в списке голосов.

Произношение и стиль

Системная подсказка задаёт, как должен звучать голос. Например вы можете указать:

  • что говорящий должен звучать как носитель русского языка;
  • что слова как AI, AI-School, ChatGPT, OpenAI и Gemini произносились на английском;
  • что Claude следует произносить как французское имя;
  • чтобы тон был спокойным, тёплым, деловым, неформальным, низким или энергичным.

Когда вы выбираете другой язык, AI-School адаптирует стандартные инструкции под этот язык.

Сохранение и восстановление

Вы можете сохранить настройки в своей учётной записи. AI-School запомнит, в частности, модель, язык, голос и системную подсказку. При Восстановить по умолчанию вы удалите эти сохранённые предпочтения.

Результат

После генерации аудиофайл сразу появляется в чате. Вы можете воспроизвести его через аудиоплеер и скачать с помощью кнопки загрузки.

Во время генерации форма ввода временно отключается. Это предотвращает одновременную генерацию нескольких аудиофайлов.