Modelos de texto a voz

AI-School admite modelos de texto a voz que convierten texto en audio. Estos modelos se utilizan en Texto a audio en el panel y en funciones que generan audio a partir de un chat.

Catálogo actual

Proveedor	Modelo	Observación
OpenAI	GPT-4o mini TTS	Habla natural con buen control de tono y estilo.
Google	Gemini 3.1 Flash TTS Preview	Nuevo modelo de voz Gemini con control preciso de estilo, tempo y tono.
European AI	Voxtral Mini TTS	texto a voz europeo basado en Mistral Voxtral Mini.

Claude no tiene un modelo de texto a voz propio en el catálogo. Si Claude está habilitado como proveedor, los modelos de voz dependen de los demás proveedores configurados.

Qué determina un modelo de voz

Un modelo de voz determina cómo se pronuncia el texto y qué posibilidades están disponibles. Piense en:

las voces disponibles;
los idiomas que una voz soporta;
la calidad y naturalidad de la pronunciación;
la forma en que se siguen las instrucciones sobre tempo, tono, acento y pronunciación.

Voces e idiomas

Las voces disponibles varían según el proveedor. AI-School muestra en texto a audio solo voces que coinciden con el idioma elegido, o voces adecuadas para varios idiomas. Si una voz está destinada solo a ciertos idiomas, ese idioma se indica junto a la voz.

OpenAI y Google soportan la mayoría de los idiomas de catálogo. Voxtral Mini TTS soporta un conjunto más reducido de idiomas, incluidos neerlandés, inglés, francés, español, portugués, italiano, alemán, hindi y árabe.

Prompt del sistema

En texto a audio, el prompt del sistema puede usarse para dirigir la pronunciación y el estilo. Por ejemplo, puedes indicar que suene natural en neerlandés, que términos como AI, AI-School, ChatGPT y OpenAI se pronuncien en inglés, o que Claude suene como un nombre francés.

Preferencias

Los usuarios pueden guardar sus configuraciones de texto a audio como preferencias personales. Así, no es necesario volver a elegir modelo, idioma, voz y pautas de pronunciación cada vez.

Catálogo actual​

Qué determina un modelo de voz​

Voces e idiomas​

Prompt del sistema​

Preferencias​

Catálogo actual

Qué determina un modelo de voz

Voces e idiomas

Prompt del sistema

Preferencias