برو به محتوای اصلی

مدل‌های تبدیل متن به گفتار

AI-School از مدل‌های تبدیل متن به گفتار پشتیبانی می‌کند که به تبدیل متن به صدا منجر می‌شوند. این مدل‌ها در داشبورد برای متن به صدا و در قابلیت‌هایی که از چت صوت می‌سازد، استفاده می‌شوند.

کاتالوگ فعلی

ارائه‌دهندهمدلیادداشت
OpenAIGPT-4o mini TTSگفتار طبیعی با کنترل خوب روی لحن و سبک.
GoogleGemini 3.1 Flash TTS Previewمدل گفتاری جدید Gemini با کنترل دقیق روی سبک، سرعت و لحن.
European AIVoxtral Mini TTSگفتار متن-به-صدا اروپایی بر پایه Mistral Voxtral Mini.

Claude هیچ مدل تبدیل متن به گفتار مستقلی در کاتالوگ ندارد. اگر Claude به عنوان ارائه‌دهنده فعال باشد، مدل‌های گفتاری بسته به سایر ارائه‌دهندگان پیکربندی شده در جای خود باقی می‌مانند.

وظیفه یک مدل گفتار چیست

یک مدل گفتار مشخص می‌کند چگونه متن تلفظ می‌شود و چه امکاناتی در دسترس است. به خاطر بسپارید:

-.voiceهای موجود

  • زبان‌هایی که یک صدا پشتیبانی می‌کند
  • کیفیت و طبیعی بودن تلفظ
  • روشی که دستورالعمل‌ها درباره سرعت، لحن، لهجه و تلفظ پیروی می‌شوند

صداها و زبان‌ها

صداهای در دسترس بسته به ارائه‌دهنده فرق می‌کند. AI-School در تبدیل متن به صدا فقط صداهایی را نمایش می‌دهد که با زبان انتخاب‌شده مطابقت دارند یا صداهایی که برای چند زبان مناسب هستند. اگر صدایی صرفاً برای زبان‌های خاصی در نظر گرفته شده باشد، آن زبان در کنار صدا ذکر می‌شود.

OpenAI و Google اکثر زبان‌های کاتالوگ را پشتیبانی می‌کنند. Voxtral Mini TTS مجموعه کوچکتری از زبان‌ها را پشتیبانی می‌کند، از جمله هلندی، انگلیسی، فرانسوی، اسپانیایی، پرتغالی، ایتالیایی، آلمانی، هندی و عربی.

دستور سیستم

در متن به صدا می‌توان از دستور سیستم برای هدایت تلفظ و سبک استفاده کرد. به عنوان مثال می‌توانید مشخص کنید که هلندی باید طبیعی به نظر برسد، یا اصطلاحاتی مانند AI، AI-School، ChatGPT و OpenAI با تلفظ انگلیسی ادا شوند، یا اینکه Claude به عنوان نام فرانسوی تلفظ شود.

ترجیحات

کاربران می‌توانند تنظیمات متن-به-صدا را به عنوان ترجیح شخصی ذخیره کنند. بنابراین نیازی به انتخاب مجدد مدل، زبان، صدا و دستور تلفظ در هر بار استفاده نیست.