برو به محتوای اصلی

پردازش

مدل‌های زبانی

مدل‌های زبانی سیستم‌های هوش مصنوعی پیشرفته‌ای هستند که می‌توانند زبان انسان را درک کنند، تفسیر کنند و تولید نمایند. این مدل‌ها بر روی مجموعه‌های داده عظیمی از متن آموزش دیده‌اند و الگوها، ترکیبات کلمات، ساختار جملات و حتی ظرایف زبان‌ها و شیوه‌های مختلف استفاده از زبان را می‌آموزند. هسته بسیاری از مدل‌های زبانی مدرن، معماری ترنسفورمر است که از سازوکارهای توجه به خود (self-attention) استفاده می‌کند تا تعیین کند کدام بخش‌های متن در یک زمینه خاص مهم هستند.

در پردازش زبان، این مدل‌ها از روش‌های آماری برای پیش‌بینی احتمالاً محتمل‌ترین کلمه بعدی یا جمله بعدی در یک متن استفاده می‌کنند. آن‌ها می‌توانند زمینه را در بخش‌های طولانی از متن درک کنند و بدین ترتیب نه تنها متن‌های گرامی‌تیکاً صحیح بلکه از نظر محتوا منسجم و مرتبط تولید کنند.

وقتی از یک مدل زبانی برای مثلاً یک چَت‌بات یا یک تولیدکننده متن استفاده می‌شود، مدل برخی پرامپت‌ها یا داده‌های ابتدایی را دریافت می‌کند و بر اساس آن ورودی، متنی تولید می‌کند که به‌طور منطق به زمینه داده‌شده پیوسته است. هدف این مدل‌ها تولید متنی است که تا حد امکان شبیه به انسان باشد، هم از نظر محتوا و هم از نظر سبک.

مدل‌های متن-به-تصویر

مدل‌های متن-به-تصویر سیستم‌های هوش مصنوعی هستند که قادرند از توصیف‌های متنی نوشته‌شده نمایس‌های بصری مانند عکس‌ها، تصاویر گرفته یا انواع دیگر تصاویر را تولید کنند. این مدل‌ها از شبکه‌های عصبی پیشرفته، و به‌طور خاص از شبکه‌های مولّد مخالف (GANها) یا متغیرهای مشابه مانند مدل‌های انتشار (diffusion) استفاده می‌کنند.

فرآیند با توصیف متنی ورودی از جانب کاربر آغاز می‌شود. مدل این متن را ارزیابی کرده و سعی می‌کند معنای آن و بافت مربوط به آن را درک کند. سپس مدل تصاویری را تولید می‌کند که با توصیف متنی مطابقت دارند، با استفاده از آنچه در دوره آموزشی آموخته است، و بزرگترین مجموعه‌های داده‌ای از جفت‌های متن-تصویر را برای آموزش دیده است.

در طول آموزش، مدل پیوندهای بین توصیف‌های متنی و ویژگی‌های بصری را یاد می‌گیرد. برای مثال اگر مدل به دفعات ترکیب واژگانی «خورشیدی زرد بالای دریای آبی» را می‌بیند همراه با تصاویر که این سناریو را نمایش می‌دهند، این عناصر را می‌شناسد و در خلق‌های تصویری آینده بازتولید می‌کند.

نتیجه غالباً تصاویر دقیق و با جزئیات بالا هستند که با توصیف ورودی هم‌سو هستند. این مدل‌ها به مرور دقیق‌تر می‌شوند و قادرند سناریوهای پیچیده با چندین شیء و مفاهیم ذهنی را نمایش دهند. آن‌ها در دامنه‌های گسترده‌ای از کاربردها استفاده می‌شوند، از جمله خلق هنری، طراحی بازی، واقعیت مجازی و غیره.

گشایش مدل‌های AI-School

مهم است که بدانید AI-School چندین مدل AI را که در کاتالوگ مدل مرکزی گنجانده شده‌اند، گشوده می‌کند. این مدل‌ها توسط ارائه‌دهندگان خارجی از طریق API ارائه می‌شوند. یک API یا رابط برنامه‌نویسی کاربردی، مجموعه‌ای از قوانین و تعاریف است که به نرم‌افزارها اجازه می‌دهد با یکدیگر ارتباط برقرار کنند. این یک «زبان» است که برنامه‌ها برای تبادل اطلاعات و فراخوانی توابع به آن متکی هستند. AI-School خود هیچ مدل زبانی، مدل‌های متن-به-تصویر یا مدل‌های متن-به-صوت ندارد.

ما مسئول نتایج مدل‌های مختلف نیستیم. با این حال، به انتخاب بهترین و جالب‌ترین مدل‌ها برای مدارس توجه کرده‌ایم.

روند پردازش مطابق DPIA

DPIA روند پایه‌ای برای تولید پاسخ را به‌صورت زیر توضیح می‌دهد:

  • کاربر یک prompt را در پورتال AI-School وارد می‌کند.
  • پرامپت در پایگاه‌ داده AI-School ذخیره می‌شود.
  • AI-School پرامپت را از طریق یک API-koppeling و یک حساب کاربری عمومی به مدل AI منتخب به‌صورت ناشناس ارائه می‌دهد.
  • مدل AI هیچ داده‌شخصی از کاربر فردی دریافت نمی‌کند.
  • پاسخ مدل AI به AI-School بازگردانده می‌شود.
  • پاسخ در پایگاه‌ داده AI-School ذخیره می‌شود.
  • پاسخ به کاربر ارائه می‌شود.

AI-School هیچ داده‌شخصی از کاربر فردی را به مدل AI ارسال نمی‌کند. مدل محتوای پرامپت را بدون ارتباط با یک کاربر قابل شناسایی دریافت می‌کند. کاربر ممکن است خود داده‌های شخصی داشته باشد که در پرامپت وارد کرده است؛ در این صورت این داده‌ها ممکن است توسط مدل AI منتخب پردازش شوند.

زمینه اضافی

در کاربردهایی مانند چت با اسناد، ورودی چندرسانه‌ای یا ابزارهای خاص، پرامپت می‌تواند با بافت انتخابی کاربر، مانند بخش‌های سند، تصاویر یا نتایج جستجو، تکمیل شود. این بافت نیز بدون اتصال به یک کاربر قابل شناسایی به مدل ارائه می‌شود، اما محتوا ممکن است حاوی داده‌های شخصی باشد اگر کاربر آن را به‌طور شخصی اضافه کرده باشد.