انتقل إلى المحتوى الرئيسي

التحدث مع الوثائق

الخطوة التالية في معالجة المعلومات

بدلاً من الاعتماد على مجموعات البيانات العامة والمعرفة العامة، يولد "الدردشة مع Documents" إجابات وتحليلات مرتبطة بالسياق استناداً إلى مصادر داخليّة موثوقة لديك. قم بتحميل وثائقك واستخدم هذه الوثائق كأساس للإجابة على أسئلتك في المحادثة!

حل قيود البيانات

عند طرح أسئلة على نموذج لغوي، أنت تعتمد على مجموعة البيانات التي تم تدريب النموذج عليها. عادةً ما تكون هذه معلومات مأخوذة من الإنترنت. المصادر غير العامة على الأرجح ليست في هذه المجموعة. عند استخدام وثائقك كمصدر للدردشة، تتأكد من أن النموذج لديه المعلومات التي تحتاجها للإجابة على أسئلتك.

إمكانات مع وثائقك

يمكنك طرح أسئلة حول وثائقك مثل ذكر النقاط الرئيسية لوثيقة أو تلخيص الوثيقة. كما يمكنك أن تطلب من النموذج إجراء تحليلات محددة باستخدام مجموعة بياناتك الخاصة.

عيوب الدردشة المعتمدة على الوثائق

رفع الوثائق ومعالجتها يمثل خطوات إضافية لا تحتاج إليها إذا كان بالإمكان الحصول على إجابة جيدة دون الاعتماد على سياق معلومات محددة. كما أن إنشاء الإجابة يستغرق وقتاً أطول لأن المعلومات اللازمة من الوثيقة يجب استخراجها أولاً قبل إرسال الطلب إلى النموذج اللغوي.

وراء كواليس الدردشة مع الوثائق

يتم استخراج النص من الوثائق التي تقوم بتحميلها وتقسيمه إلى مقاطع. يحتوي كل مقطع على عدد ثابت من الأحرف (1024 حرفاً) وهناك تداخل محدد بين المقاطع (128 حرفاً). يتم حفظ كل قطعة نص كمتجه في قاعدة بيانات متجهية. عند كل سؤال يتم إجراء اختيار من هذه البيانات بناءً على التشابه مع السؤال المطروح.

عملية اختيار مقاطع الوثيقة

تم تحويل القطع النصية بالفعل إلى متجهات. للمتجهات أبعاد متعددة تشير إلى مدى “تشابه” هذا النص مع نص آخر. فكر في نظام ألوان RGB. لون له قيمة RGB مشابهة يعتبر لوناً قريباً لكن ليس متطابقاً. قاعدة البيانات المتجهة تمكننا من استرجاع مقاطع النص مرتبة ومفلترة بناءً على السؤال المطروح. نختار أقصى 100 مقطع نصي من 1024 حرفاً لإرسالها مع السؤال.

النماذج المناسبة للدردشة المعتمدة على الوثائق

اخترنا نماذج ذات نافذة سياقية كبيرة للسماح بالدردشة مع الوثائق. نريد إرسال ما يصل إلى 100 مقطع نصي من 1024 حرفاً. هذا أكثر من 100,000 حرف. استخدم نموذج لغة عالي الجودة من فهرس النماذج المركزي عند الحاجة.

النماذج المناسبة

النماذج المناسبة هي نماذج ذات مساحة سياق كافية وتحليل مستند جيد، مثل نماذج OpenAI عالية الجودة، Claude، Google، أو نماذج أوروبية للذكاء الاصطناعي.

حدد وثيقة أو أكثر

يمكنك تفعيل وضع الملفات بالنقر على مشبك الورق على يمين شريط الأسئلة. يمكنك اختيار حتى 10 ملفات للدردشة.

الملفات التي ترفعها تُعالج أولاً. بمجرد الانتهاء من المعالجة، يمكن لـ AI-School استخدام المحتوى في المحادثة، وفي المساعدين، وفي سير العمل. إذا فشلت المعالجة، فسيحصل الملف على حالة خطأ ويجب عليك إعادة رفعه أو إعادة معالجته.

النماذج اللغوية المناسبة

في اللحظة التي تبدأ فيها الدردشة مع الوثائق، يتم التحقق من ملاءمة النموذج اللغوي للدردشة مع الوثائق. إذا لم يكن مناسباً، يتم تلقائياً اختيار نموذج مناسب من الكتالوج الحالي.

الدردشة مع الوثائق

أنت المحادثة مع هذه الوثائق طالما كان وضع الملفات قيد التشغيل.

إدارة الملفات وإعادة المعالجة

في إدارة الملفات ستلاحظ الملفات التي قمت بتحميلها أو التي أنشأتها AI-School. بالنسبة لملفات PDF، يمكنك عبر قائمة الإجراءات إعادة معالجة الملف. هذا يستبدل استخراج النص الحالي بمعالجة جديدة.

بالنسبة لملفات PDF يمكن لـ AI-School استخدام طبقة النص العادية وعند الحاجة إجراء تحليل PDF أكثر تفصيلاً. هذا التحليل مفيد خصوصاً في:

  • PDFs الممسوحة ضوئياً
  • النماذج المعبأة
  • الإجابات المكتوبة بخط اليد
  • الاختيارات المقررة أو المظللة
  • الجداول، الأشكال، والمعلومات البصرية الأخرى

قد تستغرق المعالجة لملفات PDF الكبيرة وقتاً أطول. تقسم AI-School المستندات الكبيرة عند الحاجة إلى أجزاء، حتى يمكن معالجة PDFs الأطول أيضاً.

اختيار الملفات الموجودة

عندما يطلب نموذج أو تدفق عمل ملفاً، يمكنك ليس فقط رفع ملفات جديدة، بل أيضاً اختيار ملفات موجودة عبر مدير الوسائط. بذلك لا تحتاج لإعادة رفع اختبار أو نموذج التصحيح أو أي مستند مصدر آخر في كل مرة.

الملفات التي تتم إضافتها عبر مثل هذا النموذج تظهر في ملفات المساعد للدردشة. لن تُختار تلقائياً لأسئلة الدردشة العادية، إلا إذا قمت أنت بتشغيلها هناك.

المعالجة per ملف

إلى جانب الدردشة مع الوثائق، تتيح AI-School أيضاً خيار تطبيق موجه منفصل على كل وثيقة والحصول على إجابات فردية. تسمى هذه الميزة المعالجة per ملف.

المعالجة per ملف

يمكن استخدام هذه الميزة بالتزامن مع "الدردشة مع الملفات".

سيناريو ممكن

مثال عملي لاستخدام "المعالجة per ملف":

  1. قم بتحميل الاختبار ونموذج الإجابة وتفعيلهما في الدردشة مع الملفات
  2. قم بتحميل عدة اختبارات مقدمة وتفعيلها في المعالجة per ملف
  3. صغ موجهة تُطبق على جميع الملفات بشكل فردي

بهذه الطريقة يمكنك مثلاً أن تتيح تلقائياً تصحيح جميع الاختبارات المقدمة بناءً على نموذج الإجابة.

الحد الأقصى لعدد الملفات

هناك حد أقصى قدره 30 ملفاً للوظيفة "المعالجة per ملف".

أنواع الملفات المدعومة

AI-School يدعم أنواع ملفات مختلفة للدردشة مع الوثائق:

  • ملفات PDF تنتهي بـ .pdf
  • ملفات Word تنتهي بـ .docx
  • ملفات CSV تنتهي بـ .csv
  • ملفات JSON تنتهي بـ .json
  • ملفات نصية تنتهي بـ .txt
  • ملفات Markdown تنتهي بـ .md
  • ملفات صوت وفيديو بامتدادات 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' أو 'webm'

الدردشة مع ملفات الصوت أو الفيديو

للدردشة مع ملفات الصوت أو الفيديو، تستخدم AI-School نموذج Whisper من OpenAI.

بعد استخراج النص يمكن استخدام نموذج نص مناسب للتحقق من الترقيم والإملاء وتصحيحه.

ثم تتبع نفس إجراء استخراج النص من وثائق PDF أو Word.

يحد Whisper من 25 ميجابايت لكل ملف صوتي أو فيديو. لذا نطبق نفس الحد الأقصى عند رفع ملفات جديدة.

الملفات التي يمكنك تنزيلها كعينة

وثيقة تاريخية كبيرة