Ana içeriğe atla

Dokümanlarla Sohbet

Bilgi işlemede bir sonraki adım

Açık veri setlerine ve genel bilgiye güvenmek yerine, "Dokümanlarla Sohbet" güvenilir dahili kaynaklarınıza dayanarak bağlam-özel yanıtlar ve analizler üretir. Belgelerinizi yükleyin ve bu belgeleri sohbette soruları yanıtlamak için temel olarak kullanın!

Ver.i kısıtlarını Çözme

Bir dil modeline sorular sorduğunuzda, modelin eğitildiği veri kümesine bağlısınız demektir. Bu genelde internetten elde edilen bilgilerdir. Özel olmayan kaynaklar muhtemelen bu veri kümesinde değildir. Sohbet için kayna olarak belgelerinizi kullanarak, modelin yanıtlarınız için gerekli bilgilere sahip olduğundan emin olursunuz.

Belgelerinizle Gelen Olanaklar

Belgeleriniz hakkında ana noktaları sıralamak veya belgenin özetini almak gibi sorular sorabilirsiniz. Ayrıca kendi veri kümenizi kullanarak dil modelinden belirli analizler yaptırabilirsiniz.

Belge Tabanlı Sohbetin Dezavantajları

Belgelerin yüklenmesi ve işlenmesi ek adımlar gerektirir; bağlamı olmayan bilgilerle bile yanıt alabilirseniz bu adımları atlamış olursunuz. Ayrıca süreç, gerekli bilgileri belgeden önce alınması gerektiğinden yanıtın oluşturulması daha uzun sürebilir.

Dokümanlarla Sohbetin Arkasındaki İşler

Yüklediğiniz belgelerden metin belirlendikten sonra belgeden çıkarılır ve parçalara ayrılır. Bu parçalar sabit bir karakter sayısına sahiptir (1024 karakter) ve parçalar arasında bazı örtüşme ayarı (128 karakter) bulunur. Her bir metin parçası, bir vektör olarak vektör veritabanında saklanır. Her soruda bu verilerden, soruyla benzerlik temelinde bir seçim yapılır.

Belgeparçacıkları Seçim Süreci

Metin parçacıkları zaten vektörlere dönüştürülmüş durumda. Vektörler, bu metnin diğer metinlerle ne kadar “benzer” olduğunu gösteren birden çok boyuta sahiptir. RGB renk uzayını düşünün. Benzer RGB değerine sahip bir renk de benzer bir renk olarak kabul edilir, ama biraz farklıdır. Vektör veritabanı, parçaları sorguya göre sıralı ve filtreli şekilde almamıza olanak tanır. Sorduğunuz soruya göre en fazla 100 teksti parçasını seçer ve ilgili soruyla birlikte iletiriz.

Belgeye Dayalı Sohbet İçin Uygun Modeller

Belgelerle sohbeti mümkün kılmak için geniş bağlam pencereli modeller seçtik. En fazla 100 parça 1024 karakteri iletmek istiyoruz. Bu, 100.000 karakterden fazladır. Bunun için merkezi model kataloğundan yüksek kaliteli bir dil modeli kullanmanızı öneririz.

Uygun Modeller

Uygun modeller, yeterli bağlam alanı ve iyi belge analizi sunan modellerdir; OpenAI, Claude, Google veya Avrupa AI’nin yüksek kaliteli modelleri gibi.

Bir veya Daha Fazla Belge Seçin

Soru kutusunun sağ tarafındaki ataç ikonuna tıklayarak dosya modunu açabilirsiniz. 10 adet dosyaya kadar sohbet etmek için seçebilirsiniz.

Yüklediğiniz dosyalar önce işlenir. İşleme tamamlandığında, AI-School içerik sohbette, yardımcılar ve iş akışlarında kullanılabilir. İşleme başarısız olursa, dosya bir hata durumuna alır ve yeniden yüklemeniz veya yeniden işlemesini sağlamanız gerekir.

Uygun Dil Modelleri

Dokümanlarla sohbet ederken, dil modelinin dokümanlarla sohbet için uygun olup olmadığı kontrol edilir. Uygun değilse, mevcut kataloğumuzdan otomatik olarak uygun bir model seçilir.

Dokümanlarla Sohbet

Bu belgelerle sohbetinizi, dosya modu açık olduğu sürece sürdürebilirsiniz.

Dosyaları Yönetme ve Yeniden İşleme

Dosya Yönetiminde yüklediğiniz veya AI-School tarafından oluşturulan dosyaları görebilirsiniz. PDF dosyaları için eylem menüsünden bir dosyayı yeniden işleyebilirsiniz. Bu, mevcut metin çıkarımını yeni bir işleme ile değiştirir.

PDF’lerde, AI-School normal metin katmanını kullanabilir ve gerekirse daha kapsamlı bir PDF analizi yapabilir. Bu analiz özellikle şu durumlarda faydalıdır:

  • taranmış PDF’ler
  • doldurulmuş formlar
  • el yazısı yanıtlar
  • çerçeve içinde işaretlenmiş veya çizili seçenekler
  • tablolar, şekiller ve diğer görsel bilgiler

Büyük PDF’lerde işleme daha uzun sürebilir. AI-School gerekli olduğunda uzun belgeleri bölümlere ayırır, böylece daha uzun PDF’ler de işlenebilir.

Var Olan Dosyaları Seçme

Bir form veya iş akışı bir dosya isterse, yeni dosyalar yüklemekle kalmayıp mevcut dosyaları da medya yöneticisinden seçebilirsiniz. Böylece bir sınavı, değerlendirme modeli veya başka bir kaynak belgesini her seferinde yeniden yüklemek zorunda kalmazsınız.

Bu tür bir form aracılığıyla dosyalar eklenenler, sohbetin yardımcı dosyaları bölümünde görünür. Herhangi bir sohbet sorusu için otomatik olarak seçilmezler; siz onları aktif hale getirdiğinizde görünürler.

Dosya Başına İşleme

Dokümanlarla sohbetin yanında, her belge üzerinde ayrı bir istem uygulama ve bireysel yanıtlar alma imkanı da vardır. Bu özellik Dosya Başına İşleme olarak adlandırılır.

Dosya Başına İşleme

Bu özellik, "Dosyalarla Sohbet" ile birlikte kullanılabilir.

Olası Senaryo

"Dosya Başına İşleme" kullanmanın pratik bir örneği:

  1. Sınavı ve cevap modelini yüklersiniz ve bunları Dosyalarla Sohbet için etkinleştirirsiniz
  2. Birden çok yüklenen sınavı ve bunları Dosya Başına İşleme için etkinleştirirsiniz
  3. Tüm dosyalara ayrı ayrı uygulanacak bir istem formüle edersiniz

Bu şekilde, örneğin tüm teslim edilen sınavlar otomatik olarak cevap modeline göre değerlendirilebilir.

Maksimum Dosya Sayısı

"Dosya Başına İşleme" özelliği için maksimum 30 dosya sınırı vardır.

Desteklenen Dosya Türleri

AI-School belgelere dayalı sohbet için çeşitli dosya türlerini destekler:

  • PDF (.pdf)
  • Word (.docx)
  • CSV (.csv)
  • JSON (.json)
  • Metin (.txt)
  • Markdown (.md)
  • Ses ve video dosyaları: .mp3, .mp4, .mpeg, .mpga, .m4a, .wav, .webm

Sesli veya Görüntülü Dosyalarla Chat

Sesli veya görüntülü dosyalarla sohbet için AI-School OpenAI’nin Whisper modelini kullanır.

Metin çıkarımından sonra noktalama ve yazım hatalarını kontrol etmek ve düzeltmek için uygun bir metin modeli kullanılabilir.

Daha sonra, PDF veya Word belgelerden çıkarma ile aynı prosedür takip edilir.

Whisper, bir ses veya video dosyası başına 25 MB limiti vardır. Yeni dosyaları yüklerken bu limiti aynen uygularız.

Örnek Olarak İndirilebilecek Dosyalar

Geniş geçmiş belgesi