Chat con documentos
El siguiente paso en el procesamiento de información
En lugar de confiar en conjuntos de datos públicos y conocimiento general, "Chat con Documentos" genera respuestas y análisis context-specific basados en tus fuentes internas confiables. ¡Carga tus documentos y usa estos documentos como base para responder preguntas en el chat!
Solución de limitaciones de datos
Si haces preguntas a un modelo de lenguaje, dependes del conjunto de datos con que se entrenó. En general, es información obtenida de la web. Las fuentes no públicas probablemente no estén en ese conjunto de datos. Al usar tus documentos como fuente para el chat, te aseguras de que el modelo tenga la información que necesitas para responder tus preguntas.
Posibilidades con tus documentos
Puedes hacer preguntas sobre tus documentos, como enumerar los puntos principales de un documento o resumirlo. También puedes pedir al modelo de lenguaje que realice análisis específicos utilizando tu propio conjunto de datos.
Desventajas del chat basado en documentos
La carga de documentos y su procesamiento son pasos adicionales que no necesitas si con la contextualización de información específica puedes obtener una buena respuesta. También lleva más tiempo generar una respuesta porque primero se debe extraer la información necesaria del documento antes de enviar la solicitud al modelo de lenguaje.
Detrás de escena del chat con documentos
El texto de los documentos que subes se extrae del documento y se divide en fragmentos. Estos fragmentos tienen un número fijo de caracteres (1024 caracteres) y también hemos configurado una superposición (128 caracteres) entre los fragmentos. Cada trozo de texto se almacena como un vector en una base de vectores. Para cada pregunta, se realiza una selección de estos datos basada en su similitud con la pregunta planteada.
Proceso de selección de fragmentos de documentos
Los trozos de texto ya se han convertido en vectores. Los vectores tienen múltiples dimensiones que indican cuán “parecido” es este texto a otro texto. Piensa en el sistema de colores RGB. Un color con un valor RGB similar también es un color similar, pero ligeramente distinto. La base de vectores nos permite recuperar los fragmentos de texto de forma ordenada y filtrada según la pregunta planteada. Seleccionamos como máximo 100 fragmentos de texto de 1024 caracteres para incluirlos en la consulta.
Modelos adecuados para chat basado en documentos
Hemos seleccionado modelos con un gran contexto para permitir chatear con documentos. Queremos poder enviar como máximo 100 fragmentos de texto de 1024 caracteres. Esto equivale a más de 100.000 caracteres. Usa preferentemente un modelo de lenguaje de alta calidad desde el catálogo central de modelos.
Los modelos adecuados son aquellos con suficiente espacio de contexto y buena capacidad de análisis de documentos, como los modelos de alta calidad de OpenAI, Claude, Google o AI europeos.
Selecciona uno o varios documentos
Puedes activar el modo de archivo haciendo clic en el clip junto a la barra de preguntas. Puedes seleccionar hasta 10 archivos para chatear.
Los archivos que subas primero serán procesados. Una vez que el procesamiento esté completo, AI-School podrá usar el contenido en el chat, en asistentes y en flujos de trabajo. Si el procesamiento falla, el archivo obtendrá un estado de error y tendrás que volver a cargarlo o volver a procesarlo.
Cuando empiezas a chatear con documentos, se verifica si el modelo de lenguaje es adecuado para chat con documentos. Si no lo es, automáticamente se selecciona un modelo adecuado de la catalogación actual.

Chateas con estos documentos siempre que el modo de archivos esté activado.
Administrar archivos y volver a procesarlos
En Gestión de archivos ves los archivos que has cargado o que AI-School ha generado. Para archivos PDF, desde el menú de acciones puedes volver a procesar el archivo. Esto sustituye la extracción de texto existente por un nuevo procesamiento.
Con PDFs, AI-School puede usar la capa de texto común y, cuando sea necesario, realizar un análisis más detallado de PDF. Este análisis es especialmente útil para:
- PDFs escaneados
- Formularios completados
- Respuestas manuscritas
- Opciones marcadas o subrayadas
- Tablas, figuras y otra información visual
Con archivos grandes, el procesamiento puede tardar más. AI-School divide documentos grandes cuando es necesario, para poder procesar también PDFs más largos.
Elegir archivos existentes
Cuando un formulario o flujo de trabajo solicita un archivo, no solo puedes cargar archivos nuevos, sino también elegir archivos existentes a través del gestor de medios. Así no tienes que volver a subir una prueba, un modelo de corrección u otro documento fuente.
Los archivos añadidos a través de ese tipo de formulario aparecen en los archivos de la asistente de la chat. No se seleccionan automáticamente para preguntas de chat normales, a menos que las actives allí.
Procesamiento por archivo
Además de chatear con documentos, AI-School ofrece la posibilidad de aplicar un prompt por separado a cada documento y recibir respuestas individuales. Esta función se llama Procesar por archivo.

Esta función puede usarse en combinación con “Chat con archivos”.
Escenario posible
Un ejemplo práctico de uso de "Procesar por archivo":
- Subes la prueba y el modelo de respuesta y los activas en Chat con archivos
- Subes varias pruebas entregadas y las activas en Procesar por archivo
- Formulas un prompt, que se aplica a todos los archivos de forma individual
De esta manera puedes, por ejemplo, hacer que automáticamente se califiquen todas las pruebas entregadas basándose en el modelo de respuesta.
Existe un máximo de 30 archivos para la función "Procesar por archivo".
Tipos de archivos compatibles
AI-School admite varios tipos de archivos para chatear con documentos:
- Archivos PDF con extensión .pdf
- Archivos Word con extensión .docx
- Archivos CSV con extensión .csv
- Archivos JSON con extensión .json
- Archivos de texto con extensión .txt
- Archivos Markdown con extensión .md
- Archivos de audio y video con extensiones 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'
Chatear con archivos de audio o video
Para chatear con archivos de audio o video, AI-School utiliza el modelo Whisper de OpenAI.
Tras la extracción de texto, se puede usar un modelo de texto adecuado para comprobar y corregir la puntuación y la ortografía.
Luego sigue el mismo procedimiento que la extracción de PDFs o documentos Word.
Whisper tiene un límite de 25 MB por archivo de audio o video. Por ello, mantenemos el mismo límite al subir nuevos archivos.