Chat con documentos

El siguiente paso en el procesamiento de información

En lugar de confiar en conjuntos de datos públicos y conocimiento general, "Chat con Documentos" genera respuestas y análisis context-specific basados en tus fuentes internas confiables. ¡Carga tus documentos y usa estos documentos como base para responder preguntas en el chat!

Solución de limitaciones de datos

Si haces preguntas a un modelo de lenguaje, dependes del conjunto de datos con que se entrenó. En general, es información obtenida de la web. Las fuentes no públicas probablemente no estén en ese conjunto de datos. Al usar tus documentos como fuente para el chat, te aseguras de que el modelo tenga la información que necesitas para responder tus preguntas.

Posibilidades con tus documentos

Puedes hacer preguntas sobre tus documentos, como enumerar los puntos principales de un documento o resumirlo. También puedes pedir al modelo de lenguaje que realice análisis específicos utilizando tu propio conjunto de datos.

Desventajas del chat basado en documentos

La carga de documentos y su procesamiento son pasos adicionales que no necesitas si con la contextualización de información específica puedes obtener una buena respuesta. También lleva más tiempo generar una respuesta porque primero se debe extraer la información necesaria del documento antes de enviar la solicitud al modelo de lenguaje.

Detrás de escena del chat con documentos

El texto de los documentos que subes se extrae del documento y se divide en fragmentos. Estos fragmentos tienen un número fijo de caracteres (1024 caracteres) y también hemos configurado una superposición (128 caracteres) entre los fragmentos. Cada trozo de texto se almacena como un vector en una base de vectores. Para cada pregunta, se realiza una selección de estos datos basada en su similitud con la pregunta planteada.

Proceso de selección de fragmentos de documentos

Los trozos de texto ya se han convertido en vectores. Los vectores tienen múltiples dimensiones que indican cuán “parecido” es este texto a otro texto. Piensa en el sistema de colores RGB. Un color con un valor RGB similar también es un color similar, pero ligeramente distinto. La base de vectores nos permite recuperar los fragmentos de texto de forma ordenada y filtrada según la pregunta planteada. Seleccionamos como máximo 100 fragmentos de texto de 1024 caracteres para incluirlos en la consulta.

Modelos adecuados para chat basado en documentos

Hemos seleccionado modelos con un gran contexto para permitir chatear con documentos. Queremos poder enviar como máximo 100 fragmentos de texto de 1024 caracteres. Esto equivale a más de 100.000 caracteres. Usa preferentemente un modelo de lenguaje de alta calidad desde el catálogo central de modelos.

Modelos adecuados

Los modelos adecuados son aquellos con suficiente espacio de contexto y buena capacidad de análisis de documentos, como los modelos de alta calidad de OpenAI, Claude, Google o AI europeos.

Selecciona uno o varios documentos

Puedes activar el modo de archivo haciendo clic en el clip junto a la barra de preguntas. Puedes seleccionar hasta 10 archivos para chatear.

Los archivos que subas primero serán procesados. Una vez que el procesamiento esté completo, AI-School podrá usar el contenido en el chat, en asistentes y en flujos de trabajo. Si el procesamiento falla, el archivo obtendrá un estado de error y tendrás que volver a cargarlo o volver a procesarlo.

Modelos de lenguaje adecuados

Cuando empiezas a chatear con documentos, se verifica si el modelo de lenguaje es adecuado para chat con documentos. Si no lo es, automáticamente se selecciona un modelo adecuado de la catalogación actual.

Chat con documentos

Chateas con estos documentos siempre que el modo de archivos esté activado.

Administrar archivos y volver a procesarlos

En Gestión de archivos ves los archivos que has cargado o que AI-School ha generado. Para archivos PDF, desde el menú de acciones puedes volver a procesar el archivo. Esto sustituye la extracción de texto existente por un nuevo procesamiento.

Con PDFs, AI-School puede usar la capa de texto común y, cuando sea necesario, realizar un análisis más detallado de PDF. Este análisis es especialmente útil para:

PDFs escaneados
Formularios completados
Respuestas manuscritas
Opciones marcadas o subrayadas
Tablas, figuras y otra información visual

Con archivos grandes, el procesamiento puede tardar más. AI-School divide documentos grandes cuando es necesario, para poder procesar también PDFs más largos.

Elegir archivos existentes

Cuando un formulario o flujo de trabajo solicita un archivo, no solo puedes cargar archivos nuevos, sino también elegir archivos existentes a través del gestor de medios. Así no tienes que volver a subir una prueba, un modelo de corrección u otro documento fuente.

Los archivos añadidos a través de ese tipo de formulario aparecen en los archivos de la asistente de la chat. No se seleccionan automáticamente para preguntas de chat normales, a menos que las actives allí.

Procesamiento por archivo

Además de chatear con documentos, AI-School ofrece la posibilidad de aplicar un prompt por separado a cada documento y recibir respuestas individuales. Esta función se llama Procesar por archivo.

Procesar por archivo

Esta función puede usarse en combinación con “Chat con archivos”.

Escenario posible

Un ejemplo práctico de uso de "Procesar por archivo":

Subes la prueba y el modelo de respuesta y los activas en Chat con archivos
Subes varias pruebas entregadas y las activas en Procesar por archivo
Formulas un prompt, que se aplica a todos los archivos de forma individual

De esta manera puedes, por ejemplo, hacer que automáticamente se califiquen todas las pruebas entregadas basándose en el modelo de respuesta.

Número máximo de archivos

Existe un máximo de 30 archivos para la función "Procesar por archivo".

Tipos de archivos compatibles

AI-School admite varios tipos de archivos para chatear con documentos:

Archivos PDF con extensión .pdf
Archivos Word con extensión .docx
Archivos CSV con extensión .csv
Archivos JSON con extensión .json
Archivos de texto con extensión .txt
Archivos Markdown con extensión .md
Archivos de audio y video con extensiones 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'

Chatear con archivos de audio o vídeo

Para archivos de audio o vídeo, AI-School primero transcribe el archivo mediante el proveedor configurado, por ejemplo OpenAI o IA europea. Los modelos concretos proceden del catálogo central de modelos.

En conversaciones, la transcripción puede incluir bloques de tiempo y etiquetas de hablante cuando el modelo elegido lo admite. Después, un modelo de texto adecuado puede corregir puntuación, ortografía, etiquetas de hablante y términos especializados.

Tras la transcripción se sigue el mismo proceso que con documentos PDF o Word.

Los modelos de audio y vídeo tienen límites de tamaño y duración que dependen del proveedor y del modelo. Por eso los archivos largos pueden procesarse de forma distinta. Si el procesamiento falla, revisa el estado del archivo e inténtalo de nuevo o aporta el archivo en partes más pequeñas.

Archivos que puedes descargar como ejemplo

Groot historia documento

Solución de limitaciones de datos​

Posibilidades con tus documentos​

Desventajas del chat basado en documentos​

Detrás de escena del chat con documentos​

Proceso de selección de fragmentos de documentos​

Modelos adecuados para chat basado en documentos​

Selecciona uno o varios documentos​

Administrar archivos y volver a procesarlos​

Elegir archivos existentes​

Procesamiento por archivo​

Escenario posible​

Tipos de archivos compatibles​

Chatear con archivos de audio o vídeo​

Archivos que puedes descargar como ejemplo​