Traitement
Modèles linguistiques
Les modèles linguistiques sont des systèmes d'IA avancés capables de comprendre, interpréter et générer du langage humain. Ces modèles sont entraînés sur d'énormes ensembles de données textuelles et apprennent des motifs, des combinaisons de mots, des structures de phrases, et même les subtilités de différentes langues et usages linguistiques. Le cœur de nombreux modèles linguistiques modernes est l'architecture transformer, qui utilise des mécanismes d'auto-attention pour déterminer quelles parties du texte sont importantes dans un contexte donné.
Lors du traitement du langage, ces modèles utilisent des méthodes statistiques pour prédire le mot ou la phrase suivante la plus probable dans un texte. Ils peuvent comprendre le contexte sur de longs passages de texte et ainsi générer non seulement des textes grammaticalement corrects, mais aussi cohérents et pertinents sur le plan du contenu.
Lors de l'utilisation d'un modèle linguistique pour un chatbot ou un générateur de texte, le modèle reçoit certaines invites ou données initiales et, en fonction de cette entrée, il génère un texte qui suit logiquement le contexte donné. L'objectif de ces modèles est de produire du texte qui ressemble le plus possible à un texte humain, tant en termes de contenu que de style.
Modèles texte-à-image
Les modèles texte-à-image sont des systèmes d'IA capables de générer des représentations visuelles à partir de descriptions textuelles écrites, telles que des photos, des illustrations ou d'autres types de matériel visuel. Ces modèles utilisent des réseaux neuronaux avancés, et plus précisément des réseaux antagonistes génératifs (GAN) ou des variations comme les modèles de diffusion.
Le processus commence par une description textuelle saisie par un utilisateur. Le modèle évalue ce texte et tente de comprendre sa signification et son contexte. Il génère ensuite des images correspondant à la description textuelle, en utilisant ce qu'il a appris pendant l'entraînement, en s'entraînant sur d'immenses ensembles de données de paires texte-image.
Pendant l'entraînement, le modèle apprend des associations entre des descriptions textuelles et des caractéristiques visuelles. Par exemple, si le modèle voit à plusieurs reprises la combinaison de mots "un soleil jaune au-dessus d'une mer bleue" avec des images illustrant ce scénario, il apprend à reconnaître et à reproduire ces éléments dans de futures créations d'images.
Le résultat sont souvent des images étonnamment précises et détaillées qui correspondent à la description textuelle saisie. Ces modèles deviennent de plus en plus raffinés et sont capables de représenter des scénarios complexes avec plusieurs objets et concepts abstraits. Ils sont utilisés dans un large éventail d'applications, y compris les créations artistiques, la conception de jeux, la réalité virtuelle et plus encore.
AI-School déverrouille des modèles
Il est important de comprendre qu'AI-School déverrouille différents modèles d'IA proposés par de grandes entreprises technologiques via une API. Une API, ou Interface de Programmation d'Application, est un ensemble de règles et de définitions permettant à des programmes logiciels de communiquer entre eux. Elle fonctionne comme une sorte de "langue" comprise par les programmes pour échanger des informations et appeler des fonctions les unes des autres. AI-School n'a pas ses propres modèles linguistiques ou modèles texte-à-image.
Nous ne sommes pas responsables des résultats des différents modèles. Cependant, nous avons porté une attention particulière à la sélection des modèles les plus performants et les plus intéressants pour les écoles.
Procédure de traitement
La procédure suivante est suivie pour générer une réponse :
- L'utilisateur crée une invite.
- L'application web frontend la lie au chat actif et ajoute un message de chat avec le statut "Initialisation".
- Sur les serveurs d'AI-School, une fonction est déclenchée sur la base d'une requête HTTP.
- Le statut du message de chat est défini sur "Traitement".
- Lors de la sélection d'un chat avec des documents, le serveur envoie d'abord une requête à la base de données vectorielle Firestore pour sélectionner les textes des documents.
- Le serveur envoie ensuite la requête via une liaison API au modèle linguistique sélectionné.
- Une fois la réponse complète reçue, le statut est défini sur "Terminé".
- L'application frontend est actualisée.
- En cas d'erreurs constatées, le statut est défini sur "Erreur" et un message d'erreur est affiché.
Nous n'envoyons aucune donnée personnelle avec chaque requête API. Cependant, l'utilisateur peut avoir inclus des données personnelles dans l'invite ou dans les documents téléchargés.