Zum Hauptinhalt springen

Verarbeitung

Sprachmodelle

Sprachmodelle sind fortschrittliche KI-Systeme, die menschliche Sprache verstehen, interpretieren und generieren können. Diese Modelle werden auf riesigen Textdatensätzen trainiert und lernen Muster, Wortkombinationen, Satzstrukturen und sogar Feinheiten verschiedener Sprachen und Sprachgebraüche. Der Kern vieler moderner Sprachmodelle ist die Transformer-Architektur, die Selbstaufmerksamkeitsmechanismen nutzt, um zu bestimmen, welche Teile des Textes in einem gegebenen Kontext wichtig sind.

Bei der Sprachverarbeitung verwenden diese Modelle statistische Methoden, um vorherzusagen, was das wahrscheinlichste nächste Wort oder der wahrscheinlichste nächste Satz in einem Text sein könnte. Sie können Kontext über längere Textpassagen verstehen und dadurch nicht nur grammatikalisch korrekte, sondern auch inhaltlich zusammenhängende und relevante Texte generieren.

Bei der Verwendung eines Sprachmodells für beispielsweise einen Chatbot oder Generator wird dem Modell ein bestimmter Prompt oder anfängliche Daten gegeben, und basierend auf dieser Eingabe generiert das Modell Text, der logisch aus dem gegebenen Kontext folgt. Das Ziel dieser Modelle ist es, Text zu produzieren, der so menschlich wie möglich wirkt, sowohl in Bezug auf Inhalt als auch Stil.

Text-zu-Bild-Modelle

Text-zu-Bild-Modelle sind KI-Systeme, die in der Lage sind, aus schriftlichen Textbeschreibungen visuelle Darstellungen zu generieren, wie Fotos, Illustrationen oder andere Arten von Bildmaterial. Diese Modelle nutzen fortschrittliche neuronale Netze, insbesondere generative adversariale Netze (GANs) oder Variationen wie Diffusionsmodelle.

Der Prozess beginnt mit einer vom Benutzer eingegebenen Textbeschreibung. Das Modell bewertet diesen Text und versucht, seine Bedeutung und seinen Kontext zu verstehen. Anschließend generiert das Modell Bilder, die der Textbeschreibung entsprechen, und nutzt dabei das, was es während des Trainings gelernt hat, wobei es auf riesigen Datensätzen von Text-Bild-Paaren trainiert wird.

Während des Trainings lernt das Modell Assoziationen zwischen Textbeschreibungen und visuellen Merkmalen. Wenn das Modell beispielsweise wiederholt die Wortverbindung "eine gelbe Sonne über einem blauen Meer" zusammen mit Bildern sieht, die dieses Szenario illustrieren, lernt es, diese Elemente zu erkennen und in zukünftigen Bildkreationen zu reproduzieren.

Das Ergebnis sind oft überraschend präzise und detailreiche Abbildungen, die der eingegebenen Textbeschreibung entsprechen. Diese Modelle werden zunehmend verfeinert und sind in der Lage, komplexe Szenarien mit mehreren Objekten und abstrakten Konzepten darzustellen. Sie werden in einer Vielzahl von Anwendungen eingesetzt, einschließlich künstlerischer Kreationen, Spieldesign, virtueller Realität und mehr.

AI-School gibt Modelle frei

Es ist wichtig zu verstehen, dass AI-School verschiedene KI-Modelle freigibt, die von großen Technologieunternehmen über eine API angeboten werden. Eine API oder Application Programming Interface ist eine Reihe von Regeln und Definitionen, mit denen Softwareprogramme miteinander kommunizieren können. Sie fungiert als eine Art "Sprache", die von Programmen verstanden wird, um Informationen auszutauschen und Funktionen aufzurufen. AI-School selbst verfügt nicht über Sprachmodelle oder Text-zu-Bild-Modelle.

Wir sind nicht verantwortlich für die Ergebnisse der verschiedenen Modelle. Wir haben jedoch bei der Auswahl der besten und interessantesten Modelle für Schulen sorgfältig geachtet.

Verarbeitungsprozedur

Die folgende Prozedur wird befolgt, um eine Antwort zu generieren:

  • Der Benutzer erstellt einen Prompt.
  • Die Frontend-Webanwendung verbindet dies mit dem aktiven Chat und fügt eine Chatnachricht mit dem Status "Initialisieren" hinzu.
  • Auf den Servern von AI-School wird eine Funktion ausgelöst basierend auf einer HTTP-Anfrage.
  • Der Status der Chatnachricht wird auf "Verarbeiten" gesetzt.
  • Bei Auswahl eines Chats mit Dokumenten sendet der Server zunächst eine Anfrage an die Firestore-Vektordatenbank, um die Texte aus den Dokumenten auszuwählen.
  • Der Server sendet dann die Anfrage über eine API-Verbindung an das ausgewählte Sprachmodell.
  • Sobald die gesamte Antwort empfangen wurde, wird der Status auf "Abgeschlossen" gesetzt.
  • Die Frontend-Anwendung wird aktualisiert.
  • Bei festgestellten Fehlern wird der Status auf "Fehler" gesetzt und eine Fehlermeldung angezeigt.

Wir senden keine personenbezogenen Daten mit jeder API-Anfrage mit. Jedoch kann der Benutzer personenbezogene Daten in den Prompt oder in die hochgeladenen Dokumente aufgenommen haben.