Przejdź do głównej treści

Przetwarzanie

Modele językowe

Modele językowe to zaawansowane systemy AI, które potrafią rozumieć, interpretować i generować ludzką mowę. Te modele są trenowane na ogromnych zbiorach danych tekstowych i uczą się wzorców, łączeń wyrazów, struktur zdań, a nawet subtelności różnych języków i sposobów ich używania. Kernem wielu nowoczesnych modeli językowych jest architektura transformer, która wykorzystuje mechanizmy samouważności (self-attention) do określenia, które części tekstu są istotne w danym kontekście.

Podczas przetwarzania języka te modele używają metod statystycznych do przewidywania najbardziej prawdopodobnego następnego słowa lub najbardziej prawdopodobnego następnego zdania w tekście. Potrafią zrozumieć kontekst długich fragmentów tekstu, dzięki czemu nie tylko generują gramatycznie poprawne, ale także merytorycznie spójne i istotne teksty.

Podczas korzystania z modelu językowego na przykład do chatbota lub generatora tekstu, modelowi podaje się pewne prompt/y lub dane początkowe, a na ich podstawie generuje tekst, który logicznie wynika z danego kontekstu. Celem tych modeli jest produkcja tekstu, który wygląda jak najbardziej ludzko, zarówno pod kątem treści, jak i stylu.

Modele tekst–do–obrazu

Modele tekst–do–obrazu to systemy AI zdolne do generowania wizualnych reprezentacji na podstawie opisu tekstowego, takich jak zdjęcia, ilustracje lub inne typy materiałów wizualnych. Te modele wykorzystują zaawansowane sieci neuronowe, a w szczególności generatywne sieci przeciwstacyjne (GAN-y) lub ich warianty, takie jak modele dyfuzji.

Proces zaczyna się od opisu tekstowego wprowadzonego przez użytkownika. Model ocenia ten tekst i próbuje zrozumieć jego znaczenie i kontekst. Następnie generuje obrazy odpowiadające opisowi tekstowemu, korzystając z tego, czego nauczył się podczas treningu, trenując na ogromnych zestawach danych par tekst–obraz.

Podczas treningu model uczy się powiązań między opisami tekstowymi a cechami wizualnymi. Na przykład, jeśli model wielokrotnie widzi zestaw słów „żółte słońce nad błękitnym morzem” wraz z obrazami ilustrującymi ten scenariusz, uczy się rozpoznawać te elementy i odtwarzać je w przyszłych kreacjach obrazów.

Wynikiem są często zaskakująco dokładne i bogate w szczegóły obrazy, które odpowiadają wprowadzanemu opisowi. Te modele stają się coraz bardziej dopracowane i potrafią odwzorować złożone scenariusze z wieloma obiektami i abstrakcyjnymi pojęciami. Są wykorzystywane w szerokim zakresie zastosowań, w tym w twórczości artystycznej, projektowaniu gier, w rzeczywistości wirtualnej i nie tylko.

Udostępnianie modeli przez AI-School

Ważne jest, aby pamiętać, że AI-School udostępnia różne modele AI, które są zarejestrowane w centralnym katalogu modeli. Modele te są oferowane przez zewnętrznych dostawców poprzez API. API, czyli interfejs programowania aplikacji, to zestaw reguł i definicji umożliwiających programom współpracę. Działa jak „język”, który programy rozumieją do wymiany informacji i wywoływania funkcji między sobą. AI-School sam w sobie nie posiada modeli językowych, modeli tekst–do–obrazu ani modeli tekst–do–mowy.

Nie ponosimy odpowiedzialności za wyniki poszczególnych modeli. Jednakże zwracamy uwagę na wybór najlepszych i najciekawszych modeli dla szkół.

Procedura przetwarzania zgodnie z DPIA

DPIA opisuje podstawową procedurę generowania odpowiedzi w następujący sposób:

  • Użytkownik wprowadza prompt na portalu AI-School.
  • Prompt jest przechowywany w bazie danych AI-School.
  • AI-School udostępnia prompt za pośrednictwem API-koppeling i w sposób anonimowy na ogólne konto wybranego modelu AI.
  • Model AI nie otrzymuje danych osobowych pojedynczego użytkownika.
  • Odpowiedź modelu AI jest zwracana do AI-School.
  • Odpowiedź jest przechowywana w bazie danych AI-School.
  • Odpowiedź jest prezentowana użytkownikowi.

AI-School nie przekazuje danych osobowych pojedynczego użytkownika do modelu AI. Model otrzymuje treść promptu bez powiązania z identyfikowalnym użytkownikiem. Użytkownik może sam umieścić dane osobowe w promptie; w takim przypadku mogą one być przetwarzane przez wybrany model AI.

Dodatkowy kontekst

W przypadkach funkcji takich jak czatowanie z dokumentami, wejście multimodalne czy niektóre narzędzia, prompt może być uzupełniony o kontekst wybrany przez użytkownika, na przykład fragmenty dokumentów, obrazy lub wyniki wyszukiwania. Też ten kontekst jest oferowany modelowi bez powiązania z identyfikowalnym użytkownikiem, ale zawartość może zawierać dane osobowe, jeśli użytkownik sam je dodał.