Tech-gigant Microsoft i jego kluczowy partner, OpenAI, stoją w obliczu kilku procesów, w których zarzuca im się korzystanie z prac objętych prawami autorskimi osób trzecich bez ich zgody w celu szkolenia wielkich modeli językowych (LLM). To, co OpenAI przekazało Komisji Komunikacji i Cyfryzacji Izby Lordów, daje do zrozumienia, że w przyszłości możemy oczekiwać więcej takich spraw.
Używanie materiałów chronionych prawem autorskim jest nieuniknione?
OpenAI w swoim pisemnym wystąpieniu (PDF) dla komitetu ds. dochodzeń w sprawie LLM poinformowało, że "niemożliwe jest szkolenie dzisiejszych czołowych modeli AI bez korzystania z materiałów chronionych prawem autorskim". OpenAI tłumaczy, że przepisy prawa autorskiego obejmują praktycznie każdą formę ludzkiego wyrazu - od postów na blogach, po zdjęcia, posty na forach, fragmenty kodu oprogramowania i dokumenty rządowe. Firma dodaje, że ograniczanie danych do treści z książek i rysunków z domeny publicznej sprzed ponad wieku, mogłoby stanowić ciekawy eksperyment, ale nie dostarczyłoby systemów AI spełniających potrzeby współczesnych obywateli.
OpenAI podejmuje działania wspierające twórców
OpenAI zaznacza, że przestrzega prawa autorskiego podczas szkolenia swoich modeli. W nowym wpisie na blogu, napisanym w odpowiedzi na pozew The New York Times, firma stwierdza, że korzystanie z powszechnie dostępnych materiałów internetowych do szkolenia AI wpada pod doktrynę fair use. Zdaje sobie jednak sprawę, że "wciąż jest wiele do zrobienia, aby wspierać i uprawniać twórców". OpenAI omówiło sposoby, w jaki pozwala wydawcom na blokowanie web crawlera GPTBot, uniemożliwiając mu dostęp do ich stron internetowych oraz opracowuje dodatkowe mechanizmy pozwalające osobom posiadającym prawa autorskie na wycofanie się z procesu szkolenia.
Przyszłość Microsoft, OpenAI i praw autorskich
W niektórych pozwach skierowanych przeciwko OpenAI i Microsoft, powodowie oskarżają firmy o odmowę zapłaty autorom za ich pracę, podczas gdy sami zarabiają miliardy na tej branży. Zostało to zarzucone również przez parę autorów publikacji non-fiction. OpenAI nie odniosło się bezpośrednio do tych procesów sądowych, ale dostarczyło bezpośrednią odpowiedź na skargę The New York Times, oskarżającą firmę o wykorzystywanie bez zgody artykułów opublikowanych przez tą gazetę.
Podsumowanie
Dyskusja na temat szkolenia modeli AI i praw autorskich to coś, co będzie z nami na dobre. Firma OpenAI podejmuje próby zmniejszenia napięć, stawiając pierwsze kroki do ochrony twórców, ale sprawa jest skomplikowana i daleka od osiągnięcia stanu, w którym każda ze stron będzie zadowolona. Wygląda na to, że konsekwencję będą odczuwały wszystkie firmy działające w tej branży, nie tylko OpenAI i Microsoft.