Z ostatnich wydarzeń dotyczących technologii AI warto zwrócić uwagę na kontrowersyjne kwestie związane z modelami bazującymi na danych. W wywiadzie dla „The Wall Street Journal” Mira Murati z OpenAI niezbyt klarownie odpowiadała na pytania dotyczące źródeł danych modelu Sora, który może generować wideo.
Niejasność wokół danych treningowych Sory
Mira Murati z OpenAI unikała konkretnych odpowiedzi dotyczących źródeł danych wykorzystanych do szkolenia modelu Sora. Dopiero po naciskach przyznała, że część danych pochodzi z serwisu Shutterstock. Pytanie o konkretny rodzaj danych, na których bazowała Sora, pozostało jednak bez jasnej odpowiedzi.
Brak pewności co do materiałów użytych do szkolenia
Dyrektor technologii OpenAI unikała konkretnych informacji na temat danych wykorzystanych do nauki Sory, co budziło wątpliwości co do przejrzystości procesu. Sygnały o możliwym partnerstwie z firmami zewnętrznymi, takimi jak Shutterstock, mogą być istotne dla oceny legalności szkolenia modeli AI.
Artykuł nie może odnaleźć się na łamach prasy o tak nieprecyzyjnych odpowiedziach w kontekście procesu szkolenia sztucznej inteligencji. Satysfakcjonujące wyjaśnienie źródeł danych jest kluczowe dla zapewnienia przejrzystości i uniknięcia potencjalnych kłopotów prawnych w przyszłości.