Meta таємно тренувала свій ШІ на піратській базі даних
Компанія Meta використовувала Library Genesis (LibGen) – піратську “тіньову бібліотеку”, створену в Росії, – для тренування своїх моделей генеративного штучного інтелекту (ШІ), повідомляє Wired. Про це свідчить розсекречена судом інформація в провадженні, де група авторів звинувачує корпорацію в порушенні їхніх авторських прав шляхом використання їхніх творів для тренування своїх моделей ШІ.
Розсекречені документи містять цитати працівників Meta, які побоювалися, що використання LibGen може зашкодити перемовинам з регуляторами. Один із працівників написав: “Є щось неправильне в тому, щоб завантажувати торенти з робочого ноутбука Meta”.
Документи також свідчать, що в обговоренні використання LibGen брав участь генеральний директор Meta Марк Цукерберг. Згідно з поданими доказами, команда ШІ Meta отримала дозвіл використовувати піратські дані.
Письменники Річард Кадрей, Крістофер Ґолден і комедійна акторка Сара Сільверман подали колективний позов проти Meta в липні 2023 року. Вони звинувачують компанію у використанні їхніх творів для тренування мовних моделей без дозволу. Meta заявляє, що використання публічно доступних матеріалів захищене доктриною “fair use”.
Meta також визнала, що раніше використовувала Books3 – базу даних із приблизно 196 тисяч книжок, зібраних з інтернету, – але те, що компанія завантажувала дані безпосередньо з LibGen, було зʼясовано лише зараз.
Позивачі стверджують, що Meta не лише послуговувалася піратськими матеріалами, але й поширювала їх. У документах ідеться, що компанія завантажувала й ділилася піратськими файлами на торент-сайтах, що робить її розповсюджувачем нелегального контенту.
Як зазначає видання, Library Genesis – це онлайн-архів книжок, створений у Росії близько 2008 року. Це одна з найбільших і найвідоміших “тіньових бібліотек” у світі. У 2015 році суд у Нью-Йорку спробував тимчасово закрити сайт, але адміністратори просто змінили домен. У вересні 2024 року інший суд ухвалив рішення стягнути з LibGen $30 мільйонів компенсації за порушення авторських прав.
Як повідомляв ІМІ, у листопаді 2024 року у видавництві HarperCollins заявили, що дозволять використання деяких своїх книжок для навчання моделей ШІ за умови отримання згоди авторів.
Марія Ігнатьєва, Валентина Троян
Help us be even more cool!