Проти NVIDIA подали розширений колективний позов, у якому група письменників стверджує, що компанія свідомо використовувала мільйони піратських книг для навчання своїх мовних моделей. Згідно з оновленою скаргою, NVIDIA нібито напряму контактувала з піратською бібліотекою Anna's Archive, щоб отримати високошвидкісний доступ до її архівів, пише TorrentFreak.

Позов подали до Окружного суду Північного округу Каліфорнії. У ньому автори посилаються на внутрішнє листування та документи NVIDIA, отримані під час збирання доказів. За їхніми твердженнями, рішення про використання піратських матеріалів було санкціоноване керівництвом компанії через конкурентний тиск у сфері штучного інтелекту.

У першій версії позову на початку 2024 року автори звинувачували NVIDIA у використанні набору даних Books3, який містить піратські книги, захищені авторським правом. Компанія тоді заявляла, що навчання моделей підпадає під "добросовісне використання", а книги для ШІ служать лише як статистичні шаблони, а не відтворюють оригінальні тексти.

Оновлена скарга значно розширює звинувачення. У ній зазначено, що представник NVIDIA звернувся до Anna's Archive з проханням дати доступ до її колекцій для навчання мовних моделей. За словами позивачів, бібліотека попередила компанію, що матеріали незаконні, і поцікавилася, чи має NVIDIA дозвіл на їх використання.

Згідно з позовом, протягом тижня після цього керівництво NVIDIA дало "зелене світло" на продовження співпраці. Anna's Archive нібито запропонувала доступ приблизно до 500 терабайтів даних, які містили мільйони книг, частина з яких зазвичай доступна лише через Internet Archive. У документах не зазначено, чи платила NVIDIA за цей доступ.

Окрім Anna's Archive, автори також звинувачують NVIDIA у використанні матеріалів з інших піратських ресурсів, зокрема LibGen, Sci-Hub і Z-Library. Також у позові йдеться про те, що компанія нібито поширювала скрипти та інструменти, які дозволяли її корпоративним клієнтам автоматично завантажувати датасет The Pile, що включає піратський набір Books3.

Серед позивачів у справі зазначені письменники Абді Наземіан, Браян Кін, Стюарт О'Нан, Андре Дюбюс III та Сьюзен Орлеан. Вони вимагають компенсації збитків і не виключають приєднання до позову сотень інших авторів.

$NMR