Reddit ініціює судовий процес проти Anthropic через несанкціонований збір даних користувачів для навчання штучного інтелекту — Delo.ua

#Бізнес

Позов, який був поданий до суду Каліфорнії, стверджує, що компанія Anthropic виконала більше 100 000 несанкціонованих запитів до серверів Reddit, незважаючи на те, що вона раніше зробила публічну заяву про припинення подібних дій.

Reddit повідомляє, що компанія Anthropic не врахувала технічні обмеження та правила використання їхньої платформи. Зокрема, вона обійшла захисні механізми, такі як файл robots.txt, який забороняє автоматизований збір інформації. Окрім того, Anthropic звинувачують у порушенні приватності, оскільки вона збирала та експлуатувала публікації користувачів, навіть ті, що були видалені, з комерційними намірами.

Reddit пропонує законний доступ до своїх даних через ліцензійні угоди, зокрема з такими компаніями, як OpenAI та Google. Ці угоди містять умови щодо використання контенту, охорони приватності та видалення даних. Проте, як стверджує Reddit, Anthropic відмовилася від підписання угоди, внаслідок чого просто скрапила дані, уникаючи фінансових зобов'язань та нехтуючи встановленими правилами.

У позовній заяві також згадується дослідження, проведене у 2021 році, співавтором якого виступав CEO Anthropic Даріо Амодей. У цьому дослідженні Reddit називається цінним джерелом даних для навчання мовних моделей. Reddit наводить приклади, коли Claude фактично повторював публікації з їхньої платформи, включаючи ті, що були видалені користувачами. На думку Reddit, це свідчить про те, що Anthropic не вжила достатніх заходів для забезпечення конфіденційності.

Reddit вимагає фінансової компенсації та судового заборони на використання своїх даних у майбутніх версіях Claude. Anthropic відкидає звинувачення і заявляє, що буде захищатися в суді.

Anthropic знову потрапила в епіцентр скандалу. У серпні 2024 року група авторів вирішила подати колективний позов, обвинувачуючи компанію в незаконному використанні їхніх книг для тренування моделі Claude. А в жовтні 2023 року Universal Music Group та інші музичні видавці висунули звинувачення проти Anthropic за порушення авторських прав через відтворення текстів пісень за допомогою бота Claude.

Позов Reddit має свої унікальні особливості, адже він не пов'язаний із захистом авторських прав — його основна увага зосереджена на порушенні умов користування та конкуренції, що не є чесною. Reddit підкреслює, що хоча їхні дані і є публічно доступними, вони підлягають правилам, які Anthropic навмисно проігнорувала. Ця справа може стати важливим прецедентом для інших платформ, які намагаються регулювати використання свого контенту в сфері штучного інтелекту.

Після подання позову акції Reddit піднялися на 67%, що демонструє довіру з боку інвесторів.

Оскільки компанії, що займаються штучним інтелектом, все більше використовують дані з інтернету, правові та етичні аспекти скрапінгу набувають дедалі більшого значення. Судова справа Reddit проти Anthropic є ще одним етапом у встановленні норм для нової ери штучного інтелекту.