Nvidia обвиняется в использовании видеороликов YouTube и Netflix для обучения искусственного интеллекта

Nvidia обвиняют в загрузке видео с YouTube и Netflix для обучения ИИ, включая контент для академических целей.

август 7, 2024 - 16:07

Nvidia обвиняется в использовании видеороликов YouTube и Netflix для обучения искусственного интеллекта

Nvidia находится под пристальным вниманием из-за предполагаемой загрузки огромного количества видео с YouTube, Netflix и других платформ для обучения своих систем ИИ. Отчет 404 Media показывает, что компания приобрела эти видео для улучшения моделей ИИ, используемых в таких продуктах, как генератор 3D-мира Omniverse и проект GR00T для цифровых людей. Отчет, основанный на просочившихся документах и сообщениях, предполагает, что Nvidia поручила сотрудникам собирать видео из различных источников, включая MovieNet, библиотеки видеоигр и набор данных WebVid на GitHub.

Несмотря на этические и юридические возражения, высказанные некоторыми сотрудниками, в отчете утверждается, что эти практики были одобрены высшим руководством Nvidia. Широкое использование скопированных видео из различных источников поднимает вопросы о соблюдении компанией правил авторского права и добросовестного использования при обучении ИИ.

Согласно отчету, Nvidia получила доступ к видео из обширной коллекции контента YouTube, предназначенного исключительно для академического использования. Компания, как сообщается, утверждала, что эти видео, часть библиотеки HD-VG-130M с 130 миллионами видео YouTube, были пригодны для коммерческих приложений ИИ, несмотря на их лицензию на академическое использование. Чтобы обойти обнаружение и избежать потенциальных запретов со стороны YouTube, Nvidia якобы использовала виртуальные машины (ВМ) с чередующимися IP-адресами для систематической загрузки контента. Этот метод позволил компании тайно получить значительный объем материала для обучения своих систем ИИ, избегая ограничений, предназначенных только для академического использования. Такая практика вызывает обеспокоенность по поводу этических и правовых последствий использования такого ограниченного контента в коммерческих целях.