Прав ли новый руководитель Microsoft в сфере искусственного интеллекта, выступая за «бесплатный» веб-контент?
Контроверсиальная функция Recall от Microsoft, сохраняющая скриншоты пользовательской активности на ПК, вызывает волну опасений о приватности данных.
Ранее в этом году Мустафа Сулейман, соучредитель Google DeepMind, произвел фурор, присоединившись к Microsoft и возглавив новую команду, занимающуюся потребительскими продуктами искусственного интеллекта, такими как Copilot, Bing и Edge, и подчиняясь непосредственно генеральному директору Сатье Наделле. Недавно Сулейман вызвал споры в интервью корреспонденту CNBC Эндрю Россу Соркину, предположив, что общедоступные данные в открытой сети, имеющие решающее значение для обучения моделей ИИ, следует считать «бесплатным программным обеспечением». Его замечания вызвали критику, вызвав обеспокоенность по поводу практики обработки данных технологических гигантов и их намерений получить прибыль от свободно доступной интернет-информации.
В дискуссиях об ИИ часто участвуют известные технологические компании, подчеркивающие этику, управление и ответственное использование ИИ. Однако недавнее исследование политики обработки данных ИИ и политики конфиденциальности указывает на закономерность, схожую с подходом Марка Цукерберга: публичные обещания контрастируют с действиями, которые могут подорвать конфиденциальность. Утверждение генерального директора Microsoft AI о том, что веб-контент следует рассматривать как «бесплатное ПО», еще больше обострило дебаты. Это утверждал, что контент в открытой сети исторически рассматривался как добросовестное использование с 1990-х годов, подразумевая, что он доступен для свободного копирования и воспроизведения. Такая позиция поднимает вопросы об этических границах использования данных, особенно в отношении пользовательского контента, который Microsoft считает бесплатными обучающими данными. Интерпретация генеральным директором закона об авторском праве расходится с собственной политикой Microsoft, о чем свидетельствуют прошлые судебные иски против нарушений авторских прав. Меняющаяся ситуация с правами на индексирование и использование данных продолжает вызывать юридические и этические дискуссии, особенно в отношении практики очистки веб-страниц и практики индексирования, оспариваемой в судах.
Спорный инструмент сбора данных от Microsoft
В последние годы крупные технологические компании стремились собрать огромные объемы данных для разработки ИИ, включая сбор глобальных данных и преобразование видео YouTube в удобные для использования расшифровки. Растет обеспокоенность по поводу будущей доступности таких данных для обучения ИИ, которая, по прогнозам, уменьшится к 2026 году. Функция Microsoft Recall, напоминающая что-то из «Черного зеркала», каждые несколько секунд делает снимки экрана действий пользователей на ПК с Windows и сохраняет их локально для обеспечить комплексный визуальный поиск своей цифровой истории. Эта возможность вызвала тревогу по поводу конфиденциальности, что вызвало пристальное внимание со стороны регулирующих органов, таких как Управление комиссара по информации (ICO), которое подчеркивает необходимость прозрачности и гарантий при использовании данных. Критики утверждают, что такие технологии дают технологическим гигантам неограниченный доступ к личным данным, включая сообщения, местоположение и поведение в Интернете, для оптимизации алгоритмов таргетированной рекламы.