OpenAI решает не наносить водяные знаки на текст ChatGPT, чтобы избежать раскрытия информации пользователями
OpenAI изучает внедрение метаданных для идентификации текста от ChatGPT. Это решение может быть менее спорным и исключает ложные срабатывания.
Согласно отчету The Wall Street Journal, OpenAI уже около года готовит систему для маркировки водяными знаками текста, сгенерированного ChatGPT, и инструмент обнаружения, но внутри компании нет единого мнения о том, выпускать ли ее. Хотя система водяных знаков может помочь преподавателям идентифицировать написанные ИИ работы, потенциально удерживая студентов от использования ИИ для выполнения заданий, она также может повлиять на прибыльность OpenAI. Метод водяных знаков корректирует то, как модель предсказывает слова и фразы, создавая обнаруживаемый шаблон, не влияя на качество текста. Опрос, заказанный OpenAI, выявил сильную глобальную поддержку инструмента обнаружения ИИ с перевесом четыре к одному в пользу.
В ответ на отчет Journal OpenAI подтвердила существование своей системы водяных знаков в сообщении в блоге, назвав ее «эффективной на 99,9%» и устойчивой к фальсификации, такой как перефразирование. Однако компания выразила обеспокоенность тем, что такие методы могут быть легко обойдены злоумышленниками и могут негативно повлиять на восприятие инструментов ИИ неносителями языка. Кроме того, OpenAI опасается потенциальной негативной реакции пользователей; почти 30% опрошенных пользователей ChatGPT указали, что будут использовать программное обеспечение реже, если будет реализовано наложение водяных знаков.
Несмотря на опасения, некоторые сотрудники OpenAI считают, что наложение водяных знаков остается эффективным решением. Однако из-за постоянных опасений пользователей были высказаны предложения изучить альтернативные методы, которые могут быть менее спорными, но в настоящее время не доказаны. В своем последнем обновлении блога OpenAI объявила, что находится на ранних стадиях экспериментов со встраиванием метаданных в качестве альтернативного подхода. Хотя еще слишком рано оценивать эффективность этого метода, OpenAI отмечает, что, будучи криптографически подписанным, он исключит ложные срабатывания. Это исследование направлено на устранение оговорок пользователей и поиск жизнеспособного способа идентификации контента, созданного ИИ.