Duty-Free.cc

Могут ли данные пользователей в Claude оказаться у злоумышленников? Как обезопаситься

Anthropic признала допущенную ошибку в процессе рассмотрения отчёта о безопасности лишь после того, как история получила широкое публичное обсуждение.

Исследователь Йоханн Рехбергер (известный под псевдонимом wunderwuzzi) сообщил, что ему удалось продемонстрировать сценарий, при котором чат-бот Claude может выполнить скрытые инструкции и передать данные пользователя третьей стороне. Он показал, что при определённых условиях встроенный функционал, включая работу в «песочнице» и сетевые операции, при недостаточной фильтрации может быть использован злоумышленником для получения конфиденциальной информации.

По словам исследователя, атака основана на механизме скрытого внедрения подсказок (indirect prompt injection). В документ заранее добавляются инструкции, не заметные пользователю, и после запроса на пересказ или анализ текста модель непреднамеренно выполняет эти команды. В результате Claude может сохранить данные во внутреннем окружении и затем отправить файл через File API, используя подставленный ключ доступа. Характерные элементы атаки маскируются под обычный код, из-за чего защитные фильтры не распознают вредоносную часть.

В компании Anthropic уточнили, что подобные риски уже описаны в документации, и рекомендуют пользователям отслеживать активность модели и отменять подозрительные действия. Рехбергер назвал такие меры недостаточными и направил отчёт в программу поиска уязвимостей на HackerOne. Первоначально сообщение было закрыто как не соответствующее условиям программы, однако впоследствии Anthropic признала ошибку классификации и подтвердила важность подобных обращений.

Возможность сетевого взаимодействия в Claude зависит от тарифа: для пользователей Pro и Max она включена по умолчанию, в корпоративных тарифах Team и Enterprise — отключена, но может быть активирована администратором. Расширенные параметры допускают обращения к внешним API, что увеличивает потенциальную поверхность атак даже в ограниченной сетевой среде.

По данным специалистов hCaptcha, аналогичные уязвимости, связанные с внедрением инструкций и попытками обхода защит, встречаются и в других крупных моделях. Эксперты подчёркивают: по мере усложнения функционала систем требуется ужесточать контроль доступа к ресурсам и проверку внешних ключей — в противном случае дополнительные возможности могут привести к угрозам конфиденциальности данных.