Роскомнадзор рекомендовал блокировать бота, собирающего данные для ChatGPT

Подведомственный Роскомнадзору радиочастотный центр разослал ряду хостинг-провайдеров письмо с рекомендациями по выявлению и блокировке GPTBot компании OpenAI. Бот, созданный для сбора данных, улучшающих работу ChatGPT, слишком активно сканирует российские веб-ресурсы.

Письмо хостинг-провайдерам

Главный радиочастотный центр (ГРЧЦ), подведомствен Роскомнадзору, разослал ряду хостинг-провайдеров письмо с рекомендациями по выявлению и блокировке бота GPTBot компании OpenAI. С документом ознакомился «Коммерсант».

В письме говорится о необходимости оценить риски сбора информации об уязвимости ресурсов или «иной чувствительной информации, в том числе содержащей персональные данные».

В случае выявления таких рисков ГРЧЦ указывает на необходимость заблокировать обращения бота. Ведомство также направило инструкцию о том, как это сделать.

Бот от OpenAI

OpenAI запустила GPTBot в августе 2023 г. для сканирования веб-ресурсов и сбора открытых данных, которые впоследствии будет использовать для улучшения своей нейросети ChatGPT. Вскоре после запуска на волне критики продукта и компании за несанкционированный сбор данных OpenAI опубликовала инструкцию, как заблокировать доступ бота к сайту или предоставить ему данные лишь частично.

ГРЧЦ рекомендовал блокировать GPTBot компании OpenAI

«Сам по себе GPTBot оформлен максимально корректно, он всегда "представляется", когда появляется на сети, и заявляет о соблюдении правил доступа для ботов, заданных владельцами ресурсов», — сказал изданию менеджер продукта Qrator.AntiBot в Qrator Labs Георгий Тарасов.

Однако, когда в ноябре 2023 г. Qrator Labs зафиксировала резкий рост активности вредоносных ботов, абсолютным рекордсменом по интенсивности обращений стал GPTBot.

Тоже в ноябре 2023 г. после скандального увольнения и не менее скандального возвращения исполнительного директора компании Сэма Олтмана (Sam Altman) стало известно, что исследователи OpenAI написали совету директоров письмо, в котором утверждалось, что разработчикам удалось сделать некое устрашающее открытие, которое может угрожать человечеству. Об этом писал CNews.

Что это за открытие точно не известно. Копию письма журналистам получить не удалось. На запрос Reuters его предполагаемые авторы не ответили.

Чего опасается ГРЧЦ

«Не секрет, что ИИ-боты могут применяться не только в мирных целях, но и служить интересам киберпреступников. На базе таких решений уже сейчас создают инструменты для быстрого взлома, фишинга, обеспечения работы даркнет-площадок», — сказал «Коммерсанту» гендиректор хостинг-провайдера RUVDS Никита Цаплин.

Этим рискам нужно уделять внимание, отметил Цаплин, поэтому рекомендация Роскомнадзора позволяет ограничить возможности автоматизированного поиска уязвимостей с помощью тех или иных ИИ-ботов: «Они становятся все эффективнее и, следовательно, опаснее. Конечно, отличить бота от обычного пользователя не всегда просто, но в целом такую работу вести нужно. Мы расцениваем инициативу как здравую, ее можно советовать применять всем вебмастерам».

Но эта мера через какое-то время может перестать быть действенной. «Если компании в рунете и в глобальном интернете продолжат запрещать доступ для GPTBot и других AI-поисковых роботов в том же темпе, как это происходит сейчас, то AI/ML бизнесам придется прибегать к другим методам сбора актуальных данных, — считает Тарасов. — Например, к маскировке ботов под легитимных пользователей и покупку агрегированных данных у владельцев бот-ферм, а это уже входит в категорию нежелательных бот-атак».