Обучение нейросетей
Структура МТС, которая занимается кибербезопасностью, ООО «Серенити Сайбер Секьюрити» (МТС RED) зарегистрировала домен roy9.ru, как выяснил «Коммерсант». Из информации на этом сайте следует, что компания тестирует продукт «Рой 9», предусматривающий предоставление пользователями в аренду вычислительных мощности своих устройств, в том числе мобильных. После запроса издания МТС закрыла доступ к сайту.
Арендованные мощности используются для распределенного обучения моделей машинного обучения (machine learning, ML). Под машинным обучением понимается построение большого количества гипотез и моделей, основанных на заданных показателях. В том числе они позволяют выявлять скрытые закономерности между разными показателями работы информсистем и ускорять обработку большого массива данных.
По данным газеты на сайте было указано, что обучение проходят четыре нейросетевые модели.
В МТС заверили издание, что ресурс предназначен для внутренних нужд и продукта на этой основе запускать не планируется. Внутренние нужды действительно могут возникать. В апреле 2022 г., например, вице-президент компании Евгений Черешнев рассказывал о самообучающейся системе автоматизированного тестирования инфраструктуры МТС на устойчивость (CICADA 8): «При подключении CICADA начинает ломать инфраструктуру, как это делают хакеры. Она пока работает хуже хакеров, но вы не представляете, как она быстро учится».
Модель решает вопрос нехватки ресурсов
«Дефицит доступных вычислительных мощностей для обучения ИИ-моделей — реальность, и идея использовать своего рода краудфандинг решила бы вопрос», — приводит издание комментарий гендиректора хостинг-провайдера RUVDS Никиты Цаплина. Смартфоны, уточняет эксперт, сопоставимы по мощности с компьютерами, для компании это был бы «бюджетный и простой способ» справиться с нехваткой ресурсов.
Эксперт «Кода безопасности» Мария Фесенко сказала «Коммерсанту», что подобная концепция обучения нейросетей практикуется за рубежом: «Только обычно устройства или открытые площадки используются для того, чтобы языковые модели могли обучаться на данных пользователей. В случае МТС модели нейросети будут использовать только мощности устройств участников проекта».
Для реализации подобных проектов используется разное количество вычислительных мощностей, все зависит от уровня зрелости языковых моделей. «Например, для обучения GPT-4 потребовалось 25 тыс. видеокарт, которые суммарно проработали порядка 57 млн часов, а на проект MosaicML MPT-7B — 440 аналогичных карт, которые проработали более 100 тыс. часов», объяснил собеседник на ИТ-рынке
Зачем это пользователям
На сайте roy9.ru МТС так мотивировала пользователей: «Новые модели AI помогут людям в новых открытиях, вы можете стать частью этого движения. Кроме того, помогая в обучении моделей, вы делаете мир интереснее».
Комментируя ситуацию изданию, Цаплин предположил, что в случае удачного тестирования продукта оператор предоставит скидку абонентам, позволяющим использовать мощности своих смартфонов, например ночью, — «в регионах это может быть вполне востребовано».