Причины создания суверенного ИИ
В Сбербанке объяснили, зачем создают суверенный искусственный интеллект (ИИ), пишет РБК. Это единственный способ получить хорошую модель и снизить риск закрытия доступа.
Суверенный ИИ — это единственный способ получить ИИ-модель очень хорошего качества и остаться устойчивым, снизить риск внешних факторов вроде внезапного закрытия доступа, заявил в интервью РБК старший вице-президент, руководитель блока «Развитие генеративного ИИ» Сбербанка Антон Фролов.
В понимании Сбербанка суверенность ИИ означает полный контроль над наиболее сложным и ресурсоемким технологическим этапом его создания. Компания изначально обучала собственную языковую ИИ-модель, лежащую в основе «ГигаЧата» с нуля самостоятельно, без использования открытых архитектур других ИТ-разработчиков. Такой подход требует значительно больших вычислительных ресурсов graphical processing unit (GPU) как на этапе обучения, так и при дальнейшем развитии ИИ-модели по сравнению с компаниями, использующими готовые открытые ИТ-решения.
«У создания ИИ существует несколько ключевых технологических этапов. Один из них — предобучение т.е. pre-training, который является наиболее ресурсоемким. Если компания действительно хочет создать по-настоящему собственную ИИ-модель, критически важным становится полный контроль именно над этим этапом», — отметил Антон Фролов.
По его словам, при попытке модифицировать существующие Open Source ИИ-модели в процессе адаптации под собственные нужды часто происходит нарушение фундаментальных знаний ИИ-модели. Кроме того, сохраняется риск внезапного закрытия доступа к открытым ИИ-моделям или прекращения выпуска их новых версий.
Таким образом, в Сбербанке считают, что только независимое обучение ИИ-модели с нуля обеспечивает настоящий технологический суверенитет для России и долгосрочную устойчивость решений в области ИИ-технологий.
Зарубежный контент
При этом при обучении ИИ-моделей Сбербанка, в том числе на этапе предобучения, использовались как российские, так и зарубежные данные, добавил Фролов. «Основная информация, которая вообще есть в мире, на английском языке. Не использовать данные на английском — это выстрел себе в ногу. Вопрос не в использовании таких данных, а в их дальнейшей очистке, фильтрации и во взвешивании российских данных. При обучении ИИ-модели российским текстам культурным контекстам и локальным знаниям намеренно придается больший приоритет — чтобы ИИ-модель отвечала на запросы через призму российской культуры и реалий», — рассказал Антон Фролов, отметив, что суверенность — это усиливать то, что относится к нашей национальной идентичности.
Представитель Сбербанка признал наличие проблемы недостаточного объема российского массива данных для обучения ИИ-моделей на российском рынке. Из-за этого ИИ на отдельные запросы пользователей может генерировать ответы, основанные преимущественно на западных данных. Например, по запросу нарисовать «Винни-Пуха» ИИ-модель может представить персонажа в стиле диснеевского мультфильма, а не в соответствии с советской художественной традицией.
Оцифровка российских данных
«Суверенность ИИ необходима в том числе для корректного понимания и сохранения культурных кодов. Россия обладает колоссальным культурным и научным наследием: архивами, библиотеками, историческими документами, которые десятилетиями существовали только в бумажном виде. 24 марта 2026 г. этот массив активно оцифровывается как отраслью, так и научным сообществом, что позволяет последовательно расширять российский массив данных», — отмечает РБК Антон Фролов.
По его словам, для развития любых нейросетевых ИИ-моделей данных всегда будет недостаточно. Чем больше будет появляться инициатив, направленных на обогащение и расширение качественных датасетов, тем лучше для всей отрасли ИИ-технологий.
Рассчитывает ли Сбербанк получить статус суверенной и национальной ИИ-модели для своего ИИ в 2026 г., руководитель блока «Развитие генеративного ИИ» Сбербанка комментировать не стал.
Отдельный законопроект
19 марта 2026 г. Министерство цифрового развития, связи и массовых коммуникаций (Минцифры) России представило законопроект «Об основах государственного регулирования сфер применения ИИ-технологий», который впервые на законодательном уровне закрепляет правила разработки и использования ИИ в России.
Документ предлагает ввести понятие суверенных и национальных ИИ-моделей. К ним будут относить решения, которые разрабатывают отечественные ИТ-специалисты на российских данных, а ключевые права принадлежат гражданам или юридическим лицам страны.
Как уже информировал CNews, также предлагается ввести статус доверенных ИИ-моделей — тех, что прошли проверку Федеральной службы безопасности (ФСБ) и Федеральной службе по техническому и экспортному контролю (ФСТЭК) на кибербезопасность, подтвердили качество по отраслевым стандартам и были внесены в специальный реестр.
В ФСТЭК могут разрешить использовать в государственных информационных системах и на объектах критической информационной инфраструктуры (КИИ) т.е. информационные системы и сети связи государственных органов, энергетических, финансовых, медицинских, транспортных и ряда других компаний.




