Выбирай : Покупай : Используй
0

Назван «топ-3 лидеров» российского Open Source

Университет ИТМО провел исследование особенностей и тенденций в развитии Open Source, согласно которому, лидерами в российском Open Source названы «Яндекс», Сбербанк и «Т-Банк».

Основные выводы исследования ИТМО

Специалисты исследовательского центра «Сильный ИИ в промышленности» ИТМО изучили особенности и тенденции в развитии и использовании общемирового опенсорса в области машинного обучения и работы с данными в России, сообщили CNews представители университета. В исследовании также приняли участие эксперты из «Яндекса», Сбербанка, «Т-Банка», VK, Wildberries, «Рокет Контрол», CodeScoring и МФТИ.

По результатам исследования, тройку лидеров среди российских разработчиков опенсорс-решений составили «Яндекс», Сбербанк и «Т-Банк». В список лидирующих проектов вошли разработки как отечественных, так и международных компаний, например, CatBoost, LangChain, Spark, MetaBase, Numpy, ClickHouse и др.

Исследователи пришли к выводу, что почти все компании-разработчики открытых решений в Data/ML находят пользователей не только на внутреннем, но и на международном рынке. Востребовано то, что лучше работает без привязки к конкретной стране. В России создается много сильных открытых инструментов, многие активно используемые датасеты создаются российскими компаниями, но продвигать свои проекты сложно. Не хватает системности и поддержки, в том числе схем монетизации.

Исследование ИТМО определило лидеров российского Open Source

ИТМО — Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики. Создан на базе Ленинградского института точной механики и оптики (ЛИТМО), существовавшего с 1933 г. — в 1992 г. ЛИТМО был переименован в Санкт-Петербургский институт точной механики и оптики, а в 1994 г. получил статус университета. Сейчас здесь обучается более 12,5 тыс. студентов из 88 стран мира, как указано на сайте вуза.

Лидеры Open Source в России

Лидеры среди российских компаний-разработчиков определялись по нескольким критериям. Среди них – количество Open Source проектов по тематическим категориям в области Data/ML, показатели используемости этих проектов в России, уровень качества реализации репозиториев, количество контрибьюторов и их активность.

Компания Репозитории Количество звезд Количество contribuors Количество коммитов
Yandex ytsaurus, gixy, YaLM-100B, odyssey 65 065 460 198 979
Postgrespro* rum, jsquery, postgres, pg_probackup, pg_pathman 16 920 62 55 294
МФТИ DeepPavlov, ner, question_generation, visionforge, plotly.kt 7 322 73 3 727
Tinkoff etna, CORL, katakomba 12 262 44 907
Sber Kandinsky-2, ru-gpts, ru-dalle, ghost, Kandinsky-3, LightAutoML, Eco2AI, Py-Boost, gigachain 9 406 46 977
ITMO FEDOT, BAMT, Fedot.Industrial 826 47 1 541
HSE face-emotion-recognition, DeepGenerativeModels, probaforms, commit-activity 1 073 12 55 343
MTS RecTools, Ambrosia, CoolGraph 648 21 191
Skoltech SKAB 307 7 165
VK YouTokenToMe, tarantool, nocc 4 480 163 16 448

Источник: ИТМО

По большинству показателей среди российских компаний лидером стал «Яндекс», на втором и третьем месте — Сбербанк и «Т-Банк».

У «Яндекса» 120 Open Source решений (топ-3 решений: CatBoost, YTSaurus, YDB); средний рейтинг 13,5; звезд 65,065 тыс.; 460 уникальных контрибьюторов.

У Сбербанка 100 Open Source решений (топ-3 решений: LightAuotoVL, GigaChain, RePlay); средний рейтинг 11,25; звезд 9,406 тыс.; 46 уникальных контрибьюторов.

У «Т-Банка» 132 Open Source решений (топ-3 решений: ETNA, CORL, Katakomba); средний рейтинг 11,25; звезд 1,262 тыс.; 44 уникальных контрибьюторов.

Статистика по количеству звезд

В топ-10 также вошли Postgres Pro, VK, «Авито», Evrone, МТС, Selectel и топовые университеты. Эти компании обладают сильными позициями по результатам опроса экспертов и анализа открытых данных (звезды, форки, скачивания и т. д.; в статистике звезд и форков приведены суммарные данные по ТОП-10 решений от каждой компании).

Статистика по количеству forks

«Для работы с данными мы используем YTsaurus, или, как он называется у нас внутри, — YT. Также, используем свои датасеты и модели, стараясь полагаться на собственные разработки. В рамках коллабораций мы анализируем, как наши модели работают по сравнению с чужими. Это позволяет нам выявить, какие решения показывают лучшие результаты», — сказал Сергей Бережной, директор «Яндекса» по взаимодействию с разработчиками.

Перспективы развития Open Source

Общее мнение участвовавших в исследовании экспертов о перспективах Open Source: развитие технологий ИИ многое изменит, но люди останутся на первом месте.

«Перспективы применения искусственного интеллекта в разработке и опенсорсе представляют собой сложную картину. Возможно, мы столкнемся с "хоккейной клюшкой" сингулярности, когда изменения произойдут стремительно и неожиданно. Есть вероятность, что мы доживем до технологической сингулярности в течение ближайших 10-20 лет», — сказал Бережной.

«Велики ожидания от мультиагентных подходов на основе LLM — вплоть до замены части команды разработки на ИИ-агентов. Однако, общая постановка задач остается человеку. С практической точки зрения это означает рост запроса инструменты из сферы LLMOpts и AutoML. Несмотря на то, что уже существует множество активно используемых проектов, многие ниши все еще не закрыты», — говорится в результатах исследования.

Александр Сидоров, Head of Data Science Wildberries, считает, что все перспективы — в максимально «стандартном» Open Source: «Нет российского Open Source и какого-то еще, плохо и вредно плодить ветки по странам, разделять Open Source на "свое" и "чужое"».

Комментарии