«Яндекс» представил третье поколение больших языковых моделей YandexGPT

«Яндекс» анонсировал линейку нейросетей YandexGPT 3. Первая языковая модель линейки — YandexGPT 3 Pro — уже доступна на сайте...

«Яндекс» анонсировал линейку нейросетей YandexGPT 3. Первая языковая модель линейки — YandexGPT 3 Pro — уже доступна на сайте Yandex Cloud. Она лучше работает со сложными запросами и точнее следует заданному формату ответов, благодаря чему будет особенно полезна при решении реальных задач компаний и в ИT-продуктах. Кроме того, бизнес-пользователи смогут дообучить новую нейросеть самостоятельно. В ближайшее время нейросети третьего поколения YandexGPT появятся и в сервисах «Яндекса» для широкой аудитории. Об этом CNews сообщили представители «Яндекса».

YandexGPT 3 Pro можно встроить в продукты бизнеса через API. Перед этим качество работы нейросети можно оценить в деморежиме. Новым зарегистрированным пользователям доступно 100 бесплатных запросов в час.

YandexGPT 3 — третье поколение языковых моделей «Яндекса».

YandexGPT 3 Pro — первая нейросеть, которая вошла в линейку YandexGPT 3. В дальнейшем их станет больше: каждая будет ориентирована на решение задач определённого типа.

Новые возможности YandexGPT 3 Pro

YandexGPT 3 Pro эффективнее решает сложные задачи и лучше понимает контекст беседы по сравнению с YandexGPT 2. Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а еще — корректнее работает с фактами, даёт более точные и полные ответы и допускает меньше стилистических ошибок. При этом YandexGPT 3 Pro может обрабатывать существенно больше запросов за единицу времени, чем языковые модели прошлого поколения YandexGPT.

Новая нейросеть особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и не только. Задачи, связанные именно с перечисленными отраслями, составили значительную часть набора данных для обучения YandexGPT 3.

Стоимость использования нейросети снизилась почти в два раза. Заказчики смогут самостоятельно дообучить YandexGPT 3 Pro в сервисе ML-разработки Yandex DataSphere для того, чтобы она ещё лучше соответствовала потребностям конкретного бизнеса. Чтобы запустить процесс дообучения, нужно загрузить в DataSphere файл с примерами запросов и эталонными ответами на них. Такая нейросеть будет доступна только дообучившей ее компании.

Качество ответов YandexGPT 3

Для оценки качества работы YandexGPT 3 Pro разработчики использовали несколько тестов. Первый из них — YaMMLU_ru, локализованная на русский язык версия международного бенчмарка MMLU.

Также разработчики применили методику тестирования Side by Side (SBS) для того, чтобы оценить, как новая модель справляется с генерацией идей, обобщением информации, задачами классификации, созданием контента и другими бизнес-задачами. В среднем YandexGPT 3 отвечала лучше, чем YandexGPT 2 в 67% случаев. При работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть отвечала лучше в 69% и 60% случаев соответственно.

Новый стандарт в следовании формату запроса

Для проверки того, насколько хорошо ответы первой нейросети из линейки YandexGPT 3 соответствуют заданному в запросе формату, разработчики создали русскоязычный тест на базе бенчмарка IFEval. При этом они значительно расширили список решаемых задач и усложнили их.

В сравнении с YandexGPT 2 качество ответов YandexGPT 3 улучшилось на 10 процентных пунктов, а их консистентность увеличилась в два раза. Это значит, что нейросеть научилась лучше понимать, какими именно должны быть ответы на одинаковые по сути, но сформулированные по-разному запросы.

Кроме того, новая языковая модель значительно реже ошибается. По сравнению с YandexGPT 2 количество фактических ошибок сократилось с 16,4% до 13,5%, а доля неподтверждённой информации в ответах снизилась с 6,4% до 5%. Количество ситуаций, когда модель не дает ответ на вопрос пользователя, уменьшилось в пять раз. Все эти проверки проводились с помощью специального набора особенно сложных запросов, применимых в реальном бизнесе.

***

YandexGPT — нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывает контекст беседы с пользователем. YandexGPT кратко пересказывает статьи из интернета в «Яндекс Браузере» и на 300.ya.ru, обобщает информацию из отзывов о товарах в «Поиске» и на «Маркете», помогает создавать описания товаров продавцам «Маркета», пишет рекламные объявления для пользователей «Яндекс Бизнеса» и не только. Нейросеть можно протестировать в собственном бизнесе — для этого нужно зарегистрироваться в Yandex Cloud и использовать API.