«Яндекс» представил третье поколение больших языковых моделей YandexGPT
«Яндекс» анонсировал линейку нейросетей YandexGPT 3. Первая языковая модель линейки — YandexGPT 3 Pro — уже доступна на сайте Yandex Cloud. Она лучше работает со сложными запросами и точнее следует заданному формату ответов, благодаря чему будет особенно полезна при решении реальных задач компаний и в ИT-продуктах. Кроме того, бизнес-пользователи смогут дообучить новую нейросеть самостоятельно. В ближайшее время нейросети третьего поколения YandexGPT появятся и в сервисах «Яндекса» для широкой аудитории. Об этом CNews сообщили представители «Яндекса».
YandexGPT 3 Pro можно встроить в продукты бизнеса через API. Перед этим качество работы нейросети можно оценить в деморежиме. Новым зарегистрированным пользователям доступно 100 бесплатных запросов в час.
YandexGPT 3 — третье поколение языковых моделей «Яндекса».
YandexGPT 3 Pro — первая нейросеть, которая вошла в линейку YandexGPT 3. В дальнейшем их станет больше: каждая будет ориентирована на решение задач определённого типа.
Новые возможности YandexGPT 3 Pro
YandexGPT 3 Pro эффективнее решает сложные задачи и лучше понимает контекст беседы по сравнению с YandexGPT 2. Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а еще — корректнее работает с фактами, даёт более точные и полные ответы и допускает меньше стилистических ошибок. При этом YandexGPT 3 Pro может обрабатывать существенно больше запросов за единицу времени, чем языковые модели прошлого поколения YandexGPT.
Новая нейросеть особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и не только. Задачи, связанные именно с перечисленными отраслями, составили значительную часть набора данных для обучения YandexGPT 3.
Стоимость использования нейросети снизилась почти в два раза. Заказчики смогут самостоятельно дообучить YandexGPT 3 Pro в сервисе ML-разработки Yandex DataSphere для того, чтобы она ещё лучше соответствовала потребностям конкретного бизнеса. Чтобы запустить процесс дообучения, нужно загрузить в DataSphere файл с примерами запросов и эталонными ответами на них. Такая нейросеть будет доступна только дообучившей ее компании.
Качество ответов YandexGPT 3
Для оценки качества работы YandexGPT 3 Pro разработчики использовали несколько тестов. Первый из них — YaMMLU_ru, локализованная на русский язык версия международного бенчмарка MMLU.
Также разработчики применили методику тестирования Side by Side (SBS) для того, чтобы оценить, как новая модель справляется с генерацией идей, обобщением информации, задачами классификации, созданием контента и другими бизнес-задачами. В среднем YandexGPT 3 отвечала лучше, чем YandexGPT 2 в 67% случаев. При работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть отвечала лучше в 69% и 60% случаев соответственно.
Новый стандарт в следовании формату запроса
Для проверки того, насколько хорошо ответы первой нейросети из линейки YandexGPT 3 соответствуют заданному в запросе формату, разработчики создали русскоязычный тест на базе бенчмарка IFEval. При этом они значительно расширили список решаемых задач и усложнили их.
В сравнении с YandexGPT 2 качество ответов YandexGPT 3 улучшилось на 10 процентных пунктов, а их консистентность увеличилась в два раза. Это значит, что нейросеть научилась лучше понимать, какими именно должны быть ответы на одинаковые по сути, но сформулированные по-разному запросы.
Кроме того, новая языковая модель значительно реже ошибается. По сравнению с YandexGPT 2 количество фактических ошибок сократилось с 16,4% до 13,5%, а доля неподтверждённой информации в ответах снизилась с 6,4% до 5%. Количество ситуаций, когда модель не дает ответ на вопрос пользователя, уменьшилось в пять раз. Все эти проверки проводились с помощью специального набора особенно сложных запросов, применимых в реальном бизнесе.
***
YandexGPT — нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывает контекст беседы с пользователем. YandexGPT кратко пересказывает статьи из интернета в «Яндекс Браузере» и на 300.ya.ru, обобщает информацию из отзывов о товарах в «Поиске» и на «Маркете», помогает создавать описания товаров продавцам «Маркета», пишет рекламные объявления для пользователей «Яндекс Бизнеса» и не только. Нейросеть можно протестировать в собственном бизнесе — для этого нужно зарегистрироваться в Yandex Cloud и использовать API.