Четвертое пришествие YandexGPT
Российский интернет-гигант «Яндекс» сообщил CNews о релизе четвертого поколения своей нейросети YandexGPT. Дебют первой версии состоялся в мае 2023 г., то есть до версии 4 сервис дорос всего за полтора года.
В «Яндексе» подчеркнули, что YandexGPT 4 доступна сразу в двух модификациях – облегченной Lite и напичканной всеми возможными функциями Pro. Каждая из них разительно отличается от YandexGPT 3 уже как минимум тем, что эксперты «Яндекса» научили ее обрабатывать даже очень длинные запросы.
Если YandexGPT 3 понимает запросы длиной около 15 страниц и может работать с ними, то YandexGPT 4 способна понимать почти 60-страничные, то есть в четыре раза более длинные запросы.
В «Яндексе» подчеркнули, что теперь, благодаря такому росту, YandexGPT 4 пригодна «для решения более сложных и разнообразных бизнес-задач, от анализа обращений клиентов до автоматизации закупок».
Каждому свое
Разделение YandexGPT 4 на версии Lite и Pro позволило расширить сферу ее применения. Например, если пользователю нужны оперативные ответы на сравнительно простые ответы, то возможностей Lite-ревизии для этого будет более чем достаточно. Новые модели применимы в разных сферах. С их помощью можно, например, сортировать письма и заявки клиентов, анализировать резюме и решать другие задачи, связанные с обработкой текста, уверяют разработчики. Pro-сборка YandexGPT 4 – еще более серьезный и функциональный инструмент, который может превратиться в отличного бизнес-помощника. Например, с его помощью можно проводить анализ продаж.
К моменту выхода материала некоторые функции YandexGPT 4 еще тестировались. Редакция CNews обратилась к представителям «Яндекса» с вопросом о сроках релиза их стабильных их версий и ожидает ответа.
Также пока очень ограничено количество сервисов «Яндкекса», где можно опробовать YandexGPT 4 в действии. Пока они доступны лишь в демоверсии в чате на платформе Yandex Cloud, но в будущем, как обещают разработчики, новая нейросеть появится «в сервисах "Яндекса" для широкой аудитории». «Первым таким сервисом станет "Алиса" с опцией "Про"», – добавили они, не назвав точные сроки.
Прогресс налицо
Несмотря на то, что промежуток между релизами YandexGPT 4 и YandexGPT 3 составляет всего несколько месяцев, новая версия нейросети «Яндекса» заметно опережает свою предшественницу по качеству оттенков. По заверениям разработчиков, в этом плане YandexGPT 4 Pro обходит YandexGPT 3 Pro в 70% случаев.
«Версия Lite отвечает не хуже самой мощной модели "Яндекса" прошлого поколения. Это стало возможным благодаря улучшению процесса обучения. В частности, разработчики научили нейросеть рассуждать – на примерах с пошаговым решением задач», – сообщили CNews представители «Яндекса».
Почти как человек
Одной из ключевых особенностей YandexGPT 4 стало умение разбивать поставленную перед ней сложную задачу на несколько более простых, после чего решать их пошагово. Фактически, нейросеть научилась рассуждать, то есть составлять цепочки мыслей (функция chain-of-thought).
Качество ответов YandexGPT 4 на фоне предыдущих версий нейросети улучшилось, в том числе, благодаря этой возможности. За счет умения рассуждать YandexGPT 4 способна отвечать на вопросы, требующие анализа. В качестве примера «Яндекс» привел негативный отзыв клиента – нейросеть может разобраться в причинах недовольства и предложить пути решения проблемы.
Разработчики намерены дополнительно улучшить способность YandexGPT 4 к рассуждению. Они хотят добавить в нее возможность включать скрытые рассуждения для всех запросов.
Не как человек
Особенностью человеческого мышления является то, что люди очень часто додумывают что-то или придумывают вымышленные факты. Нейросети научились этому от них, и YandexGPT 4 в этом плане – не исключение, но разработчики постарались до минимума сократить долю ошибок в ответах (в том числе и выдуманных фактов).
Новые модели лучше отвечают на вопросы с опорой на внешние источники (применяется в системах RAG, Retrieval Augmented Generation). Такими источниками могут быть, например, документы компании или статьи. Доля ошибок и придуманных фактов снизилась в таких сценариях почти в два раза – с 4% в третьем поколении нейросети до до 2,1% в четвертом. «Кроме того, новые модели в среднем в два раза быстрее предыдущих отвечают на вопросы», – добавили разработчики.
Комментарий «Яндекса»
После публикации материала в редакцию CNews поступили официальные комментарии «Яндекса.
На вопрос редакции о сроках завершения тестирования оставшихся функций нейросети, представители «Яндекса» ответили: «На запуске мы даем возможность разработчикам сторонних сервисов протестировать модели, подготовиться к переходу на новую версию и убедиться в стабильности работы. Уже сейчас модель Pro в Yandex Cloud может обрабатывать в четыре раза более длинные запросы. В ближайшее время в сервисе появятся и новые инструменты для бизнеса: модели смогут строить цепочки рассуждений, чтобы решать задачи пошагово, а также работать с внешними приложениями».
Ответ на вопрос, когда новые возможности YandexGPT 4 появятся в сервисах «Яндекса» для широкой аудитории, был таким: «Все интеграции моделей семейства YandexGPT 4 в сервисы компании мы анонсируем дополнительно, следите за обновлениями».
На вопрос, в каких еще сервисах, помимо «Алисы с опцией «Про», будет использоваться новая нейросеть в «Яндексе» ответили: «Про новые интеграции YandexGPT в сервисы компании мы расскажем дополнительно. Различные версии YandexGPT уже используются почти в 20 сервисах «Яндекса», в том числе в «Браузере», «Поиске с Нейро», «Алисе» и многих других».
Также редакция CNews поинтересовалась, с чем связан резкий 70-процентный прирост качества ответов по сравнению с третьим поколением, и означает ли это, что третье поколение часто давало некачественные ответы. В «Яндексе» сообщили: «Мы проделали значительную работу над новым поколением, чтобы оно гораздо лучше решало прикладные задачи, как в сервисах «Яндекса», так и в сторонних бизнесах. В процессе тренировки нейросетей мы значительно обновили обучающий датасет, добавили больше качественных данных и хороших примеров ответов модели, увеличили долю длинных документов, а также показывали нейросети примеры с пошаговым решением задач. Для обучения разработчики собрали набор сложных бизнес задач: от суммаризации документа до автоматизации саппорта. На эти сценарии модель обучалась в первую очередь».