Новая версия
Компания OpenAI представила новую модель искусственного интеллекта (ИИ) GPT-4o mini, которая является самой экономичной среди малых моделей компании. Об этом в середине июля 2024 г. сообщается на сайте компании. Ожидается, что это значительно расширит диапазон приложений, построенных на базе ИИ, благодаря доступной цене.
GPT-4o будет доступна в виде удобного приложения для персонального компьютера (ПК), а впоследствии появится и версия для Mac. Данная версия ИИ-модели нового поколения может отвечать на вопросы о видео в реальном времени. Например, если пользователь наведет камеру на утку и спросите «Что это?», GPT-4o безошибочно определит ее. GPT-4o mini превосходит другие малые модели по академическим тестам и демонстрирует высокие показатели в области математического анализа и работы с кодом.
GPT-4 Omni понимает эмоции и тон голоса, а также позволяет прерывать ее во время разговора. Благодаря этой функции пользователи смогут отправить GPT-4o скриншот с задачей, и она предоставит им четкое и исчерпывающее решение. GPT-4o mini поддерживает множество задач, включая применение в цепочках API-запросов и в чат-ботах для поддержки клиентов.
GPT-4o знаменует собой значительный шаг вперед в развитии ИИ, делая его более доступным, универсальным и интуитивно понятным для широкой общественности. Эта революционная модель открывает множество новых возможностей для использования ИИ-технологий в различных сферах, таких как образование, наука, бизнес и развлечения.
Стоимость использования модели составляет 14 руб. за миллион входных токенов и 53 руб. за миллион выходных токенов, что на порядок дешевле предыдущих ИИ-моделей и более чем на 60% дешевле GPT-3.5 Turbo. В настоящее время GPT-4o mini поддерживает работу с текстом и изображениями по API, а в будущем планируется поддержка видео и аудио. ИИ-модель обладает контекстным окном в 128 тыс. токенов и базой знаний до октября 2023 г.
ИИ-модель успешно применялась партнерами OpenAI, такими как инфраструктурный криптостартап Ramp и почтовое приложение Superhuman, для задач, требующих извлечения структурированных данных и ИИ-генерации высококачественных ответов на электронные письма.
Преимущества
Внедрение таких моделей, как GPT-4o mini, позволяет значительно снизить затраты на использование ИИ и расширить его доступность для широкого круга пользователей и приложений. ИИ-модель также демонстрирует высокую производительность при вызове функций, что позволяет разработчикам создавать приложения, получающие данные или выполняющие действия с внешними системами, и улучшенную производительность в длинном контексте по сравнению с GPT-3.5 Turbo.
GPT-4o mini демонстрирует высокие результаты на различных тестах. Модель набирает 82% на MMLU и превосходит GPT-41 по предпочтениям в чатах на undefined LMSYS.
Благодаря низкой стоимости и низкой задержке GPT-4o mini позволяет решать широкий спектр задач, таких как приложения, которые выполняют цепочку или распараллеливают несколько вызовов ИИ-модели (например, вызов нескольких API), передают модели большой объем контекста (например, полную базу кода или историю разговоров) или взаимодействуют с клиентами посредством быстрых текстовых ответов в режиме реального времени (например, чат-боты для поддержки клиентов). GPT-4o mini демонстрирует высокую производительность при вызове функций, что позволяет разработчикам создавать приложения, получающие данные или выполняющие действия с внешними ИТ-системами.
GPT-4o mini лучше других малых моделей справляется с задачами на рассуждение, включающими как текст, так и зрение, набрав 82,0% баллов в MMLU, эталоне текстового интеллекта и рассуждений, по сравнению с 77,9% у Gemini Flash и 73,8% у Claude Haiku. GPT-4o mini отлично справляется с заданиями на математическое мышление и кодирование, превосходя предыдущие маленькие модели на рынке.
На MGSM, измеряющем математические способности, GPT-4o mini набрал 87,0%, по сравнению с 75,5% у Gemini Flash и 71,7% у Claude Haiku. GPT-4o mini набрал 87,2% по результатам HumanEval, измеряющим производительность кодирования, по сравнению с 71,5% у Gemini Flash и 75,9% у Claude Haiku.
GPT-4o mini также демонстрирует высокие результаты в MMMU, оценке мультимодальных рассуждений, набрав 59,4 % по сравнению с 56,1% у Gemini Flash и 50,2% у Claude Haiku.
Меры безопасности, встроенные в GPT-4o mini, также делают данную ИИ-модель надежной для использования в масштабных приложениях. Это включает защиту от утечек данных и устойчивость к различным кибератакам на ИТ-систему.