Выбирай : Покупай : Используй

Вход для партнеров

Вход для продавцов

0

Путеводитель по ключевым терминам искусственного интеллекта от AGI до токенов

Разбираемся в терминах ИИ: от AGI до токенов и RAMageddon

Искусственный интеллект меняет мир и одновременно создаёт новый язык для описания того, как это происходит. Уже через пять минут чтения о ИИ вы столкнётесь с такими аббревиатурами, как LLM, RAG, RLHF и десятками других терминов, которые могут поставить в тупик даже опытных специалистов в технологической сфере. Этот глоссарий призван устранить эту неопределённость. Мы регулярно обновляем его по мере развития отрасли, поэтому считайте его живым документом — подобно самим системам ИИ, которые он описывает.

AGI
Искусственный общий интеллект (AGI) — расплывчатое понятие, обычно обозначающее ИИ, превосходящий среднего человека во многих, если не во всех задачах. Генеральный директор OpenAI Сэм Альтман однажды описал AGI как «аналог среднего человека, которого можно нанять в качестве коллеги». В уставе OpenAI AGI определяется как «высокоавтономные системы, превосходящие людей в большинстве экономически ценных видов деятельности». Google DeepMind, в свою очередь, понимает AGI как «ИИ, по крайней мере не уступающий людям в большинстве когнитивных задач». Эксперты на переднем крае исследований ИИ тоже не пришли к единому мнению.

AI agent
AI-агент — это инструмент, использующий технологии ИИ для выполнения серии задач от вашего имени, выходящих за рамки возможностей обычного чат-бота: от подачи отчётов о расходах и бронирования билетов или столиков в ресторане до написания и поддержки кода. Однако в этой развивающейся области много неопределённостей, и термин «AI-агент» может означать разное для разных людей. Инфраструктура всё ещё строится для реализации заявленных возможностей. В основе концепции лежит автономная система, способная задействовать несколько ИИ-моделей для выполнения многоэтапных задач.

API endpoints
API-эндпоинты можно представить как «кнопки» на задней панели программного обеспечения, которые другие программы могут нажимать, чтобы заставить его выполнять действия. Разработчики используют эти интерфейсы для создания интеграций — например, чтобы одно приложение могло получать данные из другого или чтобы ИИ-агент мог управлять сторонними сервисами напрямую, без участия человека. Большинство умных устройств и подключённых платформ имеют такие скрытые «кнопки», даже если обычные пользователи их не видят. По мере роста возможностей ИИ-агентов они всё чаще способны самостоятельно находить и использовать эти эндпоинты, открывая мощные — и порой неожиданные — возможности автоматизации.

Chain of thought
Человек может мгновенно ответить на простой вопрос вроде «кто выше — жираф или кошка?». Но во многих случаях для получения правильного ответа нужны промежуточные шаги — например, при решении задачи с 40 головами и 120 ногами у кур и коров требуется составить уравнение (ответ: 20 кур и 20 коров).
В контексте ИИ цепочка рассуждений (chain-of-thought) для больших языковых моделей означает разбиение задачи на промежуточные шаги для повышения качества результата. Это занимает больше времени, но повышает вероятность правильного ответа, особенно в логических или программных задачах. Такие модели рассуждений создаются на основе традиционных больших языковых моделей и оптимизируются для цепочечного мышления с помощью обучения с подкреплением.

Coding agents
Это более узкое понятие по сравнению с «AI-агентом»: программа, способная автономно выполнять последовательные действия для достижения цели. Coding agent специализирован на разработке программного обеспечения. Вместо того чтобы просто предлагать код для ручной вставки, он может писать, тестировать и отлаживать код самостоятельно, выполняя итеративную работу, обычно занимающую большую часть дня разработчика. Такие агенты способны работать со всеми кодовыми базами, находить ошибки, запускать тесты и внедрять исправления с минимальным контролем человека. Это как нанять очень быстрого стажёра, который никогда не спит и не теряет концентрацию — но, как и в случае со стажёром, человеку всё равно нужно проверять результат.

Compute
Хотя термин многозначен, «compute» обычно обозначает вычислительную мощность, необходимую для работы ИИ-моделей. Эта мощность лежит в основе индустрии ИИ, обеспечивая обучение и развёртывание мощных моделей. Часто термин используется как сокращение для аппаратного обеспечения, обеспечивающего такую мощность: GPU, CPU, TPU и других компонентов инфраструктуры, формирующих основу современной индустрии ИИ.

Deep learning
Глубокое обучение — подмножество машинного обучения, в котором алгоритмы ИИ построены на многослойных искусственных нейронных сетях (ANN). Это позволяет им выявлять более сложные зависимости по сравнению с простыми моделями машинного обучения, такими как линейные модели или деревья решений. Структура вдохновлена нейронными связями человеческого мозга.
Модели глубокого обучения способны самостоятельно выделять важные признаки в данных, не требуя ручного определения от инженеров. Они также могут учиться на ошибках, улучшая результаты через повторение и корректировку. Однако для получения хороших результатов им нужны огромные объёмы данных (миллионы и более), а обучение занимает больше времени и дороже по сравнению с простыми алгоритмами.

Diffusion
Диффузия — технология, лежащая в основе многих генеративных ИИ для изображений, музыки и текста. Вдохновлённая физикой, она постепенно «разрушает» структуру данных (фотографий, песен и т.п.), добавляя шум до полного исчезновения информации. В физике диффузия необратима — растворённый в кофе сахар не вернуть в кубик. Но ИИ-системы диффузии обучаются «обратному процессу», чтобы восстанавливать данные из шума, что позволяет им генерировать новые данные.

Distillation
Дистилляция — метод извлечения знаний из большой ИИ-модели с помощью подхода «учитель-ученик». Разработчики отправляют запросы «учителю» и записывают его ответы, которые иногда сравниваются с набором данных для оценки точности. Эти ответы затем используются для обучения «ученика», который учится имитировать поведение учителя.
Дистилляция позволяет создавать меньшие и более эффективные модели с минимальными потерями. Вероятно, так OpenAI создала GPT-4 Turbo — ускоренную версию GPT-4. Хотя все компании ИИ используют дистилляцию внутренне, её также могут применять для копирования передовых моделей конкурентов — что обычно нарушает условия использования API и чат-ассистентов.

Fine-tuning
Дообучение модели ИИ для оптимизации под конкретную задачу или область с помощью новых, специализированных данных. Многие стартапы используют большие языковые модели как основу и повышают их полезность для целевого сектора, добавляя собственные доменные знания через fine-tuning.

GAN
Генеративно-состязательная сеть (GAN) — это фреймворк машинного обучения, лежащий в основе некоторых генеративных ИИ, включая инструменты для создания дипфейков. GAN состоит из двух нейронных сетей: генератор создаёт данные, а дискриминатор оценивает их подлинность. Они соревнуются: генератор пытается обмануть дискриминатор, а тот — распознать подделку. Такой подход улучшает реализм вывода без участия человека, но лучше всего работает в узких задачах, например, генерации реалистичных изображений.

Hallucination
Галлюцинация — термин, обозначающий генерацию ИИ ложной информации. Это серьёзная проблема качества: такие выводы могут вводить в заблуждение и даже нести реальные риски (например, вредные медицинские советы). Причина — пробелы в обучающих данных. Это стимулирует переход к более узкоспециализированным ИИ, чтобы снизить вероятность ошибок.

Inference
Инференс — процесс запуска обученной ИИ-модели для получения прогнозов или выводов на основе новых данных. Без предварительного обучения инференс невозможен. Выполняться он может на разных устройствах — от смартфонов до мощных GPU и специализированных ускорителей ИИ, но эффективность сильно зависит от аппаратных возможностей.

Large language model (LLM)
Большие языковые модели (LLM) лежат в основе популярных ИИ-ассистентов: ChatGPT, Claude, Gemini, Llama, Copilot, Le Chat. Они представляют собой глубокие нейронные сети с миллиардами параметров, обучающиеся на огромных текстовых корпусах и генерирующие наиболее вероятные ответы на запросы пользователей.

Memory cache
Кэширование памяти — метод оптимизации инференса, позволяющий сократить вычислительные затраты. При повторных запросах модель использует сохранённые промежуточные результаты вместо повторных вычислений. Один из известных типов — KV-кэширование в трансформерных моделях, ускоряющее генерацию ответов.

Neural network
Нейронная сеть — многослойная алгоритмическая структура, лежащая в основе глубокого обучения и бума генеративного ИИ. Идея вдохновлена нейронными связями мозга, но реальный прорыв стал возможен благодаря GPU, изначально разработанным для видеоигр.

Open source
Открытый исходный код — подход, при котором код программного обеспечения или ИИ-модели доступен всем для использования, изучения и модификации. Пример в ИИ — семейство моделей Llama от Meta*. Закрытые модели, такие как GPT от OpenAI, не раскрывают код, что стало одной из ключевых дискуссий в индустрии.

Parallelization
Параллелизация — выполнение множества операций одновременно, а не последовательно. В ИИ это критически важно: современные GPU рассчитаны на тысячи параллельных вычислений, что сделало их основой индустрии. По мере роста моделей параллелизация между чипами и серверами становится ключевым фактором эффективности.

RAMageddon
«RAMageddon» — шуточное название острой нехватки оперативной памяти (RAM), вызванной массовыми закупками чипов крупными ИИ-компаниями для своих дата-центров. Это приводит к росту цен и дефициту в других отраслях: гейминге, потребительской электронике и корпоративных вычислениях. Знаков скорого окончания кризиса пока нет.

Reinforcement learning
Обучение с подкреплением — метод, при котором ИИ учится через пробу и ошибку, получая «награды» за правильные действия. В отличие от обучения на размеченных данных, здесь модель исследует среду и корректирует поведение на основе обратной связи. Особенно эффективно для игр, робототехники и улучшения рассуждений в LLM. RLHF (обучение с подкреплением на основе человеческой обратной связи) стало ключевым для тонкой настройки моделей.

Token
Токены — базовые единицы обработки текста в LLM. Токенизация разбивает текст на сегменты (часто части слов), которые модель может обработать. В корпоративном использовании стоимость ИИ-услуг часто рассчитывается за токен.

Token throughput
Пропускная способность по токенам — объём токенов, обрабатываемых системой за единицу времени. Это ключевой показатель производительности ИИ-инфраструктуры, определяющий, сколько пользователей может обслуживаться одновременно и насколько быстро приходят ответы.

Training
Обучение — процесс, при котором модель учится на данных, выявляя закономерности для генерации полезных выводов. Требует больших объёмов данных и ресурсов, поэтому часто используется гибридный подход с fine-tuning.

Transfer learning
Перенос обучения — использование ранее обученной модели в качестве основы для новой задачи, особенно когда данных мало. Позволяет экономить ресурсы, но требует дополнительной донастройки для достижения высокой точности.

Weights
Веса — числовые параметры, определяющие важность различных признаков в данных. В ходе обучения они корректируются, чтобы модель точнее соответствовала целевым результатам. Например, при прогнозировании цен на жильё веса могут отражать влияние количества спален, наличия гаража и других факторов.

Validation loss
Валидационные потери — метрика, показывающая, насколько хорошо модель обобщает знания, а не просто запоминает обучающие данные. Низкое значение — хорошо. Помогает выявить переобучение и оптимизировать процесс обучения.

 

Источник

* Американская транснациональная холдинговая компания Meta Platforms Inc. по реализации продуктов социальных сетей Facebook и Instagram входит в перечень организаций, признанных в соответствии с законодательством Российской Федерации экстремистскими

Netgear обвиняет TP-Link в обмане покупателей и фиктивном уходе из Китая Netgear переходит в наступление и подает встречный иск к TP-Link, обвиняя конкурента в ложной рекламе и фиктивном ребрендинге. Несмотря на заявления о независимости, компания продолжает опираться на китайские разработки и производство, что подтверждается черным списком Пентагона.
HONOR X80 Pro Max с гигантской батареей 11000 мАч засветился на живых фото В сети появились реальные фотографии смартфона HONOR X80 Pro Max с уникальной кожаной отделкой и аккумулятором на 11 000 мАч. Устройство получило круглый блок камер на 50 Мп, узкие рамки дисплея и процессор Snapdragon 6 Gen 5. Также в обзоре: новый TECNO POVA 8 с мини-экраном и список смартфонов realme для обновления до Android 17.
Стартап Джеффа Безоса создает универсального искусственного инженера для проектирования будущего Компания Prometheus при поддержке Джеффа Безоса разрабатывает ИИ-инструменты для проектирования сложных физических изделий. Новая технология способна ускорить создание прорывных решений в робототехнике, фармацевтике и аэрокосмической отрасли.