Google Cloud представила два новых ИИ-чипа для конкуренции с Nvidia
Google Cloud в среду объявила о запуске восьмого поколения собственных ИИ-чипов — тензорных процессоров (TPU). Впервые линейка будет разделена на две модели: TPU 8t, ориентированный на обучение моделей, и TPU 8i, предназначенный для инференса. Инференс — это использование обученных моделей в реальном времени, например, при обработке пользовательских запросов после отправки промптов.
Компания заявила о значительном росте производительности новых чипов по сравнению с предыдущими поколениями: ускорение обучения ИИ-моделей до 3 раз, повышение производительности на доллар на 80% и возможность объединения более чем 1 млн TPU в один кластер. Это должно обеспечить значительно большую вычислительную мощность при меньшем энергопотреблении и снижении затрат для клиентов. Чипы называются TPU, а не GPU, поскольку изначально Google разработала их как энергоэффективные специализированные процессоры под названием Tensor.
Однако новые чипы Google пока не представляют прямой угрозы для Nvidia. Как и другие крупные облачные провайдеры — Microsoft и Amazon — Google использует собственные TPU для дополнения систем на базе чипов Nvidia в своей инфраструктуре, а не для их полной замены. Более того, Google подтвердила, что позже в этом году в её облаке появится новейший чип Nvidia — Vera Rubin.
В перспективе гипермасштабируемые облачные провайдеры, разрабатывающие собственные ИИ-чипы, могут снизить зависимость от Nvidia по мере того, как предприятия будут переносить ИИ-нагрузки в облака и адаптировать приложения под специализированные архитектуры. Тем не менее, на текущий момент ставка против Nvidia остаётся рискованной. Как иронично отметил известный аналитик рынка чипов Патрик Мурхед в соцсети X, он ещё в 2016 году предположил, что TPU от Google станут плохой новостью для Nvidia (и Intel). С тех пор рыночная капитализация Nvidia приблизилась к $5 трлн, что ставит под сомнение прежние прогнозы.
Если всё пойдёт по плану Nvidia, рост Google как поставщика ИИ-облачных услуг может принести чипмейкеру ещё больше бизнеса, даже если значительная часть нагрузок будет выполняться на собственных чипах Google.
Кроме того, Google сообщила о сотрудничестве с Nvidia в области разработки компьютерных сетей, повышающих эффективность систем на базе чипов Nvidia в облаке Google. В частности, компании совместно работают над улучшением программно-определяемой сетевой технологии Falcon, которую Google создала и открыла в 2023 году в рамках Open Compute Project — организации, курирующей открытые стандарты для оборудования дата-центров.


