Импортозамещение – дорогое удовольствие
Китайские компании, работающие в сфере искусственного интеллекта или использующие его, могут столкнуться с крупными тратами при отказе от ускорителей Nvidia и переходе на отечественные решения, пишет South China Morning Post. По всей видимости, разница в стоимости между китайскими и американскими ИИ-ускорителями не в пользу первых настолько высока, что китайским центрам обработки данных даже советуют не импортозамещаться.
С таким советом выступили эксперты Китайской академии информационных и телекоммуникационных технологий (China Academy of Information and Communications Technology CAICT). «Если позволяют условия, дата-центрам стоит выбрать высокопроизводительные ускорители Nvidia A100 и H100. Если потребность в вычислительной мощности ограничена, они также могут сделать выбор в пользу H20 или альтернативные решения китайских производителей», – приводит издание официальные рекомендации Академии.
Против партии
Ситуация, в которой оказались китайские ЦОДы и все те, кто в этой стране связан с искусственным интеллектом, не из простых. С одной стороны, если они начнут менять ускорители Nvidia на решения китайских вендоров, им придется заметно увеличить свои расходы.
С другой стороны, если они решат остаться в стороне от импортозамещения и продолжат пользоваться имеющимися ускорителями Nvidia и закупать новые, они тем самым пойдут против руководства КНР. В начале октября 2024 г. CNews писал, что китайские власти «порекомендовали» китайским компаниям как можно быстрее забыть про Nvidia и ее продукцию и импортозаместить ускорители ИИ.
«Перенос моделей, обученных на графических процессорах Nvidia, на внутренние решения требует сложной инженерии из-за различий в аппаратном и программном обеспечении», – говорится в заявлении CAICT.
Что не запрещено, то разрешено
К моменту выхода материала тотальный запрет на использование ИИ-ускорителей Nvidia в Китае местными властями внедрен не был, но их рекомендации по импортозамещению могут быть первым звоночком. Также нельзя забывать, что власти США со своей стороны тоже препятствуют отгрузке продукции Nvidia китайским клиентам, эскалируя торговую войну и вводя все новые экспортные ограничения.
Эксперты CAICT подчеркнули, что подобные лимиты американских чиновников за последние три года очень сильно подстегнули развитие китайских разработчиков ПО и «железа». Однако пока что этого недостаточно, чтобы стоимость затрат на переоснащение парка ИИ-ускорителей китайскими решениями была сопоставима с ценой партии ускорителей от Nvidia.
А что с масштабами
Nvidia – это лидер на рынке ускорителей искусственного интеллекта. Конкурентов в этой области у нее немного, и ни один из них пока не достиг ее высот. В ассортименте компании есть графические процессоры А100 и Н100 – два самых востребованных чипа для обучения и запуска моделей ИИ. Они были запрещены к экспорту в Китай с августа 2022 г.
Чтобы обойти ограничения, Nvidia модифицировала эти GPU, создав модели A800 и H800, но и они попали под запрет в США – с октября 2023 г. их больше нельзя легально отгружать в Китай.
В 2024 г. свет увидели ускорители H20, L20 и L2 – Nvidia выпустила их, чтобы не потерять рынок в Китае, поскольку эта страна приносит ей миллиарды долларов выручки. Пока что ни один из этих ускорителей официально в «черном списке» не значится, но, как пишет South China Morning Post, китайские клиенты Nvidia уже сталкиваются с различными трудностями при размещении заказов на H20.
По информации издания, к концу 2023 г. общая вычислительная мощность серверов Китая на базе центральных процессоров (ЦП) и графических процессоров, а также суперкомпьютеров выросла до 230 экзафлопс, что на 27% больше год к году. Китайские мощности в сфере искусственного интеллекта растут еще быстрее на 70% в 2023 г. в сравнении с 2022 г. Это является признаком того, что Китай ускоряет разработку оборудования для ИИ на фоне глобальной гонки в этом секторе.
Больше, чем нужно
В Китае в настоящее время наблюдается явный переизбыток вычислительных мощностей. К июню 2024 г в стране было построено или находилось в стадии строительства в общей сложности более 250 дта-центров с доступом в интернет, поскольку местные органы власти, государственные операторы телекоммуникационных сетей и частные инвесторы вкладывают деньги в «новую инфраструктуру». Эксперты отрасли предупреждают о переизбытке вычислительных мощностей, поскольку многие из этих объектов расположены в районах, удаленных от технологических центров страны, и простаивают.
Отчет CAICT подтвердил эту обеспокоенность – эксперты Академии предупредили, что масштабное строительство ЦОД в Китае было омрачено несоответствием спроса и предложения, низкими показателями использования оборудования, неэффективным управлением и низким качеством обработки данных.
«Тенденция к фрагментации вычислительной мощности становится все более серьезной, при этом средний уровень использования GPU составляет менее 40%», – говорится в отчете CAICT. Эксперты также утверждают, что сложностей в использовании ЦОДов добавляет необходимость формирования вычислительных кластеров, объединяющих оборудование от разных поставщиков, каждое из которых имеет технологические барьеры и несовместимые между собой программные экосистемы и вычислительные платформы.