Процессоры Intel Xeon 6+ Clearwater Forest официально выходят на рынок и получают расширенную аппаратную телеметрию
В октябре прошлого года Intel раскрыла основные характеристики процессоров Xeon 6+, известных под кодовым названием Clearwater Forest. Знак плюс в названии подчеркивает, что речь идет не о полностью новой платформе, а о развитии семейства Xeon 6 с сохранением совместимости по сокету и платформе.
Теперь Intel официально запускает Xeon 6+ и одновременно представляет дополнительные возможности платформы, включая новую систему аппаратной телеметрии Intel Application Energy Telemetry.
Совместимость с существующей платформой удалось сохранить благодаря повторному использованию тайлов ввода-вывода. В состав процессора входят два таких тайла, выпускаемых по техпроцессу Intel 7. Кроме них используются три активных базовых тайла, изготовленных по технологии Intel 3, а вычислительные тайлы с энергоэффективными ядрами производятся по техпроцессу Intel 18A. Таким образом, после Panther Lake Clearwater Forest стал вторым продуктом Intel, частично использующим производство по технологии Intel 18A.
Как и Panther Lake, новое серверное семейство использует энергоэффективные ядра архитектуры Darkmont. На уровне микроархитектуры различий между ними нет, Intel перенесла реализацию Darkmont из Panther Lake практически без изменений, поэтому все ключевые особенности этих ядер остаются прежними.
Особый интерес представляет сама конструкция Clearwater Forest. В максимальной конфигурации процессор объединяет двенадцать вычислительных тайлов и три базовых тайла. Вычислительные тайлы производятся по техпроцессу Intel 18A, а базовые по технологии Intel 3-T.
Энергоэффективные ядра, как и прежде, объединены в кластеры по четыре ядра. Каждый такой кластер получает 4 МБ кэша второго уровня. Intel заявляет пропускную способность кэш-подсистемы на уровне 200 ГБ/с на ядро, а соединение между кластерами обеспечивает межсоединение Fabric с пропускной способностью 35 ГБ/с. Всего Clearwater Forest может содержать до 288 ядер. При двенадцати вычислительных тайлах это соответствует 24 кластерам и 96 ядрам на каждый вычислительный тайл.
Конструкцию завершают два тайла ввода-вывода, расположенные сверху и снизу корпуса. Они также выпускаются самой Intel по техпроцессу Intel 7. На них возложены маршрутизация интерконнекта Fabric, а также работа контроллеров и физических блоков для PCI Express, UPI, CXL и различных ускорителей.
Серьезные изменения произошли и в подсистеме памяти. Контроллеры DDR5 теперь размещены не на вычислительных тайлах, а на базовых, где также расположен крупный кэш последнего уровня. Базовые тайлы и тайлы ввода-вывода соединяются через EMIB, тогда как вычислительные тайлы устанавливаются поверх базовых с использованием технологии Foveros Direct 3D.
В общей сложности процессор Clearwater Forest состоит из 17 активных кристаллов. Такая компоновка неизбежно напоминает Ponte Vecchio, однако на этот раз Intel использует более зрелые технологии и рассчитывает избежать проблем, с которыми столкнулся предыдущий проект.
В линейку входят модели Xeon 6+ 6990E+ с 288 ядрами, базовой частотой 2,2 или 1,7 ГГц и TDP 450 или 330 Вт, модели Xeon 6+ 6980E+ с 264 ядрами, базовой частотой 2,1 или 1,6 ГГц и TDP 400 или 300 Вт, модель Xeon 6+ 6970E+ со 192 ядрами, базовой частотой 2,3 ГГц и TDP 400 Вт, а также модель Xeon 6+ 6960E+ со 144 ядрами, базовой частотой 2,4 ГГц и TDP 330 Вт. Все процессоры оснащены кэшем третьего уровня объемом от 432 до 576 МБ, максимальной турбо-частотой 3,2 ГГц, двенадцатиканальным контроллером памяти DDR5-8000, шестью линиями UPI и 96 линиями PCI Express.
Флагманские модели Xeon 6+ 6990E+ получили по 288 ядер, что вдвое больше по сравнению со 144-ядерным Xeon 6 6780E. Две версии Xeon 6+ 6990E+ отличаются уровнем TDP и, соответственно, максимально возможной частотой при нагрузке на все ядра. Все процессоры Xeon 6+ оснащаются двенадцатиканальным контроллером памяти с поддержкой DDR5-8000. Шесть линий UPI позволяют использовать два процессора в одной системе, а платформа по-прежнему предлагает 96 линий PCI Express.
Для Xeon 6+ 6990E+ показатель TDP вырос с 330 до 450 Вт. Несмотря на столь заметное увеличение энергопотребления, процессор остается в рамках существующей платформы. Очевидно, что обеспечить питание 288 ядер без роста потребления невозможно, однако удвоение числа ядер не означает пропорционального роста энергопотребления или производительности.
Ранее поддержку DDR5-8000 Intel предлагала только для процессоров Xeon 6 с производительными ядрами Granite Rapids. Теперь такую же скорость памяти официально поддерживают и Clearwater Forest с Xeon 6+. Благодаря двенадцати каналам памяти компания сохраняет высокий уровень пропускной способности в расчете на одно ядро даже при столь значительном росте их количества.
Одной из важных новых функций процессоров Xeon 6+ стала технология Intel Application Energy Telemetry. Это разработанная Intel система телеметрии для центров обработки данных, которая позволяет отслеживать энергопотребление приложений значительно подробнее, чем существующие инструменты мониторинга. Если традиционные методы обычно ограничиваются измерением потребления всего сервера, отдельного процессора или виртуальной машины, то новая система обеспечивает прозрачность энергопотребления отдельных приложений и рабочих нагрузок вплоть до уровня процессорных ядер.
В основе технологии лежит многоуровневая система сбора и обработки энергетических данных. На аппаратном уровне процессор передает исходные показатели энергопотребления через существующую платформу телеметрии Intel. Затем с помощью технологии Intel Resource Director Technology эти данные сопоставляются с конкретными приложениями, контейнерами или процессами, в результате чего формируется прямая связь между фактическим энергопотреблением и соответствующей программной нагрузкой.
Внутри телеметрического конвейера данные сначала собираются и агрегируются, после чего система распределяет показатели энергопотребления между отдельными приложениями. На основании этих данных платформа рассчитывает энергопотребление каждого приложения и передает результаты в системы мониторинга, отчетности и управления через соответствующие интерфейсы. В итоге оператор получает подробную картину энергопотребления, которая показывает не только общий расход сервера, но и вклад каждого приложения или сервиса.
Для операторов крупных дата-центров это дает сразу несколько преимуществ. Во-первых, появляется возможность точно определить наиболее энергоемкие приложения, которые увеличивают эксплуатационные расходы. Во-вторых, становится проще выявлять неэффективные рабочие нагрузки, чрезмерно использующие вычислительные ресурсы или пропускную способность памяти, что позволяет администраторам оптимизировать программное обеспечение, перераспределять нагрузки или переносить приложения на более энергоэффективные платформы.
Кроме того, новая технология помогает компаниям формировать более точные отчеты по энергопотреблению и устойчивому развитию. Поскольку расход электроэнергии можно привязать к конкретным приложениям или клиентам, появляется возможность использовать более справедливые модели распределения затрат и строить точные расчеты выбросов углекислого газа. Особенно востребованы такие данные у облачных провайдеров, операторов колокации и крупных корпоративных дата-центров, где энергоэффективность уже стала одним из ключевых показателей работы инфраструктуры.
Поэтому Intel называет данную технологию первым на рынке решением, которое позволяет учитывать энергопотребление на уровне отдельных приложений и процессорных ядер. Технология должна повысить прозрачность расходования энергии программным обеспечением, ускорить поиск проблемных рабочих нагрузок, повысить эффективность эксплуатации инфраструктуры и создать основу для более точной энергетической и экологической отчетности. По сути, система расширяет традиционную аппаратную телеметрию, связывая энергопотребление непосредственно с выполняемыми приложениями и превращая энергию в измеримый ресурс программного уровня.
После официального запуска Xeon 6+ вскоре появятся независимые обзоры новых процессоров, однако Intel уже представила собственные результаты тестирования.
На первом слайде Xeon 6990E+ сравнивается с Xeon 6780E в ряде серверных и облачных нагрузок. Наибольший прирост производительности наблюдается в задачах баз данных и аналитики. Intel приводит ускорение до 2,39 раза в PostgreSQL HammerDB, до 2,31 раза в MySQL HammerDB и до 2,24 раза в нагрузке 5G Control Plane. В остальных сценариях преимущество находится в диапазоне от 2,09 до 2,29 раза. Учитывая двукратный рост числа ядер, подобные результаты вполне ожидаемы.
На втором слайде Intel сравнивает Xeon 6990E+ с AMD EPYC 9965. Здесь преимущество выглядит более умеренным, но сохраняется во всех представленных тестах. По показателю Thread Score Intel заявляет ускорение в 1,29 раза в Integer Throughput, 1,33 раза в General Compute, 1,37 раза в WordPress и 1,45 раза в MediaWiki. Дополнительно компания подчеркивает лучшие показатели производительности на ватт.
При этом важно учитывать, что Intel демонстрирует не усредненные результаты по широкому набору серверных нагрузок, а подборку отдельных тестов с оптимальными конфигурациями. Поэтому эти данные скорее показывают направление развития платформы, чем позволяют напрямую сравнить общую производительность процессоров. Наиболее уверенно Xeon 6+ чувствует себя в задачах с большим количеством потоков, высокой нагрузкой на память и подсистему ввода-вывода, а также в классических базах данных и веб-сервисах. В более универсальных вычислительных или Java-нагрузках преимущество обычно находится в диапазоне от 10 до 40 %.
Источник Intel


