«Виновник» найден
Intel установила причину нестабильной работы флагманских моделей фирменных десктопных процессоров семейства Raptor Lake.
Возникновением проблемы, известной как “Vmin Shift”, CPU Intel к дефекту контура тактового дерева схемы производительных вычислительных ядер (IA) процессора (гарантирует синхронное получение тактового сигнала всеми компонентами микросхемы). Эта часть микросхемы, как выяснила Intel, особенно уязвима и быстро и необратимо деградирует под влиянием высоких напряжения и температуры, в результате чего нарушается рабочий цикл процессора.
Под Vmin в Intel подразумевают минимальное значение напряжения, подаваемого на контакты процессора, которое необходимо для обеспечения на 100% стабильной работы микросхемы. CPU сам следит за тем, чтобы текущее напряжение не падало ниже этого порогового значения. Ситуация, в которой устройство по той или иной причине более не способно демонстрировать стабильную работу при Vmin называется «смещением Vmin», или “Vmin Shift”.
Четыре способа «заработать» Vmin Shift
Intel описывает в общей сложности четыре сценария эксплуатации процессора, способных приводить к “Vmin Shift”. Первый предполагает значения параметров питания CPU в BIOS материнской платы, превышающие рекомендованные Intel.
Второй сценарий возможен ввиду наличия ошибки в алгоритме eTVB, используемом в микрокоде процессоров Core i9 13 и 14 поколений. Эту ошибку устраняет обновление микрокоды 0x125.
Технология eTVB, используемая во флагманских чипах Intel, позволяет микросхеме повышать тактовую частоту одного или нескольких ядер с учетом температуры ее работы. Функция позволяет «выжимать максимум» из CPU в требовательных к ресурсам приложениях при его достаточном охлаждении. В результате ошибки алгоритма процессор мог «разгоняться» и работать на повышенной тактовой частоте даже при достижении высоких температур (70-90 градусов Цельсия), которое обусловлено обязательным в таком случае повышением напряжения на CPU, тогда как в норме алгоритм предполагает снижение частоты и напряжения в подобной ситуации.
Еще одна ошибка алгоритма в микрокоде – на этот раз в интерфейсе взаимодействия процессора с системой питания материнской платы (SVID) – проводит к Vmin Shift. В результате ошибки алгоритм запрашивает более высокие напряжение и частоту на длительные периоды времени, что также приводит к перегреву и деградации уязвимых компонентов микросхемы. Для ее исправления предназначено обновление микрокода 0x129.
Наконец, в последнем, четвертом сценарии микрокод и BIOS запрашивают подачу повышенного напряжения на ядро, в частности, в периоды простоя или незначительной нагрузки в системе. Митигация проблемы осуществляется установкой последнего обновления микрокода 0x12B.
Из опубликованных Intel материалов ясно, что проблеме Vmin Shift подвержены не только флагманы 13 и 14 поколений – исключительно для них характерен только второй описанный сценарий, но и все остальные десктопные представители расширенного семейства Raptor Lake с TDP от 65 Вт и выше (параметр TDP – требования по теплоотводу).
В семейства Raptor Lake и Raptor Lake-R (13 и 14 поколение Intel Core) входит 28 моделей CPU. 22 из них могут быть уязвимы к Vmin Shift.
Больше полугода на поиск первоисточника проблемы
Жалобы на нестабильную работу Intel CPU Core i9 13 и 14 поколений, которая могла приводит к возникновению системных ошибок, начали поступать едва ли с самого начала 2024 г. Лишь в апреле 2024 г. Intel официально признала наличие проблем такого характера. Компания предпочла аккуратно переложить часть вины за их возникновение на производителей материнских плат – якобы предусмотренные ими профили заставляли процессоры работать на чрезмерно высоких частотах и под слишком высоким напряжением. Тогда же выяснилось, что Intel было известно о случаях нестабильной работы флагманов Raptor Lake по крайней мере с февраля 2024 г.
С тех пор Intel опубликовала четыре заявления, касающихся нестабильной работы настольных CPU 13 и 14 поколений, а также два обновления микрокода 0x125 и 0x129 для устранения проблемы, которые впоследствии были объединены в патч 0x12B, который также включает исправления.
Впрочем, эти обновления полезны только владельцам полностью «здоровых» CPU. Если процессор уже демонстрирует признаки нестабильности, существует ненулевая вероятность того, что он неисправен. В таком случае поможет только замена устройства на новое, а обновления микрокода/BIOS не спасут.