Обзор российского 4-ядерного процессора Эльбрус-4С. Часть 2: Архитектура Читать
Модули на микропроцессорах «Эльбрус»
В настоящее время ЗАО «МЦСТ» выпускает несколько готовых модулей на основе процессоров R1000 архитектуры SPARC, а также серию модулей на основе «Эльбрус». Каждый из модулей изготовлен в виде системной платы с набором необходимых внешних интерфейсов, по сути представляя собой готовый компьютер, требующий лишь подключения источника питания и накопителей для хранения данных, да и то не всегда (зачастую флеш-диск достаточного объёма распаян прямо на плате). Он выполнен в стандартном форм-факторе потребительского либо промышленного стандарта, и устанавливается в корпус заказчика. В настоящее время модули комплектуются процессорами «Эльбрус-2С+», а с началом серийного выпуска «Эльбрус-4С» элементная база будет обновлена.
В каталоге компании «МЦСТ» представлены следующие модули: МВКУБ/С, МВК/U, Монокуб, КУБ-COM, МВ3S/C-К. Первый из них содержит два процессора, остальные — один. Каждый модуль оснащён картой CompactFlash, использующейся либо для хранения системы двоичной трансляции, либо для установки ОС, причём последний из перечисленных модулей содержит также дополнительный SSD-диск стандарта mSATA. Пусть вас не вводит в заблуждение слово «куб» в названиях некоторых из них: форм-фактор конструктивного исполнения — Compact PCI, COM Express type 2 и mini-ITX, напоминающие в лучшем случае прямоугольный параллелепипед, а слово «куб» выбрано, видимо, только «для красоты». Ещё один модуль, МВ3С2/C, не содержит процессора, а предоставляет лишь набор периферийных интерфейсов. Заметим, что интерфейсных модулей существует большое множество, но мы не стали перечислять их все для экономии места.
Вычислительные модули на основе микропроцессоров «Эльбрус»
|
МВКУБ/С | МВК/U | Монокуб | КУБ-COM | МВ3S/C-К | МВ3С2/C |
Форм-фактор | Compact PCI (2 слота) | Compact PCI 3U (2 слота) | mini-ITX | COM Express type 2 | Compact PCI 6U (1 слот) | Compact PCI (2 слота) |
Микропроцессор | Эльбрус-2С+ | Эльбрус-2С+ | Эльбрус-2С+ | Эльбрус-2С+ | Эльбрус-2С+ | нет |
Количество процессоров |
2 | 1 | 1 | 1 | 1 | нет |
Видеопамять, МБ | 8 | * | * | 16 | * | * |
Видеоконтроллер | * | * | Silicon Motion SM718 | * | * | |
Оперативная память, ГБ | 8 | 4 | 4 | 4 | 4 | * |
Тип оперативной памяти | DDR2 Mini-DIMM | DDR2-800 Mini-DIMM ECC | * | DDR2-667 Mini-DIMM ECC | * | * |
Flash-память, ГБ | 16 | 128 | 16 | 64 | 16 (+8 для двоичной трансляции) | * |
Каналы ввода/вывода |
1 Ч VGA 2 Ч IOLink 3 Ч Gigabit Ethernet 4 Ч SATA 2.0 4 Ч USB 2.0 1 Ч IEEE 1284 2 Ч RS-232 1 Ч Audio (вход/выход/MIC) |
1 Ч VGA 1 Ч PCI-Express 1.0 x8 1 Ч Gigabit Ethernet 4 Ч PCI 32/33 4 Ч SATA 2.0 1 Ч IDE (CompactFlash) 2 Ч USB 2.0 1 Ч IEEE 1284 2 Ч RS-232/485 1 Ч Audio (вход/выход/MIC) |
1 Ч VGA 1 Ч DVI 1 Ч PCI-Express x8 1 Ч Gigabit Ethernet 4 Ч SATA 8 Ч USB 2.0 1 Ч RS-232; 2 Ч Audio (вход/выход/MIC) 6 Ч GPIO |
1 Ч VGA (1920 х 1440) 1 Ч Video LVDS (1920 х 1440) 1 Ч PCI-Express 1.0 x8 1 Ч Gigabit Ethernet 1 Ч PCI 32/33 4 Ч SATA 2.0 5 Ч USB 2.0 1 Ч Audio (вход/выход/MIC) |
1 Ч PCI-Express 1 Ч cPCI 32/66 2 Ч Gigabit Ethernet 4 Ч SATA 2 Ч USB 2.0 3 Ч RS-232 1 Ч RS-485 1 Ч IDE 2 Ч PS/2 1 Ч КМПО 1 Ч GPIO 1 Ч КВВ 2 Ч Audio (вход/выход/MIC) |
1 Ч VGA (1920х1080) 1 Ч Gigabit Ethernet 4 Ч SATA 2 Ч IDE 4 Ч USB 2.0 2 Ч RS-232 2 Ч IOLink 1 Ч Audio (вход/выход/MIC) |
Напряжение питания, В | +3,3; +5 | +3.3; +5 | * | +12 | * | * |
Потребляемая мощность, Вт | 100 | 40 | * | 45 | * | 6 |
Диапазон рабочих температур, °С | 0…+35 | 0…+55 | 0…+55 | 0…+45 | 0…+45 | * |
Средняя наработка на отказ, часов | 10000 | 10000 | 30000 | 10000 | 30000 | 9000 |
Гарантийный срок эксплуатации, лет | 5 | 5 | 5 | 5 | * | * |
Минимальный срок службы, лет | 15 | 12 | 12 | 12 | 25 | * |
Группа исполнения | 1.1 | 1.1 | * | * | 2.1.1, 2.1.2, 2.3.1, 2.3.2 | зависит от ВК |
Габаритные размеры, мм | 267 Ч 213 Ч 40 | 212,6 Ч 130,6 Ч 60,6 | 177 Ч 170 Ч 36 | 125 Ч 95 Ч 21 | 195,2 Ч 233,4 Ч 19,6 | * |
Источник: ZOOM.CNews
Вычислительные комплексы
Этим научным термином в компании «МЦСТ» называют любые законченные компьютеры на основе процессора «Эльбрус», от ноутбука и до мощного сервера. Да, вы не ослышались: ноутбук на этом кристалле уже выпускается и носит гордое название «Носимый терминал НТ-ЭльбрусS». Конечно, ему пока ещё далеко по изяществу до Macbook Air, своим брутальным видом он напоминает, скорее, защищённые ноутбуки фирмы Panasonic или аналогичные.
НТ-ЭльбрусS
Характеристики «НТ-ЭльбрусS» достаточно скромные, но вполне достаточные для запуска «офиса» и подобных программ. А вот прочность конструкции находится на высоком уровне: аппарат не только способен нормально работать в широком диапазоне температуры (от -10 до +55°С) и влажности (вплоть до полного погружения под воду до глубины 1 м), но и вибрации, ударных нагрузках (вплоть до падения на бетон с высоты 0,75 м).
Полезным может оказаться и наличие универсального приёмника сигналов спутниковой навигации (ГЛОНАСС/GPS), а при необходимости может быть установлен адаптер Wi-Fi. Вот разве что разрешения экрана — 1024 на 768 точек — маловато для комфортной работы, да и батарею можно было бы поставить помощнее, так как заряда штатной хватает всего на 1 час.
Монокуб-РС
Другой ВК — «Монокуб-PC» — вполне сопоставим с недорогим офисным ПК, да и по размерам весьма похож на него. 4 ГБ оперативной памяти и 500 ГБ жёсткого диска, разумеется, могут быть заменены на другие стандартные компоненты нужного объёма, благо что интерфейсы внутри самые что ни на есть общедоступные: слоты DDR2 и разъёмы SATA II (правда, DDR2 смотрится в наши дни некоторым анахронизмом, да и по цене уже проигрывает DDR3). К нему подключается любой стандартный монитор с коннектором VGA или DVI, а также клавиатура и мышь. Лишь наличие интерфейсов GPIO слегка намекает нам на то, что перед нами не обычный офисный ПК, а изделие для лабораторно-промышленного применения.
КМ4-Эльбрус
Ещё одна традиционная компоновка — моноблок КМ4-Эльбрус, или конструкция «всё-в-одном». Это ПК, собранный в общем корпусе с монитором. Его экран обладает уже вполне достойным разрешением 1600 на 900 точек, более того, он сенсорный! Корпус, правда, несколько толстоват, но по большому счёту, малая толщина его — лишь дань моде. На рабочий стол он впишется вполне нормально, а при желании к нему можно без дополнительных средств подключить второй монитор, с разрешением вплоть до 1920 на 1440.
Экспериментальный 4-процессорный сервер на базе процессора Эльбрус-4С
И ещё один ВК, «Эльбрус-3С», является мощным модульным сервером с 16-ю процессорами (4 процессорных модуля по 4 процессора), 128 ГБ ОЗУ, встроенным коммутатором Gigabit Ethernet и оптическим контроллером сети. Он рассчитан на высокопроизводительные вычисления, а благодаря модульной конструкции, его конфигурация может сильно различаться, в зависимости от требований заказчика.
Вычислительные комплексы на основе микропроцессоров «Эльбрус»
|
Носимый терминал НТ-ЭльбрусS | ВК Монокуб-PC | Моноблок КМ4-Эльбрус | ВК Эльбрус-3С |
Микропроцессор | Эльбрус-2С+ | Эльбрус-2С+ | Эльбрус-2С+ | Эльбрус-2С+ |
Количество процессоров | 1 | 1 | 1 | 4 модуля Ч 4 |
Видеопамять, МБ | 16 | 16 | 16 | 64 |
Видеоконтроллер | * | Silicon Motion SM718 | Silicon Motion SM718 | МГА3D/М |
Оперативная память, ГБ | 4 | 4 | 4 | 128 |
Дисковая память, ГБ | 16 | 500 | 500 | 320 |
Тип накопителя | SSD | HDD | HDD | SSD |
Оптический привод | нет | DVD-RW | DVD-RW DL | нет |
Карта памяти CompactFlash, ГБ | нет | 16 | 16 | нет |
Диагональ экрана, дюймов | 15 | нет | 20 | нет |
Разрешение экрана, точек | 1024 Ч 768 | нет | 1600 Ч 900 | нет |
Разрешение видеовыхода, точек | * | * | 1920 Ч 1080 | * |
Разрешение сенсорной панели, точек | нет | нет | 2048 Ч 2048 | нет |
Приёмник спутниковой навигации | ГЛОНАСС / GPS | нет | нет | нет |
Клавиатура |
водозащищённая SB-87-TP, 87 клавиш со встроенным манипулятором |
внешняя | внешняя | внешняя |
Устройство чтения/записи карт | нет | нет | xD, SD (SDHC), MMC, MS, MS-Pro, CF | нет |
Каналы ввода/вывода |
1 Ч VGA; 1 Ч Gigabit Ethernet; 1 Ч Wi-Fi (наличие и тип по договору); 2 Ч USB 2.0; 2 Ч RS-232; 2 Ч PS/2; 1 Ч IEEE 1284 (опция) |
1 Ч PCI-Express х16; 1 Ч VGA; 1 Ч DVI; 1 Ч Gigabit Ethernet; 4 Ч USB 2.0; 1 Ч RS-232; 6 Ч GPIO; 2 ЧAudio |
1 Ч VGA; 1 Ч Gigabit Ethernet; 1 Ч Wi-Fi 802.11 b/g (антенна на задней панели); 7 Ч USB 2.0; 1 Ч RS232; 1 Ч Аудио (вход/выход/микр.) |
1 Ч VGA; 2 Ч HDMI; 12 Ч Gigabit Ethernet; 4 Ч Fast Ethernet; 7 Ч RS-232; 8 Ч RS-422/485; 7 Ч USB 2.0; 1 Ч IEEE 1284; 1 Ч «Манчестер»; 2 Ч SATA 2.0; 1 Ч Audio (вход/выход/микр.); 7 Ч IOLink; 1 Ч ВОЛС; 1 Ч RDMA |
Габаритные размеры, мм | 372 Ч 338 Ч 82 | 267 Ч 341 Ч 98 |
510 Ч 420 Ч 190 (с подставкой), 510 Ч 355 Ч 100 (без подставки) |
724 Ч 600 Ч 1152 |
Масса, кг | 10 | * | 11 (с подставкой), 9 (без подставки) | 102 |
Угол наклона подставки, ° | нет | нет | 0…12 | нет |
Ёмкость аккумуляторной батареи, А•ч | 8,8 | нет | нет | нет |
Время непрерывной работы от батареи, ч | 1 | нет | нет | нет |
Напряжение питающей сети, В | 220 ± 10% (от адаптера) / 8…36 | 220 ± 10% | 100…240 | 220 ± 10% |
Частота питающей сети, Гц | 50 ± 5 (от адаптера) | 50 ± 1 | 50…60 | * |
Потребляемая мощность, Вт | 50 | 250 | 150 | 1610 (зависит от группы исполнения) |
Диапазон рабочих температур, °С | –10…+55 | 0…+35 | * | * |
Высота падения на бетонную поверхность, м | 0,75 | нет | нет | нет |
Глубина погружения в воду, м | 1 | нет | нет | нет |
Время погружения в воду, ч | 2 | нет | нет | нет |
Средняя наработка на отказ, ч | 10000 | 9000 | * | 10000 |
Гарантийный срок службы, лет | 1 | * | * | 5 |
Срок службы, лет | 12 | 12 | * | 12 |
Группа исполнения | О гр.1.10 | 1.1 | * | 1.2, 1.3, 2.1.1, 2.2.1 и 2.3.1 |
Тесты, тесты, тесты
Наверняка многим из вас не терпится узнать, на что способны новые кристаллы в плане производительности? Есть ли у новой архитектуры преимущества в реальных задачах? Чтобы выяснить это, мы подготовили три «боевых» теста: архивацию и распаковку архиватором 7-zip, обработку видеосигнала цифровым фильтром, и шифрование информации по алгоритму ГОСТ. Такой выбор задач был сделан отчасти из-за того, что все они реализованы в виде приложений для ОС Linux, способной функционировать как на процессорах Эльбрус, так и на чипах производства Intel, что позволяет провести сравнительный анализ, а отчасти потому, что эти задачи входят в число наиболее типичных применений разработанных ВК (не забываем, что основными заказчиками оных являются различные предприятия).
Характеристики тестовых стендов
|
Intel Core i7-2600 | Эльбрус-2C+ | Эльбрус-4С |
Количество ядер | 4 | 2 | 4 |
Тактовая частота, МГц | 3400 | 500 | 700 |
Объём кеш-памяти, МБ | 8 | 2 | 8 |
Количество процессоров в системе | 1 | 1 | 4 |
Объём оперативной памяти системы, ГБ | 16 | 4 | 64 |
Характеристики тестовых стендов приведены в таблице. Отметим лишь, что в день тестирования сервер на четырёх процессорах «Эльбрус-4С» с частотой 800 МГц оказался занят, и нам предложили такой же, работающий на частоте 700 МГц, что несколько повлияло на результаты. В принципе, ничто не мешает пересчитать их, умножив или разделив на 8/7, так как производительность сервера линейно зависит от частоты. Также следует иметь в виду, что все тесты выполнялись в однопоточном режиме; для хорошо распараллеливаемых задач, а к ним принадлежат все упомянутые тесты, с ростом числа задействованных ядер производительность будет возрастать практически линейно. Соперником наших героев, а также точкой отсчёта, послужил сервер на процессоре Intel Core i7-2600, работающем на частоте 3400 МГц.
Коммуникационными портами компьютеры "Эльбрус" не обделены
Первый тест, архивация по алгоритму 7-zip, является, пожалуй, антипримером, с точки зрения демонстрации эффективности отечественной архитектуры. Алгоритм 7-zip довольно сложен и плохо поддаётся оптимизации, поэтому общая скорость упаковки, измеряемая в мегабайтах в секунду (т.е. чем лучше производительность, тем больше числа), почти точно пропорциональна тактовой частоте, которая у российских кристаллов сильно уступает продукции лидера мирового процессоростроения. При распаковке ситуация чуть лучше: в самом деле, если частоты Core i7 и «Эльбрус-2С+» различаются в 3400/500=6,8 раза, то результаты теста лишь в 33,437/6,296=5,31 раза, что говорит о том, что работая на той же частоте, что и процессор Intel, «Эльбрус» смог бы его обойти!
Логи тестовых испытаний.
При нажатии на миниатюру откроется полномасштабное изображение
С фильтрацией видеосигнала наш кристалл справляется лучше. Недаром эта область являлась одной из профильных при его разработке. Но не следует полагать, что тут задействованы дополнительные ядра встроенного DSP — так было бы «нечестно» по отношению к сопернику, поэтому тестовая программа использует только ядра общего назначения. Здесь «Эльбрус-2С+» медленнее лишь в 2,5 раза (тест измеряет время выполнения одной и той же задачи, так что здесь лучшей производительности соответствует меньшее число). «Эльбрус-4С» практически подобен своему собрату, выдавая результат во столько раз лучше него, во сколько раз различаются их тактовые частоты).
Но самый выигрышный результат оказался при шифровании по алгоритму ГОСТ, недаром он тоже разрабатывался нашими специалистами. Здесь «Эльбрус-2С+» выполнил задачу на 30% быстрее, несмотря на почти семикратную разницу в частоте, а «Эльбрус-4С» — почти в 2 раза быстрее! Что говорит о том, что эффективность отечественной архитектуры на подобных задачах лучше почти в 9 раз. Подробности можно лицезреть на скриншотах окна терминала. Не удивляйтесь, увидев неожиданное сообщение cpuinfo о странном процессоре «Эльбрус-2S»: именно так планировалось ранее назвать новый четырёхъядерный чип, но в последний момент он был переименован с целью отображения в названии количества ядер. Это же «старое» название можно прочесть и на фотографии крышки корпуса кристалла, массово отштампованной до этого момента.
Сравнительные результаты тестирования микропроцессоров
|
Intel Core i7-2600 | Эльбрус-2C+ | Эльбрус-4С |
Архивация по алгоритму 7zip (сжатие), Мбайт/с | 3,95 | 0,543 | 0,665 |
Архивация по алгоритму 7zip (распаковка), Мбайт/с | 33,437 | 6,296 | 8,679 |
Цифровая фильтрация сигнала, с | 1,384 | 3,469 | 2,474 |
Шифрование по алгоритму ГОСТ, с | 2,102 | 1,601 | 1,112 |
Источник: ZOOM.CNews
Вперёд, к светлому будущему?
Итак, всё выглядит не так уж и плохо? И да, и нет. Несмотря на успешный старт, у МЦСТ осталась ещё масса нерешённых проблем. Главная из них — поиск производственных мощностей для выпуска чипов. Пока «Эльбрус-2С+» производится на фабриках партнёров из Юго-Восточной Азии, что не очень-то вписывается в картину России, как независимой интеллектуальной державы. К тому же для изготовления нового чипа, «Эльбрус-4С», требуется более «тонкий» процесс с нормами литографии 65 нм. Однако, перечитывая новости прессы, можно заметить, что зеленоградский завод полупроводниковых компонентов «Микрон» не так давно разработал новую для России технологию – как раз 65 нм – и закупает под нее дополнительное оборудование в свою производственную линию. Очевидно, что именно туда планируется перенести производство «Эльбрус», но «гладко бывает только на бумаге»: чтобы запустить линию и наладить серийное производство, как правило, требуется не меньше двух лет, а то и заметно больше. К чести предприятия "Микрон" стоит отметить, что задача освоения нового технологического процесса - дело далеко не тривиальное (о том, как организовано производство процессоров мы расскажем в рамках отдельного репортажа).
Вторая актуальная проблема — рост тактовой частоты. Чтобы на равных конкурировать с мировыми производителями, неплохо бы поднять её хотя бы вдвое, а лучше впятеро. Казалось бы, этого можно достичь дальнейшим уменьшением норм техпроцесса, но не всё так просто. Сменив легковушке 100-сильный двигатель на 1000 л.с., не увеличить скорость со 150 до 1500 км/ч. Необходима существенная переработка топологии под новую частоту, отладка, тесты... Да и возможности производства в нашей стране на таких линиях пока призрачны. Проще линейно наращивать количество ядер, добавив кеш-памяти и слегка повышая частоту (по мере оптимизации внутренних узлов). Примерно так и сконструирован «Эльбрус-8С», разработка которого уже идёт полным ходом и должна завершиться в будущем году. Помимо повышения частоты до 1,3 ГГц, в нём вдвое (по сравнению с «Эльбрусом-4С») увеличено количество ядер, и во столько же раз — кеш-памяти, но не только: количество вычислительных устройств с плавающей запятой также возросло с 4-х до 6-ти, что дополнительно позволит выжать из него чуточку мощности, доведя итоговую производительность до впечатляющей цифры в 250 Гфлопс. Правда, уменьшение норм техпроцесса всё же планируется, что позволит сохранить или даже уменьшить при этом суммарное тепловыделение кристалла.
А что же дальше? Увидим ли мы когда-нибудь на прилавках обилие полностью, на 100%, отечественных ПК? Если и увидим, то очень не скоро. Несмотря на некоторые явные преимущества, по соотношению главных потребительских качеств «производительность/цена» наш «Эльбрус» всё ещё проигрывает конкурентам, а доплачивать за сомнительные преимущества в виде защищённого режима или эффективного шифрования массовый потребитель вряд ли захочет. Другое дело — корпоративный клиент, для которого надёжность работы и наличие полной документации является определяющим критерием. А так как всё равно в большинстве случаев систему для него придётся разрабатывать «под заказ», то здесь отечественный производитель может даже предложить более выгодную цену, чем зарубежный партнёр. Поэтому клиентов у МЦСТ пока хватает.
Что ж, пожелаем им удачи! И будем надеяться на то, что наша страна снова станет «супердержавой», как это уже было не раз.