Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемskif.pereslavl.ru
1 ?
2 Биатлон для СКИФов: быстро и точно С.М. Абрамов, А.И. Адамович, М.Р. Коваленко, В.А. Роганов Институт программных систем Российской академии наук
3 Программa СКИФ разработка и освоение в серийном производстве разработка и освоение в серийном производстве семейства высокопроизводительных вычислительных установок (суперкомпьютеров) семейства высокопроизводительных вычислительных установок (суперкомпьютеров) и прикладных систем на их основе и прикладных систем на их основе
4 Особенности Программы СКИФ учет тенденции к расширению области применения высокопроизводительных вычислений учет тенденции к расширению области применения высокопроизводительных вычислений семейство моделей с широким спектром производительности семейство моделей с широким спектром производительности усилия по увеличению показателя отношения производительности к стоимости усилия по увеличению показателя отношения производительности к стоимости
5 Заказчики-координаторы Программы СКИФ Национальная Академия наук Республики Беларусь Национальная Академия наук Республики Беларусь Министерство промышленности, науки и технологий Российской Федерации Министерство промышленности, науки и технологий Российской Федерации
6 Участники Программы СКИФ НИО Кибернетика, УП НИИ ЭВМ, УП Белмикросистемы, ИТМО НАН Беларуси и другие... НИО Кибернетика, УП НИИ ЭВМ, УП Белмикросистемы, ИТМО НАН Беларуси и другие... ИПС РАН, МГУ, НИЦЭВТ, ИВВиИС, предприятие Суперкомпьютерные системы и другие... ИПС РАН, МГУ, НИЦЭВТ, ИВВиИС, предприятие Суперкомпьютерные системы и другие...
7 Двухуровневая архитектура
8 Первые образцы семейства СКИФ
9 Характеристики первых образцов (декабрь 2000 г.) Пиковая производительность 20 GFlops Вычислительных узлов 16 шт. Intel PentiumIII-600 MHz 32 шт. Оперативная память GB = 8 GB Дисковая память GB = 160 GB Системная сеть SCI 2D-тор задержка (MPI, не хуже) 6 µs - скорость MPI-обменов (точка-точка) до 120 MB/s - физичeская скорость обмена до 800 MB/s
10 Поиск альтернативы Цель: испытать в качестве вычислительных узлов для установокСКИФ системные платы с процессорами AMD AthlonMP Цель: испытать в качестве вычислительных узлов для установокСКИФ системные платы с процессорами AMD AthlonMP Средства: Средства: Тест на производительность: Linpack Тест на производительность: Linpack Тест на работу с памятью: STREAM Тест на работу с памятью: STREAM Тесты производительности (bandwidth и latency) реализации MPI на SCI-сети: all2all, send-receive, ping-ping и ping-pong Тесты производительности (bandwidth и latency) реализации MPI на SCI-сети: all2all, send-receive, ping-ping и ping-pong
11 Объекты испытаний два типа процессоров: два типа процессоров: AMD Athlon MP 1800+; AMD Athlon MP 1800+; AMD Athlon MP 2000+; AMD Athlon MP 2000+; три типа системных плат: три типа системных плат: ASUS A7M266-D; ASUS A7M266-D; TYAN Thunder K7X; TYAN Thunder K7X; TYAN Tiger MPX; TYAN Tiger MPX; адаптеры SCI: адаптеры SCI: Dolphin SCI PCI-64/66 / D330. Dolphin SCI PCI-64/66 / D330.
12 Результаты теста Linpack (KFlops)
13 Эффективность процессоров (Linpack Flops/Hz) Тип процессора Частота (MHz) Linpack Flops/Hz Intel P-III-600 (1-й SKIF-кластер) Intel P-III , AMD AthlonMP , AMD AthlonMP ,
14 STREAM: эффективность обменов процессор-память Сравнение: Intel Pentium-III 600 MHz, Supermicro SUPER 370DLE Intel Pentium-III 600 MHz, Supermicro SUPER 370DLE AMD Athlon MP 1800+, ASUS A7M266-D. AMD Athlon MP 1800+, ASUS A7M266-D.Тесты: copy, scale, add, triadcopy, scale, add, triadРежимы: mono и dualmono и dual
15 Результаты теста STREAM (MB/s)
16 Эффективность обменов с памятью в SMP-режиме: отношение (dual/mono) CopyScaleAddTriad Intel PentiumIII 600MHz, Supermicro 370DLE 81%85%72%79% AMD Athlon MP ASUS A7M266-D 94%94%95%96%
17 STREAM: выбор оптимальной AMD-платформы
18 Эффективность MPI-обменов по SCI-сети Рекорды AMD платформ: Bandwidth (max): Bandwidth (max): ping-ping 276 MB/s; ping-ping 276 MB/s; ping-pong 234 MB/s ping-pong 234 MB/s send-receive 258 MB/s send-receive 258 MB/s Latency (packet size ) Latency (packet size ) ping-ping µs; ping-ping µs; ping-pong µs; ping-pong µs; send-receive µs. send-receive µs.
19 Tест ping-pong: latency (µs)
20 Tест ping-pong: bandwidth (MB/s)
21 Ping-pong/bandwidth: выбор оптимальной AMD-платформы
22 Выводы AMD AthlonMP привлекательное решение для кластерных систем: AMD AthlonMP привлекательное решение для кластерных систем: высокие технические характеристики; высокие технические характеристики; отличное отношение стоимости к производительности. отличное отношение стоимости к производительности. AMD Athlon MP с системной платой ASUS A7M266-D лучшая конфигурация на базе AMD процессоров из 6 рассмотренных нами вариантов (по совокупности всех тестов) AMD Athlon MP с системной платой ASUS A7M266-D лучшая конфигурация на базе AMD процессоров из 6 рассмотренных нами вариантов (по совокупности всех тестов)
23 Благодарности Авторы благодарны Авторы благодарны Представительству AMD в Москве Представительству AMD в Москве фирме Традиция фирме Традиция ОАО НИЦЭВТ ОАО НИЦЭВТ которые предоставили авторам все аппаратные средства, необходимые для рассмотренных экспериментов. которые предоставили авторам все аппаратные средства, необходимые для рассмотренных экспериментов.
24 AMD AthlonMP
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.