История вычислительной техники – Суперкомпьютеры План: Этапы развития суперкомпьютеров 1.1 Суперкомпьютеры XX века. 1.2 Современный этап массово-параллельные вычисления на базе микропроцессоров. 1.3 Вопросы дальнейшего развития суперкомпьютеров. 2. Суперкомпьютеры 2.1 Параллельно-векторные суперкомпьютеры 2.2 Суперкомпьютеры 2.3Суперкомпьютеры стали в миллион раз быстрее за 50 лет
1.1 Суперкомпьютеры XX века Динамика развития электронной вычислительной техники от её зарождения и до наших дней охарактеризована в ряде публикаций. Термин «суперкомпьютер» стал употребляться в период развития транзисторных вычислительных машин (это 2- е поколение вычислительной техники) применительно к десятку, затем сотне, а на сегодня – к тысяче наиболее мощных вычислительных установок мира (подразумевая тот или иной критерий оценки производительности).
В создании наиболее мощных вычислительных систем в своё время лидировала корпорация Control Data (США), серийно выпускавшая с 1965 г. машину CDC производительностью 3 млн. операций в секунду, а затем и более мощные. Впоследствии это направление работ выделилось как фирма Cray, выпускавшая одноименные суперкомпьютеры (см. ниже). Корпорация IBM, лидирующая по объёму выпускаемой компьютерной продукции, также выпускала весьма мощные установки в составе семейств машин 2-го и 3-го поколений (соответственно, IBM 709 х и System 360). После 1975 г. большое внимание уделялось векторно- конвейерным суперкомпьютерам, построенным на схемотехнике с невысоким уровнем интеграции, но с высокой тактовой частотой – 100 МГц и более (американские системы Cray -1, -2, их разновидности и некоторые японские системы).
1.2 Современный этап: массово-параллельные вычисления на базе микропроцессоров В 2000 г. корпорация IBM ввела в действие суперкомпьютер ASCI White с пиковой производительностью 12 Tflops (6 тыс. процессоров), в гг. поэтапно ввела в действие систему Blue Gene / L с пиковой производительностью 360 Tflops (65 тыс. двухпроцессорных чипов), а в 2007 г. производительность этой системы за счёт наращивания объёма аппаратуры была повышена до 0,6 Petaflops. Установки названных типов выпущены также и с меньшим числом процессоров; таким образом, IBM закрепила свою доминирующую роль во всём спектре производительности компьютеров
В 2004 г. создана в России и передана для эксплуатации в Минск 576-процессорная система К-1000 с пиковой производительностью 2,5 Tflops. В гг. в МСЦ поэтапно введена 1148-процессорная система МВС с пиковой производительностью 10 Tflops. Крупным событием стал ввод в действие в начале 2007 г. в Томском университете системы Cyberia с пиковой производительностью 12 Tflops, содержащей 566 двухъядерных процессоров. Названные системы на момент их ввода в действие входили в первую сотню позиций списка Top 500. Они позволили решать новые сложные задачи с большим объёмом вычислений. В Москве и различных регионах страны эксплуатируются также кластеры с меньшим числом процессоров (в различных модификациях по типам процессоров, объемам памяти, межпроцессорным связям, конструктивному оформлению, составу программного обеспечения). Осуществляется поэтапно- прогрессирующее наращивание производительности и совершенствование технико-экономических показателей действующих и вновь создаваемых систем. В гг. введены в действие мощные кластеры в МГУ и ряде других вузов России.
1.3 Вопросы дальнейшего развития суперкомпьютеров 1.3 Вопросы дальнейшего развития суперкомпьютеров Ведущие компьютерные фирмы сориентированы на выпуск систем производительностью оп./с (квадриллион оп./с. - petaflops ) и более. Реализуются крупные программы работ этого направления В середине 2008 г. введен в действие кластер Roadrunner, корпорации IBM, с пиковой производительностью 1,3 Pflops, построенный на базе микропроцессоров Cell. Но ещё в 2006 г. производительность, эквивалентная уровню оп./с, была реализована в японской системе MDGRAPE-3, процессоры и общая структура которой ориентированы на решение задач молекулярной динамики (в т. ч., исследование структур белковых молекул и др.)
Pост производительности суперкомпьютеров взаимосвязан с расширением, обновлением и усложнением применений, разработками новых математических моделей, развитием соответствующих вычислительных методов. При этом необходимо распараллеливать обработку данных в алгоритмах и программах решаемых вычислительных задач, учитывая специфику структурного параллелизма, присутствующего в том или ином виде на всех уровнях систем – от внутри процессорного до общесистемное-сетевого с выходом на глобальные Grid -технологии. Умелое использование и перманентное развитие программного обеспечения (как системного, так и прикладного) существенно определяет эффективность применений суперкомпьютеров и остается сложной и широкой проблемой.
2.1 Параллельно-векторные суперкомпьютеры 2.1 Параллельно-векторные суперкомпьютеры Большое разнообразие архитектур вычислительных систем породило естественное желание ввести для них какую-то классификацию. Эта классификация должна была однозначно относить ту или иную вычислительную систему к некоему классу, который, в свою очередь, должен достаточно полно ее характеризовать. Таких попыток предпринималось множество. Одна из первых классификаций, ссылки на которую чаще всего встречаются в литературе, была предложена М. Флинном в конце 60-х годов прошлого века. Она базируется на понятиях двух потоков: команд и данных. На основе числа этих потоков выделяется четыре класса архитектур: SISD (Single Instruction Single Data) - единственный поток команд и единственный поток данных, SIMD (Single Instruction Multiple Data) - единственный поток команд и множественные потоки данных, MISD (Multiple Instruction Single Date) - множественные потоки команд и единственный поток данных и, наконец, MIMD (Multiple Instruction Multiple Date) - множественные потоки команд и данных.С момента появления первых вычислительных устройств их создатели пытались усовершенствовать свои творения, в частности, повысить их эффективность за счет увеличения производительности или изобрести новые устройства, более совершенные. Суперкомпьютеры работают очень быстро не только благодаря самой современной элементной базе, но и за счет принципиальных решений, заложенных в их архитектуру. Основную роль здесь играет принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий.
Суперкомпьютеры NEC SX Типичным примером PVP-решений могут служить системы SX, которые создает подразделение корпорации NEC - HNSX Supercomputers ( ). Развитие PVP-архитектуры продолжается, а суперкомпьютеры на ее основе в ряде случаев существенно опережают конкурентов. NEC имеет давние традиции производства больших универсальных ЭВМ (достаточно упомянуть выпускавшиеся в 80-х годах мэйнфреймы ACOS). Примерно в то же время появились и первые суперкомпьютеры семейства SX. Процессоры в SX-1 имели пиковую производительность 570 MFLOPS. Во второй половине 80-х были разработаны NEC SX-2 со временем цикла 6 нс; пиковая производительность старшей модели SX-2 составила уже 1,3 GFLOPS. В 1989 г. была выпущена NEC SX-3 с пиковой производительностью центрального процессора около 5 GFLOPS, в состав которой входило до четырех процессоров. Начинка суперкомпьютера SX-4A
Серия SX-5 Эти суперкомпьютеры предназначены для крупномасштабных параллельных вычислений, что обеспечивается набором параллельно работающих узлов, каждый из которых, в свою очередь, представляет собой полноценный векторно- конвейерный SMP-суперкомпьютер. Серия SX-8 Суперкомпьютер SX-8. Осенью прошлого года NEC представила новую серию суперкомпьютеров SX-8, одна из моделей которой, согласно утверждению компании, стала самым быстрым в мире на сегодняшний день векторным суперкомпьютером, обладая быстродействием до 65 TFLOPS. SX-8 существует в трех версиях - две с одним узлом (табл. 2) и одна система, состоящая из большего количества узлов (табл. 3). Результат в 65 TFLOPS - наивысший показатель, который могла бы показать последняя. Максимальное число узлов в ней - 512, каждый из которых имеет по восемь процессоров (т. е. общее число процессоров достигает 4096). Максимальный объем адресуемой памяти составляет 64 Тбайт, максимальная скорость обмена данными с памятью Тбайт/с.
2.2 Суперкомпьютеры 2.2 Суперкомпьютеры В ноябре прошлого года была опубликована 18-я редакция списка 500 мощнейших компьютеров мира Top500. Лидером списка по-прежнему остается корпорация IBM ( ), которой принадлежит 32% установленных систем и 37% от общей производительности. Интересной новостью стало появление Hewlett- Packard на втором месте по количеству систем (30%). При этом, поскольку все эти системы относительно невелики, то их суммарная производительность составляет всего 15% от всего списка. Ожидается, что после слияния с Compaq обновленная компания займет доминирующее положение в этом списке. Далее по количеству компьютеров в списке идут SGI, Cray и Sun Microsystems.
Суперкомпьютеры Intel До недавнего времени одним из самых быстродействующих компьютеров был Intel ASCI Red детище ускоренной стратегической компьютерной инициативы ASCI (Accelerated Strategic Computing Initiative). В этой программе участвуют три крупнейшие национальные лаборатории США (Ливерморская, Лос-Аламосская и Sandia). Построенный по заказу Министерства энергетики США в 1997 г., ASCI Red объединяет 9152 процессора Pentium Pro, имеет 600 Гбайт суммарной оперативной памяти и общую производительность 1800 млрд операций в секунду.
Суперкомпьютеры IBM Когда на компьютерном рынке появились универсальные системы с масштабируемой параллельной архитектурой SP (Scalable POWER parallel) корпорации IBM они достаточно быстро завоевали популярность. Сегодня подобные системы работают в различных прикладных областях таких, как вычислительная химия, анализ аварий, проектирование электронных схем, сейсмический анализ, моделирование водохранилищ, поддержка систем принятия решений, анализ данных и оперативная обработка транзакций. Успех систем SP определяется прежде всего их универсальностью, а также гибкостью архитектуры, базирующейся на модели распределенной. Вообще говоря, суперкомпьютер SP это масштабируемая массивно-параллельная вычислительная система общего назначения, представляющая собой набор базовых станций RS/6000, соединенных высокопроизводительным коммутатором. Действительно, кому не известен, например, суперкомпьютер Deep Blue, который сумел обыграть в шахматы Гарри Каспарова? А ведь одна из его модификаций состоит из 32 узлов (IBM RS/6000 SP), базирующихся на 256 процессорах P2SC (Power Two Super Chip). памяти с передачей сообщений.
2.3 Суперкомпьютеры стали в миллион раз быстрее за 50 лет Затем он приступил к проектированию параллельного CDC 6600, способного работать с 60-разрядными словами. Из-за разногласий со своим партнером Крей покинул CDC и в 1972 г. основал фирму Cray Research. К тому времени в НАСА был установлен 64-разрядный ILLIAC IV корпорации Burroughs, показывавший 20 млн. операций в секунду. Он успешно действовал до 1981 г. Суперкомпьютер Cray История суперкомпьютеров неразрывно связана с именем Сеймора Крея (Seymour Cray, 1925–1996), известного прежде всего как основателя компании Cray, лидера американского рынка суперкомпьютеров. Первый транзисторный суперкомпьютер CDC 1604 Крей создал в 1958 г., возглавляя компанию Control Data Corporation (CDC), основанную им с Уильямсом Норрисом годом раньше.
В перспективе в GRAPE-решение будет включено 20 тыс. процессоров, а обойдется оно всего в 10 млн. долл. Правда, еще в 1996 г. создатели GRAPE выдвигали оптимистичный лозунг: Даешь петафлопс к 2000 г!. Суперкомпьютер Grape Петафлопсный рубеж (тысяча триллионов операций с плавающей запятой в секунду) Cray обещает преодолеть к концу десятилетия. Схожие сроки сулят и японцы. В Токио в рамках соответствующего проекта GRAPE ( готовится модель GRAPE-6. Она объединяет 12 кластеров и 2048 процессоров и показывает производительность 2,889 Тфлопс (с потенциальными возможностями 64 Тфлопс).