Москва 2008 Специализированное вычислительное устройство для обработки радиолокационной информации Московский физико-технический институтИнститут точной.

Презентация:



Advertisements
Похожие презентации
Схема предсказания исключительной ситуации «потеря точности» в модуле операции «умножение с накоплением» Ивасюк Евгений Вячеславович Научно-исследовательский.
Advertisements

Автор: Бараковских Екатерина 10 А МОУ СОШ 1 Свердловская область, Нижнесергинский район, город Михайловск Числа с плавающей запятой.
Устройство для вычисления скалярного произведения векторов с коррекцией ошибок на базе системы остаточных классов Авторы: Соловьев Р.А. (докладчик) Д.В.
Представление чисел в компьютере автор: Хайманова Т.Я. май 2008 г.
форма с фиксированной точкой (применяется к целым числам) форма с плавающей точкой (применяется к вещественным числам)
Лекция 6. Способы адресации в микропроцессорных системах.
РЕАЛИЗАЦИЯ ОБРАТНОГО ПРЕОБРАЗОВАТЕЛЯ МОДУЛЯРНОЙ АРИФМЕТИКИ СОВМЕЩЕННОГО С ОПЕРАЦИЕЙ ОКРУГЛЕНИЯ ДЛЯ ЗАДАЧ ЦОС Амербаев В. М., Тельпухов Д. В., Балака Е.
Разработка и исследование алгоритмов динамического распределения и доставки данных с учетом требований вычислительных сервисов в системе распределенных.
Архитектура компьютера. Функциональные характеристики ПК Лекция 2 часть г.
Лекция 9. Двоичная арифметика и проблема точности вычислений Краткое содержание 1.Двоичная система счисления: целые числа и дроби 2.Восьмеричная система.
Представление чисел в компьютере. Числовые данные обрабатываются в компьютере в двоичной системе счисления. Числа хранятся в оперативной памяти в виде.
ВЯТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ «Роль ВятГУ в развитии биотехнологии Кировской области» Пименов Евгений Васильевич II Международная конференция биотехнологов.
Роль микропроцессора в организации работы компьютера.
Комплексные числа -минимальные условия; -определения; -арифметические операции; -свойства.
Процессор – это блок, предназначенный для автоматического считывания команд программы, их расшифровки и выполнения.
Представление числовой информации в ПК Мясникова О.К.
Магистерская диссертация Выполнил Кощеев Михаил Научный руководитель: Хлобыстов Владимир Тимофеевич Устройство сложения чисел с плавающей точкой в микропроцессоре.
Реализация базовых функций задачи горения на основе операции FMA специализированного векторного сопроцессора Ивасюк Евгений Вячеславович Научно - исследовательский.
Представление целых чисел в ЭВМ В этом формате в ОП ЭВМ хранятся целые числа. Представление чисел в формате с фиксированной запятой Каждому разряду ячейки.
Микропроцессоры. Процессор Центральным устройством в компьютере является процессор. Он выполняет различные арифметические и логические операции, к которым.
Транксрипт:

Москва 2008 Специализированное вычислительное устройство для обработки радиолокационной информации Московский физико-технический институтИнститут точной механики и вычислительной техники имени С. А. Лебедева РАН Д.Д. Николаев, М.Л. Ремизов, А.В. Ростовцев, Чинь Куанг Киен

Постановка задачи Рекурсивное вычисление комплексной 64-мерной матрицы: n = 1, 2,…128

Требования по производительности За 5 секунд необходимо выполнить вычисление матрицы 1728 раз. Вычисления программным способом > 43 мин.

Этапы вычислений Этап Операции и объем вычислений 164х64 MAC 21x64 MAC 31DIV 4w n = -kz n 64 MUL 564х64 MAC

5 Варианты реализации фиксированная запятая: простой алгоритм малый объем оборудования малая производительность проблема диапазона и точности плавающая запятая: сложный алгоритм большая трудоемкость большой объем оборудования большая производительность автоматическое решение проблемы диапазона и точности Выбран вариант с плавающей запятой

6 Формат чисел Порядок 7 разрядов Скрытый бит мантиссы представлен в явном виде Округление только к ближайшему Нет специальных значений Нет денормализованных чисел (при underflow - flush to zero) Предложенный формат: Результат вычисления матрицы R^-1 в нашем формате совпадает с вычисленным в IEEE 754 single

7 Комплексный MAC - Multiply & Accumulate (А + Bi)(C + Di)+ E + Fi

8 Комплексный MAC - Multiply & Accumulate (А + Bi)(C + Di)+ E + Fi C AC BC AC + E BC + F

9 Комплексный MAC - Multiply & Accumulate (А + Bi)(C + Di)+ E + Fi D AD BD AC + E - BD BC + F + AD AC + E BC + F

10 Структурная схема вычислителя

11 Прототип Прототип создан на базе FPGA Virtex-5 xc5vlx330 Использовано Триггера из % LUT из % f = 200 МГц Вычисление одной матрицы < 1 мс Производительность ~6,5 млрд. операций с плавающей запятой в секунду

12 Пути повышения производительности полная конвейеризация использование MAF быстрый алгоритм умножения (без итераций) быстрый алгоритм MAC использование нескольких узлов MACR Эффект - увеличение производительности в 5-10 раз

13 Пути повышения точности увеличение разрядности мантиссы уменьшение количества округлений: одно округление на умножение и сложение одно округление на два умножения и сложение