ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Исследование принципов работы блока ввода данных для параллельной потоковой вычислительной.

Презентация:



Advertisements
Похожие презентации
ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Архитектура планировщика процессора сопоставления ППВС «Буран» Д.Н. Змеев, Н.Н. Левченко,
Advertisements

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Способы регулирования вычислений в параллельной потоковой вычислительной системе Д.Н. Змеев,
Разработка аппаратного модулярного фильтра с конечной импульсной характеристикой на базе теоретико- числового быстрого преобразования Фурье В.М. Амербаев.
РЕАЛИЗАЦИЯ ОБРАТНОГО ПРЕОБРАЗОВАТЕЛЯ МОДУЛЯРНОЙ АРИФМЕТИКИ СОВМЕЩЕННОГО С ОПЕРАЦИЕЙ ОКРУГЛЕНИЯ ДЛЯ ЗАДАЧ ЦОС Амербаев В. М., Тельпухов Д. В., Балака Е.
ОРГАНИЗАЦИЯ ПАМЯТИ С ПАРАЛЛЕЛЬНЫМ ДОСТУПОМ К ИНФОРМАЦИИ И ЕЕ ПРИМЕНЕНИЕ Мурзин Федор Александрович.
Выполнил студент группы А Буренков Сергей Александрович. Научный руководитель к.т.н., доцент Шамаева Ольга Юрьевна. ОРГАНИЗАЦИЯ И ИССЛЕДОВАНИЕ ПАРАЛЛЕЛЬНО-ПОСЛЕДОВАТЕЛЬНЫХ.
Применение конвертируемых режимов адресации для повышения производительности сопроцессоров цифровой обработки сигналов в составе многоядерной СнК Пантелеев.
Лекция 12 Быстрое преобразование Фурье Нахождение спектральных составляющих дискретного комплексного сигнала непосредственно по формуле ДПФ требует комплексных.
КВНО апреля 2013 г. ИПА РАН Суркис И. Ф., Зимовский В. Ф., Шантырь В. А., Кен В. О., Мишин В. Ю., Соколова Н. А., Павлов Д.А. Характеристики.
Анализ и синтез арифметического узла проф. Поспелова Д.А. поля Галуа Авторы: Амербаев В.М.,Балака Е.С. (докладчик), Соловьев Р.А.,Тельпухов Д.В. ИП ПМ.
Планирование выполнения инструкций для векторных процессоров с переменной длиной векторов Пантелеев Алексей Юрьевич Национальный исследовательский ядерный.
П РЕОБРАЗОВАНИЕ ПРОГРАММ НА ЯЗЫКЕ C-DVM В ПРОГРАММЫ ДЛЯ КЛАСТЕРОВ выполнила: студентка 527 группы Коваленко Алина Игоревна научный руководитель: профессор,
Оценка эффективности параллельных вычислений Комышев Е. Г. гр
Обрабатывать информацию. Сохранять информацию Получать и передавать информацию.
Устройство для вычисления скалярного произведения векторов с коррекцией ошибок на базе системы остаточных классов Авторы: Соловьев Р.А. (докладчик) Д.В.
Организация обмена информацией Функции устройств магистрали.
1 Лекция 6 Графы. 2 Граф – это множество вершин и соединяющих их ребер. Примеры графов:
Учитель Лесконог Е.В.. Содержание Понятие табличной формулы. Особенности ввода табличной формулы. Понятие матрицы. Виды матриц. Понятие определителя.
Эффективность распараллеливания Оценки качества вычислительного алгоритма, системного ПО и аппаратуры Цель – оптимизация счета Критерии качества: Производительность.
« МАТИ » - РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ К. Э. ЦИОЛКОВСКОГО КАФЕДРА « ПРОЕКТИРОВАНИЕ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ » « Моделирование.
Транксрипт:

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Исследование принципов работы блока ввода данных для параллельной потоковой вычислительной системы Д.Н. Змеев, Н.Н. Левченко, А.С. Окунев, А.Л. Стемпковский

Признаки токена КлючДанное Токен Пакет Признаки пакетаNзNз Данное 1 Данное 2 Ключ Контекст Аузл Структура данных системы + * аb cdn ** - + / результат Вычисление формулы ((a+b)*(c+n))/(b*c-(a+b)*d) узлы Потоковый граф программы 2

3 x4–> M1.b{9,4}x2–> M1.b{7,6} x3–>M2.c{8,6} x1–>M1.a{7,6} M1(x1,x2){7,6} Программа на DFL = набор узлов … node M1(a,b) {i,j} begin … a*b –> M2.c{i+1,j}; … end … i j пакет токены входы узла заголовок узла программа узла Ассоциативная память Сопоставление токенов (при одинаковом контексте) Сопоставление токенов (при одинаковом контексте) формирование пакета ожидание «парного» токена ожидание «парного» токена формирование и посылка токена формирование и посылка токена поступает на вход узла node M1(a,b){i,j} контекст узла имя узла M1(x1,x2){7,6} пакет

4... коммутатор токенов пакет токен... ПС k-1 ИУ 0 внутренний коммутатор пакетов ПС 0 токен пакет токен пакет ЯДРО ВЫЧИСЛИТЕЛЬНЫЙ МОДУЛЬ внутренний коммутатор токенов... пакет токен пакет токен пакет ЯДРО ВЫЧИСЛИТЕЛЬНЫЙ МОДУЛЬ ИУ m-r ПС n-k ПС n-1 ИУ m-1 внутренний коммутатор пакетов внутренний коммутатор токенов ИУ r-1 Блок ввода данных

5 Память данных данные с ХОСТа Входной регистр токенов Память токенов Узел анализа алгоритма ввода токенов Узел анализа режима ввода токенов Узел ввода токенов токены в КМТ Регистр выдачи токенов Узел формирования полей токенов Узел генерации токенов Узел формирования ядра Узел формирования этапа Формирователь токенов

- последовательный ввод по строкам;- последовательный ввод по столбцам;- по блочно-квадратный ввод;- по блочно-квадратный половинчатый ввод;- ввод колонками;- ввод планками;- блочно-точечный ввод;- диагональный ввод;- ввод векторов для БПФ. 6

7 Суммарная загрузка памяти ключей в процессоре сопоставления В два раза уменьшен требуемый объем памяти ключей! на задаче БПФ для разных алгоритмов ввода данных последовательный ввод данных вектора чередование полу векторов

8 Суммарная загрузка памяти ключей в процессоре сопоставления Максимальный объем памяти ключей меньше в 80 раз! на задаче перемножение матриц для разных алгоритмов ввода Последовательно и чередованием

9 Суммарная загрузка памяти ключей в процессоре сопоставления Максимальный объем памяти ключей меньше в раз! Зависит от размерности вектора на задаче сложение векторов для разных алгоритмов ввода (последовательно и чередованием) последовательный ввод данных вектора чередование векторов

10 Задача «Сложение векторов» тактов Ускорение на 16% Задача «Быстрое преобразование Фурье» тактов Ускорение на 18%

ИНСТИТУТ ПРОБЛЕМ ПРОЕКТИРОВАНИЯ В МИКРОЭЛЕКТРОНИКЕ РАН (ИППМ) Спасибо за внимание!