Разработка контроллера обрабатываемых запросов кэш памяти третьего уровня микропроцессора "Эльбрус-4С+" Студент: Кожин Евгений, группа 713 Научный руководитель:

Презентация:



Advertisements
Похожие презентации
Московский физико-технический институт (государственный университет) Факультет радиотехники и кибернетики Кафедра информатики и вычислительной техники.
Advertisements

Научный руководитель: Кожин А.С. Студент: Лавров А.В, ФРТК 816 гр.
Выполнил: Петрыкин Д.А., ФРТК, 613 гр. Научный руководитель: Слесарев М.В. Выпускная квалификационная работа.
Магистерская диссертация Исаев Михаил, ФРТК, 515 гр. Научный руководитель д.т.н. Сахин Ю. Х. Отладка и усовершенствование межъядерного коммутатора для.
Разработка интерфейса между системным коммутатором и контроллером памяти с использованием протокола AXI Выпускная квалификационная работа на соискание.
Выпускная квалификационная работа Исаев Михаил, ФРТК, 515 гр. Научный руководитель Сахин Ю. Х. Объединение двух процессорных ядер с архитектурой "Эльбрус"
Разработка кэша справочника для вычислительного комплекса на базе микропроцессора Эльбрус – 2S Студент : Петров Игорь, ФРТК, 613 группа Научный руководитель:
Разработка контроллера встроенного интерфейса AXI в составе системы на кристалле «Эльбрус-S2» Студент: Поляков Н.Ю., ФРТК, 515 гр. Научный руководитель:
Адаптация буферизующего коммутатора данных МП «Эльбрус-S2» Студент: Рогов А.С., ФРТК, 613 гр. Научный руководитель: Костенко В.О. Выпускная квалификационная.
Реализация справочника для аппаратной поддержки когерентности в ВК Эльбрус-2S Студент: Петров Игорь, ФРТК, 613 группа Научный руководитель: к.т.н. Груздов.
Разработка модулей коммутации данных в микропроцессоре « Эльбрус -4 С +» Выпускная квалификационная работа на соискание степени бакалавра студента 816.
Интерфейсный блок AXI- коммутатора в составе системы на кристалле «Эльбрус-S2» Студент: Смольянов Павел 518 гр. Научный руководитель: Сахин Ю.Х.
Разработка системного коммутатора для микропроцессора «MCST-4R» Выполнил: Студент 415 группы МФТИ Щербина Н.А. Научный руководитель: Черепанов С.А. Дипломная.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ ФИЗИКО - ТЕХНИЧЕСКИЙ ИНСТИТУТ (государственный университет) Устройство управления вещественного.
Студент: Перов Д.Ю., ФРТК, 816 группа Научный руководитель: д.т.н. Сахин Ю.Х.
Разработка коммутатора сообщений блока регистров и прерываний в кластере «Эльбрус-S» Выполнил: Петроченков М. В. 613 гр. Научный руководитель: Зайцев А.И.
Министерство образования и науки Российской Федерации Московский физико-технический институт (государственный университет) Факультет радиотехники и кибернетики.
Разработка 4-х канального контроллера оперативной памяти DDR3 SDRAM с интерфейсом AXI Студент: Кожин А.С., ФРТК, 515 гр. Научный руководитель: д.т.н.,
Московский Физико-Технический Институт Оптимизация методов умножения матриц библиотеки линейной алгебры для ВК Эльбрус-3M1 и Эльбрус-90 микро Выполнил:
Доработка контроллера памяти DDR2 SDRAM МП Эльбрус-S для МП Эльбрус-S2 Научный руководитель: Шерстнёв Андрей Кожин Алексей, ФРТК 513 гр.
Транксрипт:

Разработка контроллера обрабатываемых запросов кэш памяти третьего уровня микропроцессора "Эльбрус-4С+" Студент: Кожин Евгений, группа 713 Научный руководитель: к.т.н. Груздов Ф.А. Московский физико-технический институт (государственный университет) Факультет радиотехники и кибернетики Магистерская диссертация Кафедра информатики и вычислительной техники

Точка сериализации Когерентность памяти Атомарность операций с памятью Сериализация запросов к одной и той же кэш-строке Точка сериализации – устройство, обеспечивающее сериализацию запросов по одному адресу. Останавливает обработку следующих запросов до завершения текущего.

МП «Эльбрус-2S» как система с одной точкой сериализации Сериализация запросов в SIC Темп обработки – 1 запрос/такт

МП «Эльбрус-4С+» 8 процессорных ядер архитектуры «Эльбрус» Общий кэш третьего уровня (L3 кэш) – 16 МБ Использование L3 кэша в качестве уровня сериализации

Структурная схема МП

Постановка задачи Разработка устройства обработки запросов в L3 кэше (Request In-process Buffer, RIB) Требования: Хранение переходного состояния строки L3 кэша в RIB, а не в памяти L3 кэша Использование RIB в качестве устройства, обеспечивающего сериализацию локальных запросов (от процессорных ядер)

Функции RIB Упорядочивание запросов к одной и той же кэш-строке для максимального количества разных адресов Отправка запросов в SIC для получения доступа к кэш-строке Рассылка снуп-запросов в процессорные ядра Отправка ответов на запросы в SIC и ядра Запись нового состояния в память L3 кэша Чтение данных из конвейера данных L3 кэша

Расположение RIB в конвейере банка L3 кэша IRQ(girq, lirq) – входые очереди Reqarb – арбитр запросов Tag&State Memory – память тэгов и состояний Tagcmp – сравнение тэгов LDAnalizer – блок анализа состояний Pipe_lru – устройство поиска жертвы для вытеснения Pipe_dm – конвейер данных

Прохождение запроса через RIB CAM - Content-addressable memory В памяти L3 кэша не хранится переходное состояние строки Просмотр RIB при прохождении запроса через конвейер Одна запись вместо двух

Построение очередей Решение: Запросам в L3 кэше назначаются права на работу с кэш-строкой Полное владение (O) Частичное владение (H) Отсутствие прав, блокировка запроса (B) Проблема двух точек сериализации: Локальный запрос блокирует адрес в L3 кэше и посылает запрос в SIC В это же время глобальный запрос из другого МП блокирует адрес в SIC и посылает снуп-запрос в L3 кэш

Примеры построения очередей

Оптимизации Очереди запросов по чтению. Данные выдаются запросчику до прихода ответа о получении данных предыдущим запросчикам –Минимальная задержка между последовательными чтениями – 2 такта Проблема гонки запросов Invalidate. Строка находится в L3 кэше. Ядро хочет получить права на запись строки. Посылается в SIC запрос Invalidate. В этот момент глобальный запрос отнимает данные из L3 кэша. Решение раньше – превращение Invalidate в Read&Invalidate в SIC Решение сейчас – отслеживание типа ответов от SIC –Уменьшение нагрузки на котроллер памяти и трафика данных

Результаты работы Разработан контроллер обрабатываемых запросов кэш памяти третьего уровня микропроцессора "Эльбрус-4С+" –Обеспечение сериализацию локальных запросов –Реализация протокола переходных состояний кэш-строк L3 кэша –Емкость 32 запроса –Работа на частоте 1300 MHz (28 нм) Проведена автономная верификация и верификация в составе МП Проводится верификация на прототипе

Спасибо за внимание