The AMD Athlon (K7)
Шина AMD Athlon
AMD Opteron
x86-64 Programmers Model Added by x86-64 XMM8 XMM15 R8 R15 RAX 63 x87x87x87x In x86 XMM0 XMM7 SSESSESSESSE 1270 EIP 031 Program Counter AH EAX AL GPRGPRGPRGPR EAX EDI EAX AHAL
Свойства AMD64 Ядро AMD64 (х86-64 ) Одновременное исполнение 32-разрядного и 64- разрядного кода. Преодолен барьер 4 Гбайт для памяти, присущий 32- разрядным системам. Интегрированный контроллер памяти DDR Увеличенная скорость выполнения приложений за счет существенного сокращения латентности ОП. Канал HyperTransport Пиковая пропускная способность до 19 Гбайт/с на процессор, что уменьшает узкие места в системе ввода/вывода. Технология HyperTransport масштабируется в зависимости от количества процессоров.
AMD Athlon64/Opreron
Подсистема памяти 64-разрядная виртуальная адресация Плоское адресное пространство 64-битные регистры –8 новых РОН (R8-R15) –8 новых регистров SSE (xmm8-xmm15) КЭШ L1: Кбайт, 2-ассоциативный КЭШ L2: 1024 Кбайт, 16-ассоциативный
Работа конвейера Выборка (FETCH) 16 байт/такт Распределение по 3 OP в планировщики из декодировщика (буфер 24 OP) Производительность FPU: –x87: 1 MUL + 1 ADD (1.9 FLOP/c max) –3DNow: 2 MUL + 2 ADD (3.4 FLOP/c max) Целочисленная производительность: –32 бита: 1 ADD + 1 MUL (3 такта) –64 бита: 1 ADD или 1 MUL (4 такта) Предсказание ветвлений:
ТЕХНОЛОГИЯ HYPERTRANSPORT HyperTransport – это высокопроизводительный интерфейс, соединенный по принципу «точка-точка» (peer-to-peer). Это теоретически означает, что между собой могут быть соединены любые компоненты системы, причем без применения каких-либо коммутаторов или мостов. Каждое соединение состоит из субсоединения Передачи (Tx) и субсоединения Получения (Rx), работающих асинхронно. Передача данных организована в виде пакетов длиной до 64 байт. Пиковая производитель- ность до 12,8 Гб/c. Соединение HyperTransport может иметь магистраль шириной 2,4,8,16,32 или 64 бит в 100 МБ/сек для каждого направления.
ТЕХНОЛОГИЯ HYPERTRANSPORT 1 -- системная шина процессора; 2 -- интерфейс памяти; 3 -- межчиповое соединение; 4 -- интерфейсы ввода-вывода для шин.
Свойства HyperTransport Масштабируемая пропускная способность при обмене информацией с другими процессорами, подсистемами ввода/вывода и прочими устройствами. Поддержка до трех согласованных каналов HyperTransport, что обеспечивает пиковую пропускную одного процессора до 19,2 Гбайт/с. Пропускная способность одного канала, достигающая 6,4 Гбайт/с, является достаточной для поддержки новых технологий обмена данными, включая шину PCI-X, новые модели памяти DDR, архитектуру InfiniBand и сети 10G Ethernet. Низкое энергопотребление (напряжение питания – 1,2 В) уменьшает общее тепловыделение вычислительной системы.
Интегрированный контроллер памяти DDR DRAM Изменяет порядок доступа центрального процессора к ОП, в результате чего увеличивается пропускная способность, уменьшается латентность памяти и увеличивается производительность процессора. Доступная пропускная способность памяти масштабируется вместе с числом процессоров. 128-разрядная шина памяти и интегрированный контроллер памяти DDR DRAM с поддержкой до 8 модулей памяти типа registered DDR DIMM на процессор. Доступная полоса пропускная способность памяти до 5,3 Гбайт/с на процессор (при спецификации памяти PC2700).
Сравнение характеристик Memory Cache memory Conveyer length Issue ports count Register count Functional units =16 TB L2 cache 1 MB 2 ALU 80 integer 72 float 833 MHz 4 instructions / cycle L1 cache 64KB 6 2 MEM 2 FPU =1 TB L2 cache 1 MB 3 ALU 120 integer 120 float 1,4 MHz 3 x86 instructions / cycle L1 cache 64 KB 8 3 ME M 3 FPU Alpha 21264Opteron бита 3,2 MB/sec 128 бит 6,4 MB/sec 1х128 2х64 Frequency Throughput Bus width
Сравнение характеристик