Новосибирский государственный университет

Факультет информационных технологий

Словарь терминов в коллекции "Вычислительные системы"

Вычислительные системы с неоднородным доступом к памяти

Синонимы: Вычислительные системы с неоднородным доступом к памяти; NUMA-системы;

Вычислительные системы с неоднородным доступом к памяти - система, состоящая из однородных узлов, состоящих из процессора и блока памяти и объединенных с помощью высокоскоростного коммутатора. Здесь поддерживается единое адресное пространство, аппаратно поддерживается доступ к удаленной памяти, т.е. к памяти других модулей. При этом доступ к локальной памяти в несколько раз быстрее, чем к удаленной.
Примеры систем, с архитектурой NUMA: HP 9000 V-class в SCA-конфигурациях, SGI Origin2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000, SNI RM600.

В вычислительных системах с неоднородным доступом к памяти реализована технология NUMA (Non-Uniform Memory Access).
Технология неоднородного доступа к памяти считается одной из путей создания крупномасштабных вычислительных систем. В архитектуре NUMA память физически распределена, но логически общедоступна. Это позволяет сохранить преимущества архитектуры с единым адресным пространством, а также ощутимо расширяет возможности масштабирования ВС.

В типичной организации системы типа ccNUMA имеется множество независимых составляющих ВС (узлов), объединенных с помощью какой-либо сети соединений (например, кроссбара, кольца и т.д.). Узел содержит процессор с кэш-памятью, а также локальную основную память, рассматриваемую как часть глобальной основной памяти системы.

Согласно технологии неоднородного доступа, каждый узел в системе владеет локальной памятью, но с позиций системы имеет место глобальное адресное пространство, где каждая ячейка любой локальной основной памяти имеет уникальный системный адрес. Когда процессор инициирует доступ к памяти и нужная ячейка отсутствует в его локальной кэш- памяти, организуется операция выборки. Если нужная ячейка находится в локальной памяти, выборка производится с использованием локальной шины. Если же требуемая ячейка хранится в удаленной секции глобальной памяти (локальной памяти другого процессора), то автоматически формируется запрос, посылаемый по сети соединений на локальную шину узла, где находится запрошенная информация, и уже по ней на подключенную к данной локальной шине кэш-память. Все эти действия выполняются автоматически, прозрачны для процессора и его кэш-памяти.

Как и в любой ВС с разделяемой памятью, особое внимание уделяется когерентности кэшей. В подавляющем большинстве NUMA-систем реализована аппаратная поддержка когерентности кэш-памяти процессорных элементов (ccNUMA), хотя известны системы, где такая поддержка отсутствует (nccNUMA). Поскольку для взаимодействия узлов системы используется не шина, а сеть соединений с более сложной топологией, в ccNUMA-системах проблема когерентности решается с помощью протоколов на основе распределенных справочников. Хотя отдельные реализации и отличаются в деталях, общим является то, что каждый узел содержит справочник. Взаимодействуя между собой, справочники позволяют определить физическое расположение любой информации в глобальном адресном пространстве.

В реальных NUMA-системах узлы обычно содержат не одиночные процессорные элементы, а сборки из нескольких ПЭ, чаще всего - SMP-системы. Так, одна из наиболее производительных ВС - Tera 10 - состоит из 544 SMP-узлов, каждый из которых содержит от 8 до 16 процессоров Itanium 2.

NUMA-системы, как правило, работают под управлением единой операционной системы.

Масштабируемость NUMA-систем ограничена лишь величиной адресного пространства, возможностями аппаратных средств поддержки когерентности кэшей и возможностями операционной системы по управлению большим числом процессоров. Например, NUMA-система Silicon Graphics Origin поддерживает до 1024 процессоров R10000, а система Sequent NUMA-Q объединяет 252 процессора Pentium II. Очередным этапом развития технологии NUMA стала архитектура NumaFlex, используемая в семействе SGI 3000, где допускается наращивание системы даже за счет различных процессоров.

Общая характеристика вычислительных систем с неоднородным доступом к памяти:

Имеются два или более узлов, каждый из которых может быть представлен процессорным элементом с кэш-памятью или SMP-системой.
Каждый узел имеет локальную память, рассматриваемую как часть глобальной памяти системы.
Узлы соединены посредством высокоскоростной сети, в роли которой чаще всего выступает коммутатор типа «кроссбар».
Поддерживается единое адресное пространство, то есть любой узел имеет доступ к памяти других узлов, однако время доступа к локальной памяти существенно меньше времени обращения к удаленной памяти (локальной памяти других узлов).
Когерентность кэшей обычно поддерживается аппаратными средствами (ccNUMA), но возможен вариант без таких средств (nccNUMA).
Вычислительная система управляется единой операционной системой, как в SMP, но возможен вариант с разбиением системы на разделы, работающие под управлением разных операционных систем.

Благодаря своей архитектуре и заложенному в нее потенциалу масштабируемости NUMA-системы считаются перспективным направлением при создании мощных вычислительных систем.

Литература

Основная:

Цилькер Б.Я. Организация ЭВМ и систем : Учебник для вузов / Б.Я. Цилькер, С.А. Орлов. - 2-е изд. - СПб.: Питер, 2011. - 688 с. - ISBN 978-5-49807-862-5.

Ключевые термины (головные): Архитектура вычислительной машины; Классификация Флинна; MIMD-архитектура; Архитектура NUMA; Архитектура ccNUMA; Архитектура nccNUMA; Симметричные мультипроцессорные системы; Топология кроссбар; Когерентность кэш-памяти;

Федотов Анатолий Михайлович

НГУ
ФИТ НГУ
ИВТ СО РАН

© 1998-2024, Новосибирский государственный университет, Новосибирск
© 1998-2024, Институт вычислительных технологий СО РАН, Новосибирск
© 1998-2024, Федотов А.М.
Дата последней модификации: 30.10.2013