• Пространственная локальность, которая характеризуется присущей программам тенденцией ссылаться на адреса памяти, близкие к тем, к которым недавно обращались (из-за последовательного характера обработки инструкций и иногда последовательного характера обработки структур данных).
• Локальность по отношению ко времени — характеризуется свойственной программам тенденцией обращаться к тем же адресам памяти в ближайшем будущем, к которым обращение уже было в недавнем прошлом (из-за использования циклов).
В результате локальности ссылок появляется возможность выполнять программу, располагая в оперативной памяти лишь часть ее адресного пространства.
Структура виртуальной памяти подразумевает разбиение памяти, используемой каждой программой, на небольшие блоки фиксированного размера, называемые страницами. Соответственно, оперативная память делится на блоки страничных кадров (фреймов) одинакового размера. В любой отдельно взятый момент времени в страничных кадрах физической памяти требуется наличие только некоторых страниц программы. Эти страницы формируют так называемый резидентный набор. Копии неиспользуемых страниц программы размещаются в области подкачки — зарезервированной области дискового пространства, применяемой для дополнения оперативной памяти компьютера, — и загружаются в оперативную память лишь по мере надобности. Когда процесс ссылается на страницу, которой нет в оперативной памяти, происходит ошибка отсутствия страницы, в результате чего ядро приостанавливает выполнение процесса, пока страница загружается с диска в память.
В системах x86-32 размер страницы составляет 4096 байт. В некоторых других реализациях Linux используются страницы больших размеров. Например, в Alpha — страницы размером 8192 байт, а в IA-64 — изменяемый размер страниц, обычно с исходным объемом 16 384 байт. Программа может определить размер страницы виртуальной памяти системы с помощью вызова sysconf(_SC_PAGESIZE), рассматриваемого в разделе 11.2.
Для поддержки этой организации ядро ведет для каждого процесса таблицу страниц (рис. 6.2). В ней дается описание размещения каждой страницы в виртуальном адресном пространстве процесса (набора всех страниц виртуальной памяти, доступных процессу). В каждой записи таблицы страниц указывается либо расположение виртуальной страницы в памяти, либо то место, которое она в данный момент занимает на диске.
Записи в таблице страниц нужны не всем адресным диапазонам виртуального адресного пространства процесса. Обычно большие диапазоны потенциального виртуального пространства не используются, поэтому нет необходимости вести соответствующие записи в таблице страниц. Если процесс пытается получить доступ к адресу, для которого не имеется соответствующей записи в таблице страниц, он получает сигнал SIGSEGV.
Рис. 6.2. Общий вид виртуальной памяти
Диапазон допустимых для процесса виртуальных адресов за время его жизненного цикла может измениться по мере того, как ядро будет выделять для процесса и высвобождать страницы (и записи в таблице страниц). Это может происходить при следующих обстоятельствах:
• когда стек разрастается вниз, выходя за ранее обозначенные ограничения;
• когда память выделяется в куче или высвобождается в ней путем подъема крайней точки программы с использованием вызовов brk(), sbrk() или семейства функций malloc (см. главу 7);
• когда области совместно используемой памяти (System V) прикрепляются с помощью вызова shmat() и открепляются вызовом shmdt();
• когда отображение памяти создается с применением вызова mmap() и убирается с помощью munmap() (см. главу 45).
Реализация виртуальной памяти требует аппаратной поддержки в виде блока управления страничной памятью — Paged Memory Management Unit (PMMU). Блок PMMU переводит каждую ссылку на адрес виртуальной памяти в соответствующий адрес физической памяти и извещает ядро об ошибке отсутствия страницы, когда конкретный адрес виртуальной памяти ссылается на страницу, отсутствующую в оперативной памяти.
Управление виртуальной памятью отделяет виртуальное адресное пространство процесса от физического адресного пространства оперативной памяти. Это дает множество преимуществ.
• Процессы изолированы друг от друга и от ядра, поэтому один процесс не может прочитать или изменить память другого процесса или ядра. Это достигается за счет записей в таблице страниц для каждого процесса, указывающих на различные наборы физических страниц в оперативной памяти (или в области подкачки).