В качестве примера файловых систем мы рассмотрим FAT16 и FAT32. В сфере персональных
компьютеров в 1987 г. возник кризис. Возможности файловой системы FAT, разработанной
фирмой Microsoft за десять лет до этого для интерпретатора Standalone Disk Basic
и позднее приспособленной для операционной системы DOS, были исчерпаны. FAT
предназначалась для жестких дисков емкостыо не свыше 32 Мбайт, а новые НЖМД
(накопители на жестких магнитных большей емкости оказывались совершенно бесполезными
для пользователей PC. Некоторые независимые поставщики предлагали собственные
способы решения этой проблемы, однако лишь с появлением DOS 4.0 этот кризис
был (на некоторое время!) преодолен.
Значительные изменения структуры файловой системы в DOS 4.0 позволили операционной
системе работать с дисками емкостью до 128 Мбайт; а после внесения незначительных
дополнений впоследствии этот предел был поднят до 2 Гбайт. В то время казалось,
что такой объем памяти превышает любые мыслимые потребности. Однако если история
персональных компьютеров чему-то и научила, тому, что емкость, "превышающая
любые мыслимые потребности", быстро становится "почти недостаточной
для серьезных работ". Действительно, в настоящее время в продаже имеются
жесткие диски емкостью, как правило, 2,5 Гбайт и выше, а когда-то очень высокий
и избавивший нас от ограничений потолок в 2 Гбайт превратился в еще одно препятствие,
которое предстояло преодолеть.
Для систем Windows фирма Microsoft разработала новое расширение системы FAT - FAT32.
Области диска
Файловая система FAT предусматривает ряд специальных областей на диске, выделенных
для организации пространства диска в процессе его форматирования, - головную
запись загрузки, таблицу разбиения диска, запись загрузки, иду размещения файлов
(от которой система и получила свое название) и корневой каталог. На физическом
уровне пространство диска разбивается на области по 512 байт, называемые секторами.
В системе FAT место для файлов выделяется блоками, которые состоят из целого
числа секторов и именуются кластерами. Число секторов в кластере должно быть
кратно степени двойки. В Microsoft кластеры называют единицами выделения памяти
(allocation unit). Обычно кластера можно определить, поделив объем памяти диска
на 64 Кбайт 536 байт) и округлив результат до ближайшего числа, кратного степени
двойки. Так, размер кластеров 1,2-гигабайтного диска составляет 32 Кбайт: если
1,2 Гбайт (1258291,2 Кбайт) поделить на 65 536, получим 19,2 Кбайт, а после
округления - 32 Кбайт.
Цепочка FAT
FAT представляет собой базу данных, связывающую кластеры дискового пространства
с файлами. В этой базе для каждого кластера предусматривается только один элемент.
Первые два элемента содержат информацию о самой системе FAT. Третий и последующие
элементы ставятся в соответствие кластерам дискового пространства, начиная с
первого кластера, отведенного для файлов. Элементы FAT могут содержать несколько
специальных значений, указывающих, что кластер свободен, то есть не использован
ни одним файлом (для FAT16 это значение составляет 0000Н); кластер содержит
один или несколько секторов с физическими дефектами и не должен использоваться
(для FAT 16 это значение составляет FFF7H); данный кластер - последний кластер
файла (для FAT 16 это значение составляет FFF8 FFFFH).
Для любого используемого файлом, но не последнего кластера элемент FAT содержит
номер следующего кластера, занятого файлом.
Каждый каталог - корневой или подкаталог - также представляет собой базу данных.
В каталоге DOS для каждого файла предусмотрена одна главная запись (в среде
Windows для длинных имен файлов введены дополнительные записи). В отличие
от FAT, где каждый элемент состоит из единственного поля, записи для файла в
каталоге состоят из нескольких полей (табл. 4.1). Некоторые поля - имя, расширение,
размер, дата и время - могут быть выведены на экран по команде DIR. Но в системе
FAT предусмотрено поле, которое не отображается командой DIR, - поле с номером
первого кластера, отведенного под файл.
Таблица 4.1. Структура записи об атрибутах файла в FAT
Смещение
|
0-7
|
8-10
|
11
|
12-21
|
22-23
|
24-25
|
26-27
|
28-31
|
|
Имя файла
|
Расширение
|
Атрибут
|
Не используется
|
Время
|
Дата
|
Начальный
|
Размер файла
|
Размер
|
8 байт
|
3 байта
|
1 байт
|
10 байт
|
2 байта
|
2 байта
|
2 байта
|
4 байта
|
Запись в каталоге для файла состоит из восьми полей, содержащих основную информацию
о файле, например его размер, начальный кластер на диске, время и дату последнего
внесения в него изменений.
Когда программа отправляет запрос к операционной системе с требованием предоставить
ей содержимое какого-либо файла, ОС просматривает запись каталога для него,
чтобы найти первый кластер этого файла. Затем она обращается к элементу FAT
для данного кластера, чтобы найти следующий кластер в цепочке. Повторяя этот
процесс, пока не обнаружит последний кластер файла, ОС точно определяет, какие
кластеры принадлежат данному файлу и в какой последовательности. Таким образом,
система может предоставить программе любую часть запрашиваемого ею файла. Такой
способ организации файла носит название цепочки FAT.
В системе FAT файлам всегда выделяется целое число кластеров. На 1,2-гигабайтном
жестком диске с 32-килобайтными кластерами в каталоге может быть указано, что
размер текстового файла, содержащего слова "Hello, world", составляет
всего 12 байт, но на самом деле этот файл занимает 32 Кбайт дискового пространства.
Неиспользованная часть кластера называется потерянным местом (slack). В небольших
файлах почти весь кластер может быть потерянным местом, а в среднем потери составляют
половину размера кластера.
Один из способов высвобождения пространства на диске - с помощью программ сжатия
диска, например DriveSpace, которая выделяет "потерянные места" для
использования другими файлами.
Расчеты размеров секторов и кластеров
Сначала в файловой системе FAT в DOS 1.0 использовались 12-разрядные элементы
FAT. В DOS 2.0, оснащенной дополнительными средствами для работы с жесткими
дисками, в FAT уже были предусмотрены 16-разрядные элементы. Последнее стало
причиной проблемы, возникшей в 1987 г. Сущность ее заключалась в том, что в
низкоуровневой команде считывания сектора диска под значение параметра с номером
считываемого сектора было отведено 16 разрядов. Таким образом, максимальный
объем внешнего устройства, с которым, в принципе, могла работать операционная
система DOS 2.0, ограничивался 32 Мбайт (данный предел получается как результат
умножения 65536, максимального числа, укладывающегося в 16 разрядов, на 512байт
в секторе). В DOS 4.0 для обработки запросов на считывание секторов нижнего
уровня используются 32-разрядные параметры.
Предел в 2 Гбайт на самом деле обусловлен не проблемами операционной системы,
а существующими программами. На диске емкостью 2 Гбайт и более кластеры имеют
размер 64 Кбайт, или 65 536 байт. Но самое большое значение, которое может быть
представлено в 16 разрядах, составляет 65 535; 64 Кбайт - слишком большая величина
для 16 разрядов. В Microsoft обнаружили, что при разработке многих существующих
в настоящее время программ их авторы исходили из предположения, что значение
числа байт в кластере умещается в 16 разрядах.
Ограничения на размеры секторов и кластеров в FAT16
Даже если такой проблемы не возникло при объеме в 2 Гбайт, то операционная система
все равно не сможет работать с дисками емкостью свыше 4 Гбайт. При использовании
FAT16 число секторов в кластере сохраняется самой ОС в одном байте блока параметров
диска, устанавливаемого ОС. Это число должно быть кратным степени 2 и при этом
меньше 256. Таким образом, в кластер может входить не более 128 секторов, или
64 Кбайт. В итоге, даже если ограничение в 2 Гбайт снимается, система FAT 16
приемлема лишь для дисков емкостью менее 4 Гбайт.
В файловой системе FAT32 как элементы FAT, так и номера секторов 32-разрядные.
Вот что это значит: умножим 4 294 967 296 различных 32-разрядных значений на
512 байт в секторе и получим огромное число 2 Тбайт (2 199 023 255 552 байт),
которое представляет собой максимально возможную емкость диска при использовании
FAT32.
Таблица 4.2. Ограничения на размеры секторов и кластеров
Размер диска |
Число секторов в кластере
|
Размер кластера
|
||
Десятичное | Двоичное | Десятичное | Двоичное | |
Менее 128 Мбайт | 4 | 00000100 | 2 Кбайт | 0000100000000000 |
Менее 128 Мбайт | 8 | 00001000 | 4 Кбайт | 0001000000000000 |
Менее 128 Мбайт | 16 | 00010000 | 8 Кбайт | 0010000000000000 |
Менее 128 Мбайт | 32 | 00100000 | 16 Кбайт | 0100000000000000 |
Менее 128 Мбайт | 64 | 01000000 | 23 Кбайт | 1000000000000000 |
Менее 128 Мбайт | 128 | 10000000 | 264 Кбайт | Ошибка: проблема для существующих программ |
Менее 128 Мбайт | 256 | Ошибка: проблема для ОС |
Некоторое устранение потерь
Теперь, когда допустимое число кластеров и число секторов одинаковы, видимо,
можно было бы предположить, что для минимизации потерь места на диске в FAT32
будут использоваться кластеры, состоящие только из одного сектора. Но в этом
вопросе необходим какой-то компромисс, поэтому в спецификации FAT32 размер кластера
для накопителей емкостью до 8 Гбайт составляет 4 Кбайт.
Таблица 4.3. Зависимость размера кластера от емкости диска
Емкость диска, Гбайт | Размер кластера, Кбайт |
Менее 8 | 4 |
Менее 16 | 8 |
Менее 32 | 16 |
32 и более | 32 |
Одним из факторов, сыгравшим роль в принятии такого решения, стало то, что
теперь нужно учитывать и размер самой FAT. Операционная система сохраняет две
копии FAT, поэтому под элемент каждого кластера в FAT требуется 8 байт. На 2-гигабайтном
диске FAT займет 32 Мбайт его пространства при размере кластера 512 байт. А
если размер кластера составляет 4 Кбайт, для хранения двух таблиц FAT потребуется
всего 4 Мбайт, то есть будет сэкономлено 28 Мбайт.
Но причиной для компромисса послужили не только соображения экономии дискового
пространства; для ускорения доступа к диску встроенная программа дискового кэша
VCACHE загружает всю FAT в оперативную память.
Очевидно, что этого проще добиться, если каждая отдельная таблица FAT занимает
2 Мбайт, а не 16 Мбайт. И не беспокойтесь о том, что увеличение числа кластеров
и удвоение размера элементов FAT приведут к снижению эффективности VCACHE: для
FAT32 предусмотрен новый метод работы с кэшем, который, согласно заявлениям
Microsoft, повышает общую производительность.
Другие изменения в FAT32
Чтобы обеспечить возможность работы с возросшим числом кластеров, в записи каталога
для каждого файла должно выделяться 4 байт для начального кластера а (вместо
2 байт в системе FAT 16). Традиционно каждая запись в каталоге состоит из 32
байт (см. рис. 4.1). В середине этой записи не используются 10 байт (байты с
12-го по 21-й), которые Microsoft зарезервировала для своих собственных нужд
в будущем. Два из них теперь отводятся как дополнительные байты, необходимые
для указания начального кластера в системе FAT32.
Операционная система всегда предусматривала наличие на диске двух экземпляров
FAT, но использовался только один из них. С переходом к FAT32 операционная система
может работать с любой из этих копий. Еще одно изменение состоит в том, что
корневой каталог, раньше имевший фиксированный размер и строго определенное
место на диске, теперь можно свободно наращивать по мере необходимости, подобно
подкаталогу. Теперь не существует ограничений на число записей в корневом каталоге.
Это особенно важно, поскольку под каждое длинное имя файла используется несколько
записей каталога.
Следует помнить, что, поскольку поле для размера файла в записи каталога занимает
32 разряда, размер отдельного файла не может превышать 4 Гбайт.