Электронная библиотека книг Александра Фролова и Григория Фролова.
Shop2You.ru Создайте свой интернет-магазин
Библиотека
Братьев
Фроловых

MS-DOS для программиста

© Александр Фролов, Григорий Фролов
Том 19, М.: Диалог-МИФИ, 1995, 253 стр.

[Назад] [Содеожание] [Дальше]

2.3. Таблица размещения файлов

Сразу вслед за загрузочным сектором на логическом диске находятся секторы, содержащие таблицу размещения файлов FAT (File Allocation Table). Для того, чтобы назначение этой таблицы стало более понятным, вспомним, как организовано хранение информации на различных носителях данных.

Последовательный и прямой доступ

Начнем с магнитных лент. При использовании магнитных лент информация записывается в виде файлов с последовательным доступом. Последовательный доступ означает, что для чтения какого-либо файла требуется вначале прочитать (или просмотреть) все предыдущие файлы. При записи информация может добавляться в конец ленты, после той информации, которая была записана в последний раз.

Для такого устройства, как магнитный диск, возможна запись информации либо последовательным, либо прямым методом доступа. Использование прямого метода доступа позволяет программе позиционировать головки сразу на тот файл, который вам нужен (или на нужную запись файла). Например, при чтении записи вы можете задать номер сектора на определенной дорожке и номер головки , где она расположена, либо смещение записи относительно начала файла в байтах.

Как правило, прямой метод доступа более эффективен, однако важное значение имеет также способ распределения места на диске для файлов.

Кластеры

Операционная система ОС ЕС для ЭВМ ряда ЕС позволяла задать начальное количество цилиндров диска для размещения набора данных и размер области диска, которая может быть использована для этого набора дополнительно. Если при записи в файл все распределенное для файла место на диске окажется исчерпанным, программа завершится аварийно, даже если на диске еще есть свободные цилиндры.

Операционная система MS-DOS использует дисковое пространство другим способом.

При создании файла для него не задается начальное распределение памяти в дорожках или секторах. По мере того как файл увеличивается в размерах, операционная система распределяет этому файлу секторы из числа свободных, не используемых другими файлами. При этом файл не обязательно располагается в смежных областях диска, он может быть разбросан по разным дорожкам и секторам.

Очевидно, что в этом случае операционная система должна вести учет используемых секторов диска. Для каждого файла она должна хранить где-то информацию о распределении файлам секторов диска. В операционной системе MS-DOS для хранения этой информации используется таблица размещения файлов.

Весь диск разбивается операционной системой на участки одинакового размера, называемые кластерами. Кластер может содержать несколько секторов. Для каждого кластера в таблице FAT есть своя индивидуальная ячейка, в которой хранится информация об использовании данного кластера. Другими словами, таблица размещения файлов - это массив, содержащий информацию о кластерах. Размер этого массива определяется общим количеством кластеров на логическом диске.

Содержимое таблицы FAT

Что же хранится в таблице размещения файлов?

Если ответить на этот вопрос коротко, то в FAT находятся списки кластеров, распределенных файлам. Все свободные кластеры отмечены нулями.

Таким образом, если файл занимает несколько кластеров, то эти кластеры связаны в список. При этом элементы таблицы FAT содержат номера следующих используемых данным файлом кластеров. Конец списка отмечен в таблице специальным значением. Номер первого кластера, распределенного файлу, хранится в элементе каталога, описывающего данный файл.

Программа format.com , предназначенная для форматирования диска и некоторые специальные программы аналогичного назначения проверяют диск на предмет наличия дефектных областей. Кластеры , которые находятся в этих дефектных областях, отмечаются в FAT как плохие и не используются операционной системой.

Итак, FAT - массив информации об использовании кластеров диска, содержит списки кластеров, распределенных файлам. Номера начальных кластеров файлов хранятся в каталогах, о которых мы будем говорить в разделе "Файлы и каталоги".

img00005.gif (5905 bytes)

Рис. 2.2. Пример распределения кластеров для файлов autoexec.bat и config.sys

На рис. 2.2 показаны фрагменты корневого каталога диска С: и элементы FAT для файлов autoexec.bat и config.sys .

Из рисунка видно, что для файла autoexec.bat отведено три кластера, а для файла config.sys - два кластера. Реально эти файлы не используют столько кластеров, так как их размер обычно невелик.

В каталоге кроме всего прочего указаны номера первых кластеров, распределенных этим файлам (соответственно 11 и 12). В своей одиннадцатой ячейке таблица FAT содержит число 17 - номер второго кластера, распределенного файлу autoexec.bat. Ячейка с номером 17 содержит число 18. Это номер третьего кластера, принадлежащего файлу autoexec.bat. Последняя ячейка, которая соответствует последнему кластеру, распределенному этому файлу, содержит специальное значение - FFFF.

Таким образом, файл autoexec.bat занимает три несмежных кластера с номерами 11, 17 и 18. Что же касается файла config.sys , то в нашем примере для него отведено два смежных кластера с номерами 12 и 13.

Два формата таблицы FAT

Таблица FAT может иметь 12- или 16-битовый формат. При этом в таблице для хранения информации об одном кластере диска используется, соответственно, 12 и 16 бит.

12-битовый формат удобен для дискет с небольшим количеством секторов - вся таблица размещения файлов помещается в одном секторе.

Если размер диска такой, что для представления всех секторов недостаточно двенадцати разрядов, можно увеличить размер кластера, например до восьми секторов.

Однако большой размер кластера приводит к неэффективному использованию дискового пространства. Это происходит из-за того что минимальный фрагмент дисковой памяти, выделяемый файлу, имеет слишком большой размер. Даже для файла размером 1 байт выделяется целый кластер. Значит, если размер кластера составляет 8 секторов, то для хранения одного байта будет использовано 4 Кбайт дисковой памяти (размер кластера составляет 512 байт).

При использовании 16-битового формата таблицы FAT операционная система MS-DOS может работать с диском, который имеет размер более 32 Мбайт.

Определение формата таблицы FAT

Сектор загрузочной записи диска, отформатированного в MS-DOS версий 4.0 - 6.22 в поле со смещением 36h содержит строку длиной 8 байт, идентифицирующую формат FAT . Она имеет вид "FAT12 " или "FAT16 ". Вы можете использовать это поле для определения формата FAT. В структуре BOOT, описанной нами ранее в разделе "Программа BOOTVIEW", это поле называется fat_format.

Если разделы на жестком диске создавались программой fdisk.exe , формат FAT можно определить, анализируя содержимое поля sys главной загрузочной записи (Master Boot Record ). Если это поле содержит значение 1, используется 12-битовый формат, если 4, то 16-битовый.

Идентификация кластеров

Первый байт таблицы FAT называется "Описатель среды" (Media Descriptor). Он имеет такое же значение, как и байт-описатель среды, находящийся в загрузочном секторе логического диска.

Следующие 5 байт для 12-битового формата или 7 байт для 16-битового формат всегда содержат значение 0FFh.

Остальная часть таблицы FAT состоит из 12- или 16-битовых ячеек. Каждая ячейка соответствует одному кластеру диска. Эти ячейки могут содержать следующие значения:

FAT12 FAT16 Что означает
000h 0000h Свободный кластер
FF0h - FF6h FFF0h - FFF6h Зарезервированный кластер
FF7h FFF7h Плохой кластер
FF8h - FFFh FFF8h - FFFFh Последний кластер в списке
002h - FEFh 0002h - FFEFh Номер следующего кластера в списке

Чтение таблицы FAT

Непосредственный доступ к FAT может потребоваться вам для организации сканирования каталогов при поиске файлов, для чтения каталогов как файлов, для организации защиты информации от несанкционированного копирования. Общая схема использования FAT такая:

  • Читаем таблицу FAT в память

Обычно FAT располагается сразу после загрузочного сектора (логический сектор с номером 1). Для точного определения начального сектора FAT следует прочитать в память загрузочный сектор и проанализировать содержимое блока параметров BIOS. В поле ressecs записано количество зарезервированных секторов, которые располагаются перед FAT. Поле fatsize содержит размер FAT в секторах. Кроме того, следует учитывать, что на диске может находиться несколько копий FAT. Операционная система использует только первую копию, но обновляет вторую. Другие копии FAT нужны для утилит восстановления содержимого диска, таких как scandisk.exe . Количество копий FAT находится в поле fatcnt загрузочного сектора.

  • Получаем номер первого кластера файла, для которого необходимо определить его расположение на диске
  • Используем номер первого кластера как индекс в таблице FAT для извлечения номера следующего кластера
  • Повторяем предыдущую процедуру до тех пор, пока извлеченное из FAT значение не будет соответствовать концу файла

Процедура извлечения номера кластера из FAT зависит от формата таблицы размещения файлов .

16-битовую таблицу FAT можно представить как массив 16-битовых чисел. Для определения номера следующего кластера вам надо просто извлечь 16-битовое значение из FAT, использовав в качестве индекса номер предыдущего кластера.

Для 12-битовой таблицы FAT процедура значительно сложнее. Необходимо выполнить следующие действия:

  • умножить номер начального кластера на 3;
  • разделить результат на 2 (так как каждый элемент таблицы имеет длину 1,5 байта);
  • прочитать 16-битовое слово из FAT , используя в качестве смещения значение, полученное после деления на 2;
  • если номер начального кластера четный, на выбранное из FAT слово надо наложить маску 0FFFh, оставив младшие 12 бит, если же номер начального кластера нечетный, выбранное из FAT значение необходимо сдвинуть вправо на 4 бита, оставив старшие 12 бит;
  • полученный результат - это номер следующего кластера в цепочке, при этом значение 0FFFh (или другое в диапазоне от 0FF8h до 0FFFh) соответствует концу цепочки кластеров.

Используя описанные выше процедуры просмотра FAT , вы сможете для каждого файла определить цепочку занимаемых им кластеров. Для чтения файла при помощи прерывания INT 25h вам будет нужно установить соответствие между номерами кластеров и номерами секторов, в которых располагаются эти кластеры. Для того чтобы это сделать, необходимо определить расположение и размер корневого каталога. Поэтому следующий раздел книги будет посвящен каталогам и файлам. Там же будут приведены примеры программ для работы с FAT.

[Назад] [Содеожание] [Дальше]