Файловые системы. Файловая система NTFS. Общие сведения

Июль 29, 2022

Главная
Информатика
Файловые системы. Файловая система NTFS. Общие сведения

Содержание

2. Файловая система NTFS Общие сведения
3. Краткое описание NTFS Разработана для быстрого выполнения стандартных файловых операций типа чтения, записи и поиска. Поддерживает
4. Вопрос Вспомните методы физической организации файловой системы.
5. Физическая организация NTFS NTFS использует физическую организацию близкую перечню номеров блоков (кластеров). Для увеличения эффективности кластеры
6. Тома NTFS Структура NTFS начинается с тома (volume), который соответствует логическому разделу на диске и создается,
7. Типы томов NTFS (1) Простой том (simple) Составной том (spanned) – том, использующий более одного раздела
8. Типы томов NTFS (2) Чередующийся набор томов (stripped, RAID 1) – том, состоящий из нескольких разделов,
9. Внутреннее имя тома В разделе HKEY_LOCAL_ MACHINE\SYSTEM\MountedDevices системного реестра хранится информация о базовых дисках. Внутреннее имя
10. Размер кластера тома NTFS Пользователь может определить размер кластера при форматировании тома NTFS /a: , т.е.
11. NTFS и архитектура Windows
12. Физическая структура NTFS Том NTFS условно делится на две части. Первые 12,5% тома отводятся под так
13. Механизм использования MFT-зоны Когда файлы уже нельзя записывать в обычное пространство, MFT-зона просто сокращается, освобождая таким
14. Первые 16 файлов NTFS (метафайлы) носят служебный характер. Метафайлы находятся корневом каталоге NTFS диска – они
15. Перечень метафайлов (1)
16. Перечень метафайлов (2)
17. Файлы и их атрибуты (1) Каждый файл на томе NTFS представлен записью MFT, под которое отводится
18. Файлы и их атрибуты (2) Обычно атрибуты располагаются непосредственно после заголовков, однако если длина значения слишком
19. Заголовок атрибута
20. Атрибуты файлов NTFS (1)
21. Атрибуты файлов NTFS(2)
22. Запись MFT заголовок записи MFT стандартная информация имя файла данные дескриптор безопасности* * в последних версиях
23. Резидентное хранение файлов и каталогов Файлы и каталоги с размером менее размера записи MFT могут полностью
24. Нерезидентное хранение файлов среднего размера В большинстве случаев все данные файла не помещаются в запись MFT,
25. Нерезидентное хранение файлов среднего размера На рисунке файл состоит из 3-х серий кластеров: 20 – 23,
26. Нерезидентное хранение больших файлов Если файл настолько велик (или сильно фрагментирован), что его атрибут данных не
27. Вопрос Сравните организацию хранения больших файлов в NTFS и файловых системах ОС UNIX.
28. Сжатие файлов Файловая система NTFS поддерживает прозрачное сжатие файлов следующим образом: Когда файловая система NTFS записывает
29. Пример сжатия файла (1)
30. Пример сжатия файла (2) На предыдущем слайде показан файл, в котором первые 16 блоков успешно сжаты
31. Разреженные файлы (sparse files) Если у вас есть файлы, которые содержат множество нулей, т.е. «пустые области»,
32. Создание разреженных файлов Разреженные файлы конвертируются с помощью следующей команды: fsutil sparse.
33. Многопоточные файлы При необходимости в одном файле, записанном на диске NTFS, можно хранить несколько потоков информации.
34. Пример создания многопоточного файла В интерфейсе командной строки перейдем в раздел NTFS (например, в папку, содержащую
35. Каталоги NTFS Каталог на NTFS представляет собой специфический файл, хранящий ссылки на другие файлы и каталоги,
36. Поиск в каталогах NTFS Для поиска файла с данным именем в линейном каталоге, таком, например, как
37. Бинарное дерево
38. Вопрос Нарисуйте бинарное дерево.
39. Простой и бинарный поиск
40. B+ дерево B+ дерево – структура данных, представляет собой сбалансированное дерево поиска. B+ дерево является модификацией
41. Хранение каталогов Небольшие записи каталогов находятся полностью внутри структуры MFT, для хранения используется атрибут $Index_Root (корневой
42. Пример хранения каталогов а) запись MFT для небольшого каталога (резидентное хранение) б) запись MFT для “большого”
43. Запись MFT для небольшого каталога Запись MFT для небольшого каталога содержит несколько записей, каждая из которых
44. Пример нерезидентного хранения каталогов (1) На рисунке показана запись MFT каталога, в трех узлах которой содержится
45. Пример нерезидентного хранения каталогов (2) Рассмотрим ситуацию открытия файла e.bak. Во-первых, NTFS считывает атрибут индексного корня
46. Пример нерезидентного хранения каталогов (3) На основании информации из $INDEX_ALLOCATION, файловая система преобразует VCN в логический
47. Хранение корневого каталога
49. Скачать презентацию

Слайд 2

Файловая система NTFS
Общие сведения

Слайд 3

Краткое описание NTFS
Разработана для быстрого выполнения стандартных файловых операций типа чтения,

записи и поиска.
Поддерживает улучшенные операции восстановления файловой системы на очень больших жестких дисках.
Включает возможности безопасности, требуемые для файловых серверов и высококачественных персональных компьютеров в корпоративной среде.

Слайд 4

Вопрос
Вспомните методы физической организации файловой системы.

Слайд 5

Физическая организация NTFS
NTFS использует физическую организацию близкую перечню номеров блоков (кластеров).
Для

увеличения эффективности кластеры выделяются файлам по возможности в виде совокупности последовательных кластеров (так называемых серий, экстентов, пробегов).
Каждая последовательность кластеров описывается отдельной записью – (стартовый кластер, число кластеров).
Подобный подход позволяет частично решить проблему фрагментации файлов, т.к. свободное место выделяется не отдельными кластерами, а группами смежных кластеров.

Слайд 6

Тома NTFS
Структура NTFS начинается с тома (volume), который соответствует логическому разделу

на диске и создается, когда Вы форматируете диск или часть его для NTFS.

NTFS обрабатывает каждый том независимо от других.
NTFS поддерживает тома, состоящие из нескольких разделов.

NTFS поддерживает размеры кластеров – от 512 байт до 64 Кбайт.

Слайд 7

Типы томов NTFS (1)
Простой том (simple)
Составной том (spanned) – том, использующий

более одного раздела для формирования одного протяженного. Можно использовать разделы с разных дисков для создания набора томов, большего по объему, чем любой имеющийся на компьютере физический диск.
Зеркальный том (mirrored, RAID 0) содержит копии своих данных на двух разделах. В случае зеркала запись данных производится на оба раздела, а считывание происходит только с одного. Зеркальный том устойчив к сбою одного диска, в этом случае работает оставшаяся половина.

Слайд 8

Типы томов NTFS (2)
Чередующийся набор томов (stripped, RAID 1) – том,

состоящий из нескольких разделов, по которым равномерными блоками распределены данные. Размер блока данных – 64 Кбайт.
Чередующийся набор томов с четностью (RAID 5) – это чередующийся набор с дополнительным блоком данных размером в 64 Кбайт. Дополнительный блок содержит информацию о четности, которую система может использовать при восстановлении данных, расположенных на одном из разделов чередующегося набора, в случае выхода из строя диска, где был расположен раздел.

Слайд 9

$Внутреннее имя тома В разделе HKEY_LOCAL_ MACHINE\SYSTEM\MountedDevices системного реестра хранится информация$

Внутреннее имя тома
В разделе HKEY_LOCAL_ MACHINE\SYSTEM\MountedDevices системного реестра хранится информация о

базовых дисках.
Внутреннее имя имеет форму \??\Volume{XX-XX-XX-XX}, где X – числа, образующие глобальный уникальный ID (GUID), присвоенный тому операционной системой.
Для работы с томами существует системная утилита mountvol (будет рассмотрена позже).

Слайд 10

Размер кластера тома NTFS
Пользователь может определить размер кластера при форматировании тома

NTFS /a:, т.е.
format d: /a:1024 /fs:ntfs
NTFS-сжатие не поддерживается для кластеров, размер которых больше 4 КБайт.

Слайд 11

NTFS и архитектура Windows

Слайд 12

Физическая структура NTFS
Том NTFS условно делится на две части. Первые

12,5% тома отводятся под так называемую MFT зону. Запись данных в эту область невозможна. Остальные 87,5% тома представляют собой пространство для хранения файлов.
Свободное место тома, однако, включает в себя всё физически свободное место – незаполненные фрагменты MFT-зоны туда тоже включаются.

Слайд 13

Механизм использования MFT-зоны
Когда файлы уже нельзя записывать в обычное пространство, MFT-зона

просто сокращается, освобождая таким образом место для записи файлов.
При освобождении места в обычной области MFT-зона может снова расширится. При этом не исключена ситуация, когда в этой зоне остались и обычные файлы.
Метафайл MFT может фрагментироваться, хотя это и нежелательно.

Слайд 14

Первые 16 файлов NTFS (метафайлы) носят служебный характер.
Метафайлы находятся корневом

каталоге NTFS диска – они начинаются с символа имени "$".
Для метафайлов указан реальный размер – можно узнать, например, сколько ОС тратит на каталогизацию всего диска.

MFT и ее структура

Слайд 15

Перечень метафайлов (1)

Слайд 16

Перечень метафайлов (2)

Слайд 17

Файлы и их атрибуты (1)
Каждый файл на томе NTFS представлен записью

MFT, под которое отводится определенное количество пространства (4Кбайт).
Запись MFT состоит из заголовка записи, за которым следует последовательность пар (заголовок атрибута, значение).

Слайд 18

Файлы и их атрибуты (2)
Обычно атрибуты располагаются непосредственно после заголовков, однако

если длина значения слишком велика, чтобы поместиться в запись таблицы MFT, она может быть помещена в отдельный блок диска. Такой атрибут называется нерезидентным.

Слайд 19

Заголовок атрибута

Слайд 20

Атрибуты файлов NTFS (1)

Слайд 21

Атрибуты файлов NTFS(2)

Слайд 22

Запись MFT
заголовок записи MFT
стандартная информация
имя файла
данные
дескриптор безопасности*
* в последних версиях NTFS

все дескрипторы безопасности хранятся в отдельном файле, потому что дескрипторы многих файлов одинаковы.

Слайд 23

Резидентное хранение файлов и каталогов
Файлы и каталоги с размером менее размера

записи MFT могут полностью содержаться внутри записи MFT.
Подобный подход обеспечивает очень быстрый доступ к файлам.
Вместо того, чтобы искать файл в таблице и затем считывать цепочку кластеров для поиска данных файла, NTFS обращается к диску только один раз и немедленно считывает данные.

Слайд 24

Нерезидентное хранение файлов среднего размера
В большинстве случаев все данные файла не

помещаются в запись MFT, поэтому этот атрибут, как правило, является нерезидентным.
Файл без фрагментации описывается всего одной записью (стартовый кластер, число кластеров).

Слайд 25

Нерезидентное хранение файлов среднего размера
На рисунке файл состоит из 3-х серий

кластеров: 20 – 23, 64 – 65, 80 – 82. Число таких серий зависит от того насколько удачно ФС сумела найти место для хранения файла.

Слайд 26

Нерезидентное хранение больших файлов
Если файл настолько велик (или сильно фрагментирован), что

его атрибут данных не помещается в одной записи MFT, то этот атрибут становится нерезидентным, то есть он находится в другой записи таблицы MFT, ссылка на которую помещена в исходной записи о файле.

Слайд 27

Вопрос
Сравните организацию хранения больших файлов в NTFS и файловых системах ОС

UNIX.

Слайд 28

Сжатие файлов
Файловая система NTFS поддерживает прозрачное сжатие файлов следующим образом:
Когда файловая

система NTFS записывает на диск файл, помеченный для сжатия, она изучает первые 16 кластеров. Затем к этим кластерам применяется алгоритм сжатия.
Если полученные на выходе данные могут поместиться в 15 или менее кластеров, то сжатые данные записываются на диск, предпочтительно в виде одной серии.
Если получить выигрыш не получается, то группа из16 кластеров записывается без сжатия.
Затем алгоритм повторяется для группы следующих 16 кластеров и т.д.
Сжатие файла частями по 16 кластеров явилось компромиссом, если бы порции были меньше, то эффективность бы сжатия снизилась. Если размер порции был бы больше, то это замедлило бы произвольный доступ.

Слайд 29

Пример сжатия файла (1)

Слайд 30

Пример сжатия файла (2)
На предыдущем слайде показан файл, в котором первые

16 блоков успешно сжаты в 8 блоков, следующие 16 не могут быть сжаты, наконец, последние 16 блоков также успешно сжаты на 50%.
Эти три части файла записаны в виде трех сегментов, информация о которых хранится в записи MFT. «Пропущенные» блоки обозначаются в записи MFT как сегменты с нулевым дисковым адресом. На слайде за заголовком (0,48) следует 5 пар, две для первого (сжатого) сегмента, одна для несжатого и две для последнего (сжатого) сегмента.
При чтении этого файла система NTFS должна знать, какие из сегментов файла сжаты, а какие нет. Она видит это по дисковым адресам. Дисковый адрес 0 указывает на то, что предыдущий сегмент сжат. Дисковый блок 0 не может использоваться для хранения данных во избежание неоднозначности (это загрузочный сектор).
Произвольный доступ к сжатому файлу возможен, например, для чтения блока 35 необходимо определить где находится этот блок и распаковать весь сегмент.

Слайд 31

Разреженные файлы (sparse files)
Если у вас есть файлы, которые содержат множество

нулей, т.е. «пустые области», то NTFS позволяет сохранять пространство диска, предоставляя возможность использовать sparse (разреженные) файлы.
В случае разреженных файлов система просто не выделяет место для «пустых областей» – в результате чего и достигается уменьшение размера файла. При обращении системы к частям, отмеченным как пустые, NTFS возвращает нулевые значения. При просмотре свойств файла система сообщит о зарезервированном для него размере, хотя фактический объем может быть меньше.
Разреженные файлы применяются, в частности, в журнале NTFS ($LogFile).

Слайд 32

Создание разреженных файлов
Разреженные файлы конвертируются с помощью следующей команды: fsutil sparse.

Слайд 33

Многопоточные файлы
При необходимости в одном файле, записанном на диске NTFS, можно

хранить несколько потоков информации. Это позволяет, в частности, снабжать файлы документов дополнительной информацией, хранить в одном файле несколько версий документов (например, на разных языках), хранить в отдельных потоках одного файла программный код и данные и т.п.
При создании файла основные данные следует записать в неименованный поток. Затем необходимо создать внутри того же файла именованный поток, предназначенный для данных образа. Теперь один файл будет содержать два потока.

Слайд 34

Пример создания многопоточного файла
В интерфейсе командной строки перейдем в раздел NTFS

(например, в папку, содержащую системные шрифты) и введем следующую команду (не делайте лишних пробелов!):
С:\WINDOWS\Fonts>dir > New_Stream.TXT:New_Stream
В результате выполнения этой команды система создаст файл New_Stream.TXT. Он будет содержать два потока: неименованный, в котором находится 0 байт, и именованный (с именем New_Stream), где будет находиться результат выполнения команды dir. Доступ к именованному потоку можно получить, обратившись к нему по имени через двоеточие после имени файла.
Для вывода содержимого именованного потока воспользуемся:
C:\WINDOWS\Fonts>more < New_Stream.TXT:New_Stream

Слайд 35

Каталоги NTFS
Каталог на NTFS представляет собой специфический файл, хранящий ссылки на

другие файлы и каталоги, создавая иерархическое строение данных на диске. Файл каталога поделен на блоки, каждый из которых содержит имя файла, базовые атрибуты и ссылку на элемент MFT, который уже предоставляет полную информацию об элементе каталога.
Внутренняя структура каталога представляет собой бинарное B+ дерево (форма двоичного дерева, каждый узел которого может иметь более двух дочерних узлов), элементы которого сортируются по имени.

Слайд 36

Поиск в каталогах NTFS
Для поиска файла с данным именем в линейном

каталоге, таком, например, как у FAT-а, системе приходится просматривать все элементы каталога, пока она не найдет нужный. Бинарное же дерево располагает имена файлов таким образом, чтобы поиск файла осуществлялся более быстрым способом – с помощью получения двухзначных ответов на вопросы о положении файла.
Вывод – для поиска одного файла среди 1000, например, FAT придется осуществить в среднем 500 сравнений (наиболее вероятно, что файл будет найден на середине поиска), а системе на основе дерева – всего около Log2(N), т.е. 10-ти (210 = 1024).

Слайд 37

Бинарное дерево

Слайд 38

Вопрос
Нарисуйте бинарное дерево.

Слайд 39

Простой и бинарный поиск

Слайд 40

B+ дерево
B+ дерево – структура данных, представляет собой сбалансированное дерево поиска.
B+

дерево является модификацией бинарного дерева, истинные значения ключей которого содержатся только в листьях, а во внутренних узлах – ключи-разделители, содержащие диапазон изменения ключей для поддеревьев.

Слайд 41

Хранение каталогов
Небольшие записи каталогов находятся полностью внутри структуры MFT, для хранения

используется атрибут $Index_Root (корневой индекс), который всегда резидентный.
В том случае, когда каталог не умещается целиком в MFT, требуется выделение дополнительного пространства:
корневой индекс хранит корень дерева B+ со ссылками на нерезидентные индексные буферы;
для хранения описания файлов выделяются нерезидентные индексные буферы (4 Кбайт), каждый из которых адресуется с использованием виртуального номера кластера (virtual clusters numbers, VCN) для сквозной нумерации кластеров в рамках одной записи MFT;
соответствие между VCN и LCN (logical clusters numbers) хранится в атрибуте каталога $Index_Allocation.

Слайд 42

Пример хранения каталогов
а) запись MFT для небольшого каталога (резидентное хранение)
б) запись

MFT для “большого” каталога (нерезидентное хранение)

Слайд 43

Запись MFT для небольшого каталога
Запись MFT для небольшого каталога содержит несколько

записей, каждая из которых описывает файл или каталог.
Фиксированная запись содержит индекс записи MFT файла, длину имени файла, а также другие разнообразные поля и флаги.
Поиск файла в каталоге по имени состоит в последовательном переборе всех имен файлов.

Слайд 44

Пример нерезидентного хранения каталогов (1)
На рисунке показана запись MFT каталога, в

трех узлах которой содержится девять элементов.
Корень B+ дерева находится в атрибуте $INDEX_ROOT.

В записи MFT каталога девять элементов не помещается, поэтому для их хранения NTFS выделяет два буфера размещения индексов (index allocation). Обычно, корень индекса и буферы размещения индексов могут хранить элементы для более чем трех файлов, в зависимости от длины имен. VCN представляет собой порядковый номер кластера в файле или каталоге.
Красные стрелки указывают, что элементы NTFS хранятся в алфавитном порядке.

Слайд 45

Пример нерезидентного хранения каталогов (2)
Рассмотрим ситуацию открытия файла e.bak.
Во-первых, NTFS считывает

атрибут индексного корня $INDEX_ROOT и сравнивает строку e.bak с именем первого элемента d.new.
Т.к. алфавитный номер e.bak больше, чем d.new, то NTFS переходит к следующему элементу – h.txt.
Повторив операцию сравнения, NTFS выясняет, что алфавитный номер e.bak меньше, чем h.txt.

Затем NTFS отыскивает в $INDEX_ROOT номер виртуального кластера VCN индексного буфера, содержащего элементы каталога, алфавитные номера которых меньше, чем h.txt, но больше, чем d.new.

Слайд 46

Пример нерезидентного хранения каталогов (3)
На основании информации из $INDEX_ALLOCATION, файловая система

преобразует VCN в логический номер кластера LCN, т. е. номер кластера относительно начала тома.
Далее NTFS читает буфер размещения индексов и просматривает его в поисках совпадений.
Если элемент индексного буфера для h.txt не содержит файла e.bak, то NTFS сообщает о неудачном завершении поиска.

На рисунке первый же элемент индексного буфера совпадает с критерием поиска, и NTFS читает номер записи MFT e.bak.

Слайд 47

Файловые системы. Файловая система NTFS. Общие сведения

Содержание

Файловая система NTFSОбщие сведения

Краткое описание NTFSРазработана для быстрого выполнения стандартных файловых операций типа чтения,

ВопросВспомните методы физической организации файловой системы.

Физическая организация NTFSNTFS использует физическую организацию близкую перечню номеров блоков (кластеров).Для

Тома NTFSСтруктура NTFS начинается с тома (volume), который соответствует логическому разделу

Типы томов NTFS (1)Простой том (simple)Составной том (spanned) – том, использующий

Типы томов NTFS (2)Чередующийся набор томов (stripped, RAID 1) – том,

Внутреннее имя томаВ разделе HKEY_LOCAL_ MACHINE\SYSTEM\MountedDevices системного реестра хранится информация о

Размер кластера тома NTFSПользователь может определить размер кластера при форматировании тома

NTFS и архитектура Windows

Физическая структура NTFS Том NTFS условно делится на две части. Первые

Механизм использования MFT-зоныКогда файлы уже нельзя записывать в обычное пространство, MFT-зона

Первые 16 файлов NTFS (метафайлы) носят служебный характер. Метафайлы находятся корневом

Перечень метафайлов (1)

Перечень метафайлов (2)

Файлы и их атрибуты (1)Каждый файл на томе NTFS представлен записью

Файлы и их атрибуты (2)Обычно атрибуты располагаются непосредственно после заголовков, однако

Заголовок атрибута

Атрибуты файлов NTFS (1)

Атрибуты файлов NTFS(2)

Запись MFTзаголовок записи MFTстандартная информацияимя файладанныедескриптор безопасности** в последних версиях NTFS

Резидентное хранение файлов и каталоговФайлы и каталоги с размером менее размера

Нерезидентное хранение файлов среднего размераВ большинстве случаев все данные файла не

Нерезидентное хранение файлов среднего размераНа рисунке файл состоит из 3-х серий

Нерезидентное хранение больших файловЕсли файл настолько велик (или сильно фрагментирован), что

ВопросСравните организацию хранения больших файлов в NTFS и файловых системах ОС

Сжатие файловФайловая система NTFS поддерживает прозрачное сжатие файлов следующим образом:Когда файловая

Пример сжатия файла (1)

Пример сжатия файла (2)На предыдущем слайде показан файл, в котором первые

Разреженные файлы (sparse files)Если у вас есть файлы, которые содержат множество

Создание разреженных файловРазреженные файлы конвертируются с помощью следующей команды: fsutil sparse.

Многопоточные файлыПри необходимости в одном файле, записанном на диске NTFS, можно

Пример создания многопоточного файлаВ интерфейсе командной строки перейдем в раздел NTFS

Каталоги NTFSКаталог на NTFS представляет собой специфический файл, хранящий ссылки на

Поиск в каталогах NTFSДля поиска файла с данным именем в линейном