top
logo

Сегодня читают

Организация файлов, организация файловой системы, логическая структура дисков.

В этой статье, мы поговорим на такие темы, как организация файлов, затронем тему организации файловой структуры, а также изучим логическую структуру дисков.

Организация файлов

В общем случае, данные,   содержащиеся в файле, имеют некоторую логическую структуру. Эта структура является базой при разработке программы, предназначенной для обработки этих данных.

Например, чтобы текст мог быть правильно выведен на экран, программа должна иметь возможность  выделить отдельные слова, строки, абзацы и т.д. Признаками, отделяющими один структурный элемент от другого, могут служить определенные кодовые последовательности или просто известные программе значения смещений этих структурных элементов, относительно начала файла. Поддержание структуры данных может быть либо целиком возложено  на приложения либо в той или иной степени может взять на себя ФС (файловую систему).

В первом случае, когда все действия, связанные со структуризацией и интерпретацией содержимого файла  целиком относятся к ведению приложения. Файл представляется ФС неструктурированной последовательностью данных. Приложение формулирует запросы к ФС на ввод/вывод, используя общие для всех приложений системные средства. Например, указывая смещение от начала файла и количество байт, которые необходимо считать или записать.

Модель файла, в соответствии с которой содержимое файла представляется неструктурированной последовательностью (потоком) байт, стала популярной вместе с ОС UNIX, а теперь она широко используется в большинстве современных ОС (MS-DOS, Windows2000/NT, NetWare).

Неструктурированная модель файла позволяет легко организовать разделение файла между несколькими приложениями: разные приложения могут по-своему структурировать и интерпретировать данные, содержащиеся в файле.

Другая модель файлов, которая применялась в ОС OS/360, DEC RSX, VMS, а в настоящее время используется достаточно редко – это  структурированный файл. В этом случае поддержание структуры файла поручается ОС. ФС видит файл как упорядоченную последовательность логических записей. Приложение может обращаться к ФС с запросами на ввод-вывод на уровне записей, например, «считать запись 25 из файла FILE.DOC». ФС должна обладать информацией о структуре файла, достаточной для того, чтобы выделить любую запись. ФС предоставляет приложению доступ к записи, а вся дальнейшая обработка данных, содержащаяся в этой записи, выполняется приложением. Замечание. Развитием этого подхода стали СУБД.

Способы физической организации файла

Физическая организация файла (ФОФ) – это способ размещения файла на диске. Основные критерии эффективности физической организации файлов:

  • Скорость доступа к данным.
  • Объем адресной информации файла.
  • Степень фрагментированнности дискового пространства.
  • Максимально возможно размер файла.

Фрагментация – это наличие большого числа несмежных участков свободной памяти очень маленького размера (фрагментов). Настолько маленького, что ни одна из вновь поступающих программ не может поместиться ни в одном из участков, хотя суммарный объем фрагментов может составить значительную величину, намного превышающую требуемый объем памяти.

Существует несколько способов физической организации файла. Непрерывное размещение – это простейший вариант ФОФ, при котором файлу предоставляется последовательность кластеров диска, образующих непрерывный участок дисковой памяти:

Организация файлаДостоинства способа: высокая скорость доступа, так как затраты на поиск и считывание кластеров файла минимальны, отсутствие фрагментации на уровне файла, минимален объем адресной информации – достаточно хранить только номер первого кластера и объем файла. Недостатки невозможно сказать, какого размера должна быть непрерывная область, выделяемая файлу, так как файл при каждой модификации может увеличить свой размер, фрагментация на уровне кластеров, из-за которой нельзя выбрать место для размещения файла целиком. Из-за этих недостатков на практике используются другие методы, при которых файл размещается в нескольких, в общем случае несмежных областях диска.

Размещение файла в виде связанного списка кластеров дисковой памяти.

При таком способе в начале каждого кластера содержится указатель на следующий кластер:

Физическая организация файла по кластерамДостоинства: Адресная информация минимальна расположение файла может быть задано одним числом – номером первого кластера, фрагментация на уровне кластеров отсутствует, так как каждый кластер может быть присоединен к цепочке кластеров какого-либо файла, файл может изменять свой размер, наращивая число кластеров.

Недостатки: Сложность организации доступа к произвольно заданному месту файла – чтобы прочитать пятый по порядку кластер файла, необходимо последовательно прочитать четыре первых кластера, прослеживая цепочку номеров кластеров, количество данных файла в одном кластере не равно степени двойки (одно слово израсходовано на номер следующего кластера), а многие программы читают данные кластерами, размер которых равен степени двойки, Фрагментация на уровне файлов (файл может разбиваться на несмежные фрагменты).

При отсутствии фрагментации на уровне кластеров на диске все равно имеется определенное количество областей памяти небольшого размера, которые невозможно использовать, то есть фрагментация все же существует. Эти фрагменты представляют собой неиспользуемые части последних кластеров, назначенных файлам, так как объем файла в общем случае не кратен размеру кластера. На каждом файле в среднем теряется половина кластера. Эти потери особенно велики, когда на диске имеется большое количество маленьких файлов, а кластер имеет большой размер.

Использование связанного списка индексов (например, в FAT)

Данный способ является модификацией предыдущего метода. Файлу также выделяется память в виде связанного списка кластеров. Номер первого кластера запоминается в записи каталога, где хранятся характеристики этого файла. Остальная адресная информация отделена от кластеров файла. С каждым кластером диска связан индекс. Индексы располагаются в отдельной области диска – в файловых системах  FAT это таблица (File Allocation Table):

Организация файлов в ФАТ Когда память свободна, все индексы имеют нулевое значение. Если некоторый кластер N назначен некоторому файлу, то индекс этого кластера становится равным либо номеру M следующего кластера данного файла, либо принимает специальное значение – признак того, что этот кластер является для файла последним. Индекс же предыдущего кластера файла принимает значение N, указывая на вновь назначенный кластер.

Достоинства: минимальность адресной информации, отсутствие фрагментации на уровне кластеров, отсутствие проблем при изменении размера файла, для доступа к произвольному кластеру файла не требуется последовательно считывать его кластеры, достаточно прочитать только секторы диска, содержащие таблицу индексов, отсчитать нужное количество кластеров файла по цепочке и определить номер нужного кластера, данные файла заполняют кластер целиком, следовательно имеют объем, равный степени двойки. Недостатки: Фрагментация на уровне файлов (файл может разбиваться на несмежные фрагменты).

Перечисление номеров кластеров, занимаемых этим файлом.

Достоинства: высокая скорость доступа к произвольному кластеру файла, так как здесь применяется прямая адресация, которая исключает просмотр цепочки указателей при поиске адреса произвольного кластера файла, отсутствие фрагментации на уровне кластеров. Недостатки: длина адреса зависит от размера файла и для большого файла может составить значительную величину. Данный подход с некоторыми модификациями используется в ОС UNIX.

Организация файловой системы

Файл, имеющий образ цельного, непрерывающегося набора байт, на самом деле разбросан «кусочками» по всему диску, причем это разбиение никак не связано с логической структурой файла: логически объединенные файлы из одного каталога совсем не обязательно должны соседствовать на диске.

Принципы размещения файлов, каталогов и системной информации на реальном устройстве (диске) называются физической организацией файловой системы.

Замечание. Различные файловые системы имеют разную физическую организацию (например, размер кластера). Основным типом устройства, которое используется для хранения файлов, являются дисковые накопители. Эти устройства предназначены для считывания и записи данных на жесткие и гибкие магнитные диски, оптические диски, flash-носители и др.

Физическая и логическая структура диска

Жесткий диск состоит из одной или нескольких стеклянных или металлических пластин, каждая из которых покрыта с одной или двух сторон магнитным материалом. Для записи информации на магнитную поверхность дисков применяется следующий способ: поверхность рассматривается как последовательность точечных позиций, каждая из которых считается битом и может быть установлена в 0 или 1. Так как расположения точечных позиций определяется неточно, то для записи требуются заранее нанесенные метки, которые помогают записывающему устройству находить позиции записи. Процесс нанесения таких меток называется физическим форматированием и является обязательным перед первым использованием накопителя.

Физическое форматирование – это процесс записи на поверхность диска служебной информации, обозначающей сектора на диске (пометка начала и конца дорожки и сектора).

На каждой стороне каждой пластины размечены тонкие концентрические окружности (по ним располагаются синхронизирующиеся метки). Каждая концентрическая окружность называется дорожкой.

Количество дорожек зависит от типа диска. Нумерация дорожек начинается с 0 от внешнего края к центру диска. Когда диск вращается, головка чтения/записи считывает двоичные данные с магнитной дорожки или записывает их на нее.  Нумерация сторон начинается с 0.

Группы дорожек (треков) одного радиуса, расположенных на поверхностях магнитных дисков, называются цилиндрами. Номер цилиндра совпадает с номером образующей дорожки. Жесткие диски могут иметь по несколько десятков тысяч цилиндров, на поверхности дискеты, как правило, их восемьдесят. Зная количество рабочих поверхностей, дорожек на одной стороне, размер сектора, можно определить емкость диска.

Для дискет 3.5”: 2 рабочие поверхности, 80 дорожек на каждой стороне, 18 секторов на каждой дорожке, 512 байт – каждый сектор. Тогда, емкость дискеты=21801181512=1 474 560 байтов = 1.44 Мбайт.

Каждая дорожка разбивается на секторы. Сектор – наименьшая адресуемая единица обмена данными дискового устройства с оперативной памятью. Нумерация секторов начинается с 1. Каждый сектор состоит из поля данных и поля служебной информации, ограничивающей и идентифицирующей его.

Для того чтобы контроллер диска мог найти на диске нужный сектор, необходимо задать ему все составляющие адреса сектора: номер цилиндра, номер поверхности, номер сектора ([c-h-s]).

ОС при работе с диском использует, как правило, собственную единицу дискового пространства, называемую кластером.

Кластер (ячейка размещения данных) – объем дискового пространства, участвующий в единичной операции чтения/записи, осуществляемой ОС.

Кластер – это минимальный размер места на диске, которое может быть выделено файловой системой для хранения одного файла.

Пример. Если файл имеет размер 2560 байт, а размер кластера в файловой системе определен в 1024 байта, то файлу будет выделено на диске 3 кластера.

Размер кластера зависит от формата диска и может соответствовать одному сектору или нескольким смежным секторам дорожки.

Размер кластера определяется, как правило, автоматически при логическом форматировании.

Узнать размер кластера можно следующими способами:

  1. В ОС Windows: Панель управления → Администрирование → Управление компьютером → Дефрагментация диска → Выделить логический диск → Анализ.
  2. Выбор размера кластера: Format c:/a:size.
  3. Создать файл небольшого размера, например документ блокнота и вывести свойства файла. Размер фала на диске будет соответствовать размеру кластера.

Этапы подготовки диска к записи

Процесс подготовки диска к записи данных разбивается на следующие этапы:

  1. Форматирование низкого уровня (физическое форматирование).
  2. Логическое разбиение (только для HDD).
  3. Логическое форматирование (высокоуровневое).

В результате выполнения процедуры физического форматирования в секторах создаются адресные метки, использующиеся для их идентификации в  процессе использования диска (создаются дорожки и секторы).
Низкоуровневый формат диска не зависит от типа ОС, которая этот диск будет использовать.
В результате выполнения процедуры логического разбиения HDD делится на логические разделы (тома) перед форматированием диска под определенную файловую систему.

Раздел – это непрерывная часть физического диска, которую ОС представляет пользователю как логическое устройство (логический диск). Необходимость в разбиении на разделы возникает в следующих случаях:

  • если существует ограничение на размер диска со стороны операционной системы.
  • если необходимо разграничить дисковое пространство между пользователями.
  • для удобства работы с разными видами информации: системный диск, архивный диск, документы и т.д.
  • если есть необходимость в нескольких операционных системах или/и файловых системах.
Организация файловой системы

ОС может поддерживать разные статусы разделов, особым образом отмечая разделы, которые могут быть использованы для загрузки модулей ОС, и разделы, в которых можно устанавливать только приложения и хранить файлы данных. Один из разделов диска помечается как загружаемый (основной, первичный, Primary). Именно из этого раздела считывается загрузчик ОС. А другой – как дополнительный (расширенный, Extenshion).

Разметку диска под конкретный тип файловой системы выполняют процедуры высокоуровневого, или логического, форматирования. При высокоуровневом форматировании определяется размер кластера и на диск записывается информация, необходимая для работы файловой системы, в том числе информация о доступном и неиспользуемом пространстве, о границах областей, отведенных под файлы и каталоги, информация о поврежденных областях. Кроме того, на диск записывается загрузчик ОС.

Логическое форматирование – процесс преобразования уже размеченного дискового пространства в соответствии со стандартами конкретной ОС. Единый стандарт разметки границ дискового раздела и разграничения разделов содержится в таблице разделов диска, которая находится в 1-ом секторе диска (цилиндр 0, дорожка 0, сектор 1). Таблица разделов содержит параметры диска, число разделов, размер и расположение каждого раздела и др.

Структура логического диска

Для организации логического диска каждая ОС разделяет его на две части:

  • системная область.
  • область данных (Data).
Системная область и область данных

Системная область предназначена для хранения служебной информации и управляет использованием области данных: применяется для регистрации состояния каждого участка диска. Эта область создается при форматировании и обновляется при операциях с файлами.

В системной области находятся:

  • Загрузочная запись – начальная область логического диска, содержащая небольшую программу, инициализирующую процесс загрузки ОС. Содержит блок параметров диска (DPB – Disk Parameter Block) и системный загрузчик (SB – System Bootstrap). Загрузочная запись системного диска называется главной загрузочной записью – Master Boot Record.
  • Таблица размещения файлов («таблица» - условное обозначение).
  • Корневой каталог – встроенное оглавление информации, содержащейся в области данных. Корневой каталог на диске единственный, совпадает с именем соответствующего диска и не может быть удален программными средствами.

Область данных предназначена для регистрации данных, хранящейся на диске. Содержит файлы и каталоги, подчиненные корневому каталогу. С учетом общей структуры логического диска структуру всего дискового пространства, разбитого на несколько разделов, можно представить следующим образом:

Системная область диска (Primary, boot record)

Вся информация, необходимая для начальной загрузки компьютера, находится в самом первом секторе жёсткого диска. Эта информация называется главной записью загрузки — MBR (Master Boot Record).

Расширенная таблица разделов состоит из двух элементов: первый элемент расширенной таблицы разделов для первого логического устройства указывает на его загрузочный сектор, второй элемент — на EBR следующего логического устройства (Extended Boot Record, EBR - Расширенная загрузочная запись).

Поделись информацией с друзьями в: vkontakte facebook twitter yandex mail livejournal myspace google google-buzz blogger
Оцените предоставленную информацию:
Организация файлов, организация файловой системы, логическая структура дисков Автор/Переводчик: ()
Опубликована:2011-01-27 18:35:15 l Просмотров:20621
Рейтинг: рейтинг

В общем случае, данные, содержащиеся в файле, имеют некоторую логическую структуру. Эта структура является базой при разработке программы, предназначенной для обработки этих данных


Возможно вам будет интересно:

HDD HDD
Опубликована:2010-02-18 18:56:35 l Просмотров: 46645
Рейтинг: рейтинг

На этой страничке мы поговорим на такие темы, как : Внешние запоминающие устройства, Внешняя память компьютера, Магнитные накопители, Накопители на жестких дисках, Винчестер.

Подробнее

HDD, Flash HDD, Flash
Опубликована:2010-02-04 18:43:28 l Просмотров: 6780
Рейтинг: рейтинг

На этой страничке мы поговорим на такие темы, как: Внешние запоминающие устройства, Внешняя память компьютера, Накопители на оптических дисках, Flash память, Flash накопители.

Подробнее

Комментарии пользователей:

Эту статью, еще никто не комментировал.

Зарегистрируйтесь , и вы сможите оставлять комментарии.

Рекомендуем прочесть


Сегодня читают

Получи 1500 Gold бесплатно в World of tanks при покупке антивируса
Wargaming - и "Лаборатория Касперского" обьявили о начале совместной акции. Теперь при покупке лицензионного программного обеспечения Kaspersky Internet Security, Kaspersky CRYSTAL, а также Kaspersky ONE.
Бесплатная trial версия Diablo III - уже доступна для скачивания
Уже как три месяца мы наслаждаемся долгожданным релизом Diablo III. Счастливые обладатели лицензии, так же получили в комплекте ваучер, который дает возможность играть в Starter Edition версию.
GTA San Andreas - модифицирована движком GTA 4 (скачать мод)
Поклонники - легендарной серии игр Grand Theft Auto решили разработать глобальный мод, GTA San Andreas будет поставлена на движок от GTA 4. Ссылку для скачивания мода вы найдете в конце данной статьи.
Дата выхода Windows 8 – начало августа
На уже ставшей традицией конференции которая проходит каждый год Worldwide Partner Conference, Вице-президент и финансовый директор корпорации Microsoft раскрыли дату выхода Windows 8.
Как скачать музыку из контакта на компьютер - программа VKSaver 3.1
В этой статье мы ответим на вопрос: как скачать музыку из контакта на компьютер совершенно бесплатно, а использовать для этого мы будем бесплатную программу - VKSaver 3.1

bottom
top
За было добавлено 62 новостей, написано 55 статьи и обзоров, пользователями оставлено
0 комментария. Сегодня 03 Декабря, 2016г 22:41, ваш IP 54.163.147.69, тип, версия браузера, а также тип операционной системы
CCBot/2.0 (http://commoncrawl.org/faq/), разрешение экрана px.
© 2010 Компьютеры и Комплектующие, Компьютерные Новости. Все права защищены. Правила копирования статей материалов сайта.
Счётчик тиц и PR
Яндекс.Метрика
bottom