В чем отличия между десктопными и RAID-версиями жестких дисков?
Вопрос хочется продолжить: и почему второе дороже первого при одинаковых емкостных и скоростных характеристиках?
Давайте представим себе одиноко шуршащий жесткий диск. Как и все другие современные жесткие диски, он наделен определенной степенью интеллекта и имеет встроенную функцию автоматической коррекции ошибок. Создатели этой функции исходили из предпосылки, что жесткий диск при обнаружении ошибки чтения должен самостоятельно решать проблему, а не сообщать о ней другим устройствам в системе, загружая их ненужной дополнительной работой.
Причины ошибки чтения могут быть разными. Ошибка может быть обусловлена плохой читаемостью сектора (нестабильный сектор), сбоем при записи данных в сектор или другими какими-либо причинами. Сектор может быть просто частично размагничен – и тогда жесткий диск зафиксирует низкий уровень сигнала и, как следствие, ошибку.
Обнаружив ошибку, жесткий диск попробует исправить её. Для этого в тот же сектор данные будут записаны заново с последующим контрольным чтением. Если уровень сигнала по прежнему будет низким, данные будут перемещены в какой-нибудь незанятый сектор диска, а сектор, в котором обнаружена ошибка, будет помечен как дефектный и исключен из дальнейшего использования. Если данные в секторе не прочитаются, будет произведена попытка их восстановления по имеющимся кодам исправления ошибок (ECC, Error Correction Code).
Этот алгоритм отлично работает, если диск является самостоятельным устройством, а не частью RAID-массива. В RAID-массиве работой жестких дисков управляет RAID-контроллер.
В случае возникновения ошибки чтения-записи жесткий диск начинает заниматься их устранением в соответствии с алгоритмом, описанном выше. При этом диск не отправляет никаких соответствующих информационных сообщений и не отвечает на запросы системы. Диск «не знает» того, что в системе есть RAID контроллер, который может помочь ему восстановить работоспособность после обнаружения ошибки. В свою очередь, контроллер не понимает, почему жесткий диск стал аутистом и не реагирует на внешние команды. В результате этого грустного факта взаимного непонимания, как только устранение ошибки превышает по продолжительности 7-15 секунд (на разных контроллерах), RAID контроллер, не получая в течение этого периода времени ответа от диска, автоматически исключает его из массива. При этом массив, в зависимости от его типа, либо распадается, либо работает, до замены диска, в режиме ограниченной функциональности. Причем, если в период до восстановления массива после замены диска такие же неприятности произойдут еще с одним жестким диском, все сохраненные в массиве данные будут потеряны.
Подобная проблема выпадения дисков из RAID_массива коснулась жестких дисков всех производителей и наиболее часто возникала при выполнении компьютерами задач, связанных с большим количеством операций ввода-вывода (web-серверы, системы видеонаблюдения и тому подобное).
TLER (Time Limited Error Recovery) – Ограниченное время на коррекцию ошибки – так называется технология, решающая проблемы, описанные в этой статье. Диски с поддержкой данной технологии при обнаружении ошибки начинают стандартную процедуру ее коррекции, но, не уложившись в 7 секунд, отправляют RAID — контроллеру соответствующее сообщение и откладывают исправление ошибки до более удобного момента, например, до момента простоя системы. Как результат, у контроллера не возникает повода исключить диск из массива. Напротив, контроллер, получив уведомление о том, что у жесткого диска имеются отложенные проблемы с чтением-записью, передает данные с учетом этого обстоятельства до тех пор, пока не получит от жесткого диска уведомление об исправлении ошибки. Для сохранения информации об ошибках чтения-записи на жестких дисках и исправлении этих ошибок контроллер ведет специальный журнал регистрации
Таким образом, TLER снижает вероятность отказа RAID массива, ограничивая время, которое диск тратит на восстановление работоспособности в случае обнаружения ошибки чтения-записи.
Целесообразность и преимущества применения серверных накопителей, построение RAID-массивов, стоит ли экономить и когда?
На рынке доступно большое количество накопителей различных скоростей, различных производителей. Далеко не все четко понимают, какой диск лучше приобрести и для какой задачи и зачем порой лучше заплатить больше, а когда можно сэкономить. В этой статье я постараюсь прояснить основные моменты и сделать проблему выбора более простой. Статья будет полезна не только тем, кто хочет купить/арендовать выделенный сервер, но и тем, кто хочет получить надежное хранилище информации дома. После прочтения материала станет понятным, почему не всегда целесообразно арендовать desktop-решения в low-cost дата-центрах и лучше остановить выбор на более надежном, серверном железе.
Начнем с того, что все имеющиеся на рынке накопители, можно четко разделить на классы:
— диски для обычных desktop-ов (применяются в домашних ПК, в ноутбуках и в desktop-серверах low-cost дата-центров);
— серверные диски со скоростью 7200 оборотов в минуту (RPM);
— Enterprise-диски со скорость 10 000 и 15 000 RPM;
— твердотельные накопители.
Особенности выбора твердотельных накопителей мы, пожалуй, рассмотрим в отдельной статье, а сейчас остановимся преимущественно на жестких дисках и рассмотрим какой диск где и когда целесообразно применять.
Начнем с обычных дисков для PC. Это отличные диски с довольно большой емкостью и хорошей производительностью, но их главный недостаток в том, что они не рассчитаны на работу в RAID-массиве в силу своих конструктивных особенностей. В этих дисках вибрации, вызываемые вращением шпинделя, практически никак не компенсируются. Конечно эти вибрации минимальны и в случае применения 1-2 дисков в домашних условиях они не являются проблемой. Однако, если рассматривать серверный случай, когда дисков много, влияние вибраций может быть довольно существенным, так как возникают взаимные вибрации, резонанс усиливает эффект. Так, когда в корпусе установлено сразу 12 дисков, да еще и работают довольно мощные серверные вентиляторы по 5000-9000 оборотов в минуту — уровень вибрации нарастает довольно значительно, а с ними и % ошибок, потерь, что и оказывает негативное влияние на производительность. Производительность дисков десктопного типа падает в этих случаях в разы, так как они испытывают значительные трудности с позиционированием головок, теряют дорожку. Это хорошо можно видеть из популярного графика зависимости производительности от вибрационной нагрузки:

Другое дело диски SATA RE (RAID Edition) или же серверные диски со скоростью 7200 RPM. Они менее подвержены вибрациям и в меньшей степени зависят от них. Как видим из графика — вероятность возникновения ошибки в результате вибраций на 50% ниже для них.
Но не только вибрации являются проблемой, другая основная проблема всех дисков — уровень невозобновимых ошибок. Что это означает на практике?
Для SATA PC дисков уровень невозобновимых ошибок 1 ошибка на 10 14 бит, или 1 ошибка на 12,5 ТБ данных. Диск на 1ТБ имеет 1000/12500х10 14 бит. 5 дисков имеют емкость 5х(1000/12500х10 14 ) бит, а вероятность возникновения ошибки при работе этих дисков в массиве RAID5 будет составлять (5х(1000/12500х10 14 ))/10 14 x100% = 40%.
Как видим, использовать 5 PC-дисков в RAID5 просто нельзя, так как вероятность возникновения невосстановимой ошибки при ребилде очень высока и ребилд завершится скорее неудачно. Таким образом мы получим массив, который заведомо выйдет из строя в случае ребилда и данные будут утеряны. Ранее я не знал об этой особенности и в 2008-м году, когда собирал свой первый сервер еще на PC-шных накопителях, построил именно RAID5-массив, с целью экономии дискового пространства и денег, и менее, чем через месяц, данные были потеряны. Сейчас мне удивительно, что массив прожил так долго 🙂
Конечно, можно применять более надежные уровни RAID, такие, как RAID10 или в крайнем случае RAID6, но при большом количестве дисков мы также будем получать довольно высокую степень вероятности возникновения невосстановимой ошибки во время ребилда.
Другое дело серверные диски со скоростью 7200 оборотов в минуту (RPM) SATA RE или диски Near Line (NL) SAS. Вероятность невосстановимой ошибки для них на порядок меньше уже за счет их технических особенностей, 1 ошибка возникает на 10 15 бит данных. Тем не менее, при использовании не только большого количества накопителей, но и накопителей большого объема — этого может быть уже недостаточным и в таких случаях все же придется применять SAS-накопители Enterprise класса, степень надежности которых 1 невосстановимая ошибка на 10 16 бит данных.
Стоит также отметить, что на самом деле для дисков SATA RE, Near Line (NL) SAS и дисков SAS Enterprise-класса, по сути дисков, которые умеют эффективно взаимодействовать с RAID-контроллером, вероятность возникновения невосстановимой ошибки еще значительно меньше, как раз за счет этой способности. Так, при работе с нагруженным массивом (базы данных, с которыми работают сразу много пользователей, активная запись и считывание данных) начинают играть роль уже восстановимые ошибки, с которыми обычные диски работают неэффективно. Они пытаются перечитать проблему многократно — в тех же Western Digital значение установлено на 64 прохода головки с разными параметрами высоты, угла, только после чего головка переходит к обработке других задач. За счет этого сильно возрастает время ожидания, которое RAID не терпит и непременно сочтет диск потерянным и попытается восстанавливать диск, в результате чего нагрузка на массив приобретет критичный характер, так как одновременно с рабочей нагрузкой будет идти еще и ребилд. Результат предсказуем — крах всего массива.
Диски, которые умеют работать с RAID, могут сообщить RAID-контроллеру, что есть проблема с чтением блока данных, запросить этот блок с других дисков и в это время обрабатывать другие запросы, а получив блок — перезаписать его в другом месте проблемного диска. За счет этого никакого падения производительности RAID-массива не происходит и вероятность потери данных снижается значительно. Однако следует отметить, что не все софтовые рейд-контроллеры, установленные на чипсетах, умеют «понимать» такие диски, потому порой недостаточно иметь диски RE для надежного массива, а все же требуется применение аппаратного контроллера или другой платформы, которая корректно работает с RAID.
Тем не мене, если есть желание собрать более надежное хранилище, нежели хранилище на PC-накопителях, можно купить более дешевые диски, нежели диски RE, к примеру Constellation CS, которые предназначены для работы исключительно с софтовыми рейдами и лишены недостатка десктопных (попыток многократного перечитывания данных в ущерб другим задачам), при этом полноценно, само собой, с контроллерами они не взаимодействуют, так что cбои RAID полностью не исключены.
Вне зависимости от того, какой накопитель Вы применяете, Вы также должны помнить о том, что у дисков есть кеш — 32, 64 МБ и более. Что это значит для RAID-массива? С точки зрения производительности кеш является плюсом, как для чтения, так и для записи. Однако с точки зрения надежности записи — это минус. Используя кеш, рейд-контроллер будет думать, что уже записал данные на массив, но на самом деле они могут быть только в кеше, а на диск записаны быть позднее. В зависимости от размера массива растет и размер общего кеша, и в случае 12 накопителей кеш составляет уже почти гигабайт. Что произойдет с данными при отключении питания? Правильно. Они будут утеряны. И если речь идет о файлопомойке, тут, наверное, не на столько критично, но если же речь идет о базах данных — будет весело. Потому рекомендуется для данных особой критичности, такие, как базы данных, все же отключать кеш на запись. Это снизит производительность диска на 8-15% в режиме баз данных, однако в значительной степени увеличит надежность. По этой причине, если Вы приобретаете хранилище данных большой емкости, крупные производители отключают там кеш по умолчанию и включить его невозможно. Применяя же диски в серверах, особенно в low-сost дата-центре, где питание к серверу не резервировано, нужно помнить об этом риске и учитывать его.
Также отметим еще одну ключевую особенность дисков SAS Enterprise-класса, на них данные хранятся еще более надежно, так как минимальный размер кластера составляет 520 байт, а не 512, добавляется еще 8 байт для проверки четности. Применяется большое количество алгоритмов восстановления данных без участия контроллера. Именно по этой причине объем этих дисков не бывает очень большой.
К слову на счет объема, крайняя рекомендация, если у Вас есть задача хранить данные надежно, не пытайтесь использовать диски большего объема, нежели это необходимо, так как в случае ребилда восстановление будет занимать больше времени. Как правило контроллеры не анализируют то, сколько реально занято на диске и восстанавливают весь диск в целом, потому разница во времени восстановления между 1 ТБ и 6 ТБ накопителем будет более, чем в 6 раз.
Подведем итоги. Исходя из вышеизложенного понятно, что для небольшого RAID-массива, применение самых дорогостоящих дисков Enterprise класса не принципиально и не дает никаких преимуществ в надежности. Тем не менее, применение серверных дисков весьма желательно, так как в этом варианте на порядок большая вероятность того, что ребилд завершится успешно. Не следует применять диски большего объема, чем это необходимо, за исключением случаев, когда нужно обеспечить более высокую производительность по IOPS (в некоторых дисках большего объема все же может быть выигрыш по скорости за счет большего количества головок и пластин). В случаях, когда необходим большой объем и много дисков и при этом достаточный уровень надежности — можно смотреть в сторону SAS NL, которые по сути являются модифицированным вариантом накопителей SATA RE за счет интерфейса SAS, однако имеют все те же 7200 RPM. Для повышения уровня надежности целесообразно применять RAID более высокого уровня. Когда же объем массива не принципиален и требуется максимальная надежность, нужно однозначно применять SAS 15000 RPM Enterprise.
Теперь, выбирая в аренду сервер в Нидерландах, у нас на площадке Switch, при помощи конфигуратора, расположенного в нижней части страницы http://www.ua-hosting.company/servers, либо, модифицируя одно из спец. предложений:

Приходит понимание того, какие диски и какой из серверов лучше использовать и для каких задач, когда лучше использовать диски в RAID, а когда по отдельности, распределяя файлы софтом в зависимости от популярности (скрипт балансера в зависимости от нагрузки). Почему 4 диска большего объема, в плане надежности, может быть лучше, чем 12 меньшего, но хуже в плане времени восстановления в случае ребилда. Ну и самое важное — почему наше предложение реально крутое для серверного сегмента и мы реально приблизили цену к desktop-площадкам, при этом сохранив на порядок более высокую надежность без преувеличений! Так что если Вам, либо Вашим знакомым нужен хороший сервер — welcome, распродажа некоторых конфигураций из списка ниже ограничена, очень скоро цены на эти конфигурации будут выше, мы хоть и щедры, но не безгранично :):

Да, если у кого-то есть реальный опыт применения тех или других накопителей для определенных задач — не стесняйтесь делиться им в комментариях. Интересно все, вплоть до статистики отказов. На эту тему, как и по поводу проблематики выбора SSD-накопителя, мы постараемся опубликовать материал позднее.
- raid edition
- sas enterprise
- pc-drives
RAID Edition жесткий диск — что это такое?

Серия дисков, которые предназначены для использования в RAID-массиве.
В отчем отличие? Такие диски просто больше оптимизированы для совместной работы в массиве. В теории даже если не использовать массив, то такой диск тоже подходит в качестве обычного, чтобы например на него установить Windows.
Что за массив RAID? Диски можно обьединить вместе, то есть два, три, четыре — они могут работать как один. После обьединения вы получаете одно пространство, обьем которого — это сумма обьемов всех накопителей. RAID-массивы могут работать по-разному:
- Скорость. Когда два диска и более работают вместе. Данные сразу (одновременно) записываются на оба. Не параллельно, нет, а одни данные как бы разбрасываются (записываются) сразу на несколько дисков — при этом скорость записи в итоге увеличивается, как и скорость чтения. Но увы, это не касается скорости случайного доступа. Поломка одного — влечет потеряю данных и на остальных.
- Надежность. Как все работает, пример — берем два диска, соединяем в массив. Данные записываются сразу на оба диска, но в отличии от первого варианта — именно клонируются. То есть на двух дисках будут одни и те же данные для надежности. Если выйдет один из строя — данные останутся на втором. Некий продвинутый бэкап в постоянном режиме.
RAID массив можно создать функциями BIOS, но лучше всего для этого купить специальную плату с аппаратным RAID. Такая плата может подключаться в разьем PCI и уже к этой плате подключатся SATA-кабели дисков, после чего создается RAID-массив. Вот пример такой платы PCI:

А еще круче купить сетевое хранилище NAS — это специальное устройство с отсеками для жестких дисков. Вставляете диски, потом создаете из них одно файловое пространство (массив), настраиваете и это пространство будет доступно по локальной сети (LAN) или даже через интернет (зависит от модели). Некоторые устройства поддерживают подключение по Wi-Fi. Пример, как выглядит данное устройство:

Совсем забыл сказать — для устройств NAS часто диски имеют маркировку NAS Hard Driver (у Western Digital это линейка WD Red).
Надеюсь информация помогла. Удачи и добра, до новых встреч друзья.
Что такое RAID-массив и зачем он нужен
![]()
Система хранения данных обязана быть надежной, в каких-то случаях производительной, а в каких-то случаях с постоянным доступом к данным, а иногда и то и другое вместе. Такие возможности может предоставить технология RAID. Может показаться, что это что-то из области серверов, и так оно и есть, но дома тоже может пригодиться. Чтобы понять, нужна ли вам эта технология и как правильно ей пользоваться, сначала придется разобраться — что же это такое.
Что такое RAID-массив
RAID (Redundant Array of Independent Disks — избыточный массив самостоятельных (независимых) дисков) — это технология объединения двух и более накопителей в единый логический элемент с целью повышения производительности и (или) отказоустойчивости отдельно взятого элемента массива.
Избыточные данные по-другому называют дополнительными. Для их хранения нужен какой-то объем. Выделяемый объем для этих данных в массивах называется аналогично — избыточным. Избыточность массива — это наличие такого объема, и чем он больше, тем больше у массива избыточность, что в свою очередь обеспечивает отказоустойчивость.
Простыми словами, RAID-массив — это несколько дисков соединенные в единый диск с выделением места под хранение информации для исправления ошибок в данных.
RAID-массивы классифицируются по следующим параметрам:
- по исполнению RAID-контроллера;
- по типам поддерживаемых интерфейсов накопителей;
- по поддерживаемым уровням RAID.
Накопители в массив можно объединять по-разному, и на выходе получать разные массивы со своими плюсами и минусами, от которых будет зависеть, в какой области лучше их применить. Каждый такой массив еще называется уровнем.
Базовые уровни
JBOD
Строго говоря, это не RAID, но тоже массив. Аббревиатура дословно расшифровывается как «просто связка дисков». Эта связка дисков не дает никакой отказоустойчивости и роста производительности, а является просто дисками, «склеенными» в один логический элемент, скорость операций на котором не выйдет за рамки самого быстрого и самого медленного накопителей, участвующих в связке.
![]()
Объем такого массива будет равен сумме объемов накопителей, собранных в этот массив. При выходе из строя накопителя(-ей) пострадает информация только на этом(-их) же накопителе(-ях) — если фрагменты файла не были разделены между двумя накопителями. Массив можно составлять из разных по емкости накопителей и легко расширять.
RAID 0
Данный массив еще называется «чередованием», так как при записи информации на него она разбивается на части (блоки) фиксированного размера и записывается поочередно на все собранные в массив диски. Применяется для библиотеки игр, видеомонтажа или рендеринга.
![]()
К примеру, если массив собран из двух накопителей, то файл разобьется на два блока: A1 и А2, блок A1 запишется на первый накопитель, а блок A2 — на второй.
Количество дисков для сборки RAID 0 — минимум две штуки. При использовании такого уровня RAID возрастают скорости записи и чтения информации, поскольку операции происходят параллельно на всех дисках. Чем больше дисков в массиве, тем он производительней. Доступен объем всех дисков. Но самый главный минус в том, что поломка одного из дисков такого массива будет означать полную потерю информации, поскольку данные хранятся разбитыми по дискам.
RAID 1
Массив известный как «зеркалирование». Представляет собой полную копию информации с одного диска массива на другой. RAID 1 подойдет для важных данных, сохранность и доступность которых в приоритете.
![]()
Предполагается использование двух накопителей. За счет дублирования обеспечивается высокая надежность — работа продолжится при повреждении одного диска. Но в таком случае необходима его срочная замена, при этом данные восстанавливаются с «зеркального» диска. Распараллеливанием запросов обеспечивается высокая скорость чтения.
Поскольку диски являются клонами друг друга, то для использования доступен объем одного диска. Логическим продолжением этого является двухкратная цена за гигабайт памяти. А еще скорость записи остается либо такой же, как в случае использования одного диска, либо даже может немного «проседать».
RAID 2
Эти массивы используют чередование дисков и коды коррекции ошибок (код Хэмминга). Из-за этого диски в нем распределяются на две группы: для самих данных и для указанных выше кодов.
![]()
За счет чередования достигается высокая скорость операций с данными по сравнению с одним диском. А Код Хэмминга позволяет обнаруживать и исправлять ошибки при операциях с файлами «на лету» без снижения скорости операций с данными. Также при выходе из строя одного накопителя массива восстанавливаться данные будут по хранящимся кодам коррекции ошибок.
Минимум этого массива — 7 дисков. Можно меньше, но это бессмысленно, потому что для кодов потребуется больше дисков, чем для самих данных. С дальнейшим увеличением дисков избыточность будет уменьшаться по экспоненте:
![]()
RAID 2 сейчас не используется, потому что он совсем не экономичный, к тому же считается устаревшим. Его вытеснили следующие уровни RAID.
RAID 3
Так же, как и RAID 2, использует чередование дисков, но без кодов Хэмминга. Вместо этого хранятся контрольные суммы, и они-то и используются для восстановления, а данные разбиваются на байты. Данный RAID-массив наиболее удачен для работы с большими файлами, потоковым мультимедиа, но на практике не встречается ввиду невысокой надежности.
![]()
Порог вхождения в этот тип массива — три диска. Скорость операций чтения высокая, скорости операций записи высоки только для больших файлов. RAID 3 предлагает хороший компромисс между доступным объемом и ценой. Хранящаяся информация теряется, если «навернется» больше одного диска.
К недостаткам. Могут наблюдаться проблемы со скоростью при работе с данными небольшого объема. Да и не все контроллеры поддерживают этот массив. Плюс высокая нагрузка на диск, хранящий контрольные суммы, сокращает срок его службы относительно дисков с данными.
RAID 4
Можно сказать, это тот же самый RAID 3, только файл бьется не на однобайтные блоки, за счет чего удалось несколько повысить скорость записи мелких файлов. Остальные характеристики соответствуют рейду третьего уровня.
![]()
RAID 5
Здесь используются контрольные суммы и чередование как в RAID 3 и RAID 4, но объем под хранение сумм распределяется по всему массиву. Это дает прирост в скорости записи, так как операции теперь можно производить параллельно. Количество накопителей в массиве начинается с трех. Для хранения контрольных сумм выделяется объем, равный объему одного накопителя. RAID 5 наиболее распространен и используется в файловых серверах, серверах общего хранения, серверах резервного копирования, работе с потоковыми данными и других средах, требующих хорошей производительности.
![]()
Полезный объем накопителей зависит от количества накопителей в массиве — чем больше накопителей, тем больше объем. Скорость чтения — высокая, относительно RAID 4 подросла и скорость записи. А за счет размазывания сумм по массиву и нагрузка на все диски распределяется равномерно.
Но когда один диск «накрывается», надежность массива существенно падает, и он переходит в критическое состояние. Восстановление — очень длительный процесс, вызывающий падение производительности массива и сильно увеличивающий нагрузку на накопители, поскольку с них производится продолжительное интенсивное чтение.
Ребилд увеличивает вероятность ухода из жизни еще одного или даже нескольких накопителей в массиве, что в свою очередь приведет к потере данных. Так же при восстановлении могут выявиться ранее не обнаруженные ошибки и восстановление данных с такого массива потребует обращения в специализированные организации.
Для предупреждения подобных ситуаций применяется анализ состояния накопителей (S.M.A.R.T.) и использование технологии Hot Spare (горячий резерв) — это автоматическое подхватывание в массив заранее зарезервированного диска вместо вышедшего из строя, и старт процедуры восстановления массива.
RAID 6
Контрольные суммы на этот массив записываются в двойном размере, что требует и увеличения объема в два раза. Такой «финт» приводит к повышению отказоустойчивости, при этом не сильно увеличивая стоимость.
![]()
Минимальное количество дисков — четыре. Ко всем достоинствам RAID 5 прибавляется повышенная надежность, за счет допустимого отказа двух дисков одновременно. Но скорость записи может быть значительно ниже, чем у RAID 5. Шестой рэйд используется там же, где и «пятый», но с заявкой на повышенную надежность.
Комбинированные уровни
RAID 01 и RAID 10
Массивы представляют собой кооперирование уровней 0 и 1. RAID 01 — это зеркалирование двух массивов чередования. Также называется «зеркало страйпов».
![]()
А RAID10 — это чередование двух зеркальных массивов.
![]()
В любом из вариантов полезный объем массива будет составлять 50 % от суммарного объема задействованных дисков.
Оба рэйда имеют одинаковую высокую производительность, но надежность у RAID 10 выше, чем у RAID 01, за счет того, что в «десятке» возможен отказ по одному накопителю в каждом «зеркале» без потери информации. По этой причине RAID 01 не используется, и поэтому же перечислим достоинства и недостатки только для RAID 10.
Доступен такой массив от четырех дисков. При нем высокая скорость от RAID 0, отказоустойчивость от RAID 1. Но цена за такой симбиоз высока. Зато это идеальный кандидат для хранения критически важных данных и в приложениях с интенсивным вводом-выводом данных.
RAID 03 и RAID 30
В этом случае чередование уже миксуется с RAID 3. И, аналогично ситуации выше, либо собираешь в RAID 3 от трех массивов RAID 0, либо в RAID 0 собраны несколько RAID 3. Логично, что рассматривать имеет смысл только последний вариант из-за того же преимущества в надежности.
![]()
Минимальные ставки повышаются до шести дисков. Как и в предыдущем случае растет производительность и повышается надежность, но в отличии от десятого уровня, полезный объем больше. Ну и, конечно, за такую экзотику придется заплатить больше.
RAID 50
Опять же чередование, только с RAID 5. Находит применение в серверах очень большой емкости.
![]()
Допускает потерю по одному диску в разных массивах RAID 5 без утраты данных, соответственно, чем больше чередуется массивов, тем больше дисков допустимо потерять.
К достоинствам RAID5 прибавляется повышение скорости записи и повышение скорости восстановления. Допускаемый минимум — шесть дисков, а это влетает в копеечку. Так же нужно иметь ввиду, что не каждый контроллер способен поддерживать этот тип массива.
RAID 60
Как не трудно догадаться, это связка RAID 0 и RAID 6.
![]()
«Ставки повышаются» до восьми накопителей. Решается проблема производительности RAID 6, но без денежных вливаний тут не обойтись. Как и у RAID 50 имеется проблема возможного отсутствия поддержки этого массива со стороны контроллера.
RAID 100
Комбинированный рэйд из комбинированных рэйдов не хотите? Да! Тут происходит чередование RAID 10.
![]()
Данный массив создается при помощи нескольких низкопроизводительных контроллеров. Это дает увеличение скоростей, по сравнению с тем, если бы рэйд строился на одном из этих контроллеров. Работа с очень большими базами данных — лучшее применение данного массива.
Существует еще несколько комбинированных массивов. Они также представляют собой либо чередование, либо зеркалирование, смешанное с каким-то другим типом массива, что закономерно приводит к повышению или производительности, или надежности. Так что заострять внимание на них мы не будем и перейдем к следующем уровню.
Усовершенствованные уровни RAID
RAID 1E
Зеркалирование, способное работать с нечетным количеством накопителей. Для реализации этого массива имеются два алгоритма:
Near — запись копии со сдвигом накопителя.
![]()
Interleaved — копия данных пишется с чередованием по полосам и сдвигом накопителя.
![]()
Для такого массива нужно минимум три диска. Дает такое усовершенствование увеличение скорости передачи данных и обработки запросов. Доступна, как и в классическом зеркале, только половина объема. Надежность несколько хуже, чем у RAID 1, хоть и допускается выход больше одного диска, при условии, что это не соседи, на которых хранится оригинальный блок данных и его дубль. Но и такое доступно не на всех контроллерах — на некоторых допускается потеря только одного накопителя.
RAID 5EE
Вариант усовершенствования RAID 5 путем включения в массив диска из горячего резерва. Стартовый набор накопителей для такого массива — четыре штуки.
Объем «горячего диска» распределяется по массиву, а общий объем становится равным объему n-2 диска. При отказе одного накопителя массив сжимается до n-1 дисков путем заполнения свободного пространства. Иными словами, это все тот же RAID 5, только с возможностью похоронить два диска вместо одного. Как только конфигурация получит новый диск вместо «отъехавшего», массив вновь займет все диски. Аналогично, кстати, может быть усовершенствован и RAID 6.
![]()
RAID DP
В данном случае был модифицирован RAID4 путем добавления еще одного накопителя для хранения контрольных сумм. Но данный рэйд узкоспециализированный и может работать только в устройствах компании NetApp, так как в нем используется файловая система WALF. Связка RAID-DP с этой системой дает повышение производительности выше, чем у рэйдов 5 и 6 уровней.
RAID 7
Технология, по названию, казалось бы, намекающая на очередное развитие базовых уровней, тоже является узкоспециализированным решением, но на сей раз принадлежащим компании Storage Computer Corporation. И это решение — RAID 4, но использующее кэширование операций по чтению и записи в ОЗУ. Для его надежной работы обязательно наличие ИБП, так как в случае перебоев питания данные повреждаются.
Приведем краткую выжимку всех уровней (кроме JBOD, RAID DP и RAID 7) в таблицу:
![]()
Ну что же с уровнями RAID вроде разобрались, осталось понять, как и из чего их можно собирать.
Каким образом можно собрать RAID-массив
Программный RAID реализуется средствами операционной системы или на уровне материнской платы. Такое решение не всегда стабильно, «отжирает» часть ресурсов процессора и оперативной памяти. В зависимости от операционной системы поддерживает далеко не все уровни RAID — Win10, например, даст возможность создать только JBOD, RAID 0,1 и 5 — но зато является «бесплатным», так как дополнительно приобретать ничего не нужно.
Интегрированный аппаратный RAID называемый еще Fake-RAID. Представляет собой чип, распаянный на материнской плате, который снимает часть нагрузки с процессора при создании и поддержании RAID’а. Такое решение производительнее чисто софтверного подхода и обеспечивает возможность установки ОС, но надежность все так же не высока.
В этой статье вы можете более подробно ознакомится с гайдом по созданию RAID-массива одним из двух описанных выше способов.
Аппаратный RAID можно в свою очередь тоже разделить на пару видов.
Первый — это дискретная карточка с интерфейсом PCI-e. На ней распаян контроллер с персональной памятью, процессором, системой охлаждения и часто даже аккумулятором для бесперебойного питания. Это решение по надежности и производительности гораздо лучше программного и интегрированного рэйдов, но вместе с тем и куда затратнее.
![]()
Второй вид — это внешние контроллеры. Они располагаются в отдельном корпусе, как правило, вместе с накопителями, имеют свой независимый блок питания и подключаться могут по PCI-e, USB 3.2 или Thunderbolt 3. Это самое надежное решение и самое дорогое.
![]()
Из чего собирать RAID-массив
Изначально RAID-массивы предназначались для жестких дисков (HDD) и поддерживали интерфейсы IDE, SATA и SAS. IDE уже давненько устарело, ну а к SATA и SAS прибавился ссдшный NVMe. Классические SATA HDD связываются в массивы без проблем. SAS тоже, но это все же удел серверов
С массивами на SSD немного сложнее. Просто собрать накопители в массив можно без проблем — работать будет, но не на тех скоростях, на которые вы рассчитывали. Потому что контроллер может быть рассчитан на работу с «механикой» и этим ограничивать пропускную способность. И лучше покупать для этого одинаковые накопители (один производитель, одна серия) чтобы не было разлета в характеристиках — для большинства массивов это важно.
И если обычные 2,5-дюймовые SSD-накопители подключаются по sata, то NVMe’шники — по шине PCI-Express и занимают четыре линии на один накопитель. Скорость RAID-массива может быть ограничена версией этой шины, но не только ей. PCI-линии разводятся на материнских платах в процессор напрямую и через чипсет. Количество линий между чипсетом и процессором распределяется по-разному и зависит также от производителя процессора.
На платах для Intel больше линий идет через чипсет, а для AMD больше линий «бросается» сразу на «камень». Так вот в случае, если вы подключите SSD через чипсетные линии, то будете ограничены пропускной способностью соединения чипсета с процессором и его версией. В итоге все это дело собирать желательно через процессорные линии PCI-e, нежели чипсетные. Всю информацию для этого необходимо искать в документации на плату Также у нас есть статья с нужной информацией.
Если у вас двучиплетный процессор, то тут тоже есть нюанс. Для достижения максимальных скоростей нужно подключать накопители массива в линии шины PCI, идущие на один чиплет. Если будет подключение к двум чиплетам, то ботлнэком будет шина, соединяющая эти чиплеты, ведь по ней они будут гонять данные.
Для «правильного» NVME RAID-массива разъемов на плате с большой вероятностью не хватит, особенно, если планируется собрать в рэйд много дисков. Помочь с этим смогут различные адаптеры или переходники. С аппаратными решениями таких проблем, как правило, не возникает. Существуют даже варианты, которые могут работать со смешанным составом накопителей.
![]()
RAID — это не бэкап. Он никогда им не был и не будет. Если вы или программа удалит данные с рэйда, то восстановить без бэкапа эти данные не получится. Поэтому такая технология не освобождает вас от резервного копирования важных данных.
Статья обновлена автором Megakot.