Дисковые массивы RAID
Дисковый массив RAID (Redundant Array of Independent Disks) — совокупность нескольких жёстких дисков (2 и более), объединённых в единую связку.
В зависимости от вида (базового уровня RAID) такое решение повышает скорость записи и считывания информации или увеличивает показатели отказоустойчивости носителей и защищенности данных от потерь.

Использование RAID-массива является одним из популярных и доступных аппаратных способов повышения отказоустойчивости при хранении и обработке данных.
Виды дисковых массивов RAID
RAID 0. Используются для увеличения скорости записи и чтения данных. В этом случае обмен информацией происходит одновременно со всеми дисками из массива. Файлы записываются частями: одна часть — на один диск, следующая — на другой.
Скорость в этом случае выше, чем при использовании только одного жесткого диска. Но о резервировании данных и повышении уровня защиты от потери речи нет.
Если важна сохранность информации, потребуется массив RAID уровня 1 и выше.
RAID 1. Применяется минимум 2 диска. Используется 100% копирование — все, что сохраняется на первый диск, в таком же виде копируется на второй.
RAID 2, RAID 3, RAID 4. Принцип записи, как в RAID 0 (блоками на разные носители). Но часть массива выделена под хранение кодов коррекции ошибок (используется код Хэмминга).
Благодаря этому повышается скорость обмена данными и показатели отказоустойчивости. Схожий принцип реализован в решениях уровней 3 и 4. Только под контрольные суммы (коды коррекции) выделяются разные объемы памяти.
Практически не используются на практике.
RAID 5. Принцип работы схож с RAID 1 (полное копирование), необходимый минимум — 3 диска. Но при этом один или несколько дисков используются для хранения контрольных сумм для восстановления информации.
RAID 6. Используется как минимум 4 диска. Такой массив может пережить одновременную поломку даже 2 носителей. Используется 2 контрольные суммы, вычисляемые разными способами. Высочайшая надёжность.
RAID 10. Их называют еще «1+0». Таким RAID присущи черты массивов 1 и 0 уровней. От нулевого они взяли увеличенную скорость доступа, от первого — высокие показатели надежности. RAID 10 подходит тем, у кого в приоритете высокая скорость операций чтения/записи. Для организации массива требуется четное количество дисков (минимум 4).
RAID 50. Представляет собой набор массивов RAID 5, объединенных в RAID 0. Минимальное количество дисков — 6. Обеспечивается надежность массива 5 уровня и вместе с этим решается проблема низкой скорости записи, присущая для него. Решение подходит для случаев, когда требуется высокая надежность и производительность.
RAID 60. Строится из 8 и более дисков. Это 2 и более массива 6 уровня, объединенных в RAID0. Отличительная черта — высокие показатели отказоустойчивости. Даже если из строя выйдет по 2 накопителя из RAID6, информация сохранится.
Решения под дисковые массивы
Системы хранения данных и сетевые хранилища NAS имеют встроенный контроллер для создания и управления RAID-массивами. Для реализации на серверах и рабочих станциях требуется контроллер, который управляет процессами записи, считывания информации и пр.
Контроллеры дисковых массивов делятся на 2 вида:
- Программный контроллер — самый доступный по цене вариант, применяется для простых задач. Представляет собой специальное ПО. Особенность — интенсивное потребление ресурсов компьютера, из-за чего может страдать быстродействие. Чаще используется для RAID 0 и 1.
- Аппаратный контроллер — представляет собой устройство расширения, подключающееся в слот компьютера или сервера. Диски подключаются к контроллеру через внутренние или внешние порты. Может иметь кэш-память, возможность установки батареи для хранения кэш-памяти при отсутствии питания, функции «горячей замены» и автоматической замены диска.
Выбор типа контроллера, как и самого RAID-массива, зависит от задач, где это будет использоваться.
Для выбора решения нужно понимать:
- какое взаимодействие будет с данными (чтение, записи, их соотношение);
- какой уровень нагрузки ожидается (редкое копирование файлов из архива или высокая нагрузка на запись со случайным доступом);
- есть ли требования под задачу по IOPS (показатель количества операций чтения\запись в секунду), пропускной способности дисковой системы, время задержки;
- нужна ли возможность «горячей замены» или автоматической замена диска (Hot Swap и Hot Spare).
Получить консультацию
Отправьте описание задачи, в решении которой нуждается ваш бизнес. Мы предложим возможные варианты её решения и оценим стоимость её выполнения.
Что такое «горячая замена»?

Сам термин «горячая замена» (hot swap — ) означает возможность замены оборудования без остановки сервера. Как правило подразумевается использование такой возможности для замены неисправных элементов системы.
Конечно, это специальные системы и серверы, сконструированные с такой возможностью. В обычном домашнем компьютере без его отключения можно заменить разве что — флэшку, клавиатуру или мышь.
Наверняка, вы слышали о возможности проводить горячую замену жестких дисков в сервере, но это далеко не единственный тип таких устройств (в иностранной литературе этот класс устройств обычно называется hot swappable). Естественно, это должен быть специальным образом сконфигурированный с достаточной избыточностью — тогда замена одного диска не скажется на работе сервера.
Если облака для вас
не просто теория
Широкий спектр услуг
по выделенным северам
и мультиклауд-решениям
Конфигурация VPS и бесплатный тест уже через 2 минуты
Организация вашей IT-инфраструктуры на основе мультиклауд-решения
Но это далеко не единственный класс устройств, который может быть исполнен в варианте, подразумевающем «горячую замену», такими могут быть и блоки питания, и вентиляторы, и коммутационные разъемы.
В нашем вам на помощь придет услуга «remote hand» и возможности хранить некоторое количество запасных частей у нас — если в вашем сервере, например, вентилятор требует замены, нет необходимости специально ехать к нам.
Наши опытные специалисты готовы по вашему указанию взять новый диск, вентилятор, блок питания из хранимых вами на нашей территории и произвести замену на вашем сервере.
Это сэкономит вам кучу времени и позволит избежать проблем. На всякий случай предупредим, что данная услуга не предоставляется «по умолчанию», и требует указания в контракте.
Популярные услуги
Debian сервер
Настройка Debian сервера занимает мало времени. Вам нужно только задать технические характеристики сервера и выбрать версию ОС. Настраивать VDS или VPS web server с нуля вам не придётся.
Ubuntu сервер
Облако на сервере Ubuntu поможет решить проблемы с масштабируемостью проектов. Под высокой нагрузкой сайту или будет выделяться больше ресурсов.
VDS Windows сервер
Любой постоянно развивающийся интернет-проект в определенный момент своего существования начинает нуждаться в неограниченном трафике. С помощью VPS Windows сервера можно быстро решить проблему с масштабированием ресурсов в рамках крупной системы.
Горячая замена (Hot Swap)
При использовании NAS серверов важно обеспечить максимально возможную сохранность данных, записанных на его диски. В таких случаях принято использовать NAS сервера с поддержкой RAID массивов с избыточностью уровней 1, 5, 6 и так далее. Однако, если вдруг один из дисков такой системы выйдет из строя, придется выключать систему для замены сбойного накопителя. Чтобы не прерывать работу сервера рекомендуется использовать NAS серверы с возможностью горячей замены дисков. В таком случае при возникновении ошибки на одном из дисков NAS позволит заменить диск без выключения. Такие системы легко отличить по наличию легкосъемных корзин для дисков, доступных без открывания корпуса NAS’а.

Помимо замены сбойного диска, корзины горячей замены заметно облегчают процесс увеличения емкости накопителей, при которой нужно по мере перестроения массива по очереди менять все диски.
Горячая замена диска Adaptec 6405

Горячая замена диска Adaptec 6405 официально поддерживается RAID-контроллером и осуществляется достаточно просто. При этом вам все же лучше будет полностью протестировать этот процесс пока сервер ещё не введен в работу, а также задокументировать эти шаги . Если какой-либо диск (или несколько дисков) все же выйдут из строя на массиве с полезной нагрузкой, вам будет не до выяснения нюансов работы контроллера, нужно будет выполнять замену диска и лучше, чтобы вы были полностью уверены в этом процессе. Для тех, кто поленился сделать для себя подробный гайд step by step главным образом и предназначается эта статья (ну а также разумеется для меня самого и моих коллег).
Подробнее о контроллерах Adaptec серии 6xxx читайте в головной статье – RAID-контроллер Adaptec 6405.
Если вам интересны raid-технологии и задачи администрирования raid-контроллеров, рекомендую обратиться к рубрике RAID на моем блоге.
Горячая замена диска Adaptec 6405
Для начала нужно определить в какой корзине находится диск, который нам нужно заменить. Есть несколько способов это сделать:
1) При должной настройке диск скорее всего сидит в корзине с тем порядковым номером, в какой и должен (судя по информации из ASM. Учтите, что номера корзин начинаются с 0);
2) На всякий случай можно подстраховаться и точно определить корзину. Для этого в утилите Adaptec Storage Manager нажимаем правой кнопкой на нужном диске – Blink physical disk.

На этом моменте корзина диска должна ритмично замигать красным светодиодом.

3) Ничего не делать и просто через ASM перевести диск в состояние Failed. В этом случае контроллер начнет издавать мерзкий писк и будет непрерывно светиться красный светодиод на корзине с проблемным диском.
Отлично, допустим диск определен (или вы пропустили этот шаг), двигаемся дальше. Теперь нужно подготовить диск к изъятию. Можно конечно его просто выдернуть, но не думаю, что это хорошее решение, тем более когда все можно сделать правильно. К тому же так рекомендуют сделать и в официальной документации 1 .
When removing a drive to simulate a failure or pro-actively replace a questionable drive, it is recommended to use the Storage Manager “set drive state to failed” or CLI / ARCCONF “force fail” option prior to removing the drive. When the drive is marked as failed, it is safe to remove and replace the drive.
Нажимаем правой кнопкой на нужном диске – Set drive state to failed:

Сразу выскочит предупреждение, что массив будет переведен в деградированное состояние:

Подтверждаем. В реальной среде вышедший из строя диск скорее всего и так будет в состоянии Failed, а массив в деградированном виде. У меня же эксперимент на тестовой среде и я перевожу диск в нужное состояние вручную. Вот как изменятся показания ПО:

Напоминаю, что массив при этом у меня формально остался в рабочем состоянии, ведь я использую RAID1 и он обеспечивает работоспособность при выходе из строя до половины дисков.
На этом этапе можно смело идти и заменять диск на новый (объем диска вплоть до байта должен быть больше или равен объему других дисков в действующем массиве). Контроллер при этом будет издавать писк (как я и говорил выше), а корзина с проблемным диском сигнализировать о проблеме непрерывно горящим красным светодиодом .
После замены показания ASM будут выглядеть следующим образом:

Новый диск готов к использованию и нужно его инициализировать. Нажимаем правой кнопкой на диске – Initialize:

Получаем предупреждение и соглашаемся с ним:

Далее нужно дать понять контроллеру, что он может использовать новый диск вместо недавно “вышедшего из строя” и замененного диска. Для этого нужно сделать новый диск диском горячей замены (правой кнопкой на новом диске – Create dedicated hot-spare drive for):

Никаких дополнительных диалоговых окон выскочить не должно, а диск сразу станет частью массива:

и автоматически запустится процесс ребилда:

Во время процесса работа сервера может не прекращаться (для наглядности скриншоты ASM я снимал как раз с того же сервера, на котором проводил тестирование). Только учтите один момент: ребилд – достаточно ресурсоемкий процесс и если в вашем массиве небольшое количество низкопроизводительных дисков (а сейчас это фактически любые диски, кроме SSD), то лучше провести технические обслуживание, предварительно сняв полезную нагрузку с сервера. Это особенно касается массивов RAID5 (и им подобных), которые в продакшене вообще использовать не рекомендуется (почему, читайте подробнее в моей статье – Типы RAID-массивов).